"ذاكرة الوصول العشوائي في العالم تنفد."
هذا الادعاء هو الخطاب الرئيسي وراء آلاف مقاطع الفيديو الفيروسية على تيك توك. قد يبدو في البداية كطعم للنقرات، لكن الحقيقة المزعجة هي أن الذكاء الاصطناعي يستهلك البنية التحتية للذاكرة العالمية بشكل أسرع بكثير مما يدركه معظم الناس.
لم يعد الذكاء الاصطناعي مفهومًا مستقبليًا؛ بل أصبح مشكلة بنية تحتية ملموسة في يومنا هذا. بينما تتوسع النماذج اللغوية الكبيرة، وأنظمة الذكاء الاصطناعي التوليدية، والوكلاء المستقلون، ومنصات التحليل في الوقت الحقيقي بسرعة غير مسبوقة، يظهر عنق الزجاجة الأكثر حرجًا في العصر الرقمي بصمت: ذاكرة الوصول العشوائي (RAM).
المزيد من الخبراء يطرحون هذا السؤال الاستفزازي:
هل يوجد في العالم ذاكرة وصول عشوائي كافية لدعم ثورة الذكاء الاصطناعي؟
تستكشف هذه المقالة سبب إنشاء الذكاء الاصطناعي لطلب متفجر على الذاكرة، وكيف يمكن أن يؤدي ذلك إلى نقص عالمي في ذاكرة الوصول العشوائي، وما يعنيه ذلك لمزودي الخدمات السحابية، والمؤسسات، والمستهلكين، وكيف يمكن للصناعة التكيف مع هذا الوضع.
ذاكرة الوصول العشوائي هي "ذاكرة العمل" لجهاز الكمبيوتر. على عكس التخزين (SSD أو HDD)، تحدد ذاكرة الوصول العشوائي ما يلي:
• مقدار البيانات التي يمكن معالجتها في وقت واحد
• مدى سرعة استجابة النماذج
• ما إذا كانت التطبيقات يمكن أن تتوسع في الوقت الحقيقي أم لا
لسنوات، كان المقياس الرئيسي للأداء هو سرعة وحدة المعالجة المركزية. اليوم، خاصة في أنظمة الذكاء الاصطناعي، أصبحت سعة الذاكرة وعرض النطاق الترددي أكثر أهمية بكثير من القوة الحسابية الخام.
إذا لم يكن هناك ذاكرة وصول عشوائي كافية للذكاء الاصطناعي، فلن يعمل النموذج.
التطبيقات التقليدية:
• خوادم الويب • قواعد البيانات • برامج المكتب • أنظمة تخطيط موارد المؤسسات (ERP)
مهامها:
• معالجة قطع بيانات صغيرة نسبيًا • تعتمد على إدخال/إخراج القرص • تتحمل التأخير
أما مهام الذكاء الاصطناعي فتتطلب:
• تحميل النموذج بالكامل في الذاكرة • تتطلب توازيًا كثيفًا • تعمل باستمرار • تستهلك الذاكرة بشكل مفرط
الفرق الأساسي: تتوسع البرامج التقليدية باستخدام وحدة المعالجة المركزية. أما الذكاء الاصطناعي فيتوسع باستخدام ذاكرة الوصول العشوائي.
لنلقِ نظرة على النماذج الحديثة للذكاء الاصطناعي:
| النموذج | عدد المعلمات | ذاكرة الوصول العشوائي المطلوبة للاستنتاج |
|---|---|---|
| GPT-3 | 175 مليار | ~350–700 جيجابايت |
| نماذج فئة GPT-4 | تريليونات (تقديري) | عدة تيرابايت |
| النماذج مفتوحة المصدر (70B) | 70 مليار | 140–280 جيجابايت |
هذه الأرقام تخص مثالًا واحدًا فقط.
الآن اضرب هذا في:
• آلاف المستخدمين المتزامنين
• متطلبات التكرار
• مجموعات التوافر العالي
• التوزيعات الطرفية
فجأة، تصبح التيرابايت من ذاكرة الوصول العشوائي لكل خدمة أمرًا طبيعيًا.
تدريب الذكاء الاصطناعي
يتطلب تدريب النماذج ما يلي:
• مجموعات ضخمة من وحدات معالجة الرسومات
• ذاكرة ذات عرض نطاق ترددي عالٍ للغاية (HBM)
• وصول متزامن إلى الذاكرة
عملية تدريب واحدة:
• يمكن أن تستهلك بيتابايتات من الذاكرة بمرور الوقت
• يمكن أن تستخدم عشرات الآلاف من وحدات معالجة الرسومات
استنتاج الذكاء الاصطناعي
الاستنتاج، أي تقديم النماذج للمستخدمين، يخلق مشكلة مختلفة:
• استخدام دائم للذاكرة
• نماذج تعمل باستمرار
• الحاجة إلى التوسع الأفقي
هذا يعني احتلال ذاكرة الوصول العشوائي بشكل مستمر بدلاً من الاستخدام المؤقت.
توقع قانون مور أن كثافة الترانزستورات ستزداد بشكل أسي. لكن:
• تباطأ النمو في كثافة ذاكرة الوصول العشوائي
• لا يوجد تقريبًا أي تحسن في تأخيرات الذاكرة
• يزداد استهلاك الطاقة لكل جيجابايت
• تزداد تعقيدات التصنيع
في المقابل، ينمو حجم نماذج الذكاء الاصطناعي بشكل أسرع بكثير من تطور الأجهزة. الطلب على الذكاء الاصطناعي مرتفع، بينما العرض من ذاكرة الوصول العشوائي خطي. جوهر النقص القادم هو هذا التفاوت.
منتجون محدودون
يسيطر على سوق ذاكرة الوصول العشوائي العالمي بشكل كبير الشركات التالية:
• سامسونج
• SK Hynix
• ميكرون
هذا الوضع يخلق:
• هشاشة في سلسلة التوريد
• تقلبات في الأسعار
• مخاطر جيوسياسية
طلب متنافس
تحتاج ذاكرة الوصول العشوائي في المجالات التالية أيضًا:
• الهواتف الذكية
• أجهزة الكمبيوتر
• الخوادم
• أنظمة السيارات
• أجهزة إنترنت الأشياء
• مسرعات الذكاء الاصطناعي
الذكاء الاصطناعي لا يحل محل هذه الخدمات؛ بل يضاف إليها.
بدأ مزودو الخدمات السحابية الكبار بالفعل في الاستجابة:
• آلات افتراضية محسنة للذاكرة (1–24 تيرابايت من ذاكرة الوصول العشوائي)
• رقائق سيليكون خاصة
• تكامل عمودي
• معماريات ذاكرة مملوكة
لكن حتى المزودين ذوي النطاق الفائق يواجهون حدودًا:
• قيود الطاقة في مراكز البيانات
• تحديات التبريد
• تكاليف متزايدة لكل جيجابايت
تجد الشركات الصغيرة والشركات الناشئة نفسها بشكل متزايد خارج النظام في الوصول إلى البنية التحتية العالية الذاكرة.
بينما يتزايد الطلب العالمي على ذاكرة الوصول العشوائي بسبب أعباء العمل في الذكاء الاصطناعي بسرعة، تصبح البنى التحتية السحابية القوية والمرنة أكثر أهمية من أي وقت مضى. لا يمكن لأي مزود إزالة الحدود الفيزيائية لإنتاج الذاكرة، لكن منصات البنية التحتية تلعب دورًا حاسمًا في كيفية تخصيص الذاكرة بكفاءة، وتوسيعها، واستخدامها.
PlusClouds تقع بالضبط في هذه النقطة المحورية. بدلاً من وضع نفسها كمنصة ذكاء اصطناعي مخصصة، تقدم أساسًا موثوقًا وقابلًا للتوسع للبنية التحتية السحابية يشمل الحساب، والتخزين، والشبكة، والأمان، والمراقبة، والتوافر العالي. في عالم تكون فيه ذاكرة الوصول العشوائي نادرة ومكلفة، تكون القرارات المعمارية مهمة بقدر أهمية السعة المادية للأجهزة. بالنسبة للفرق التي تتطلب مزيدًا من التحكم، تقدم PlusClouds تكوينات خوادم مرنة يمكن تكييفها مع عبء العمل من حيث الذاكرة، وقوة المعالجة، وملفات تعريف الموارد.
من خلال تصميم معماريات تدعم القدرات التالية:
• توزيع عبء العمل بكفاءة في الذاكرة
• توافر عالي بدون تكرار غير ضروري للذاكرة
• التوسع المرن للاستنتاج في الذكاء الاصطناعي والتطبيقات الكثيفة البيانات
تمكن PlusClouds الفرق من التركيز ليس فقط على كمية الذاكرة المستخدمة، بل على كيفية استخدامها. مع تحول أنظمة الذكاء الاصطناعي من مشاريع تجريبية إلى خدمات طويلة الأمد تعمل في بيئات الإنتاج، يصبح كل جيجابايت من ذاكرة الوصول العشوائي تكلفة قابلة للقياس.
بينما يتقدم نظام الذكاء الاصطناعي البيئي نحو مستقبل تحدده قيود الذاكرة أكثر من وفرة قوة المعالجة، سيصبح مقدمو البنية التحتية الذين يضعون الكفاءة، والشفافية، والحرية المعمارية في الأولوية شركاء لا غنى عنهم. إذا كنت ترغب في مناقشة هذه الأسئلة المعمارية المعقدة بعمق أكبر والحصول على إجابات ذات مغزى، انضم إلى مجتمعنا وكن جزءًا من هذا التحول.
التكاليف المتزايدة
• ترتفع أسعار ذاكرة الوصول العشوائي في فترات النقص
• تصبح خدمات الذكاء الاصطناعي مكلفة
• يتباطأ الابتكار للشركات الصغيرة
استهلاك الطاقة
تستهلك ذاكرة الوصول العشوائي الطاقة حتى في وضع الخمول:
• نماذج الاستنتاج التي تعمل باستمرار
• بصمة ذاكرة دائمة
• عبء التبريد
تتحول تكلفة الذكاء الاصطناعي البيئية بشكل متزايد إلى مشكلة ذاكرة بدلاً من حساب.
• التكميم
• التقليم
• الهياكل المتفرقة
• خليط من الخبراء (MoE)
• CXL (رابط التعبير الحسابي)
• الذاكرة المفككة
• تجمعات الذاكرة الموحدة لوحدة المعالجة المركزية ووحدة معالجة الرسومات
• استراتيجيات التخزين المؤقت الأفضل
• الاستنتاج القائم على التدفق
• الهياكل غير الحافظة للحالة
• نماذج أصغر مخصصة للمهام
• الاستنتاج على الجهاز
• تقليل الضغط على الذاكرة المركزية
لا يحل أي من هذه الحلول المشكلة بالكامل؛ بل يؤجلها فقط.
في عالم محدود بالذاكرة:
• النماذج الأكبر هي التي تفوز
• يزداد تركيز رأس المال
• يصبح الذكاء الاصطناعي بنية تحتية وليس برمجيات
• تتحول كفاءة الذاكرة إلى ميزة تنافسية
قد تأتي الاختراقات المستقبلية ليس من النماذج الأكبر، بل من الاستخدام الأذكى للذاكرة.
لم يعد السؤال هو ما إذا كان الذكاء الاصطناعي سيضغط على العرض العالمي لذاكرة الوصول العشوائي.
بل متى سيحدث ذلك.
الذكاء الاصطناعي يغير اقتصاديات الحوسبة جذريًا. مع نمو النماذج وانتشارها في كل مجال، تصبح ذاكرة الوصول العشوائي النفط الجديد: نادرة، استراتيجية، وتحدد من يمكنه الابتكار.
لن تقتصر ثورة الذكاء الاصطناعي على الأفكار. بل ستقتصر على الذاكرة.
تكتب AutoQuill محتوى تسويقي تابع وتنشره لك.
Create your account to get started with next-gen cloud services.