Artificial Intelligence7 min read1264 words

هل سينفد العالم من الذاكرة العشوائية؟ كيف يسبب الذكاء الاصطناعي نقصًا عالميًا في الذاكرة

Ece Kaya

Ece Kaya

Content Strategist

Cloud infrastructure & B2B marketing

Hızlı Özet

"العالم ينفد من ذاكرة الوصول العشوائي"، هذا هو الادعاء وراء آلاف مقاطع الفيديو الفيروسية على تيك توك، وبينما يبدو الأمر وكأنه طعم للنقر، فإن الحقيقة غير المريحة هي أن الذكاء الاصطناعي يدفع البنية التحتية للذاكرة العالمية أقرب إلى حدودها أكثر مما يدركه معظم الناس. الذكاء الاصطناعي لم يعد مفهومًا مستقبليًا، بل هو تحدٍ للبنية التحتية في الوقت الحاضر. مع توسع نماذج اللغة الكبيرة (LLMs) وأنظمة الذكاء الاصطناعي التوليدية والوكلاء المستقلين ومنصات التحليلات في الوقت الفعلي بسرعة غير مسبوقة، يصبح أحد مكونات الأجهزة الحرجة بهدوء عنق الزجاجة في العصر الرقمي: ذاكرة الوصول العشوائي (RAM).

هل سينفد العالم من الذاكرة العشوائية؟ كيف يسبب الذكاء الاصطناعي نقصًا عالميًا في الذاكرة

"العالم ينفد من ذاكرة الوصول العشوائي"، هذا هو الادعاء وراء آلاف مقاطع فيديو تيك توك الفيروسية، وبينما يبدو الأمر وكأنه طعم للنقرات، فإن الحقيقة غير المريحة هي أن الذكاء الاصطناعي يدفع البنية التحتية للذاكرة العالمية إلى حدودها أكثر مما يدركه معظم الناس. لم يعد الذكاء الاصطناعي (AI) مفهومًا مستقبليًا، بل هو تحدٍ للبنية التحتية في الوقت الحاضر. مع توسع النماذج اللغوية الكبيرة (LLMs) وأنظمة الذكاء الاصطناعي التوليدية والوكلاء المستقلين ومنصات التحليلات في الوقت الفعلي بسرعة غير مسبوقة، يصبح أحد المكونات المادية الحرجة بهدوء عنق الزجاجة في العصر الرقمي: ذاكرة الوصول العشوائي (RAM).

عدد متزايد من الخبراء يطرح سؤالًا استفزازيًا:

هل سيكون هناك ما يكفي من ذاكرة الوصول العشوائي في العالم لدعم ثورة الذكاء الاصطناعي؟

تستكشف هذه المقالة سبب دفع الذكاء الاصطناعي لطلب متفجر على الذاكرة، وكيف يمكن أن يؤدي ذلك إلى نقص عالمي في ذاكرة الوصول العشوائي، وما يعنيه ذلك لمزودي السحابة والشركات والمستهلكين، وكيف يمكن للصناعة التكيف.

لماذا ذاكرة الوصول العشوائي (RAM) تهم أكثر من أي وقت مضى

ذاكرة الوصول العشوائي هي ذاكرة العمل للكمبيوتر. على عكس التخزين (SSD أو HDD)، تحدد ذاكرة الوصول العشوائي:

  • مقدار البيانات التي يمكن معالجتها في وقت واحد
  • سرعة استجابة النماذج
  • ما إذا كانت التطبيقات يمكن أن تتوسع في الوقت الفعلي

على مدى عقود، كانت سرعة وحدة المعالجة المركزية هي المقياس الرئيسي للأداء. اليوم، خاصة في أنظمة الذكاء الاصطناعي، غالبًا ما تكون سعة الذاكرة وعرض النطاق الترددي أكثر أهمية من قوة الحوسبة الخام.

في الذكاء الاصطناعي، إذا لم يكن لديك ما يكفي من ذاكرة الوصول العشوائي، فلن يتمكن نموذجك ببساطة من العمل.

أعباء عمل الذكاء الاصطناعي مقابل الحوسبة التقليدية

التطبيقات التقليدية:

  • خوادم الويب
  • قواعد البيانات
  • برامج المكتب
  • أنظمة تخطيط موارد المؤسسات (ERP)

هذه الأعباء:

  • تعالج قطع بيانات صغيرة نسبيًا
  • تعتمد على إدخال/إخراج القرص
  • يمكنها تحمل التأخير

أعباء عمل الذكاء الاصطناعي، على النقيض من ذلك:

  • تحميل النماذج بالكامل في الذاكرة
  • تتطلب موازاة ضخمة
  • تعمل باستمرار
  • تحتاج إلى ذاكرة بشكل كبير

الفرق الرئيسي:

البرمجيات التقليدية تتوسع مع وحدة المعالجة المركزية. الذكاء الاصطناعي يتوسع مع ذاكرة الوصول العشوائي.

الانفجار في الذاكرة الناجم عن النماذج اللغوية الكبيرة

لنلقِ نظرة على نماذج الذكاء الاصطناعي الحديثة:

النموذج المعلمات الذاكرة المطلوبة (الاستدلال)
GPT-3 175 مليار ~350–700 جيجابايت
نماذج فئة GPT-4 تريليونات (تقديريًا) عدة تيرابايت
نماذج LLM مفتوحة المصدر (70B) 70 مليار 140–280 جيجابايت

هذا لكل مثيل.

الآن قم بضرب هذا في:

  • آلاف المستخدمين المتزامنين
  • متطلبات التكرار
  • مجموعات التوافر العالي
  • عمليات النشر على الحافة

فجأة، تصبح التيرابايت من ذاكرة الوصول العشوائي لكل خدمة أمرًا طبيعيًا.

التدريب مقابل الاستدلال: أزمتان مختلفتان للذاكرة

تدريب الذكاء الاصطناعي

يتطلب تدريب النماذج:

  • مجموعات ضخمة من وحدات معالجة الرسومات
  • ذاكرة ذات عرض نطاق ترددي عالي للغاية (HBM)
  • وصول متزامن للذاكرة

يمكن أن يستهلك تشغيل تدريب واحد:

  • بيتابايت من الذاكرة بمرور الوقت
  • عشرات الآلاف من وحدات معالجة الرسومات

استدلال الذكاء الاصطناعي

يخلق الاستدلال (تقديم النماذج للمستخدمين) مشكلة مختلفة:

  • استخدام الذاكرة المستمر
  • نماذج تعمل دائمًا
  • التوسع الأفقي

هذا يؤدي إلى احتلال دائم لذاكرة الوصول العشوائي، وليس ارتفاعات مؤقتة.

لماذا قانون مور لم يعد ينقذنا؟

توقع قانون مور نموًا أسيًا في كثافة الترانزستور. ومع ذلك:

  • نمو كثافة ذاكرة الوصول العشوائي يتباطأ
  • تحسينات تأخير الذاكرة ضئيلة
  • استهلاك الطاقة لكل جيجابايت يرتفع
  • تعقيد التصنيع يزداد

في الوقت نفسه، ينمو حجم نماذج الذكاء الاصطناعي أسرع من تحسينات الأجهزة. الطلب على الذكاء الاصطناعي أسي. العرض من ذاكرة الوصول العشوائي خطي. هذا التفاوت هو جوهر النقص القادم.

قيود الإمداد العالمي للذاكرة

مصنعون محدودون

يسيطر على سوق ذاكرة الوصول العشوائي العالمي:

  • سامسونغ
  • SK Hynix
  • ميكرون

هذا يخلق:

  • هشاشة في سلسلة التوريد
  • تقلب في الأسعار
  • مخاطر جيوسياسية

طلب متنافس

تحتاج ذاكرة الوصول العشوائي من:

  • الهواتف الذكية
  • أجهزة الكمبيوتر
  • الخوادم
  • أنظمة السيارات
  • أجهزة إنترنت الأشياء
  • مسرعات الذكاء الاصطناعي

الذكاء الاصطناعي لا يحل محل هذه الطلبات. إنه يضيف إليها.

مزودو السحابة وسباق التسلح في الذاكرة

مزودو السحابة الرئيسيون يتفاعلون بالفعل:

  • مثيلات محسنة للذاكرة (1–24 تيرابايت من الذاكرة)
  • سيليكون مخصص
  • تكامل عمودي
  • معماريات ذاكرة خاصة

لكن حتى مقدمي الخدمات الضخمة يواجهون حدودًا:

  • قيود الطاقة في مراكز البيانات
  • تحديات التبريد
  • ارتفاع التكاليف لكل جيجابايت

الشركات الصغيرة والشركات الناشئة تتعرض بشكل متزايد للتسعير خارج البنية التحتية ذات الذاكرة العالية.

دور مزودي البنية التحتية السحابية في عصر الذكاء الاصطناعي المقيد بالذاكرة

مع تسارع الطلب العالمي على ذاكرة الوصول العشوائي بسبب أعباء عمل الذكاء الاصطناعي، تصبح أهمية البنية التحتية السحابية القوية والمرنة أكثر أهمية من أي وقت مضى. في حين لا يمكن لأي مزود واحد القضاء على القيود الفيزيائية لتصنيع الذاكرة، تلعب منصات البنية التحتية دورًا حاسمًا في كيفية تخصيص الذاكرة وتوسيعها واستخدامها بكفاءة.

PlusClouds تعمل بدقة في هذا التقاطع. بدلاً من وضع نفسها كمنصة ذكاء اصطناعي ذات غرض واحد، توفر PlusClouds أساس بنية تحتية سحابية موثوقة وقابلة للتوسع، بما في ذلك الحوسبة والتخزين والشبكات والأمان والرصد والتوافر العالي، مما يمكن المنظمات من تشغيل أعباء عمل الذكاء الاصطناعي الحديثة بشكل أكثر كفاءة. في عالم نادر فيه الذاكرة ومكلفة، تهم القرارات المعمارية بقدر ما تهم السعة المادية الخام. بالنسبة للفرق التي تتطلب تحكمًا أعمق، تقدم PlusClouds أيضًا تكوينات خادم قابلة للتعديل، مما يسمح بتخصيص الذاكرة والحوسبة وملفات تعريف الموارد لخصائص عبء العمل المحددة بدلاً من فرض نموذج واحد يناسب الجميع.

من خلال تصميم بيئات تدعم:

  • توزيع عبء العمل بكفاءة في استخدام الذاكرة

  • معماريات التوافر العالي دون تكرار الذاكرة غير الضروري

  • التوسع المرن للاستدلال الذكاء الاصطناعي والتطبيقات كثيفة البيانات

تساعد PlusClouds الفرق على التركيز على تحسين كيفية استخدام الذاكرة، وليس فقط مقدار الذاكرة المستهلكة. يصبح هذا النهج ذا قيمة متزايدة مع انتقال الأنظمة المدفوعة بالذكاء الاصطناعي من المشاريع التجريبية إلى الخدمات الإنتاجية طويلة الأمد حيث يكون لكل جيجابايت من الذاكرة تكلفة قابلة للقياس.

مع انتقال نظام الذكاء الاصطناعي البيئي نحو مستقبل يعرف بقيود الذاكرة بدلاً من وفرة الحوسبة، سيكون مقدمو البنية التحتية الذين يعطون الأولوية للكفاءة والشفافية والحرية المعمارية شركاء أساسيين. إذا كنت ترغب في استكشاف هذه التحديات بشكل أعمق والحصول على إجابات مدروسة للأسئلة المعقدة حول البنية التحتية مثل هذه، انضم إلى مجتمعنا وكن جزءًا من المحادثة.

التأثير الاقتصادي والبيئي

ارتفاع التكاليف

  • ترتفع أسعار الذاكرة أثناء النقص
  • تصبح خدمات الذكاء الاصطناعي أكثر تكلفة
  • يتباطأ الابتكار بالنسبة للاعبين الصغار

استهلاك الطاقة

تستهلك الذاكرة الطاقة حتى عندما تكون خاملة:

  • نماذج الاستدلال التي تعمل دائمًا
  • بصمات الذاكرة المستمرة
  • تكاليف التبريد

التكلفة البيئية للذكاء الاصطناعي أصبحت بشكل متزايد مشكلة ذاكرة، وليس مشكلة حوسبة.

الحلول المحتملة لنقص الذاكرة

1. تحسين النموذج

  • التكميم
  • التقليم
  • الهياكل المتفرقة
  • مزيج من الخبراء (MoE)

2. ابتكار في تسلسل الذاكرة

  • CXL (رابط التعبير الحاسوبي)
  • الذاكرة المفككة
  • تجمعات الذاكرة الموحدة بين وحدة المعالجة المركزية ووحدة معالجة الرسومات

3. الكفاءة على مستوى البرمجيات

  • استراتيجيات التخزين المؤقت الأفضل
  • الاستدلال المتدفق
  • الهياكل عديمة الحالة

4. الذكاء الاصطناعي المتخصص والحدودي

  • نماذج أصغر ومحددة المهام
  • الاستدلال على الجهاز
  • تقليل الضغط على الذاكرة المركزية

لا يحل أي من هذه الحلول المشكلة بالكامل، بل يؤجلها فقط.

ما يعنيه هذا لمستقبل الذكاء الاصطناعي

في عالم مقيد بالذاكرة:

  • النماذج الأكبر تفوز
  • يزداد تركيز رأس المال
  • يصبح الذكاء الاصطناعي بنية تحتية، وليس برمجيات
  • تصبح كفاءة الذاكرة ميزة تنافسية

قد تأتي الاختراقات المستقبلية ليس من النماذج الأكبر، بل من الاستخدام الأذكى للذاكرة.

الخاتمة: عالم مقيد بالذاكرة

السؤال لم يعد ما إذا كان الذكاء الاصطناعي سيضغط على إمدادات الذاكرة العالمية.

السؤال هو كم من الوقت سيستغرق ذلك.

الذكاء الاصطناعي يغير بشكل جذري اقتصاديات الحوسبة. مع نمو النماذج بشكل أكبر وأكثر انتشارًا، تصبح الذاكرة هي النفط الجديد، مورد نادر واستراتيجي يحدد من يمكنه الابتكار ومن لا يستطيع.

لن تقتصر ثورة الذكاء الاصطناعي على الأفكار. ستكون محدودة بالذاكرة.

#ذاكرة الوصول العشوائي، نقص ذاكرة الوصول العشوائي، الذكاء الاصطناعي، الذكاء الاصطناعي

Sıkça Sorulan Sorular

لماذا تهم ذاكرة الوصول العشوائي RAM في عصر الذكاء الاصطناعي أكثر من أي وقت مضى؟

ذاكرة الوصول العشوائي هي ذاكرة العمل للكمبيوتر وتحدد مقدار البيانات التي يمكن معالجتها في وقت واحد وسرعة استجابة النماذج وتوسع التطبيقات في الوقت الفعلي. في الذكاء الاصطناعي، إذا لم يكن لديك ما يكفي من RAM، فلن يتمكن نموذجك ببساطة من العمل.

ما الفرق بين أعباء عمل الذكاء الاصطناعي وأعباء الحوسبة التقليدية فيما يخص الذاكرة؟

أعباء الحوسبة التقليدية تتعامل مع قطع بيانات صغيرة وتتحمل التأخير وتستند إلى إدخال/إخراج التخزين. بعكس ذلك، أعباء الذكاء الاصطناعي تتطلب تحميل النم models كاملة في الذاكرة وتوازي ضخماً وتعمل باستمرار وتستهلك ذاكرة كبيرة.

كيف يؤدي النمو الكبير في النماذج اللغوية الكبيرة إلى ارتفاع الطلب على RAM وهل سيؤدي ذلك إلى نقص RAM عالمي؟

نماذج مثل GPT-3 تحتاج حوالي 350–700 جيجابايت للاستدلال، ونماذج GPT-4 من فئة التريليونات تحتاج عدة تيرابايت لكل مثيل. ومع وجود آلاف المستخدمين المتزامنين وتكرار وتوزيع عالٍ، تصبح التيرابايت من RAM لكل خدمة أمراً طبيعياً.

ما الفرق بين التدريب والاستدلال من حيث احتياج RAM؟

التدريب يتطلب مجموعات ضخمة من وحدات معالجة الرسومات وذاكرة ذات عرض نطاق ترددي عالٍ ووصولاً متزامناً للذاكرة، ويمكنه استهلاك بيتابايت من الذاكرة بمرور الوقت. أما الاستدلال فيستهلك RAM بشكل مستمر بسبب تشغيل النماذج دائماً وتوسعها الأفقي.

لماذا لم يعد قانون مور يساعدنا في مشكلة RAM؟

يتباطأ نمو كثافة ذاكرة الوصول العشوائي وتحسينات تأخير الذاكرة ضئيلة وتزداد استهلاك الطاقة لكل جيجابايت وتزداد تعقيدات التصنيع. في المقابل، نمو حجم نماذج الذكاء الاصطناعي أسرع من تحسينات الأجهزة، فالعرض من RAM خطي بينما الطلب أسي.

ما هي قيود الإمداد العالمي لذاكرة RAM وأثرها على السوق؟

المصنعون الرئيسيون محصورون: Samsung وSK Hynix وMicron، ما يخلق هشاشة في سلسلة التوريد وتقلباً في الأسعار ومخاطر جيوسياسية. الطلب يأتي من الهواتف الذكية وأجهزة الكمبيوتر والخوادم وأنظمة السيارات وأجهزة IoT ومسرعات AI، والذكاء الاصطناعي لا يحل محل هذه الطلبات بل يضيف إليها.

ما الدور الذي يلعبه مزودو البنية التحتية السحابية في عصر الذكاء الاصطناعي المقيد بالذاكرة؟

مزودو السحابة يقدمون مثيلات محسنة للذاكرة وتراكيب سيليكون مخصص وتكامل عمودي ومعماريات ذاكرة خاصة، لكنها تواجه قيود الطاقة والتبريد وتكاليف لكل جيجابايت. هذا يجعل الشركات الصغيرة والشركات الناشئة تتأثر بتسعير عالي في بيئة ذاكرة مكلفة.

ما هي الحلول المحتملة لنقص RAM؟

تشمل الحلول تحسين النماذج عبر التكميم والتقليم وهياكل MoE، وابتكار في تسلسل الذاكرة كـ CXL والذاكرة المفككة وتجمعات الذاكرة الموحدة، بالإضافة إلى تحسين الكفاءة البرمجية من خلال التخزين المؤقت الأفضل والاستدلال المتدفق والهياكل عديمة الحالة، مع الاعتماد على الذكاء الاصطناعي على الحافة.