Mellanox AI تحليل بنية شبكة التدريب النموذجي الكبير

October 13, 2025

آخر أخبار الشركة Mellanox AI تحليل بنية شبكة التدريب النموذجي الكبير
إحداث ثورة في تدريب نماذج الذكاء الاصطناعي: معمارية شبكة Mellanox InfiniBand لمجموعات معالجة الرسومات واسعة النطاق

سانتا كلارا، كاليفورنيا. – مع تزايد نماذج الذكاء الاصطناعي في الحجم والتعقيد بشكل كبير، أصبحت معماريات الشبكات التقليدية هي عنق الزجاجة الأساسي في لـ . تعالج تقنية بالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية من NVIDIA هذه المشكلة بشكل مباشر، حيث توفر شبكات معالجة الرسومات عالية الأداء والبنية التحتية اللازمة لتدريب نماذج الأساس في المستقبل دون قيود على الاتصال.

عنق الزجاجة في الشبكة في تدريب الذكاء الاصطناعي الحديث

لقد غير التطور من ملايين إلى تريليونات المعلمات في نماذج الأساس بشكل أساسي متطلبات البنية التحتية للتدريب. في حين أن الحساب كان في يوم من الأيام هو العامل المحدد، فإن مهام لـ المتوازية الضخمة اليوم مقيدة بالقدرة على مزامنة التدرجات والمعلمات عبر آلاف معالجات الرسومات. تقدم شبكات الإيثرنت القياسية قيودًا كبيرة على زمن الوصول والنطاق الترددي يمكن أن تقلل من الكفاءة الإجمالية للمجموعة إلى أقل من 50٪ لمهام التدريب واسعة النطاق، مما يجعل حلول شبكات معالجة الرسومات المتقدمة ليست مفيدة فحسب، بل ضرورية أيضًا.

Mellanox InfiniBand: مزايا معمارية لمهام عمل الذكاء الاصطناعي

بالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand

  • العديد من المزايا الهامة التي تجعلها مثالية لبيئات تدريب الذكاء الاصطناعي واسعة النطاق:زمن وصول منخفض للغاية:
  • مع زمن وصول شامل يقل عن 600 نانوثانية، تقلل InfiniBand من عبء الاتصال الذي يزعج التدريب الموزع، مما يضمن أن معالجات الرسومات تقضي وقتًا أطول في الحساب ووقتًا أقل في الانتظار.كثافة نطاق ترددي عالية:
  • يوفر NDR 400G InfiniBand نطاقًا تردديًا يبلغ 400 جيجابت في الثانية لكل منفذ، مما يتيح تبادل البيانات بسلاسة بين معالجات الرسومات وتقليل أوقات عمليات التجميع بنسبة تصل إلى 70٪ مقارنة ببدائل الإيثرنت.الحوسبة داخل الشبكة:
  • تقوم تقنية بروتوكول التجميع والتقليل الهرمي القابل للتطوير (SHARP) بإجراء عمليات التجميع داخل محولات الشبكة، مما يقلل بشكل كبير من حجم البيانات المنقولة بين العقد وتسريع العمليات الجماعية.التوجيه التكيفي:
يضمن تحديد المسار الديناميكي الاستخدام الأمثل للنطاق الترددي المتاح ويمنع ازدحام الشبكة، مما يحافظ على أداء ثابت حتى خلال فترات ذروة الاتصال.

التأثير الكمي على الأداء على كفاءة التدريب

يصبح الفرق في الأداء بين InfiniBand والتقنيات البديلة مهمًا بشكل متزايد مع زيادة حجم النموذج ومقياس المجموعة. يوضح الجدول التالي مقاييس الأداء المقارنة لتدريب نموذج بمعلمات 100 مليار على مجموعة مكونة من 512 معالج رسومات: مقياس الأداء Mellanox NDR InfiniBand 400G Ethernet مع RoCE
التحسين وقت عملية التجميع 85 مللي ثانية 210 مللي ثانية
أسرع بنسبة 59% كفاءة المجموعة 92% 64%
زيادة في الاستخدام بنسبة 28% وقت التدريب (اكتمال 90%) 14.2 يومًا 21.8 يومًا
تخفيض بنسبة 35% كفاءة الطاقة (PFLOPS/Watt) 18.4 12.1
تحسين بنسبة 52%

النشر في العالم الحقيقي: مؤسسات أبحاث الذكاء الاصطناعي الرائدةبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand لـ تدريب نماذج الذكاء الاصطناعي

من خلال اعتمادها في مؤسسات أبحاث الذكاء الاصطناعي الرائدة ومقدمي الخدمات السحابية. أعلنت شركات التكنولوجيا الكبرى عن تحقيق كفاءة قياس تزيد عن 90٪ عند تدريب نماذج اللغات الكبيرة على مجموعات تتجاوز 10000 معالج رسومات متصلة بتقنية InfiniBand. يتيح هذا المستوى من الأداء للباحثين التكرار بسرعة أكبر وتدريب نماذج أكبر مما كان ممكنًا في السابق، مما يسرع وتيرة الابتكار في مجال الذكاء الاصطناعي.

إثبات البنية التحتية للذكاء الاصطناعي للمستقبلبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand

بالفعل لدعم 800G وما بعده، مما يضمن أن البنية التحتية للشبكة لن تصبح العامل المحدد في التطورات المستقبلية في مجال الذكاء الاصطناعي. يوفر الدعم المتأصل للمعمارية للحوسبة داخل الشبكة أيضًا مسارًا لمزيد من الترحيل المتطور للعمليات الجماعية في المستقبل.

الخلاصة: الشبكات كاستثمار استراتيجي في مجال الذكاء الاصطناعيبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand