Mellanox AI تحليل بنية شبكة التدريب النموذجي الكبير
October 13, 2025
سانتا كلارا، كاليفورنيا. – مع تزايد نماذج الذكاء الاصطناعي في الحجم والتعقيد بشكل كبير، أصبحت معماريات الشبكات التقليدية هي عنق الزجاجة الأساسي في لـ . تعالج تقنية بالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية من NVIDIA هذه المشكلة بشكل مباشر، حيث توفر شبكات معالجة الرسومات عالية الأداء والبنية التحتية اللازمة لتدريب نماذج الأساس في المستقبل دون قيود على الاتصال.
لقد غير التطور من ملايين إلى تريليونات المعلمات في نماذج الأساس بشكل أساسي متطلبات البنية التحتية للتدريب. في حين أن الحساب كان في يوم من الأيام هو العامل المحدد، فإن مهام لـ المتوازية الضخمة اليوم مقيدة بالقدرة على مزامنة التدرجات والمعلمات عبر آلاف معالجات الرسومات. تقدم شبكات الإيثرنت القياسية قيودًا كبيرة على زمن الوصول والنطاق الترددي يمكن أن تقلل من الكفاءة الإجمالية للمجموعة إلى أقل من 50٪ لمهام التدريب واسعة النطاق، مما يجعل حلول شبكات معالجة الرسومات المتقدمة ليست مفيدة فحسب، بل ضرورية أيضًا.
بالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand
- العديد من المزايا الهامة التي تجعلها مثالية لبيئات تدريب الذكاء الاصطناعي واسعة النطاق:زمن وصول منخفض للغاية:
- مع زمن وصول شامل يقل عن 600 نانوثانية، تقلل InfiniBand من عبء الاتصال الذي يزعج التدريب الموزع، مما يضمن أن معالجات الرسومات تقضي وقتًا أطول في الحساب ووقتًا أقل في الانتظار.كثافة نطاق ترددي عالية:
- يوفر NDR 400G InfiniBand نطاقًا تردديًا يبلغ 400 جيجابت في الثانية لكل منفذ، مما يتيح تبادل البيانات بسلاسة بين معالجات الرسومات وتقليل أوقات عمليات التجميع بنسبة تصل إلى 70٪ مقارنة ببدائل الإيثرنت.الحوسبة داخل الشبكة:
- تقوم تقنية بروتوكول التجميع والتقليل الهرمي القابل للتطوير (SHARP) بإجراء عمليات التجميع داخل محولات الشبكة، مما يقلل بشكل كبير من حجم البيانات المنقولة بين العقد وتسريع العمليات الجماعية.التوجيه التكيفي:
التأثير الكمي على الأداء على كفاءة التدريب
| يصبح الفرق في الأداء بين InfiniBand والتقنيات البديلة مهمًا بشكل متزايد مع زيادة حجم النموذج ومقياس المجموعة. يوضح الجدول التالي مقاييس الأداء المقارنة لتدريب نموذج بمعلمات 100 مليار على مجموعة مكونة من 512 معالج رسومات: | مقياس الأداء | Mellanox NDR InfiniBand | 400G Ethernet مع RoCE |
|---|---|---|---|
| التحسين | وقت عملية التجميع | 85 مللي ثانية | 210 مللي ثانية |
| أسرع بنسبة 59% | كفاءة المجموعة | 92% | 64% |
| زيادة في الاستخدام بنسبة 28% | وقت التدريب (اكتمال 90%) | 14.2 يومًا | 21.8 يومًا |
| تخفيض بنسبة 35% | كفاءة الطاقة (PFLOPS/Watt) | 18.4 | 12.1 |
النشر في العالم الحقيقي: مؤسسات أبحاث الذكاء الاصطناعي الرائدةبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand لـ تدريب نماذج الذكاء الاصطناعي
إثبات البنية التحتية للذكاء الاصطناعي للمستقبلبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand
الخلاصة: الشبكات كاستثمار استراتيجي في مجال الذكاء الاصطناعيبالنسبة للمؤسسات الجادة بشأن تطوير حالة الذكاء الاصطناعي، فإن الاستثمار في البنية التحتية للشبكة المناسبة لا يقل أهمية عن اختيار معالجات الرسومات المناسبة. توفر معمارية Mellanox InfiniBand

