ميلانوكس (NVIDIA Mellanox) 920-9B110-00FH-0D0 في العمل: تحسين الاتصالات المتبادلة منخفضة التأخير لمجموعات RDMA / HPC / AI

April 14, 2026

آخر أخبار الشركة ميلانوكس (NVIDIA Mellanox) 920-9B110-00FH-0D0 في العمل: تحسين الاتصالات المتبادلة منخفضة التأخير لمجموعات RDMA / HPC / AI

في عصر تدريب نماذج الذكاء الاصطناعي على نطاق واسع و HPC على نطاق واسع ، ظهرت فترة تأخير الشبكة كأكثر الحواجز حرجة الحد من قابلية التوسع في المجموعات الخطية. معالجة هذا التحدي بشكل مباشر,الـميلانوكس (NVIDIA Mellanox) 920-9B110-00FH-0D0يغير InfiniBand Switch كيفية تصميم مؤسسات البحث ومختبرات الذكاء الاصطناعي للمؤسسات لأقمشاتها عالية الأداء.920-9B110-00FH-0D0يوفر تأخيرًا محددًا منخفضًا للغاية لحملات العمل كثيفة RDMA.

الخلفية والتحدي: جدار الاتصالات في مجموعة الذكاء الاصطناعي

منشأة أبحاث الذكاء الاصطناعي متوسطة الحجم كانت تكافح مع وقت التوقف من GPU خلال التدريب الموزع عبر 64 عقدةتسبب عمليات التواصل الجماعي، جميعها) لتستغرق ما يصل إلى 40٪ من إجمالي وقت التدريب. احتاج مهندسو الشبكات إلى حل لا يخسر، عالية الصلبة القادرة على التوسع إلى 200 جيجابايت / ثانية لكل منفذ مع الحفاظ على تأخير أقل من ميكرو ثانية..بعد تقييم الخيارات المتاحة، اختار الفريق920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDRككتلة بناء أساسية لطوبولوجيتهم الجديدة

الحل والتنفيذ: تنفيذ نسيج InfiniBand

وتركزت عملية النشر حولNVIDIA Mellanox 920-9B110-00FH-0D0المفاتيح التي تم تكوينها في بنية شجرة الدهون ذات المستويين. تم تجهيز كل عقدة حساب مع محولات HDR ConnectX-6 ، والتي تتصل بمفاتيح الورق عبر كابلات النحاس السلبية.الخطوات الرئيسية للتنفيذ:

  • بديل RDMA عبر Ethernet المتقارب (RoCE):النطاق الاصلي من InfiniBand مع التحكم في الازدحام القائم على الأجهزة القضاء على قطرات الحزم بالكامل.
  • التوجيه التكيفي:الـ920-9B110-00FH-0D0 حل InfiniBand switch OPNتمكن من موازنة الحمل الديناميكية عبر مسارات متعددة ، مما يمنع تشكيل النقاط الساخنة.
  • إدارة الأقمشة:باستخدام Subnet Manager (OpenSM) معمواصفات 920-9B110-00FH-0D0تأكيد دعم ما يصل إلى 2000 عقدة في نسيج واحد.

قبل المشتريات، قام المهندسون بمراجعةورقة بيانات 920-9B110-00FH-0D0للتحقق من التوافق مع البصريات القائمة.920-9B110-00FH-0D0 متوافقةويشمل نظام البيئة جميع مجموعات الكابلات الرئيسية HDR، وتبسيط فاتورة المواد.920-9B110-00FH-0D0 السعروقد أثبتت قدرتها على المنافسة ضد مفاتيح HDR البديلة، وكانت الوحدات متوفرة بسهولة (920-9B110-00FH-0D0 للبيع) من خلال شركاء قناة NVIDIA.

النتائج والفوائد: مكاسب أداء قابلة للقياس

أظهرت القياسات بعد النشر تحسناً كبيراً في ثلاثة مقاييس رئيسية:

متري قبل (100GbE) بعد (920-9B110-00FH-0D0 HDR) تحسين
معدل تأخير الحد الكامل (64 عقدة) 340μs 78μs انخفاض بنسبة 77%
وقت العمل العاطل لـ GPU (مصاريف الاتصال) 38% 11% 27٪ ربح مطلق
الاستخدام الفعال لنطاق النطاق الترددي للأنسجة 62% 94% +32%

وبالإضافة إلى الأرقام الخام،920-9B110-00FH-0D0 InfiniBand switch OPNمكنت الفريق من التوسع من 64 إلى 256 عقدة دون إعادة تصميم النسيج.أثبتت فترة تأخير الحتمية التي توفرها نظام التحكم في تدفق InfiniBand القائم على الائتمان ضرورة للحفاظ على اتساق التدريب عبر مئات وحدات المعالجة الفوريةالمهندسين أيضا استفادوا من920-9B110-00FH-0D0إشعار الازدحام القائم على الأجهزة لتحديد وتصحيح الانفجارات الصغيرة في الوقت الحقيقي.

ملخص وتوقعات: مستقبل ربطات الذكاء الاصطناعي

النشر يؤكد أنNVIDIA Mellanox 920-9B110-00FH-0D0بمثابة عنصر أساسي لجيل القادم من مجموعات الذكاء الاصطناعي و HPC.يمكن للمنظمات استرداد ما يصل إلى 30٪ من الحوسبة GPU التي تضيع في السابق على أكشاك الاتصالاتبالنسبة للمهندسين المعماريين الذين يخططون للبنية التحتية الجديدة للذكاء الاصطناعي،ورقة بيانات 920-9B110-00FH-0D0يوفر إرشادات مفصلة حول الطوبولوجيات التي تتراوح من مجموعات DGX الصغيرة إلى عمليات نشر على نطاق الحوسبة الفائقة.

مع تطور أحمال العمل نحو موازنة نموذج أكبر وكثافة GPU أعلى،920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDRيقدم مسارًا واضحًا للتحديث إلى الأقمشة المستقبلية 400Gb / s من خلال تصميمها المتوافق مع التطورات.920-9B110-00FH-0D0 السعرضد مكاسب الكفاءة التشغيلية أو التحقق920-9B110-00FH-0D0 متوافقةخيارات الكابلات، هذا المفتاح InfiniBand يوفر ROI قابلة للقياس للمؤسسات التي تعمل بالبيانات.