ورقة بيضاء تقنية من Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0: تحسين الربط البيني بزمن انتقال منخفض

April 14, 2026

ورقة بيضاء تقنية من Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0: تحسين الربط البيني بزمن انتقال منخفض

هذا الكتاب الأبيض التقني يستهدف مهندسي الشبكات، ومهندسي ما قبل المبيعات، ومدراء العمليات، وتوفير حل شامل يركز علىميلانوكس (NVIDIA Mellanox) 920-9B110-00FH-0D0نقوم بفحص كيفية تمكين هذه المنصة من تأخير محدد منخفض للغاية لحملات العمل كثيفة RDMA في بيئات تجمعات الحوسبة العالية والذكاء الاصطناعي

1خلفية المشروع وتحليل المتطلبات

تعتمد إطارات تدريب الذكاء الاصطناعي الحديثة (PyTorch DDP ، DeepSpeed ، Megatron) و رموز محاكاة HPC (CFD ، نمذجة الطقس ، الديناميكا الجزيئية) بشكل كبير على بدائيات الاتصال الجماعي.نسيج Ethernet التقليدي يقدم ثلاثة مشاكل أساسية: فقدان الحزم بسبب الازدحام المتكرر ، والفترة الاحتياطية المتغيرة من التبديل التخزين والإعادة ، وارتفاع تكاليف وحدة المعالجة المركزية من معالجة كومة TCP / IP.هذه القضايا تسبب أوقات فترة التوقف من GPU من 30~50% في التدريب الموزع على نطاق واسع، مما يؤدي مباشرة إلى زيادة وقت الحل وزيادة تكاليف التشغيل.

الـ920-9B110-00FH-0D0تلبي هذه التحديات من خلال تقنية InfiniBand الأصلية ، وتقدم RDMA القائمة على الأجهزة ، والتحويل المباشر ، والتحكم في التدفق القائم على الائتمان.حالات الاستخدام المستهدفة تشمل مختبرات أبحاث الذكاء الاصطناعي التي تدير 64،024 مجموعات معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة مع

2تصميم بنية الشبكة بشكل عام

تعتمد هندستنا الموصى بها على توبولوجيا شجرة الدهون ذات المستويين (Clos مطوية) ، والتي توازن بين عرض النطاق الترددي للقطعة الثانية والتكلفة والقدرة على التوسع. تفترض معايير التصميم ما يصل إلى 512 عقدة حاسوبية ،كل منها مجهز بمحولات HDR ConnectX-6 مزدوجة الموانئ.

المستوى الجهاز تكوين الميناء كمية (512 عقدة)
أوراق 920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR 40x HDR إلى أسفل + 8x HDR إلى أعلى 16 وحدة
العمود الفقري NVIDIA Mellanox 920-9B110-00FH-0D0 40x HDR (منخفضة فقط) 8 وحدات

يوفر هذا التكوين عرض النطاق الترددي الكامل لـ 200 جيجابايت / ثانية لكل عقدة ، وأداء غير محظور لنماذج الاتصالات من كل شيء إلى كل شيء ، وتأخير يصل إلى 130ns لكل قفزة (قطع).920-9B110-00FH-0D0 حل InfiniBand switch OPNيدعم كل من SKUs القياسية والخاصة ، مما يسمح بتكوينات اختراق الموانئ المرنة (على سبيل المثال ، 4x 50Gb / s لكل منفذ HDR).

3الدور والخصائص الرئيسية من 920-9B110-00FH-0D0

ضمن الهندسة المعمارية المقترحة،NVIDIA Mellanox 920-9B110-00FH-0D0بمثابة عنصر نسيج موحد في كل من طبقات الأوراق والعمود الفقري. وتشمل المميزات التقنية الرئيسية:

  • RDMA القائم على الأجهزة:يتجاوز النواة و وحدة المعالجة المركزية بالكامل ، مما يتيح نقل الذاكرة إلى الذاكرة بمعدل خط مع تأخير < 1μs.
  • التوجيه التكيفي (AR):يقوم بإعادة توجيه الحزم بشكل ديناميكي بناءً على ازدحام الموانئ في الوقت الحقيقي ، وتوزيع حركة المرور عبر جميع المسارات المتاحة دون إعادة ترتيب الحزم.
  • مراقبة الازدحام:آليات الإخطار على مستوى الأجهزة والضغط تمنع حجب رأس الخط، كما هو مفصل فيورقة بيانات 920-9B110-00FH-0D0.
  • تقييم عن بعد حاد:توفر شاشات الأجهزة المتكاملة احتلال العازل لكل منفذ ، والبطء ، ومعدي الأخطاء للإدارة الاستباقية.

المهندسين تقييم المشتريات يجب أن تراجع كاملمواصفات 920-9B110-00FH-0D0، والتي تؤكد دعم ما يصل إلى 40 منفذ HDR (200Gb / s لكل منهما) في عامل شكل 1U ، مع استهلاك الطاقة أقل من 300W نموذجيا.920-9B110-00FH-0D0 متوافقةيتضمن النظام البيئي جميع الوحدات البصرية HDR القياسية (QSFP56) وكابلات النحاس السلبية تصل إلى 5 أمتار.

4توصيات النشر والتوسع

لنشر الأولية، نوصي نهج مرحلي:

  • المرحلة 1 (التجريبية 32 عقدة):نشر مفتاح ورقة واحد (920-9B110-00FH-0D0) في تكوين مفتاح واحد. التحقق من صحة أداء RDMA باستخدام مقاييس ib_write_bw و MPI. الرجوع إلى920-9B110-00FH-0D0 للبيعالوضع لضمان مواعيد التنفيذ تتوافق مع مراحل المشروع.
  • المرحلة الثانية (الإنتاج 128 عقدة):تنفيذ شجرة الدهون الكاملة مع 4 أوراق + 2 مفاتيح العمود الفقري. تمكين التوجيه التكيفي والتحكم في الازدحام. تشغيل اختبارات الإجهاد الممتدة مع اختبارات NCCL (جميع الحد ، وجميع).
  • المرحلة الثالثة (توسيع نطاق 512+ عقدة):توسيع إلى 16 صفحة + 8 مفاتيح العمود الفقري. النظر في الترقية إلى بنية متعددة الأقمشة (شبكات الحوسبة / التخزين منفصلة).920-9B110-00FH-0D0 السعرلكل منفذ مقارنة بإضافة المزيد من المفاتيح مقابل نماذج راديكس أعلى.

عند حساب تكلفة الملكية الإجمالية، لاحظ أن920-9B110-00FH-0D0يزيل الحاجة إلى مفاتيح TOR منفصلة ، وتعقيد تكوين ECN (على عكس RoCE) ، وتراخيص إدارة الازدحام الملكية ‬جميعها مدرجة بشكل أصلي في InfiniBand.

5العمليات، المراقبة، حل المشاكل وتحسين

إدارة الإنتاجNVIDIA Mellanox 920-9B110-00FH-0D0تستند شركة Fabrics إلى أدوات رئيسية: OpenSM (مدير الشبكة الفرعية) لاستلام الأقمشة الأساسية و NVIDIA UFM (مدير الأقمشة الموحد) للقياس عن بعد على نطاق المؤسسة والأتمتة.

  • فحوصات صحية يومية:استخدم "ibnetdiscover" للتحقق من طوبولوجية النسيج، و "ibstat" لمراقبة حالة الميناء، و "perfquery" لتتبع عدادات الأخطاء.
  • ضبط الأداء:تعيين التوجيه التكيفي إلى "الستاتيكي" للحصول على تأخير محدد أو "الديناميكي" للحصول على الحد الأقصى من الإنتاجية. تعديل رسم خرائط SL2VL لتحديد أولوية التحكم مقابل حركة البيانات.
  • حل المشاكل الشائعة:عادة ما تشير أخطاء الرابط CRC إلى مشاكل سلامة الكابل / الإشارةورقة بيانات 920-9B110-00FH-0D0لـ SKU الكابلات الصالحة. غالباً ما تتطلب فترات انتهاء مدير الشبكة الفرعية تعديل `max_hop_count` للأنسجة الكبيرة.
  • تخطيط القدرة:الاستفادة من التحليلات التنبؤية لـ UFM للتنبؤ باستخدام الموانئ وتحديد النقاط الساخنة قبل أن تؤثر على فرص العمل.920-9B110-00FH-0D0 InfiniBand switch OPNيسمح للنورات المرنة التي يمكن ترقيتها للتكيف مع متطلبات عرض النطاق الترددي المتغيرة.

بالنسبة للمنظمات التي تقيم العديد من البائعين، مقارنة920-9B110-00FH-0D0 السعرمقابل مفتاح HDR البديل يجب أن يكون عاملاً في بساطة التشغيل ✓ يقلل كومة InfiniBand المتكاملة رأسياً من وقت تحديد الأخطاء عبر الفريق بنسبة تقدر بنسبة 40٪.

6ملخص وتقييم القيمة

الـميلانوكس (NVIDIA Mellanox) 920-9B110-00FH-0D0يوفر أساسًا جاهزًا للإنتاج لمجموعات RDMA / HPC / AI التي تتطلب اتصالًا متبادلًا محددًا منخفضًا. تشمل مقترحات القيمة الرئيسية:

  • الأداء:ما يصل إلى 200 جيجابايت في الثانية لكل منفذ مع تأخير التبديل أقل من 130ns ، مما يتيح لتوسيع نطاق GPU الخطي إلى الآلاف من العقد.
  • كفاءة التشغيل:إزالة حمولة الأجهزة الأصلية يلغي تدخل وحدة المعالجة المركزية لـ I / O الشبكة ، مما يحرر النواة للحوسبة.
  • مؤكدة للمستقبل:التوافق إلى الوراء مع EDR (100Gb / s) والتوافق إلى الأمام مع NDR (400Gb / s) من خلال تحويل سرعة الميناء.
  • إجمالي تكلفة الملكية:عند الحساب920-9B110-00FH-0D0 السعرمقابل بدائل إيثيرنت، تشمل وفورات من وقت العمل العاطل GPU المنخفض (15 ٪ ٪ استعادة نموذجية) والقضاء على تراخيص التحكم في الازدحام الملكية.

يتم تشجيع المهندسين المعماريين على تحميلورقة بيانات 920-9B110-00FH-0D0والإشارة إلى المسؤولمواصفات 920-9B110-00FH-0D0لمصفوفات الكابلات وميزانية الطاقة.920-9B110-00FH-0D0 للبيعالتوافر من خلال شبكة الشركاء في NVIDIA وطلب مختبر التحقق من صحة اختبار الطوبولوجيا المخصصة.