ورقة بيضاء فنية: NVIDIA Mellanox 920-9B210-00FN-0D0 حل InfiniBand Switch
January 6, 2026
أدى تطور أحمال العمل الحسابية نحو تدريب الذكاء الاصطناعي على نطاق إكساسكيل ومحاكاة HPC عالية الدقة إلى تحول أساسي في عنق الزجاجة للأداء من الحساب إلى الربط البيني. تتطلب المجموعات الحديثة المعتمدة على RDMA نسيجًا لا يوفر فقط نطاقًا تردديًا عاليًا، بل يوفر أيضًا زمن وصول منخفضًا للغاية وحتميًا، وتقليلًا للتقلبات، وقابلية للتوسع سلسة. غالبًا ما تقدم الشبكات القديمة زمن وصول متغيرًا، وفقدانًا للحزم الناجم عن الازدحام، وتعقيدًا في الإدارة، مما يترجم بشكل مباشر إلى وقت أطول للحل، وموارد GPU/CPU غير مستغلة بالكامل، وزيادة النفقات التشغيلية.
يعالج هذا الحل التقني المتطلبات الأساسية لمراكز البيانات ومرافق الأبحاث من الجيل التالي: إنشاء نسيج موحد وعالي الأداء قادر على دمج أحمال عمل HPC الكلاسيكية (القائمة على MPI) والذكاء الاصطناعي الحديث (الاتصال الجماعي). تشمل المتطلبات الفنية الرئيسية زمن انتقال التبديل دون ميكروثانية، وإنتاجية غير محظورة لجميع أنماط الاتصال، والتحكم الذكي في الازدحام، وإطار إدارة يوفر رؤية وأتمتة عميقة. تم تصميم حل مفتاح InfiniBand 920-9B210-00FN-0D0 لتلبية هذه المعايير الدقيقة.
البنية المقترحة هي نسيج عمودي أفقي مصمم لتحقيق أقصى عرض نطاق ترددي ثنائي الاتجاه وقابلية للتوسع، مبني على تقنية NDR 400 جيجابت/ثانية InfiniBand. تتكون طبقة العمود الفقري بالكامل من مفاتيح بعد القيمة، والتي تشكل النواة ذات النطاق الترددي العالي للغاية. يمكن أن تتكون طبقة الأوراق من مزيج من مفاتيح NDR أو HDR، وتوصيل عقد الحوسبة (خوادم GPU مثل أنظمة NVIDIA DGX، ومجموعات CPU)، والتخزين المتوازي عالي الأداء (NVMe-oF)، وعقد الإدارة.
يضمن هذا التصميم المنفصل زمن وصول يمكن التنبؤ به ويزيل الاكتتاب الزائد داخل النسيج. تشمل المبادئ المعمارية الرئيسية:
- نسيج موحد: شبكة واحدة للحوسبة (شرق-غرب) وحركة مرور التخزين، مما يبسط الإدارة ويقلل من رأس المال.
- تشغيل بدون فقدان: الاستفادة من التحكم الأصلي في الازدحام وإدارة تدفق حركة المرور في InfiniBand لضمان عدم فقدان الحزم، وهو أمر بالغ الأهمية لأداء RDMA وMPI.
- الشبكات المعرفة بالبرمجيات: يتيح التكامل مع NVIDIA Cumulus Linux ومنصة UFM® أتمتة النسيج القابلة للبرمجة والإدارة المستندة إلى السياسات.
يعد مفتاح 920-9B210-00FN-0D0 MQM9790-NS2F 400 جيجابت/ثانية NDR حجر الزاوية الاستراتيجي لهذه البنية، حيث يعمل كعمود فقري عالي الأداء. يتجاوز دوره مجرد التبديل؛ إنه المحرك الذكي الذي يضمن حركة البيانات المثالية.
تعالج خصائصه الفنية الرئيسية، كما هو مفصل في ورقة بيانات 920-9B210-00FN-0D0 الرسمية، تحسين زمن الوصول المنخفض بشكل مباشر:
- تبديل القطع وزمن الوصول المنخفض للغاية: يستخدم المفتاح بنية تبديل متطورة للقطع، مما يحقق زمن انتقال من المنفذ إلى المنفذ أقل من 100 نانوثانية. هذا أمر بالغ الأهمية لتقليل زمن الوصول الإجمالي لعمليات RDMA.
- نطاق ترددي NDR 400 جيجابت/ثانية: يوفر كل منفذ 400 جيجابت/ثانية، مما يوفر المساحة الرأسية اللازمة لمنع الازدحام أثناء أحمال العمل القصوى مثل نقاط فحص تدريب الذكاء الاصطناعي الموزعة أو عمليات MPI_allreduce واسعة النطاق.
- التوجيه التكيفي والتحكم في الازدحام: تعمل تقنية NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ v3، المضمنة في المفتاح، على إيقاف تحميل العمليات الجماعية من وحدة المعالجة المركزية، مما يقلل بشكل كبير من عبء التزامن. جنبًا إلى جنب مع التوجيه التكيفي الديناميكي، فإنه يمنع النقاط الساخنة ويضمن استخدام النسيج المتوازن.
- التوافق للخلف والأمام: المفتاح جزء لا يتجزأ من استراتيجية الترحيل السلس. إنه متوافق تمامًا مع معدات HDR (200 جيجابت/ثانية) وEDR (100 جيجابت/ثانية) الحالية، مما يسمح بالترقيات المرحلية. يعد الرجوع إلى الكابلات والطاقة: التفصيلية أمرًا بالغ الأهمية لتخطيط توصيل المنفذ وأنواع الكابلات.عندما يكون هذا الحل متاحًا يجب أن يتبع النشر الأولي نهجًا معياريًا "للقرنة". قد تستخدم القرنة الأولية النموذجية مفتاحين
في دور العمود الفقري للتكرار، متصلين بمفاتيح أوراق HDR أو NDR متعددة تدعم العشرات من عقد الحوسبة. طوبولوجيا Clos (Fat-Tree) غير محظورة من مستويين. يتم تحديد عدد مفاتيح العمود الفقري (وحدات 920-9B210-00FN-0D0) من خلال عدد الوصلات الصاعدة من كل مفتاح ورقة ونسبة الاكتتاب الزائد المطلوبة (يفضل 1:1 لـ HPC/AI).
التوسع: لتوسيع المجموعة، أضف المزيد من مفاتيح الأوراق وأضف بشكل متناسب المزيد من وحدات العمود الفقري
- 920-9B210-00FN-0D0 للحفاظ على النسبة غير المحظورة. تتوسع معالجة النسيج وتوجيهه بسلاسة في ظل إدارة UFM®. يمكن ترقية العقد الفردية إلى NICs NDR، والاستفادة على الفور من النطاق الترددي الكامل البالغ 400 جيجابت/ثانية إلى العمود الفقري. تدعم طبيعة المفتاح
- المتوافقة هذه البيئة غير المتجانسة.الكابلات والطاقة: يجب أن يراعي تخطيط النشر كابلات بصرية متوافقة مع NDR (على سبيل المثال، OSFP). توفر
- مواصفات 920-9B210-00FN-0D0 بيانات استهلاك الطاقة والحرارة الدقيقة لتصميم دقيق للطاقة والتبريد في مركز البيانات.عندما يكون هذا الحل متاحًا للبيع
، يُنصح بالتعامل مع الشركاء المعتمدين لنمذجة سعر 920-9B210-00FN-0D0 والكمية الصحيحة لخطتك الخاصة بالتوسع.5. توصيات التشغيل والمراقبة واستكشاف الأخطاء وإصلاحها والتحسينيتم تحقيق التميز التشغيلي من خلال منصة NVIDIA UFM®. يوفر إدارة دورة حياة شاملة للنسيج بأكمله، بما في ذلك كل مفتاح
. يوفر UFM® قياسًا عن بعد في الوقت الفعلي حول سلامة المفتاح، واستخدام المنفذ، ودرجة الحرارة، وعدادات الأخطاء، وتحليل متعمق لأنماط حركة المرور على مستوى التطبيق، بما في ذلك مصفوفات اتصالات MPI وRDMA.
- إدارة النسيج الآلية: من التوفير الأولي والتحقق من صحة الكابلات إلى تحديثات البرامج الثابتة ونسخ التكوين الاحتياطية، يقوم UFM® بأتمتة المهام الروتينية، مما يقلل من الخطأ البشري والنفقات التشغيلية.
- استكشاف الأخطاء وإصلاحها: يمكن للأدوات المتقدمة تحديد الحالات الشاذة في الأداء، وتحديد التدفقات التي تسيء التصرف والتي تسبب الازدحام، وتصور طوبولوجيا النسيج لعزل الروابط أو المكونات الفاشلة بسرعة.
- التحسين المستمر: استفد من رؤى UFM® لتحديد حجم أحمال العمل بشكل صحيح، والتحقق من أن الأداء يتماشى مع توقعات
- ورقة البيانات، والتخطيط لترقيات السعة المستقبلية. يعد المراجعة المنتظمة لمقاييس الازدحام وزمن الوصول أمرًا أساسيًا للحفاظ على أداء النسيج الذروي.6. الاستنتاج وتقييم القيمةيوفر نشر بنية نسيج تتمحور حول مفتاح InfiniBand
ميزة تنافسية أساسية للمؤسسات التي تعتمد على الحوسبة عالية الأداء. يوفر هذا الحل التقني قيمة قابلة للقياس عبر أبعاد متعددة:بعد القيمةالنتيجة المحققة
| الأداء الفني | زمن وصول حتمي دون ميكروثانية، ونطاق ترددي غير محظور يبلغ 400 جيجابت/ثانية، وتشغيل خالٍ من الازدحام لـ RDMA وMPI. |
|---|---|
| تسريع الأعمال/البحث | تقليل أوقات تشغيل التطبيقات بنسبة 20-40٪، وتسريع الوقت اللازم للاكتشاف ودورات تطوير المنتجات. |
| الكفاءة التشغيلية | الإدارة الموحدة، والتوفير الآلي، والقياس عن بعد العميق تقلل من التكلفة الإجمالية للملكية وتقليل وقت التوقف عن العمل. |
| حماية الاستثمار | تحمي التوافق مع الإصدارات السابقة والبنية القابلة للتطوير الاستثمارات الحالية مع توفير مسار واضح للتقنيات المستقبلية. |
| باختصار، فإن | 920-9B210-00FN-0D0 |
ليس مجرد مكون، بل هو أداة تمكين للبنية التحتية عالية الأداء والمتقاربة. إنه يحول الشبكة من مسؤولية محتملة إلى أصل استراتيجي يطلق العنان بالكامل لقوة المجموعات الحسابية الحديثة.

