ميلانوكس (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand Switch في الإنتاج
April 15, 2026
واجه معهد أبحاث رائد في مجال الذكاء الاصطناعي في شرق آسيا عنق زجاجة شائع ولكنه حرج. كانت مجموعته المكونة من 512 وحدة معالجة رسومات (GPU)، المستخدمة لتدريب نماذج اللغة الكبيرة ومحاكاة ديناميكيات الجزيئات، تعاني من تدهور شديد في الأداء مع زيادة حجم المهام. كان السبب الجذري هو شبكة الإيثرنت القديمة بسرعة 100 جيجابت في الثانية، حيث تسببت النفقات العامة لبروتوكول TCP/IP وفقدان الحزم أثناء أحداث التجميع (incast) في أوقات خمول لوحدات معالجة الرسومات تصل إلى 35٪. احتاج الفريق إلى شبكة خالية من فقدان الحزم، ذات زمن انتقال فائق الانخفاض، يمكنها دعم RDMA والتوسع إلى آلاف العقد دون المساس بالأداء الحتمي. بعد تقييم العديد من الحلول، اختاروا مفتاح InfiniBand من Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 كقلب لبنيتهم الجديدة ذات الطبقات المتعددة (spine-leaf).
تركز النشر حول مفتاح 920-9B210-00FN-0D0 كطبقة العمود الفقري (spine)، مع 32 مفتاحًا ورقيًا (leaf) متصلة بـ 512 وحدة معالجة رسومات NVIDIA A100 عبر محولات ConnectX-7. يوفر كل مفتاح 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR سرعة 400 جيجابت في الثانية لكل منفذ، مما يضاعف عرض النطاق الترددي لحلول HDR السابقة مع الحفاظ على زمن انتقال تبديل أقل من ميكرو ثانية. بسّطت علامة 920-9B210-00FN-0D0 InfiniBand switch OPN الرسمية عملية الشراء وضمنت اتساق البرامج الثابتة عبر جميع الوحدات. استخدم مهندسو الشبكات ورقة بيانات 920-9B210-00FN-0D0 و مواصفات 920-9B210-00FN-0D0 التفصيلية للتحقق من متطلبات الطاقة والحرارة، مما أتاح تكاملًا سلسًا في رفوف 19 بوصة الحالية. والأهم من ذلك، أن المفتاح متوافق تمامًا 920-9B210-00FN-0D0 متوافق مع كل من البنية التحتية HDR الحالية ونقاط النهاية الأحدث لـ NDR، مما يسمح بالترحيل التدريجي.
- مكاسب كفاءة RDMA: مع تمكين NVIDIA Mellanox 920-9B210-00FN-0D0 للتحكم في الازدحام المستند إلى الأجهزة، انخفض زمن انتقال كتابة RDMA من 12 ميكرو ثانية إلى 1.2 ميكرو ثانية. أصبح RDMA المباشر لوحدة معالجة الرسومات (GDR) فعالًا بالكامل، مما أزال اختناقات ذاكرة وحدة المعالجة المركزية.
- تسريع تطبيقات الحوسبة عالية الأداء (HPC): شهد رمز نمذجة الطقس الرئيسي (المعتمد على MPI) تحسنًا في الأداء بمقدار 2.7 مرة بفضل التوجيه التكيفي للمفتاح وعمليات تفريغ التجميعات الجماعية SHARP v2.
- إنتاجية تدريب الذكاء الاصطناعي: بالنسبة لمهمة تدريب نموذج لغة كبير (LLM) بـ 175 مليار معلمة، قللت الشبكة الجديدة وقت عملية all-reduce بنسبة 68٪، مما أدى إلى تحسين الاستخدام الإجمالي لوحدات معالجة الرسومات من 62٪ إلى 91٪.
- بساطة التشغيل: تم دمج 920-9B210-00FN-0D0 InfiniBand switch OPN solution مع منصة UFM من NVIDIA، مما يوفر قياسات في الوقت الفعلي وتنبيهات فشل تنبؤية. أفاد مديرو تكنولوجيا المعلومات بانخفاض بنسبة 50٪ في وقت استكشاف الأخطاء وإصلاحها المتعلقة بالشبكة.
عند تقييم المشروع، قارن معهد الأبحاث سعر 920-9B210-00FN-0D0 مقابل حلول الإيثرنت المنافسة. على الرغم من التكلفة الأولية الأعلى، إلا أن التكلفة الإجمالية للملكية (TCO) كانت لصالح InfiniBand بسبب الاستخدام الأعلى لوحدات معالجة الرسومات والطاقة الأقل لكل جيجابت في الثانية. الوحدات متاحة بسهولة كـ 920-9B210-00FN-0D0 للبيع من خلال قنوات توزيع NVIDIA، مع فترات زمنية أقصر بكثير من مفاتيح NDR الأخرى. أكدت مواصفات 920-9B210-00FN-0D0 التفصيلية أيضًا دعم إمدادات الطاقة المتكررة والمراوح القابلة للتبديل السريع، مما يلبي متطلبات الموثوقية للمعهد لعمليات أبحاث الذكاء الاصطناعي على مدار الساعة طوال أيام الأسبوع.
| المعلمة | التفاصيل |
|---|---|
| الموديل | NVIDIA Mellanox 920-9B210-00FN-0D0 |
| سرعة المنفذ | 400Gb/s NDR (لكل منفذ) |
| علامة OPN الأساسية | 920-9B210-00FN-0D0 InfiniBand switch OPN |
| التكوين الكامل | 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR |
لقد قام معهد أبحاث الذكاء الاصطناعي الآن بتوحيد استخدام 920-9B210-00FN-0D0 لجميع توسعات المجموعات المستقبلية، بما في ذلك شبكة NDR200 مخطط لها تضم 2048 وحدة معالجة رسومات. توضح هذه الحالة الواقعية أن NVIDIA Mellanox 920-9B210-00FN-0D0 ليس مجرد مفتاح - بل هو مكون أساسي لتحقيق توسع خطي في الأداء في بيئات الذكاء الاصطناعي والحوسبة عالية الأداء. بالنسبة للمهندسين ومديري تكنولوجيا المعلومات الذين يتطلعون إلى القضاء على اختناقات الشبكات، فإن 920-9B210-00FN-0D0 InfiniBand switch OPN solution تقدم مسارًا مثبتًا وجاهزًا للإنتاج للمضي قدمًا.

