NVIDIA Mellanox MCX653105A-HDAT Server Adapter في العمل: RDMA/RoCE نقل وخادم بطء منخفض
June 15, 2026
في مراكز البيانات الحديثة، تواجه مجموعات التخزين الموزعة والحوسبة عالية الأداء (HPC) ومجموعات التدريب على الذكاء الاصطناعي اختناقًا مشتركًا: الشبكة. تقدم مجموعات TCP/IP التقليدية زمن وصول كبير وحملًا إضافيًا لوحدة المعالجة المركزية، مما يعطل أداء التطبيق على نطاق واسع. تبحث دراسة الحالة هذه في كيفية تعامل موفر السحابة متوسط الحجم مع هذه التحديات المحددة من خلال نشرنفيديا ميلانوكس MCX653105A-HDATمحول الخادم لتمكين النقل منخفض زمن الوصول المستند إلى RDMA/RoCE وتعزيز إنتاجية الخادم بشكل كبير.
الخلفية والتحديات: عندما يكون لكل ميكروثانية أهمية
كانت البنية التحتية الحالية لشبكة إيثرنت بسرعة 25 جيجابت الخاصة بالموفر، والتي تعمل بنظام TCP/IP قياسي، تكافح من أجل دعم الواجهة الخلفية الجديدة للتخزين NVMe-over-Fabrics. تجاوز استخدام وحدة المعالجة المركزية في عقد التخزين بانتظام 70% فقط من معالجة الشبكة، وتراوح زمن الاستجابة بين العقد حول 50 ثانية - وهو أمر غير مقبول لأحمال عمل قاعدة البيانات الحساسة لزمن الاستجابة. علاوة على ذلك، مع توسعها إلى مئات العقد، تسبب ازدحام الشبكة في حدوث زيادات في زمن الاستجابة مما أثر على اتفاقيات مستوى الخدمة للتطبيق. لقد كانوا بحاجة إلى حل يمكنه تفريغ الحمل الزائد على الشبكة، وتوفير زمن وصول أقل من ميكروثانية، والحفاظ على أداء متسق تحت الحمل.
الحل والنشر: تقديم بطاقة الشبكة PCIe لمحول MCX653105A-HDAT ConnectX
وبعد تقييم عدة خيارات، اختار الفريقبطاقة محول إيثرنت MCX653105A-HDATلقدرته على منفذ مزدوج بسرعة 100 جيجابت ودعمه الأصلي لـ RoCE (RDMA عبر Ethernet المتقاربة). النفيديا ميلانوكس MCX653105A-HDATتم نشره عبر 120 عقدة تخزين وحوسبة، بالتكوين التالي:
- تم تمكين RoCEمع ECN (إشعار الازدحام الصريح) وDCQCN للتحكم في الازدحام
- تفريغ هدف NVMe-oFإلى الأجهزة، وتجاوز وحدة المعالجة المركزية المضيفة للتخزين I/O
- التقسيمفي التدفقات ذات الأولوية غير المفقودة لحركة مرور التخزين
- مراقبة القياس عن بعدباستخدام عدادات الأداء المدمجة في المحول
وفقا لورقة بيانات MCX653105A-HDAT، تدعم البطاقة بروتوكولي InfiniBand وEthernet، لكن الفريق اختار RoCEv2 للتكامل بسلاسة مع محولات Ethernet الحالية. كان التوافق واضحًا: كانت جميع نماذج الخوادم الرئيسية كذلكمتوافق مع MCX653105A-HDAT، ولا يتطلب سوى فتحات PCIe القياسية والبرامج الثابتة المحدثة. تم الانتهاء من النشر خلال عطلتي نهاية الأسبوع دون أي توقف عن العمل، وذلك باستخدام ميزات الترحيل المباشر للمحول.
النتائج والفوائد: مكاسب الأداء القابلة للقياس
وكان التأثير فوريًا وكبيرًا. يلخص الجدول التالي المقاييس الأساسية قبل وبعد نشرحل بطاقة محول Ethernet MCX653105A-HDAT:
| متري | قبل (TCP/IP) | بعد (روس + MCX653105A-HDAT) | تحسين |
|---|---|---|---|
| متوسط الكمون (عقدة إلى عقدة) | 52 ميكروثانية | 1.8 ميكروثانية | تخفيض 96.5% |
| استخدام وحدة المعالجة المركزية (عقدة التخزين، مكدس الشبكة) | 72% | 8% | تخفيض 89% |
| الإنتاجية الفعالة لكل عقدة (NVMe-oF) | 18 جيجابت في الثانية | 96 جيجابت في الثانية | زيادة 5.3x |
| زمن الوصول الخلفي (النسبة المئوية 99.9) | 380 ميكروثانية | 12 ميكروثانية | تخفيض بنسبة 96.8% |
وبخلاف هذه الأرقام، لاحظ الفريق فوائد تشغيلية إضافية. المواصفات MCX653105A-HDATتتضمن تتبع الاتصال القائم على الأجهزة وتفريغ تدفق ASAP2، مما أدى إلى تقليل تشويش حركة المرور بين الشرق والغرب وتمكين التوسع بشكل أكثر سلاسة. عند تقييم التكلفة الإجمالية للملكية، فإنسعر MCX653105A-HDATتم تبريره في غضون ستة أشهر من خلال انخفاض تكاليف الترخيص الأساسية لوحدة المعالجة المركزية وزيادة كثافة التخزين لكل عقدة. المحول الآن على نطاق واسعMCX653105A-HDAT للبيعمن خلال القنوات القياسية، مما يجعل هذا الأداء في متناول المؤسسات من جميع الأحجام.
الملخص والتوقعات: أساس للبنية التحتية من الجيل التالي
وتبين هذه الحالة أنبطاقة الشبكة PCIe لمحول ConnectX MCX653105A-HDATليست مجرد بطاقة NIC أسرع - إنها منصة للحوسبة الحقيقية التي تركز على البيانات. من خلال تمكين RDMA وRoCE مع عمليات إلغاء تحميل الأجهزة، يمكن لـنفيديا ميلانوكس MCX653105A-HDATيحول كيفية تواصل الخوادم، مما يزيل الحمل الزائد للبروتوكول القديم ويطلق العنان للإمكانات الكاملة لتخزين NVMe وأنسجة الذاكرة الموزعة.
وبالنظر إلى المستقبل، يخطط المزود لتوسيع نطاق نشره ليشمل GPUDirect RDMA لأحمال عمل تدريب الذكاء الاصطناعي، بالإضافة إلى استكشاف ميزات قابلية برمجة المحول لمعالجة الحزم المخصصة. بالنسبة لمهندسي تكنولوجيا المعلومات ومهندسي الشبكات الذين يواجهون تحديات توسيع مماثلة، فإنبطاقة محول إيثرنت MCX653105A-HDATيقدم مسارًا مثبتًا وجاهزًا للمستقبل لشبكات مراكز البيانات ذات زمن الوصول المنخفض والإنتاجية العالية.

