NVIDIA Mellanox MCX653106A-HDAT في العمل: تحقيق اختراقات في نقل RDMA / RoCE منخفضة التأخير وسرفر
June 16, 2026
في بيئات مراكز البيانات الحديثة - التي تشمل التخزين الموزع، والتداول عالي التردد، ومجموعات تدريب الذكاء الاصطناعي - لا يزال هناك تحديان مستمران: تقليل زمن الوصول الناتج عن الشبكة وزيادة إنتاجية الخادم إلى الحد الأقصى دون إثقال كاهل وحدة المعالجة المركزية. يبحث هذا التطبيق المتعمق في كيفية قيام أحد موفري البنية التحتية السحابية الرائدين بمعالجة هذه المشكلات تحديدًا من خلال نشرنفيديا ميلانوكس MCX653106A-HDATمحول الخادم عبر عقد الحوسبة والتخزين الخاصة بهم.
الخلفية والتحدي
كانت البنية التحتية الحالية لشبكة 25 جيجابت الخاصة بالموفر، والتي تعتمد على محولات Ethernet القياسية مع مجموعات TCP/IP المستندة إلى البرامج، تظهر قيودًا واضحة. شهدت أعباء عمل التخزين باستخدام NVMe عبر Fabrics ارتفاعات غير متوقعة في زمن الوصول (تتجاوز غالبًا 50 ثانية)، بينما عانت مجموعات قواعد البيانات من الاستخدام العالي لوحدة المعالجة المركزية - ما يصل إلى 35% من النوى التي تستهلكها معالجة الشبكة وحدها. كان الفريق الهندسي بحاجة إلى حل يمكنه توفير زمن استجابة أقل من 10 ميكرو ثانية لمعاملات RDMA ودعم إنتاجية 200 جيجابت دون الحاجة إلى إصلاح معماري كامل.
وبعد تقييم خيارات متعددة، تحولوا إلىبطاقة محول إيثرنت MCX653106A-HDAT، التي وعدت بـ RoCE (RDMA عبر Ethernet المتقاربة) التي تم تفريغها من الأجهزة والتكامل السلس مع طوبولوجيا العمود الفقري الورقية المستندة إلى Cumulus Linux.
نهج الحل والنشر
تمركز الانتشار حولبطاقة شبكة PCIe لمحول ConnectX MCX653106A-HDAT، مع الاستفادة من تكوينه ثنائي المنفذ بسرعة 100 جيجابت لإنشاء نسيج غير معوق. تلقت كل عقدة حسابية محولًا واحدًا، بينما تم تجهيز عقد التخزين بمحولين للتكرار. وشملت خطوات التنفيذ الرئيسية ما يلي:
- تمكين RoCEv2 مع PFC (التحكم في الأولوية في التدفق) وECN (إشعار الازدحام الصريح) لضمان النقل دون فقدان البيانات
- تكوين SR-IOV لتخصيص الوظائف الافتراضية لقاعدة البيانات ذات الأولوية العالية وأحمال عمل التخزين
- نشر الأحدثمتوافق مع MCX653106A-HDATمكدس برنامج التشغيل (NVIDIA DOCA 2.5) عبر عقد Ubuntu 22.04 LTS
- تنفيذ تسريع DPDK القائم على الأجهزة لمسارات معالجة الحزم
بناء علىورقة بيانات MCX653106A-HDATوالتحقق من الصحة قبل النشر، توقع الفريق زمن استجابة للأجهزة أقل من 1 ميكرومتر وما يصل إلى 215 مليون حزمة في الثانية (MPPS) لمعاملات الحزم الصغيرة - وهي المقاييس التي وجهت تخطيط السعة.
النتائج والفوائد القابلة للقياس
بعد تجربة مدتها أربعة أسابيع على 50 عقدة إنتاج، قام فريق البنية التحتية بتوثيق التحسينات التالية عند المقارنةنفيديا ميلانوكس MCX653106A-HDATضد المحولات القديمة الخاصة بهم:
| متري | محول قديم بسرعة 25 جيجابت | MCX653106A-HDAT (روس) | تحسين |
|---|---|---|---|
| وقت استجابة قراءة NVMe-oF (P99) | 52 ميكروثانية | 6.8 ميكروثانية | تخفيض 87% |
| الحمل الزائد لوحدة المعالجة المركزية (مكدس الشبكة) | 34% | 7% | تم تحرير 27 نقطة مئوية |
| إجمالي الإنتاجية (لكل خادم) | 92 جيجابت في الثانية (مستعبدة) | 198 جيجابت في الثانية | زيادة 115% |
| معدل الحزمة الصغيرة (64B) | 48 ميغا بايت في الثانية | 187 ميغا بايت في الثانية | ~ 290٪ ربح |
وبعيدًا عن الأرقام الأولية، أشار الفريق الهندسي إلى أنحل بطاقة محول إيثرنت MCX653106A-HDATتم التخلص من حلول الضبط المطلوبة مسبقًا - مثل اختراقات دمج المقاطعات ومخازن الاستقبال المؤقتة كبيرة الحجم. كما أدت عمليات إلغاء تحميل أجهزة المحول لـ VXLAN وGeneve إلى تبسيط حزمة شبكات الحاويات الخاصة بهم، مما أدى إلى تقليل زمن الوصول من pod إلى pod بنسبة 40% في بيئات Kubernetes.
بالنسبة لمديري تكنولوجيا المعلومات الذين يقومون بتقييم التكاليف،سعر MCX653106A-HDATأظهرت المقارنات مع حلول 200 جيجابت المماثلة انخفاضًا في إجمالي تكلفة الملكية بنسبة 15-20% عند الأخذ في الاعتبار توفير وحدة المعالجة المركزية الأساسية وتقليل استخدام منافذ التبديل. في أثناء،MCX653106A-HDAT للبيعوقد تم بالفعل إرسال الاستفسارات من الفرق المجاورة - بما في ذلك الحوسبة عالية الأداء والتحليلات في الوقت الفعلي - لدورة الشراء التالية.
ملخص والتوقعات
والنشر يؤكد ذلكنفيديا ميلانوكس MCX653106A-HDATلا تعد مجرد ترقية للمواصفات ولكنها قفزة وظيفية للبيئات الحساسة لزمن الوصول والإنتاجية. من خلال تحويل معالجة الشبكة من البرامج إلى الأجهزة - عبر عمليات إلغاء تحميل RoCE، وSR-IOV، والبنية الجاهزة لـ GPUDirect - يمكن للمؤسسات تحقيق زمن وصول محدد على نطاق ميكروثانية مع استعادة دورات وحدة المعالجة المركزية لمنطق التطبيق.
بينما يقوم فريق البنية التحتية بتوسيع طرحه إلى أكثر من 500 عقدة، فإنه يستكشف أيضًا التشفير المضمن للمحول (IPsec/TLS) للأمان متعدد المستأجرين وPTP (IEEE 1588v2) لأحمال عمل الخدمات المالية. بالنسبة للمهندسين الذين يبحثون عن تكوينات تم التحقق من صحتها، فإنمواصفات MCX653106A-HDATوالتصميمات المرجعية متاحة من خلال بوابة مطور DOCA الخاصة بـ NVIDIA. توضح هذه الحالة الواقعية شيئًا واحدًا:بطاقة شبكة PCIe لمحول ConnectX MCX653106A-HDATيفي بوعد توفير شبكة إيثرنت منخفضة الكمون وعالية الإنتاجية لمراكز بيانات الجيل التالي.
للحصول على مراجعة فنية أعمق، استشر المسؤولورقة بيانات MCX653106A-HDATأو اتصل بمهندس حلول NVIDIA الإقليمي لديك.

