NVIDIA Mellanox MCX653105A-HDAT Server Adapter في العمل: تعزيز الإنتاجية مع نقل RDMA / RoCE منخفض التأخير
March 16, 2026
شركة رائدة في مجال التكنولوجيا المالية، أثناء بناء منصة تحليلات البيانات الضخمة من الجيل القادم، واجهت اختناقات شديدة في شبكة إدخال/إخراج.كافحت البنية التحتية الحالية لـ 10GbE في التعامل مع تدفق البيانات الضخم المطلوب لتقييم المخاطر في الوقت الحقيقي وتحليل التداول عالي الترددكانت نواة وحدة المعالجة المركزية تنفق ما يصل إلى 30% من دوراتها فقط لإدارة حركة المرور في الشبكة، مما يترك موارد أقل لمعالجة التطبيقات الحرجة. كان التحدي الأساسي واضحا:لتوسيع قاعدة البيانات الموزعة والتحليلات القائمة على الذكاء الاصطناعي، كان عليهم أن يقللوا بشكل كبير من فترة التأخير ويزيدوا من سعة الخادم الفعالة دون إصلاح أسطول الخادم بأكمله.
الشبكات التقليدية لـ TCP/IP لم تعد قابلة للتطبيقتؤثر بشكل مباشر على أداء قواعد البيانات في الذاكرة ومجموعات التخزين القائمة على NVMeكانت الشركة بحاجة إلى حل يمكنه تحميل معالجة الشبكة من وحدة المعالجة المركزية وتمكين حركة البيانات المباشرة عالية السرعة بين الخوادم والتخزين. بعد تقييم العديد من الخيارات،تم اتخاذ القرار لنشر(مايكروسوفت) (نفيديا ميلانوكس)بطاقة محول الخادم عبر عقد الحوسبة الحيوية والتخزين.
وتركزت هذه العملية علىMCX653105A-HDAT، وهو محول مزدوج الموانئ 100 جيجابايت / ثانية من عائلة NVIDIA Mellanox ConnectX-6. كان الهدف الرئيسي هو تنفيذ RDMA عبر Ethernet Converged (RoCE) لتجاوز وحدة المعالجة المركزية لنقل البيانات.NVIDIA Mellanox MCX653105A-HDATتم اختيارها لدعمها الأصلي للأجهزة لـ RoCE ، والذي يوفر فوائد انخفاض فترة التأخير في InfiniBand أثناء التشغيل على نسيج Ethernet القياسي ،ضمان التوافق مع مفاتيح الشبكة القائمة.
قام فريق الهندسة بتكوين الخوادم في طوبولوجية عمود الفقرة العمود الفقري ، مما يتيح الاتصال من أي مكان إلى أي مكان مع أداء متوقع. كان مفتاح النجاح هو نشربطاقة MCX653105A-HDAT Ethernetفي كل من خوادم قاعدة البيانات ومصفوفات التخزين NVMe بالكامل.قام الفريق بتأسيس نسيج خال من الخسائر مع التحكم في تدفق الأولوية (PFC) لضمان انخفاض الحزم صفر، وهو شرط حاسم لعمليات RDMA الفعالة.بطاقة الشبكة PCIe MCX653105A-HDAT ConnectXأثبتت أهميتها هنا، حيث حافظت آليات مكافحة الازدحام المتقدمة على استقرار النسيج حتى تحت الحمل الكامل.
كان تحسن الأداء فوريًا ومهمًا. قبل الترقية ، حددت البنية التحتية الحالية لـ 10GbE سعة خدمة الخادم إلى الخادم بنحو 1.2 جيجابايت / ثانية مع استخدام كبير لمعالجة المعالجة المركزية.بعد دمجMCX653105A-HDATالمكيفات وتمكين RoCEv2 ، حققت المجموعة ما يلي:
| متري | قبل (10GbE/TCP) | بعد (100GbE/RoCE مع MCX653105A-HDAT) |
|---|---|---|
| الناتج الفعلي (NVMe-oF) | ~ 1.1 جيجابايت/ثانية | ~ 11.5 جيجابايت/ثانية |
| معدل تأخير (طيران ذهاب وعودة) | ~ 150 μs | < 5 μs |
| استخدام وحدة المعالجة المركزية (إدخال/خروج الشبكة) | ~ 30% | < 5% |
وقد تم تحقيق هذه الزيادة المضاعفة عشرة أضعاف في الإنتاجية مع تحرير نواة وحدة المعالجة المركزية في الوقت نفسه لمعالجة مستوى التطبيق.MCX653105A-HDATوقد أثبتت إزالة حمولة الأجهزة أنها أمر حاسم في تحقيق أداء معدل الخط 100Gb / s ، مما يسمح لقاعدة البيانات الموزعة بالتوسع أفقيًا دون الحاجة إلى خوادم إضافية.كما هو مفصل في الرسميةمواصفات MCX653105A-HDAT، تمكن من نقل الذاكرة مباشرة إلى الذاكرة، وتجاوز النواة وخفض فترة التأخير إلى مستويات لم تشهدها من قبل إلا في مجموعات HPC المتخصصة.ورقة بيانات MCX653105A-HDATلتحسين معايير PCIe، وضمان الاستخدام الأمثل لعرض النطاق الترددي Gen4.
هذا النشر يظهر أنحل البطاقات المتكاملة MCX653105A-HDAT Ethernetليس مجرد ترقية تدريجية ولكن عنصر تحويلي للمؤسسات القائمة على البيانات.MCX653105A-HDATوقد سمحت للشركة لتحقيق أقصى قدر من قيمة الاستثمارات الحالية في التخزين والحوسبة. وقد مهدت النجاح الطريق لتوسيع الانتشار إلى مجموعات تدريب التعلم الآلي،حيث أن خصائص انخفاض فترة تأخيرMCX653105A-HDAT للبيعفي السوق الحالية سوف تسريع المزيد من أوقات تدريب النموذج.متوافق مع MCX653105A-HDATوالطبيعة الطبيعية مع أنظمة التشغيل الحالية وأدوات الإدارة تجعلها خيارًا سلسًا لبناء مراكز البيانات الحديثة عالية الإنتاجية.

