الدليل الفني للحلول: NVIDIA Mellanox MCX623106AN-CDAT لتحسين زمن الاستجابة المنخفض والإنتاجية لـ RDMA/RoCE
March 11, 2026
تحت ضغط مستمر معماريات مراكز البيانات الحديثة لتقديم تأخير أقل وسرعة عمل أعلى مع الحفاظ على كفاءة وحدة المعالجة المركزية لحملات العمل التطبيقية.مع تكاليف البروتوكول المتأصلة، غالبا ما يفشل في تلبية متطلبات الحوسبة عالية الأداء (HPC) ، والذكاء الاصطناعي (AI) ، والخدمات المالية.هذا الكتاب الأبيض التقني يقدم حلًا شاملًا مبنيًا علىMCX623106AN-CDATمحول الخادم ، يركز على تنفيذ RDMA عبر Ethernet Converged (RoCE) للحد بشكل كبير من فترة التأخير وزيادة سعة الخادم. موجهة إلى مهندسي الشبكات ومهندسي ما قبل المبيعات ،ومديري العمليات، هذه الوثيقة تحدد الهندسة المعمارية واستراتيجيات النشر وأفضل الممارسات التشغيلية للاستفادة من هذه التكنولوجيا المتقدمة.
1خلفية المشروع وتحليل المتطلبات
التحدي الرئيسي الذي يعالجه هذا الحل هو "ضريبة البيانات" التي تفرضها كومة الشبكات القائمة على النواة. في السيناريوهات التي تتطلب تبادل البيانات عالية التردد، مثل التخزين الموزع،تدريب التعلم الآلييتم إهدار دورات وحدة المعالجة المركزية في معالجة الحزم وحسابات مجموعات التحقق وتبديلات السياق. تتضمن المتطلبات الأساسية للبنية التحتية الحديثة:
- تأخير منخفض جداًيجب تقليل فترة تأخير التطبيقات من نهاية إلى نهاية، ويفضل أن تكون في نطاق أقل من 10 ميكرو ثانية للاتصال بين الخوادم.
- محرك المعالجة المركزيةيجب أن تتعامل نسيج الشبكة مع حركة البيانات ، مما يحرر نواة المعالج للمهام المكثفة من الحوسبة.
- قابلية التوسع:يجب أن تدعم الهندسة المعمارية نسيجًا مسطحًا واسع النطاق الذي يمكن أن يتوسع من عشرات إلى آلاف العقد دون تدهور الأداء.
- القواعد القائمة:يجب أن يستفيد الحل من البنية التحتية الحالية لـ Ethernet لحماية الاستثمار مع إدخال قدرات متقدمة.
الـNVIDIA Mellanox MCX623106AN-CDATوقد ظهرت كمكون أساسي لتلبية هذه المتطلبات الصارمة.بطاقة مكيستير إيثرنت MCX623106AN-CDAT، تم تصميمه خصيصًا لتمكين RDMA عبر شبكات Ethernet القياسية.
2تصميم بنية الشبكة بشكل عام
الهندسة المعمارية المقترحة هي نسيج العمود الفقري الأوراق المصممة لبيئة RoCE غير الخاسرة. The key principles include a non-blocking core with sufficient oversubscription ratios and the enablement of Priority Flow Control (PFC) and Explicit Congestion Notification (ECN) across all network devicesيدمج التصميم حركة الحوسبة والتخزين والإدارة على نسيج إثنتر متوحد عالي السرعة.
في قلب هذا التصميم هي عقد الخادم، كل مجهزةبطاقة الشبكة PCIe MCX623106AN-CDATهذا المحول يصل إلى مفاتيح الأوراق عبر روابط 25GbE أو 100GbE ، اعتمادا على كثافة الحمل. توفر الطبقة العمود الفقري اتصالًا كاملًا بين الأوراق ،ضمان أي إلى أي مسارات ذات تأخير منخفضيتم أيضًا توصيل أهداف التخزين ، مثل صفوف NVMe-oF ، بنفس النسيج باستخدام محولات متوافقة ، مما يتيح الوصول المباشر إلى الذاكرة من عقد الحوسبة.
3دور NVIDIA Mellanox MCX623106AN-CDAT في الحل
الـMCX623106AN-CDATليست مجرد واجهة شبكة؛ إنها وحدة معالجة بيانات متطورة (DPU) مقدمة تتعامل مع جميع جوانب اتصالات RDMA. دورها متعدد الأوجه:
- محرك RDMA/RoCE:تنفذ أجهزة المحول بروتوكول RoCEv2 ، مما يضم معاملات RDMA عبر UDP / IP. وهذا يسمح بالاتصال القابل للتوجيه والذي يحتوي على تأخير منخفض دون إشراك وحدة المعالجة المركزية المضيفة.
- النقل:وهي تدير إنشاء الاتصال، وتسلسل الحزم، والنقل الموثوق به، وتقدم واجهة بسيطة من الذاكرة إلى الذاكرة للتطبيقات.
- واجهة PCIe Gen4:مع واجهة المضيف PCIe 4.0 ذات النطاق الترددي العالي ، يضمن المحول أنه يمكن نقل بيانات الشبكة من و إلى ذاكرة النظام بمعدل الخط ، مما يمنع اختناقات داخلية.مواصفات MCX623106AN-CDATتأكيد قدرتها على إشباع الروابط عالية السرعة بالكامل.
4توصيات النشر والتوسع
يتطلب النشر الناجح تكوينًا دقيقًا لكل من نسيج الشبكة والمضيفين النهائيين. يتم التوصية بالخطوات التالية للتنفيذ التدريجي:
- تحضير الأقمشة:قبل نشر الخوادم ، قم بتكوين جميع المفاتيح في المسار لـ RoCE بدون خسارة. وهذا ينطوي على إعداد PFC (802.1Qbb) لفئة حركة RoCE وتمكين ECN (802.1Qau) لإدارة الازدحام.
- تثبيت برامج التشغيل والبرمجيات الثابتةقم بتثبيت أحدث برامج تشغيل NVIDIA WinOF-2 أو MLNX_OFED لضمان دعم كامل للميزاتMCX623106AN-CDATتحقق من أن البرنامج الثابت يطابق الإصدار المحدد فيورقة بيانات MCX623106AN-CDAT.
- إعدادات جودة الخدمة:تنفيذ سياسات خدمة الجودة لتحديد أولويات حركة RoCE (مثل قيم DSCP) وضمان عدم التعامل مع حركة TCP العادية.تتضمن الطوبولوجيا النموذجية تجميع عقد التخزين والحوسبة في نفس مجال RoCE لأداء مثالي.
- اعتبارات التوسع:كما ينمو النسيج، واستخدام ميزات المكيف المتقدمة مثل "RoCE التوجيه التكيفي للحفاظ على تأخير منخفض عبر مسارات متعددة. تأكد من أن جميع العقد الجديدةمتوافق مع MCX623106AN-CDATمع البنية التحتية للتبديل القائمة.
5المراقبة التشغيلية وإصلاح الأخطاء والتحسين
الحفاظ على نسيج RDMA يتطلب أدوات وممارسات محددة. توفر NVIDIA مجموعة شاملة لإدارة ومراقبةMCX623106AN-CDAT.
- أدوات المراقبة:استخدم Mellanox NEO من NVIDIA أو الأدوات القياسية مثل'mlxlink' و'mlxconfig' للتحقق من سلامة الرابط ودرجة الحرارة وعدادات الأخطاء.استطلاعات رأي SNMP يمكن تتبع إحصاءات واجهة محددة لحركة المرور RoCE.
- المقاييس الرئيسية:مراقبة إطارات توقف PFC ، والتي تشير إلى ضغط العازل في النسيج. يمكن أن تؤدي أعداد توقف عالية إلى تضخم فترات التأخير وتتطلب ضبط أحجام العازل أو عتبات ECN.
- تحديثات البرمجيات الثابتة والسائق:تحقق بانتظام من تحديثات البرمجيات الثابتة للمكيف. يتم إضافة تحسينات الأداء والميزات الجديدة بشكل متكرر، مما يعزز قدرات هذاحل البطاقات المتحولة لـ MCX623106AN-CDAT Ethernet.
- ضبط الأداء:تعديل المعلمات مثل تعديل المقاطعة وإعدادات الاندماج لتحقيق التوازن بين فترة الكمون واستخدام وحدة المعالجة المركزية بناءً على ملفات تعريف التطبيقات المحددة.
6ملخص وتقييم القيمة
الحل التقني يركز حولNVIDIA Mellanox MCX623106AN-CDATيوفر مساراً واضحاً وقابلاً للتنفيذ لتحقيق اتصالات منخفضة التأخير القائمة على RDMA / RoCE ومكاسب كبيرة في معدل سرعة الخادم.من خلال تحميل معالجة الشبكة إلى أجهزة مخصصة وتمكين الوصول المباشر إلى الذاكرة، يمكن للمنظمات إطلاق الإمكانات الكاملة لتطبيقاتها.MCX623106AN-CDAT السعربالنسبة إلى دورات وحدة المعالجة المركزية الموفّرة والأداء المكتسب، فإن عائد الاستثمار مقنع.MCX623106AN-CDAT للبيعأو تخطط لنشر جديد، هذا المحول يبرز ككتلة بناء حاسمة للجيل القادم، مراكز البيانات عالية الكفاءة.

