NVIDIA Mellanox MCX4121A-ACAT Server Adapter الحل الفني: هندسة RDMA / RoCE لفترة تأخير منخفضة وأقصى

March 9, 2026

NVIDIA Mellanox MCX4121A-ACAT Server Adapter الحل الفني: هندسة RDMA / RoCE لفترة تأخير منخفضة وأقصى


1. خلفية المشروع وتحليل المتطلبات

تواجه مراكز البيانات الحديثة ضغطًا مستمرًا لدعم أعباء العمل المتزايدة والمتطلبة، بما في ذلك التحليلات في الوقت الفعلي، وتدريب التعلم الآلي الموزع، والتخزين عالي الأداء المعرف بالبرمجيات. تعتمد البنى الشبكية التقليدية، التي تعتمد بشكل كبير على مكدس TCP/IP، على زمن انتقال كبير واستهلاك كبير لوحدة المعالجة المركزية. مع انتقال سرعات الارتباط من 10 جيجابت في الثانية إلى 25 جيجابت في الثانية وما بعدها، يصبح نهج "تجاوز النواة" ليس مجرد ميزة، بل ضرورة. يبحث مهندسو الشبكات ومهندسو التخزين عن حلول يمكنها إطلاق العنان للإمكانات الكاملة لبنى NVMe-oF والخدمات المصغرة دون الحاجة إلى إعادة هيكلة كاملة للبنية التحتية. تشمل المتطلبات الأساسية المحددة في نشر واسع النطاق نموذجي زمن انتقال أقل من 10 ميكروثانية لحركة مرور التخزين، وتقليل بنسبة 40٪ في استهلاك وحدة المعالجة المركزية لإدخال/إخراج الشبكة، ونسيج موحد قادر على حمل حركة مرور TCP/IP القياسية وحركة مرور RDMA بزمن انتقال فائق الانخفاض.

2. تصميم بنية الشبكة والنظام الشاملة

تتمحور البنية المقترحة حول نسيج إيثرنت فاقد للخسارة وموحد مصمم لدعم حركة مرور الشبكة المحلية القياسية وحركة مرور التخزين عبر نفس البنية التحتية المادية. يستفيد التصميم من طوبولوجيا الأوراق والأعمدة مع مفاتيح تدعم RoCE (RDMA عبر إيثرنت الموحد). تشمل مبادئ التصميم الرئيسية:

  • النسيج الموحد: شبكة إيثرنت واحدة بسرعة 25 جيجابت في الثانية تحمل جميع أنواع حركة المرور، مما يلغي الحاجة إلى شبكات تخزين وبيانات منفصلة (توحيد الشبكة المحلية/الشبكة التخزينية).
  • أساس إيثرنت فاقد للخسارة: تطبيق التحكم في تدفق الأولوية (PFC، IEEE 802.1Qbb) واختيار الإرسال المحسن (ETS، IEEE 802.1Qaz) لإنشاء فئة خدمة فاقدة للخسارة لحركة مرور RDMA، مما يمنع إسقاط الحزم التي قد تتسبب بخلاف ذلك في ارتفاعات زمن انتقال كارثية.
  • RDMA من طرف إلى طرف: نشر RoCEv2، الذي يعمل على طبقة الشبكة، مما يسمح لـ RDMA باجتياز حدود L3 والتوسع إلى ما وراء نطاق بث واحد، على عكس RoCEv1.

ضمن هذه البنية، يعد نقطة نهاية الخادم المكون الأكثر أهمية. هنا يلعب محول الخادم NVIDIA Mellanox MCX4121A-ACAT دوره المحوري، حيث يعمل كواجهة ذكية تنفذ بروتوكول RoCE وتفرغ وظائف الشبكة المعقدة من وحدة المعالجة المركزية المضيفة.

3. دور NVIDIA Mellanox MCX4121A-ACAT في الحل

يوفر MCX4121A-ACAT حجر الزاوية في نشر جانب الخادم. بناءً على وحدة تحكم ConnectX-4 Lx، يوفر محول MCX4121A-ACAT ConnectX-4 Lx مزدوج المنفذ 25GbE SFP28 هذا التسريع اللازم لتحقيق أهداف المشروع. يتم تفصيل مساهماته المحددة في البنية أدناه:

  • محرك RoCE للأجهزة: ينفذ المحول بروتوكول RoCEv2 بالكامل في السيليكون. هذا يعني أن عمليات RDMA، بما في ذلك قراءات/كتابات الذاكرة وأفعال الإرسال/الاستقبال، تتم معالجتها بالكامل على بطاقة الشبكة، متجاوزة النواة وملغية تبديل السياق. هذه هي الآلية الأساسية لتحقيق زمن انتقال من تطبيق إلى تطبيق أقل من 10 ميكروثانية.
  • تفريغ NVMe-oF: بالنسبة لحركة مرور التخزين، يدعم MCX4121A-ACAT NVMe عبر الشبكات (NVMe-oF) مع RDMA. يقوم بتفريغ معالجة زوج طابور NVMe، مما يسمح لهدف التخزين أو البادئ بمعالجة ملايين IOPS بأقل تدخل من وحدة المعالجة المركزية.
  • تعديل المقاطعة الديناميكي: يقوم المحول بتعديل المقاطعات بذكاء، وتجميعها بناءً على حمل حركة المرور. هذا يقلل من استهلاك وحدة المعالجة المركزية المضيفة أثناء سيناريوهات الإنتاجية العالية مع الحفاظ على زمن انتقال منخفض لحركة المرور الحساسة عن طريق السماح لمقاطعات طوابير معينة بتجاوز التعديل.
  • فرض جودة الخدمة (QoS): يدعم جودة الخدمة المستندة إلى الأجهزة، مما يسمح للمهندسين بتعيين فئات حركة مرور مختلفة (مثل التخزين والإدارة والحوسبة) إلى طوابير أولوية مختلفة. هذا يضمن حصول حركة مرور RDMA على عرض نطاق ترددي مضمون وزمن انتقال منخفض، حتى أثناء ازدحام الشبكة.

4. توصيات النشر والتوسع

يوصى بنهج نشر مرحلي لتقليل المخاطر. يحدد الهيكل والخطوات التالية تنفيذًا نموذجيًا:

  • المرحلة التجريبية: نشر مجموعة صغيرة من خوادم التخزين وعقد الحوسبة، كل منها مجهز بـ MCX4121A-ACAT، متصلة بمفتاح أوراق مخصص يدعم RoCE. التحقق من تكوين PFC/ETS لضمان نسيج فاقد للخسارة لحركة مرور RoCE.
  • التكامل والاختبار: تكوين حل بطاقة محول إيثرنت MCX4121A-ACAT على كل من أهداف التخزين (مثل Ceph أو Lustre أو مصفوفات NVMe-oF الخاصة) وتطبيقات العميل. استخدم برامج تشغيل وأدوات NVIDIA الموصى بها مثل perftest لقياس زمن الانتقال الأساسي (ib_send_lat) وعرض النطاق الترددي (ib_send_bw).
  • توسيع النسيج: بمجرد استقرار المرحلة التجريبية، قم بالتوسع إلى طوبولوجيا أوراق وأعمدة كاملة. تأكد من أن مفاتيح الأعمدة تدعم RoCE أيضًا للحفاظ على علامات جودة الخدمة الفاقدة للخسارة عبر الشبكة بأكملها. تسمح الطبيعة المزدوجة المنفذ لـ NVIDIA Mellanox MCX4121A-ACAT بالتجميع النشط/الاحتياطي أو تجميع الارتباط 802.3ad للتكرار وزيادة الإنتاجية.
  • فحوصات التوافق: تحقق دائمًا من إصدارات الأجهزة والبرامج الثابتة المتوافقة مع MCX4121A-ACAT. يجب مراجعة مواصفات MCX4121A-ACAT و ورقة بيانات MCX4121A-ACAT لضمان التوافق مع اللوحات الأم للخادم وإعدادات BIOS وبرامج المفاتيح الثابتة. لتخطيط المشتريات، يمكن الحصول على سعر MCX4121A-ACAT وتوافره من خلال الموزعين المعتمدين، خاصة عند التخطيط لمشتريات MCX4121A-ACAT للبيع على نطاق واسع.

5. المراقبة التشغيلية واستكشاف الأخطاء وإصلاحها والتحسين

يتطلب الحفاظ على الأداء الأمثل مراقبة استباقية وفهمًا قويًا لسلوك نسيج RoCE. تشمل التوصيات الرئيسية لفرق العمليات ما يلي:

  • مراقبة حركة مرور RDMA: استخدم أدوات مثل ethtool و mlxstat و UFM (Unified Fabric Manager) من NVIDIA لمراقبة درجة حرارة المحول وأخطاء الارتباط وحالات أزواج طوابير RDMA. تشمل المقاييس الهامة: إسقاط حزم RoCE، وعدد إطارات إيقاف PFC المؤقت، واستخدام عرض النطاق الترددي لـ PCIe.
  • عزل الأعطال: يحدث زمن الانتقال العالي في حركة مرور RDMA دائمًا بسبب إسقاط الحزم بسبب الازدحام. تحقق من إطارات إيقاف PFC المؤقت؛ إذا تم إيقاف طابور معين بشكل مفرط، فهذا يشير إلى اختناق في المصب (على سبيل المثال، على منفذ خروج المفتاح). يمكن للعدادات المتقدمة لـ MCX4121A-ACAT المساعدة في تحديد المصدر الدقيق للازدحام.
  • ضبط الأداء:
    • حجم MTU: زيادة إلى 9000 بايت (إطارات جامبو) على كل من المحول والمفاتيح لتقليل الحمل لكل حزمة وتحسين أداء الإدخال/الإخراج الكبير.
    • توسيع جانب الاستقبال (RSS): تأكد من تكوين RSS لتوزيع حركة المرور عبر نوى وحدة معالجة مركزية متعددة، مما يسمح للمحول بمعالجة معدلات الحزم العالية في الثانية (PPS).
    • ضبط المخزن المؤقت: اضبط مخازن الاستقبال والإرسال للمحول بناءً على خصائص عبء العمل (على سبيل المثال، مخازن أكبر للتخزين، أصغر لـ HPC).

6. الخلاصة وتقييم القيمة

يوفر MCX4121A-ACAT من NVIDIA Mellanox أساسًا ناضجًا وعالي الأداء لبناء مراكز بيانات الجيل التالي. من خلال دمج هذا المحول في نسيج RoCEv2 مصمم جيدًا، يمكن للمؤسسات تحقيق نتائج تحويلية: يمكن زيادة إنتاجية الخادم إلى الحد الأقصى حيث يتم تحرير وحدة المعالجة المركزية من حمل الشبكة؛ يتم تقليل زمن الانتقال بشكل كبير إلى ميكروثانية أحادية الرقم، مما يتيح التطبيقات في الوقت الفعلي؛ ويتم خفض التكلفة الإجمالية للملكية من خلال توحيد البنية التحتية. بالنسبة للمهندسين الذين يخططون لخارطة طريق 25 جيجابت في الثانية الخاصة بهم، يمثل MCX4121A-ACAT استثمارًا استراتيجيًا في الأداء والكفاءة، مدعومًا بالنظام البيئي القوي لـ NVIDIA Mellanox.