مؤتمر GTC26: منصة Vera Rubin ترفع سرعة الحوسبة لمستويات غير مسبوقة

أعلنت إنفيديا عن منصة Vera Rubin خلال مؤتمرها التقني Nvidia GTC 2026، وقدمت رؤية جديدة لبُنى مراكز البيانات المخصّصة لتشغيل «الوكلاء الذكيين» على نطاق واسع، وأعلنت عن تشغيل سلسلة من الرفوف الموحّدة التي تجمع شرائح معالجة وكروت شاشة وشبكات وتخزين في منظومة واحدة، بهدف خفض زمن الاستجابة وتخفيض تكلفة كل توكن.

منصة Vera Rubin تجمع GPU وCPU وDPU في رف واحد متكامل.
رف NVL72 يربط 72 معالج رسومي و36 معالج مركزي بسرعة عالية.
يرفع التبريد السائل 45°م من الكفاءة ويخفض استهلاك الطاقة.
تقلل المنصة زمن الاستجابة وتزيد سعة الجلسات المتزامنة لتطبيقات الذكاء الاصطناعي.

كيف رُكّبت منصة Vera Rubin؟

قدّمت الشركة رف NVL72 كوحدة متكاملة داخل مركز البيانات حيث يجمع هذا الرف 72 معالج رسوميًت «كارت شاشة» من معمارية Rubin إلى جانب 36 معالجًا مركزيًا Vera CPU، وترتبط هذه المكوّنات عبر تقنيات اتصال عالية السرعة مثل NVLink وConnectX-9 وBlueField-4 للسماح بانتقال البيانات بسرعة كبيرة بين المعالجات المختلفة.

يهدف تصميم منصة Vera Rubin إلى تسهيل معالجة مهام الذكاء الاصطناعي المُعقّدة -خصوصًا عندما تحتاج الأنظمة إلى مشاركة المعلومات بسرعة بين عدّة نماذج أو جلسات في الوقت نفسه، ولهذا اعتمدت المنصة فكرة «الرف كوحدة حوسبة متكاملة» بحيث يعمل الرف بالكامل كأنه نظام واحد ضخم بدل مجموعة خوادم «سيرفرات» مُنفصلة.

جمعت NVL72 بين GPU وCPU وDPU في حاوية واحدة.
وفّرت روابط عالية السرعة لخفض زمن الاستجابة في تبادل البيانات.

فريق عرب هاردوير سيكون معكم بتغطية كاملة ومباشرة لهذا المؤتمر

تبريد Vera Rubin وقدرته

اختبرت فرق التصميم تبريدًا سائلًا يعمل بمياه تصل حرارة دخولها إلى نحو 45°م ليسمح بتشغيلها بدون الحاجة لأنظمة تبريد تقليدية باهظة الاستهلاك، وأدى هذا إلى قدرة أعلى على الكفاءة التشغيلية وفتح مسارات لتخفيض تكلفة الطاقة أثناء الاستخدام المُكثف.

هناك أيضًا تعاون مع بعض المُصنّعين لتوفير قواعد تركيب وكثافات طاقة مناسبة، وأعلنت شركات تصنيع خوادم مثل Supermicro عن حِزم جاهزة لتمكين تركيب NVL72 في مراكز البيانات مع متطلبات كهرباء وتبريد مُهيّأة.

رفّ NVIDIA المعروف باسم Vera Rubin NVL72 صُمّم ليقدم أرقامًا تشغيلية كبيرة تشمل: قدرة تشغيل تقارب 3.6 exaFLOPS بدقة NVFP4، مع عرض نطاق HBM4 إجمالي يُقدّر بحوالي 1.4 PB/s وسعة ذاكرة عالية السرعة داخليّة تُقارب 75 تيرابايت.

أثر شراكات وحدات التسريع المتخصصة

أشارت التقارير إلى تعاون مع شركات متخصّصة في تسريع عمليات الاستدلال بهدف تحسين أداء التطبيقات التي تتطلب استجابة شبه فورية، ومن الأمثلة على ذلك العمل مع Groq التي تطوّر رقاقات مصمَّمة لتسريع مراحل معالجة النصوص داخل النماذج، مثل خطوة تحويل المدخلات إلى تمثيل رقمي (encoding) ثم إنتاج الردّ النهائي كلمةً بعد كلمة (decoding).

يساهم هذا النوع من التسريع في تقليل زمن الاستجابة بشكل ملحوظ، وهو عامل حاسم في التطبيقات التفاعلية مثل الدردشة الفورية أو أنظمة الوكلاء الذكيين.

انعكاسات فورية على التطبيقات والسوق

قدّرت الشراكات والتقارير أن نشر منصات من هذا النوع سيُخفّض زمن الاستجابة ويرفع القدرة على خدمة آلاف الجلسات المُتزامنة، والذي يجعل تجربة المحادثة الفورية أكثر سلاسة مع خفض تكلفة كل تفاعل.

قللت المنصة تكلفة الاستدلال لكل محادثة في أوضاع الاستخدام المُرتفع.

زادت سعة الجلسات المُتزامنة لتطبيقات الدردشة والخدمات الذكية.

أرى أن امتلاك بنية قوية يوفّر المادة الخام، لكن النجاح الحقيقي يعتمد على أدوات الإدارة والبرمجيات التي تحول هذه القدرة إلى خدمة يلمسها المستخدم يوميًا.

تمثل منصة Vera Rubin خطوة ملموسة نحو مستقبل الذكاء الاصطناعي القادر على التعامل مع بيانات ضخمة بسرعة وكفاءة، وهو ما يفتح المجال لتجارب مستخدم أفضل وخدمات أكثر سلاسة مع استمرار الشركات في اختبار الأداء وتحسين البنية التحتية.