الرئيسية المقالات

A100 PCIe..وحش آخر من معمارية NVIDIA Ampere يكشر عن أنيابه

عادة ما تطلق NVIDIA إصدار SXM و PCIe من المسرعات الخاصة بها لتخدم مختلف الأطراف كما حدث مع البطاقات السابقة, واليوم تقدم لنا إصدار PCIe من البطافة المسرعة A100 💪

بعد التدشين الناجح للبطاقات المسرعة Tesla التي كانت من خلال إصدار Tesla P100 بدقة 16nm وبتصميم SXM من معمارية Pascal, تلى ذلك إصدار Tesla V100 بدقة 12nm بتصميمين SXM2 / PCIe 3.0 من معمارية Volta, وقبل شهر من الأن أطلقت إصدار A100 SXM بدقة 7nm بتصميم SXM4 من معمارية Ampere…تلحقها اليوم بإصدار A100 PCIe بنفس المواصفات ولكن تعمل بواجهة PCIe من الجيل الرابع, في هذا المقال نسلط الضوء على جديد NVIDIA.

إطلاق بطاقة A100 بإصدار PCIe يهدف لتعزيز مجال الحوسبة عالية الأداء, فصحيح أنها لا تختلف بالمواصفات عن البطاقة المسرعة السابقة إلا أنها أصبحت تعمل بواجهة PCIe بجانب انخفاض استهلاك الطاقة بقدر 150 واط. ماهو السبب وراء هذا الإصدار؟

عادة ما تطلق NVIDIA إصدار SXM و PCIe من المسرعات الخاصة بها لتخدم مختلف الأطراف كما حدث مع البطاقات السابقة, فمن سيتوجه نحو إصدار SXM يهدف لتحقيق أعلى قدر من الأداء في العمليات الحوسبية والتي تستخدم فيها منصة NVIDIA HGX لتركيب تلك المسرعات, لتخدم الشركات المصنعة لإنشاء واحدة من أكثر الأنظمة تقدماً في مجال الذكاء الاصطناعي والحوسبة عالية الأداء.

صورة لمنصة HGX التي تضم مسرعات A100 SXM4

تخيل أن المنصة الواحدة HGX تتسع لتركيب 8 مسرعات A100 و 6 رقاقات NVSwitch “يمكن مضاعفة ذلك إلى 16 مسرع” حيث سنجد أن كل مسرع A100 يتضمن جسر NVLink الذي يتصل برقاقات NVSwitch من الجيل الثاني من خلال 12 منفذ ليكون قادر على أن يتصل بشكل كامل مع كل المسرعات الثمانية. بلغة أسهل هذا يعني إمكانية أن يتصل كل معالج رسومي بمعالج رسومي أخر من خلال جسر NVLink بسرعة كاملة تصل إلى 600GB/s وهي أسرع بعشر مرات مما توفره واجهة PCIe x16 من الجيل الرابع, ولكن لكل شيء ثمنه كما يقال 💸💸💸 فهذه الإصدارات ذات تكلفة مالية مرتفعة والمنصة ككل تحتاج إلى نظام تبريد عالي لتحقيق المستوى المطلوب من الأداء الحوسبي لان المسرع الواحد A100 يستهلك 400 واط من الطاقة.

اما من سيفضل إصدار PCIe فشركة NVIDIA لم تبخل عليهم وقدمت لهم نفس البطاقة المسرعة بهذا التصميم لكي تعمل بسهولة ضمن السيرفرات القياسية المستندة على منفذ PCIe, وبهذه الطريقة تضرب NVIDIA عصفورين بحجر واحد ليبقى الاختيار عائد للشركات والمؤسسات في اختيار البطاقة المسرعة المناسبة لهم. نعيد ونكرر فيما يخص ذروة الأداء، فإن بطاقة PCIe A100 تعمل بسرعة نظيرتها SXM4 بنسبة كبيرة جداً نتيجة لذلك بطاقة A100 ذات إصدار PCIe تقدم لنا كل شيء تعرضه A100 ذات إصدار SXM4…ولكن 🤚

هل هذا يعني أن هناك انخفاض بالأداء الاجمالي عطفاً على استهلاك الطاقة المنخفض؟

يمكن أن نقول ذلك, فبشكل مبدئي تؤكد NVIDIA أن هذه البطاقة المسرعة سوف تعرض لك نفس مستوى ذروة الأداء لإصدار SXM4 من نفس البطاقة, ولكن بنفس الوقت تشير إلى أن انخفاض استهلاك الطاقة من 400 واط إلى 250 واط سوف يخفض مستوى الاداء بنسبة %10 عند المقارنة مع مسرع واحد, وستصل النسبة إلى 33% عند مقارنة المسرعات بوضعية تعدد البطاقات الرسومية مثل 8 مسرعات A100-SXM4 مقابل 8 بطاقات مسرعة A100 PCIe المتصلة بجسر NVLink من الجيل الثالث.

نلاحظ أن مقدار انخفاض استهلاك الطاقة قدر بنسبة 38% وهي نسبة ليست بالقليلة، ونتيجة لذلك سنجد أن البطاقة المسرعة PCIe A100 لن تكون قادرة منطقياً على مماثلة أرقام الأداء المستدامة لإصدار SXM4 التي تحتاج إلى تبريد أفضل وتستهلك مقدار أعلى من الطاقة. بقول كذلك، فإن إصدار PCIe لـA100 ينبغي أن يقدم حوالي 90% من أداء إصدار SXM4 في وضعية المعالج الرسومي الواحد! هل هذه نتائج سيئة؟ لا بكل تأكيد بل هي نتائج ممتازة خاصة عند الحديث عن انخفاض كبير في معدل استهلاك الطاقة.

البطاقة المسرعة PCIe A100 تستخدم جسر NVLink لتسمح بتوصيل بطاقتين فقط بأن يتم ربطها معاً, ماذا يعني ذلك؟ يعني أنه وفي حالة إصدار SMX سنلاحظ إمكانية توصيل 8 مسرعات ببضعها البعض في منصة HGX, بينما مع إصدار PCIe فلا يمكن توصيل سوى بطاقتين مع بعضهما البعض من خلال جسر NVLink, مع ذلك هذا لا يعني بأي شكل من الأشكال أن السيرفر لن يتسع سوى لبطاقتين, بالعكس سوف يتسع لتركيب 8 بطاقات مسرعة بداخله ليكون الفارق فقط أن كل اثنتين منها متصله بجسر NVLink من الجيل الثالث الذي ينبغي له أن يدفع عرض النطاق الترددي لرقم أعلى من ذلك يقدر بـ 150GB/s.

تجدر الإشارة ان جسر NVLink من الجيل الثاني والذي اطلق مع معمارية Volta كان قادر على عرض نطاق ترددي بـ 300GB/s مع استخدام 6 روابط للمعالج الرسومي الواحد بينما الجيل الثالث الموجه لمعمارية Ampere سوف يدفع عرق النطاق الترددي إلى 600GB/s باستخدام 12 رابط للمعالج الرسومي الواحد.

ماذا عن المواصفات الخاصة بالبطاقة المسرعة؟

حسناً, في البداية تستخدم هذه البطاقة نواة GA100 بدقة 7nm من معمارية Ampere بحجم قالب 826mm^2 فهي نفس النواة المستخدمة مع إصدار SXM4 كما أن كامل مواصفاتها هي نفسها. تتضمن النواة 108 وحدة حوسبة التي تعادل 6912 نواة كودا مع 432 نواة Tensor مع 54 مليار ترانزيستور. بهذه القوة تستطيع هذه البطاقة المسرعة من تحقيق أداء حوسبي FP16 بقدر 78TFLOPS و بأداء حوسبي FP32 بقدر 19.5TFLOPS وبأداء حوسبي FP64 بقدر 9.7TFLOPS.

تعمل البطاقة بتردد 1410MHz مع ذاكرة HBM2e بتردد 2430MHz مع واجهة ذاكرة 5120bit بحجم 40GB بعرض نطاق ترددي فائق يصل إلى 1555GB/s…الفرق الوحيد هو استهلاك الطاقة الذي يصل إلى 250 واط + دعمها لواجهة PCIe 4.0 الجديدة والتي تدعمها في الوقت الحالي فقط منصة AMD EPYC, مما يجعل منهما خياراً ذكياً للمؤسسات والشركات.

في الختام  ليس هناك أي معلومات بعد عن السعر ولكن عدد من كبار الشركات المصنعة للسيرفرات بدأت بتقديم تشكيلتها المتضمنة لهذه البطاقة المسرعة, كما سيكون هناك أكثر من 30 طراز مختلف من تشكيلة السيرفرات التي تتضمن PCIe V100..اكثر ما جعلني متحمساً هو إمكانية رؤية بطاقات GeForce من الفئة العليا بدقة تصنيع 7nm من العملاق TSMC, رغم أن هناك الكثير من المعلومات المتضاربة التي تتحدث عن الاعتماد على دقة 10nm من سامسونج…لننتظر ونرى إلى أين ستؤول الامور.