NVIDIA-GTC2016-641

عالم الحوسبة ذو القدرة العالية أصبح يرتكز بشكل كبير على المعالجات الرسومية, فلقد أطلقت انفيديا في وقت سابق بطاقة Tesla P100 وكانت تلك البطاقة ظهرت للنور في شهر أبريل من هذا العام ضمن مؤتمر GTC 2016.

هذه البطاقة قد ظهرت كأول منتج مستند على معمارية باسكال الجديدة والتي تستخدم دقة تصنيع 16nm بنواة GP100 الأقوى. وعندما أعلنت انفيديا عن هذه البطاقة  Tesla P100 كانت مواصفاتها وقدرتها مدهشة للغاية فهي أفضل بمراحل عن ما تقدمة سلسلة بطاقات Tesla K/M وما رأيناه من معمارية كيبلر وماكسويل المصنوعتين بدقة 28nm. وإلى جانب كونها معالج رسومي أكبر، فإن بطاقة Tesla P100  تقدم عدد من الميزات الجديدة التي تتضمن كاش أكبر وحوسبة FP16  بسرعة مضاعفة.

الإصدار الأولي لبطاقة Tesla P100..بما يمتاز؟

NVIDIA-GTC2016-11

الإصدار الأولي لبطاقة Tesla P100 المعلن عنه في ذلك الوقت يعتبر الإصدار ذو الأداء الأعلى، فتصميمه يأتي على شكل لوحة PCB يتم تركيبها الحواسب الخارقة وهي تستهلك ما يصل الى 300W وتستخدم موصل mezzanine الجديد لانفيديا مع استخدامها لـ 56 وحدة SMs من أصل 60 وحدة SMs اي أنها لا تستخدم كل قوة نواة GP100. موصل mezzanine يعتبر انتقال جذري من تصاميم بطاقة Tesla التقليدية، بل أيضاً يعتبر شيء ضروري لتسهيل عملية ناقل NVLink عالي السرعة لانفيديا.

فالبطاقة الجديدة مصممة لتوفر أفضل النتائج لتطبيقات التعلم العميق في مراكز البيانات. ستندهش أن تلك البطاقة تتمتع بما يصل الى 150 مليار ترانزستور. وبشكل اكثر تفصيلي فهذه البطاقة عبارة عن لوحة PCB تضم عدد من المكونات أهمها نواة GP100 الأقوى من معمارية باسكال, مع تضمن نفس النواة ذاكرة HBM2 من الجيل الثاني والتي تعتبر أول بطاقة بالعالم تستخدم هذه الذواكر الثورية من الجيل الثاني. نواة البطاقة مصنوع بدقة تصنيع 16nm FinFET وبحجم قالب كبير جداً يصل الى 610mm².

الفروقات بين بطاقات انفيديا Tesla P100

تصميم PCB يبدو كأنه لبطاقة رسومية لكنه صراحة لوحة بطاقة يتم استخدامها مع الحواسب الخارقة, كما هو الحال مع الحاسوب الخارق NVIDIA DGX-1. من ناحية المواصفات فتقدم بطاقة P100 أداء دقة مزدوجة FP64 يصل الى 5.3TFLOP/s وأداء دقة FP32 يصل الى 10.6TFLOP/s وأداء نصف الدقة FP16 يصل الى 21.2TFLOP/s. نفس البطاقة تتضمن ذاكرة 14.2MB SM AF مع ذاكرة L2 cache بحجم 4MB. تجدر الإشارة فقط أن هذه البطاقة سوف تستخدم فقط 56 وحدة SM لتنتج لنا ما يقارب 3584 نواة كودا, حيث تم تعطيل 4 وحدات SM من نواة GP100 كما ذكرنا سابقاً.

من ناحية الترددات فالمعالج الرسومي يعمل بتردد 1480MHz مع Boost, بينما يأتي تردد ذاكرة HBM2 من الجيل الثاني عند 1.4Gbps,  مع واجهة ذاكرة 4096bit, لتوفر عرض نطاق ترددي للذاكرة يصل الى 720GB/sec. حجم الذاكرة التي تحملها البطاقة يصل الى 16GB. وبالنسبة لمرحلة الإنتاج الكمي لهذه البطاقة فلقد بدأ بشكل رسمي في 5 أبريل. وستظهر تلك البطاقة في الخدمة السحابية لشركة انفيديا, بعد ذلك نحو شركات OEM في الربع الأول من السنة القادمة التي ستستخدمها مع سيرفراتها الخاصة.

على الجهة الأخرى..ماذا تقدم بطاقة Tesla P100 ذات إصدار PCIe من اختلاف؟

انفيديا تقدم إصدار PCIe لبطاقة Tesla P100

السبب في تقديم هذه البطاقة ذات إصدار PCIe هو عدم حاجة كل عميل إلى ميزات NVLink, فليس الكل يريد بناء أنظمة خصيصاً من أجل موصل mezzanine، وهنا يأتي دور إصدار PCIe  للبطاقة من تشكيلة Tesla P100 الجديدة كلياً. البطاقة أتت ضمن فعاليات مؤتمر الحوسبة الفائقة الدولي السنوي، المعروف باسم ISC في فرانكفورت ، ألمانيا الذي يصنف من إحدى كبار مؤتمرات الحوسبة الفائقة في العالم, حيث كشفت انفيديا عن جديدها معلنة عن إصدار PCI Express لبطاقة Tesla P100.

وفقاً لما أعلن بشكل رسمي ستشحن انفيديا إصدارين من بطاقة PCIe Tesla P100 للأسواق, وكلاهما سوف يستخدمان نفس عدد وحدات SM وهو 56 وحدة من أصل 60 وحدة, كما ستعمل كلتا البطاقتين بتردد 1.3GHz بدلا من 1.48GHz المستخدم مع بطاقة P100. هذا يدع الناتج الافتراضي للبطاقتين عند أداء الدقة المزدوجة FP64 يصل الى 4.7TFLOP/s وأداء دقة FP32 يصل الى 9.3TFLOP/s وأداء نصف الدقة FP16 يصل الى 18.7TFLOP/s وهي طبعاً أقل مما تقدمه بطاقة Tesla P100 التي تعمل بموصل mezzanine. إن تحدثنا عن استهلاك الطاقة فبطاقات PCIe تستهلك 250 واط بينما بطاقة Tesla P100 بموصل mezzanine تستهلك 300W. وبما أن الإستهلاك لإصدار PCIe هو بنفس مستوى استهلاك بطاقات الجيل الماضي Tesla PCIe فإن ذلك سيكون مناسب للغاية ليتم استخدامها كبدائل من أجل بطاقات Tesla أقدم، بما أنها تمتلك متطلبات التبريد والطافة نفسها, أي ليس عليك سوى استبدال البطاقات والحصول على أداء أفضل بكثير وهذه خطوة تحسب لانفيديا.

P100Board2

أما من ناحية الذاكرة فهي ايضاً تستخدم HBM2 من الجيل الثاني، بحجم 16GB للبطاقة الأقوى مع سرعات التردد ثابته وهي 1.4Gbps التي توفر عرض نطاق ترددي للذاكرة يصل الى 720GB/sec. بينما الإصدار الثاني من البطاقة ذو الفئة الأقل تختلف من ناحية الحجم, فيلاحظ أن هذه البطاقات تشحن مع نفس سرعات تردد المعالج الرسومي وناتج الحوسبة الإجمالي، لكنها تخفض من كمية الذاكرة وعرض نطاق الذاكرة بنسبة 25%. وهذا يعني أن البطاقة الثانية تأتي بحجم 12GB، مع عرض نطاق الترددي للذاكرة 540GB/sec.

هذا النوع من البطاقات موجه لمن؟

NVIDIA-GTC2016-70

كلاً من البطاقتين ستكون موجهتين نحو العملاء الذين لا يريدون موصل NVLink أو هم بحاجة إلى ترقيات بطاقة Tesla PCIe الحالية لديهم. فافتقاد NVLink سيؤثر على الأداء لحد ما في الأنظمة المتعددة البطاقات، لكنه سيكون معتمداً بشكل واضح على عبء العمل. فبالنسبة لأعباء العمل التي لا تتطلب الكثير من الاتصالات عالية السرعة بين المعالجات الرسومية، حينها سيكون الأثر محدوداً بالحد الأدنى، وهذا سيجعل من إصدار PCIe بطاقة جيدة وملائمة لهؤلاء العملاء. فالحوسبة اليوم أمر مهم للغاية وهو جزء لا يتجزء من استخدام الحواسب الخارقة. فهناك مجالات كثيرة لا تحصى تستفيد من قوة الحوسبة هذه وأهما التعلم العميق الذي أصبح جزء لا يتجزء من كبرى الشركات خاصة أن انفيديا التي تعتبر اليوم الرائد رقم واحد فيه, فهو يستخدم بشكل مختلف خاصة في مجال القيادة الذاتية الذي أصبح أمر حقيقي وليس بحلم كان يراودنا في العقد الماضي.

أخيراً وإلى جانب إصدار المواصفات الكاملة للبطاقة الجديدة، أعلنت انفيديا بأن بطاقة PCIe Tesla P100 ستكون متوفرة في الربع الرابع لهذا العام في الأسواق. كما أكدت انفيديا أيضاً أن مشروع ترقية الحاسوب الخارق Piz Daint يجري على قدم وساق لاحقاً هذا العام. فمركز الحوسبة الخارق الوطني السويسري سيقوم بعمل ترقية ضخمة ويستبدل 4500 بطاقة Tesla K20X  للحاسوب الفائق الخاص به مع بطاقات Tesla P100 PCIe الجديدة, ليكون أول حاسوب خارق بالعالم يستخدم البطاقات الجديدة.

ما رأيكم بهذا التطور الملفت في عالم الحوسبة وكيف أصبحت الحواسب الخارقة تنتج لنا قوة حوسبة لا تصدق