اهم ما جاء في فعاليات مؤتمر NVIDIA GTC 2015
تابعنا جميعًا فعاليات مؤتمر انفيديا GTC 2015 المميز والذي تم افتتاحه بشكل رسمي في 17 مارس وانتهى في 20 مارس وذلك بتقديم عرض شامل بدئه المدير التنفيذي جين سون-هوانغ متحدثا عن ما لدى انفيديا من منتجات جديدة مقدما البطاقة الرسومية الأسرع في العالم وهي GTX TITAN X وتطرق أيضا لخارطة العمل الجديدة لمعمارية المعالجات الرسومية، وأيضا طرح ما لدى انفيديا من حلول حديثة فيما يتعلق بالتعلم العميق أو ما يعرف بـ deep learning بالإضافة الى تقديم منتجها الجديد DIGITS DevBox. سوف نتحدث عن هذه النقاط الأربع التي تطرق لها المدير التنفيذي جين سون بشكل تفصيلي وذلك لمن لم يتابع الحدث وتغطيته من قبلنا.
بطاقة GTX TITAN X...هي البطاقة الرسومية الأسرع في العالم
كان الجميع ينتظر قدوم هذه البطاقة وليس فقط لأنها من فئة بطاقات TITAN إنما لأنها تستخدم النواة الأقوى من معمارية ماكسويل الجديدة وهي GM200، حيث تتميز هذه النواة بقوة رسومية هائلة واستهلاك طاقة منخفض مقارنة بالأجيال السابقة.
كما ذكرنا بطاقة GeForce GTX TITAN X تستخدم المعالج الرسومي GM200 وذلك مع تفعيل كامل وحدات SMM، والذي يضم 3072 نواة كودا، 192 وحدة Texture Mapping و96 وحدة Raster، كما أن النواة تحتوي على 8 مليار ترانزستور.
المعالج الرسومي منقسم إلى 6 مجموعات معالجة رسومية، كل منها يمتلك 4 وحدات SMM. المعالج الرسومي بشكله الكامل يمتلك 24 وحدة SMM و 3072 نواة كودا بالإجمال (أي كل وحدة تمتلك 128 نواة). هناك 6 وحدات تحكم ذاكرة ( كل منها بعرض 64b)، مما يسمح بإتصال بواجهة ذاكرة 384bit. ببساطة تعتبر بطاقة GTX TITAN X بطاقة رسومية تقدم أكثر بنسبة 50% عن كل شيء موجود في بطاقة GTX 980. هذه البطاقة مضبوطة عند تردد 1002MHz، ومع boost تعمل تبردد 1089MHz بينما ستعمل الذاكرة عند تردد (1753MHz (7 GHz. كما ان بطاقة TITAN X هي بطاقة GeForce الثانية (بعد TITAN Z) التي تصل مع ذاكرة بحجم بـ12GB.
بطاقة TITAN X تستهلك طاقة 250W وهي أقل مما تستهلكه بطاقة Radeon R9 290X، لكن أكثر بكثير من بطاقة GTX 980 ولكن ايضا نفس استهلاك بطاقة GTX 780 و بطاقة GTX 580! سوف تحصل على أداء أفضل بنسبة 30-40% مع استهلاك أعلى بـ85W من بطاقة GTX 980، ذلك مدهش فعلا، والذي يؤكد ذلك ووفقا للمراجعات التي صدرت للبطاقة فهي تقدم أداء أفضل من بطاقة GTX 980 بحوالي 25% الى 30% عند دقة 1440P بينما مع دقة 4K فهي تتفوق على بطاقة GTX 980 بحوالي 35% الى 40%. بينما عند مقارنتها مع بطاقة R9 295X2 فهي تعادلها تقريبا بالأداء خاصة مع دقة 4K (ولكن في حالات تكون أبطئ بحوالي 9%), ومن جهة ثانية بطاقة TITAN X تقدم نفس الأداء لبطاقتين GTX 970 SLI.
مع قوة المعالجة الرسومية وعرض نطاق ترددي بـ336.5GB/s، فيمكن لهذه البطاقة بسرعة هائلة من معالجة ملايين البيانات المستخدمة لتدريب شبكات عصبية عميقة. عند تجربة AlexNet، وهو النموذج القياسي لمجال الصناعة، حققت بطاقة TITAN X نتيجة سريعة وهي أقل من ثلاث أيام لتدريب النموذج باستخدام 1.2مليون صورة ImageNet، بينما مقارنة مع أكثر من 40 يوم لمعالج Intel صاحب 16 نواة, كما تلاحظ فرق كبير.
من ناحية كسر السرعة فبطاقة TITAN X يمكن كسر سرعتها بسهولة لتصل الى تردد (1200MHz (1280 MHz boost (وفي حالات يمكن ان تصل الى تردد أعلى ان كان لديك حلول تبريد أفضل مثل التبريد المائي). ستعمل الذاكرة ايضا عند تردد(2000MHz (8GHz تقريبا. أخيرا البطاقة هذه أصبحت متوفرة في الأسواق وبسعر 999 دولار. طبعا في اليوم الذي صدرت فيه المراجعة للبطاقة صدر أيضا تعريف خاص للبطاقة المعروف بإسم GeForce Game Ready برقم GeForce 347.88 WHQL ويمكنك من تحميله من هنا.
تعريفات GeForce Game Ready تم تقدميها لتمنح اللاعبين تجربة اللعب الأفضل مع اللعبة الجديدة وذلك بمجرد أن يتم إطلاقها. قبل الإطلاق فإن تلك الألعاب الجديدة يتم اختبارها بشكل شامل في مختبرات انفيديا لضمان أن اللعبة ستعمل بأفضل ما لديها على بطاقتك الرسومية. ترافق إطلاق البطاقة مع صدور التعريف من اجل لعبة Battlefield Hardline, حيث يقدم تعريف Game Ready عدة تحسينات لأداء لعبة Battlefield Hardline إضافة إلى دعم SLI محدث.
معمارية باسكال تطور ملفت عن معمارية ماكسويل
كشف جين سون عن خارطة عمل معمارية المعالجات الرسومية لشركة انفيديا من أجل المستقبل القريب القادم وذلك بين عام 2016 و 2018. المدير التنفيذي لانفيديا ركز على معمارية باسكال، الذي يُتوقع أن يُطلق في السنة المقبلة وايضا ذكر فقط اسم المعمارية المقبلة بعدها وهي فولتا. ستكون باسكال المعمارية الأول التي تقدم دقة مختلطة او ما يعرف بـ Mixed Precision. وستتميز أيضا بذاكرة 3D، و NVLink. ضمن حديثه في فعاليات المؤتمر، جين سون تحدث عن توقعات مفاجئة جدا وخاصة حينما تطرق للأداء المحتمل للمعمارية الجديدة مقارنة مع معمارية ماكسويل.
يمتلك باسكال ضعف أداء الفاصلة العائمة عن ماكسويل، يمتلك باسكال سعة ذاكرة أكثر بمرتين ونصف عن ماكسويل، ويمتلك باسكال دقة مختلطة أكثر بأربع مرات عن ماكسويل، كل ذلك ينتهي بقول أن معمارية باسكال سوف يكون أسرع بعشرة أضعاف أداء معمارية ماكسويل! نعم هذا صحيح الذي يقصده بذلك أن تحسينات الحوسبة وعرض النطاق الترددي سيوفر تقريبا أداء أكثر بخمس مرات عن ماكسويل. إضافة لذلك، بفضل اتصال multi-gpu الجديد المسمى NVLink فإن ذلك سيضاعف هذا الأداء، مما يمنحنا عشرات المرات مايعرضه ماكسويل اليوم.
السنوات القليلة القادمة ستجلب تغيرا هائلا لمجال صناعة المعالجات الرسومية وهو كلام صحيح 100% من جين سون، حيث تخيل معنا أننا مقبلون على معمارية تحتوي لأول مرة على ذاكرة 3D مكدسة، مع NVLink, ودعم لـ DirectX12 بالإضافة إلى قدومها بدقة تصنيع أصغر ويتوقع أن تكون 14nm أو 16nm. كما يُتوقع أن يكون عرض النطاق الترددي لذاكرة معمارية باسكال عند 750GB/s. وهذا يُترجم تقريبا إلى تردد بـ1500MHz و أربعة طرازات HBM مكدسة ولكل منها 1024bit. كما سيقدم باسكال سعات ذاكرة أعلى بكثير تخيل ان نشهد بطاقة رسومية من فئة عليا بذاكرة بحجم 32GB, بينما معمارية فولتا ستضاعف هذه القيمة إلى 64GB!
سيارة بقيادة ذاتية أمر ممكن مع DRIVE PX
كان هناك اهتمام في جانب السيارات ذاتية القيادة من قبل انفيديا وذلك بتوفيرها لأحد الحلول المطلوبة اليوم. مافعله المدير التنفيذي جين سون في خطابه الافتتاحي في 2015 GPU Technology Conference كان إعلان بشكل رسمي عن قطعة الحاسوب DRIVE PX. بعد بضع دقائق من الإعلان عن حاسوب سيارة ذاتية القيادة NVIDIA DRIVE PX، جلس وتحاور بشكل سريع مع ماسك، إيلون ماسك المدير التنفيذي لتيسلا وهو أيضا الشريك المؤسس والمدير التنفيذي لـ Space X الذي شارك وجهات نظر جريئة حول مستقبل السيارات خلال محادثة مع المدير التفنيذي لنفيديا جين سون هوانغ.
ضمن حديثه قارن تطورات الذكاء الاصطناعي "باستدعاء الشيطان" نظرا لللقدرة الذي يمكن أن يصبح عليه الذكاء الاصطناعي قريبا. كما أضاف وأوضح أن تطورات انفيديا في تقنية المعالجات الرسومية التي تقدمها اليوم ومستقبلا ستلعب دورا رئيسيا في تطوير ذلك.
ماسك تحدث مع جين سون أمام الجماهير الذي بلغ تعداده 4 ألاف شخص في سان خوزيه قائلا "سوف يتم العمل على السيارات ذاتية القيادة في وقت قصير. إني أشاهدها كما لو أنها مشكلة محلولة. نعرف ماذا سنفعل، وستكون هناك سيارات بقيادة ذاتية في بضع سنوات فقط"..."ماتفعله انفيديا مع معالجات تيغرا مثير للاهتمام حقا وهام فعلا من أجل القيادة الذاتية في المستقبل".
ولايعتقد ماسك بكلامه هذا أن السيارات ذاتية القيادة سيكون أمرا سهلا رغم تأكيده من قرب رؤيتها في الأسواق خلال السنوات القادمة. طبعا إنه مشوار طويل للانتقال من تطوير القدرات إلى تنفيذها. على سبيل المثال، يتوقع ماسك أن الجهات الرسمية ستكره المركبات ذاتية القيادة إلى أن يتم تقديمها في سنتين أو ثلاث سنوات من الدليل المقنع حول أمانها مقارنة بالسيارات المتحكم بها بواسطة السائق.
وكان ماسك أيضا قد ذكر أمر مهم وهو أننا في النهاية سيكون علينا أن نتقبل حدوث تغير جذري في علاقاتنا مع السيارات حيث تعاني الجهات الرسمية في كيفية الانتقال من سيارات متحكم بها بواسطة السائق إلى تلك التي يتم التحكم بها بواسطة الحواسب. الخلاصة أنه وفي مرحلة ما، قد لايتم منح الثقة للناس خلف مقود القيادة بعد الآن...حيث يضيف قائلا "في المستقبل البعيد قد يلجا واضعو القوانين إلى تجريم السيارات المستقلة لأنها خطيرة للغاية".
كما أشار أيضا أنه يمكن جعل السيارات ذاتية القيادة للسير عند سرعة 5 الى 10MPH وهو أمر بسيط، لكن فعل ذلك بين سرعة 10 و 50MPH في مسارات المدن والضواحي – مع المشاة، المرور المتقاطع، ومع غيرها من العوائق والحواجز، سيبرهن بأنه الجزء الأصعب من العمل. وقال أيضا "حالما نتجاوز سرعة 50MPH في بيئة الطريق السريع، فإن الأمر يصبح سهلا مرة أخرى".
هذا ليس كل شيء. قال ماسك أن الانتقال إلى سيارات ذاتية القيادة، لن يحدث بين ليلة وضحاها. حيث أشار أن 2 مليار سيارة تتواجد على الطرق اليوم، وأن مجل صناعة السيارات ستصنع ما يقارب 100 مليون سيارة أخرى. وبهذا المعدل، سيتطلب الأمر 20 عاما لاستبدال ذلك الأسطول الضخم من السيارات يدوية القيادة إذا توفرت السيارات ذاتية القيادة غدا..." لن يكون انتقالا فوريا. بل سيتطلب بعض الوقت"...كما قال " أعتقد أنه سيصبح أمرا عاديا، مثل المصعد. في السابق كان هنا أشخاص يشغلون المصاعد ومن ثم تم اختراع دارة كي يعرف ببشكل أوتوماتيكي التوجه نحو الطابق الذي أنت فيه. وكذلك الأمر بالنسبة للسيارات". أعتقد اننا امام سنوات مثيرة للأهتمام فيما يخص رؤية سيارات بقيادة ذاتية.
معالجات رسومية من انفيديا تجعل من تطور التعلم العميق أسرع من قبل
في معالجة لأحد أكثر الصعوبات التقنية تعقيدا، فقد كشقت انفيديا على لسان المدير التنفيذي جين سون عن منتج جديد يجلب سرعة وسهولة وقوة غير مسبوقة لبحث التعلم العميق. ولمن لا يعرف ما هو التعلم العميق (حيث تفاجئت بالعدد الكبير الذي يسأل عن معنى "التعلم العميق" وما هو حتى أن البعض أعتقد أنه خطأ مطبعي :-)....التعلم العميق هو قطاع متنامي بسرعة للذكاء الاصطناعي – وهو محرك لابتكار الحوسبة من أجل مجالات متنوعة كالبحث الصيدلي والطبي والعلمي المتقدم إلى سيارات ذاتية القيادة كليا. وضمن فعاليات المؤتمر استعرض المدير هوانغ ثلاث تقنيات جديدة ستحفز التعلم العميق خلال خطابه الافتتاحي أمام 4 ألاف من الحاضرين للمؤتمر:
- NVIDIA GeForce GTX TITAN X -المعالج الأقوى لتدريب شبكات عصبية عميقة.
- DIGITS Deep Learning GPU Training System - تطبيق برمجي يسهل لعلماء البيانات والباحثين أن ينشأوا بسرعة شبكات عصبية عميقة عالية الجودة.
- DIGITS DevBox - أسرع تطبيق تعلم عميق في العالم – مبني من أجل تلك المهمة، ومشغل بواسطة أربع بطاقات TITAN X ومجهز بنظام تدريب DIGITS سهل الاستخدام.
بفضل تلك المنصة المتكاملة للتعلم العميق فإنه يمكن لبطاقة TITAN X وببساطة أن تدير عوالم افتراضية ضخمة أو أن تنجز مهام علمية مكثفة في فترة زمنية بسيطة مقارنة بالحلول السابقة. إن بطاقة TITAN X هي بشكل أساسي بطاقة رسومية موجهة للألعاب، لكن وبفضل قوتها المدهشة فهي تعتبر أيضا بطاقة رسومية مناسبة بشكل فريد للتعلم العميق. الحلول السابقة من المعالجات المركزية والبطاقات الرسومية القديمة كانت تستخدم لتخدم شبكات عصبية عميقة لتدريب الحواسب على تعليم أنفسها في كيفية تصنيف وتمييز الأغراض والتي كانت تعتبر مهمة ثقيلة وتستهلك الكثير من الوقت، لذلك الحلول الجديدة تجعل من مسألة الوقت أمر بسيط يمكن تداركه بسهولة مقارنة بالنتائج الماضية.
برنامج DIGITS Deep Learning GPU Training System يغير ذلك بمنح المستخدمين مايحتاجون إليه للبدء في إنهاء بناء الشبكات العصبية العميقة الأفضل. كما أن DIGITS يوجه المستخدمين عبر عملية من التجهيزات، التكوينات وتدريب شبكات عصبية عميقة، وذلك بالتعامل مع الحمل الثقيل ليتمكن العلماء من التركيز على البحث والحصول على النتائج التي يبحثون عنها. اليوم أصبح تجهيز وتحميل مجموعات بيانات التدريب مع DIGITS أمر بسيط، بفضل واجهة المستخدم البديهية وقدرات إدارة سير العمل.
إنه النظام الأول من نوعه الذي يوفر محاكاة ظاهرية ومراقبة في الوقت الفعلي، ليتمكن المستخدمون من ضبط عملهم بدقة. مبني بوساطة فريق "هندسة تعلم عميق" من انفيديا من أجل عمل التطوير والأبحاث، فإن منتج DIGITS DevBox هو منصة بقوة متكاملة من أجل تسريع بحث التعلم العميق وذلك بتضمنه 4 بطاقات GTX TITAN X. المنتج الجديد هذا يتضمن حزمة برامج DIGITS، وهي أشهر برامج التعلم العميق Caffe ،Theano و Torch و cuDNN 2.0. وكل ذلك يأتيك بكيسة كفؤة من ناحية الطاقة، هادئة، باردة وجيدة المظهر والتي تلائم المكتب ويمكن وصلها إلى مقبس كهرباء عادي. انفيديا سعرت جهاز الأبحاث هذا بمبلغ 15 ألف دولار.
النتائج المبكرة جدا لتدريب متعدد المعالجات الرسومية تظهر أن منتج DIGITS DevBox يقدم أداء أعلى بأربع مرات من بطاقة TITAN X واحدة على برامج بنشمارك التعلم العميق. Training AlexNet يمكن أن يتم إكماله فقط في 13 ساعة مع منتج DIGITS DevBox، مقارنة بيومين مع حاسوب يستخدم بطاقة رسومية واحدة، أو أكثر من شهر مع استخدام معالج مركزي فقط.
على صعيد المستقبل فإن معمارية المعالج الرسومي القادم انفيديا باسكال، مجهز لينطلق السنة القادمة، والذي يعد بتسريع من تطبيقات التعلم العميق بعشر مرات عن سرعة معالجات ماكسويل الجيل الحالي. سيمتلك المعالج الرسومي باسكال ثلاث ميزات تصميم رئيسية سينتج عنها تدريب أكثر دقة وسرعة لشبكات عصبية عميقة أسرع بكثير من الآن.
حيث إلى جانب ذاكرة بحجم 32GB، فهي أقوى بمرتين ونصف من ذاكرة بطاقة GeForce GTX TITAN X، والسبب يعود إلى أن باسكال سيتميز بحوسبة دقة مختلطة. وسيمتلك ذاكرة 3D، لتحصل بفضلها على تحسين بخمس مرات في تطبيقات تعلم عميق. وستتميز بـ NVLink وهي اتصال عالي السرعة من انفيديا، الذي يربط اثنين من البطاقات الرسومية أو أكثر، والذي سيؤدي بالمحصلة إلى تحسينات بعشر مرات في التعلم العميق.
حوسبة الدقة المختلطة تمكن المعالجات الرسومية المستند على معمارية باسكال بأن يؤدي الحوسبة عند دقة فاصلة عائمة 16bit بمرتين عن معدل دقة الفاصلة العائمة 32bit. أن عرض النطاق الترددي للذاكرة يقيد حدود السرعة التي يمكن للبيانات أن يتم تسليمها إلى المعالج الرسومي. وتقديم ذاكرة 3D سيوفر عرض نطاق ترددي بثلاث مرات وتقريبا ثلاث مرات سعة تخزين الإطار المؤقت لماكسويل.
سيمتلك باسكال رقاقت ذاكرة مكدسة على بعضها، وموضوعة بشكل متجاور للمعالج الرسومي، بدلا من كونها على لوحات المعالج بشكل أبعد. هذا يقلل من الإنشات والميليمترز للمسافة التي تحتاج إليها البت للانتفال وهي تعبر من الذاكرة إلى المعالج الرسومي وتعود. النتيجة من كل ذلك اتصالات مسرعة بشكل كبير وكفاءة طاقة محسنة.
إضافة الـ NVLink إلى باسكال سيسمح للبيانات بالانتقال بين البطاقات الرسومية و المعالجات المركزية بشكل أسرع من 5-12 مرة من التي تستطيع بها على المعيار الحالي اليوم وهو PCI-Express. كما ان الـ NVLink يسمح بضعف عدد البطاقات الرسومية في نظام ما للعمل سويا في حوسبات التعلم العميق.
هذه هي أهم الأمور التي تطرق لها المدير التنفيذي جين سون-هوانغ أثناء عرضه الافتتاحي للمؤتمر NVIDIA GTC 2015. لا نستطيع أن نقول أننا عرفنا كل ما نريده عن معمارية باسكال ولكن المعلومات التي تطرق لها جين كانت جيدة جدا ونأمل أن يتطرق في مناسبات أخرى لتفاصيل أكبر، طبعا معمارية فولتا لم تحظ بأي اهتمام ولكن فقط تم ذكرها ضمن خارطة العمل. والتي يتوقع ان ترى النور في عام 2018. أضف أن هناك حديث عن التوجه الى دقة تصنيع 16nm او 14nm بالنسبة لمعمارية باسكال ولكن ليس هناك شئ مؤكد أو رسمي بعد.
على صعيد ظهور بطاقة GTX TITAN X فالأهم من وجهة نظري أن البطاقة أولا أتت بسعر مناسب نوعا ما (أنا لست من المشجعين لهكذا فئة من الأسعار 999 دولار) ولكني أتحدث من منطلق المقارنة لهذا السعر مع باقي الأسعار التي أطلقتها مؤخرا انفيديا وأيضا لما تستطيع البطاقة تقديمه من أداء قوي وباستهلاك طاقة منخفض حيث تخيل أنها تعادل استهلاك بطاقة GTX 580! وتتفوق على بطاقة GTX 980 بنسبة جيدة جدا وأيضا تقدم بنسبة كبيرة نفس أداء بطاقة R9 295X2. لكني أعتقد أن البعض ينتظر ظهور بطاقة GTX 980TI والتي على الأغلب سوف تأتي بسعر مناسب مستخدمة نفس النواة ربما ولكن مع ترددات أقل وتعطيل في عدد من وحدات SMM.
أما التعلم العميق فالأكيد أن انفيديا تقدم حلول مشجعه جدا لتطوير هذا النهج الجديد الذي بدأت العديد من الشركات في التوجه له. قد يحتاج الأمر الى المزيد من الوقت على صعيد ظهور سيارات بقيادة ذاتية ولكن أيضا لا يمكن إنكار أن ذلك الوقت يقترب من سنة الى اخرى. شاركنا برأيك...ما هو أهم ما جذبك في هذا المؤتمر الخاصة NVIDIA GTC 2015؟
?xml>