ايها السيدات والسادة، أفسحوا الطريق للملك، ملك المعالجات الرسومية، ليس هذا ملكا عاديا، إنه أضخم وأقوي البطاقات الرسومية قاطبة، إنه المعالج الذي يفجر ساحات التنافس علي الذكاء الاصطناعي القديمة، ويغزو ساحات جديدة ليرفع عليها علمه .. إنه المعالج الذي يرسم خطا علي الرمال ويتحدي الآخرين لتخطي هذا الخط! إنه المعالج الذي يجسد كل ما تعودنا عليه من NVIDIA من ابداع في الابتكار والتجديد.

ان NVIDIA لا تنافس أحدا سوي نفسها هنا، لقد كانت متفوقة بالفعل بمعمارية Volta متمثلة في بطاقة Tesla V100، وبمعمارية Turing متمثلة في بطاقة Titan RTX، وكانت تسبق الجميع بأشواط ليست بالقصيرة، لكنها لم تلبث أن فعلتها من جديد وسبقت نفسها بنفسها أكثر وأكثر بمعمارية Ampere.

لقد أطلقت NVIDIA لتوها معمارية Ampere الجديدة تلك، وهي المعمارية التي يمكن اختصارها في عبارة واحدة: أضخم في كل شئ، وأكثر عددا في كل شئ، الذاكرة الرسومية VRAM، الذاكرة المساعدة Caches، عدد أنوية المعالجة Cores، قوة أنوية المعالجة IPC، سعة تبادل البيانات Bandwidth.. كل شئ! وليتها اكتفت بهذا فحسب، بل زادت عليه بابتكارات جديدة لتحقق معها مستويات مذهلة من الأداء!

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

ولقد كان الفضل في ذلك يعود لتفوق بنية وتصميم معالجات NVIDIA الرسومية الذي أوصلها الي القدرة علي حشد عدد مخيف من الدوائر الكهربية Transistors باستخدام دقة تصنيع 7 نانومتر، ليصل عدد الدارات الي 54 مليار دارة! وهو عدد لم يسبق له مثيل! ويعمل باستهلاك طاقة لا يتعدي 400 واط! بالمقارنة بالمنافسين علي 7 نانومتر، نجد أن AMD قدمت معالج 5700XT الرسومي بعدد 10 مليار دارة كهربية واستهلاك طاقة 225 واط، أي أن NVIDIA أتت بخمسة أضعاف 500% هذا العدد من الدارات بنسبة زيادة 70% فقط في استهلاك الطاقة! أي أن معمارية Ampere أكثر كفاءة في استهلاك الطاقة من RDNA 1 بعدة مرات! حتي مقارنة بـ Titan RTX والتي أتت بـ 18 مليار دارة، وبـ V100 والتي أتت بـ21 مليار دارة، واستهلاك طاقة 300 حوالي واط لكليهما، فإن معمارية Ampere تبدو ذات كفاءة شديدة في استهلاك الطاقة مقارنة بهما!

ولقد توجت ثمرة إنتاج معمارية Ampere، في معالج A100 الرسومي الذي أطلقته الشركة هذا الأسبوع، ليس هذا معالجا رسوميا عاديا، إن A100 لهو معالج ذكاء اصطناعي Tensor Core GPU بالدرجة الأولي، فهو مطوع لهذا الغرض بالتحديد، فالمعالج يخلو تماما من وحدات تتبع الاشعة Ray Tracing cores ومن فتحات توصيل الشاشة .. ويستبدل كل هذا بوحدات ذكاء اصطناعي   Tensor Cores متقدمة، وعالية التخصص.

قبل إنشاء هذا المعالج كان لدي NVIDIA عدد من البطاقات التي تسيطر بها علي سوق الذكاء الاصطناعي .. فكان لديها بطاقة Tesla V100 والتي تقدم قدرة حوسبية عمومية تساوي 130 مليار عملية حسابية (130TFLOPs) بإحكام 16 بت (FP16)، ولديها أيضا بطاقة Titan RTX التي تقدم نفس المعدل كذلك: 130 مليار عملية حسابية (130TFLOPs) بإحكام 16 بت (FP16)، ولكن تزيد عليها بمعدل 260 مليار عملية ذكاء اصطناعي (260TOPs)، بإحكام 8 بت (INT8).

أما الان فلم يعد ايا من هؤلاء مهما، فلقد وحدت NVIDIA جبهات الذكاء الاصطناعي جميعها في معالج واحد متفوق .. بل ولم تكتفي بذلك بل غزت جبهات جديدة وأخضعتها لسيطرة الذكاء الاصطناعي!  ثم زادت علي ذلك بتطويعات عتادية مكنتها من تحقيق تفوق أعلي وأضخم!! وتتمثل تلك التطويعات في قدرة وحدات الذكاء الاصطناعي في A100 علي التخلص من التعليمات التي لم يعد نموذج الذكاء الاصطناعي بحاجة لها، ويرفع من جراء ذلك من القدرة الحوسبية الكلية بمعدل يصل الي الضعف!

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

ولنبدأ بعمليات الحوسبة العمومية، وهي تلك العمليات التي تعمل بإحكام 16 بت او كما يطلق عليها FP16.  فبإمكان بطاقة A100 تحقيق معدل 310 مليار عملية 310TFLOPs وهو معدل يبلغ ضعفي ونصف قدرة بطاقتي Titan RTX و V100S  .. دون تطويعات زيادة الاداء، أما بهذه التطويعات فتصل القدرة الي 625 مليار عملية 625TFLOPs، اي خمسة اضعاف قدرة بطاقات الجيل السابق.

أما عن عمليات الذكاء الاصطناعي التي تعمل بإحكام 8 بت (INT8)، فبإمكان A100 تحقيق معدل 625 مليار عملية 625TFLOPs وهو معدل يبلغ ضعفي ونصف قدرة Titan RTX ويبلغ عشرة أضعاف قدرة V100S، وكل هذا دون تطويعات الاداء، اما مع التطويعات فتزيد نسبة التفوق الي مستويات جنونية لتصل الي 1250 مليار عملية 1250FLOPs، اي خمسة اضعاف Titan RTX و عشرين ضعف V100S!

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

لكن قدرات A100 لم تتوقف عند هذا الحد، فلقد أضافت له NVIDIA القدرة علي معالجة كافة أنواع البيانات دون تدخل من المطورين، فله الان الاستطاعة علي تحويل عمليات الحوسبة العمومية بإحكام 32 بت (FP32)، (مثل البيانات الرسومية) الي عمليات ذكاء اصطناعي ومعالجتها بقدرة حوسبية هائلة تصل الي عشرة أضعاف قدرة بطاقتي V100S و Titan RTX .. بمعدل 160 مليار عملية 160TFLOPs دون التطويعات، ويزيد علي ذلك بعشرين ضعف قدرة بطاقات الجيل السابق مع التطويعات، ليصل المعدل الي 320 مليار عملية حسابية 320TFLOPs، وهي كلها معدلات مخيفة.

يمتد نفس الأمر الي العمليات الحسابية الكبري ذات إحكام 64 بت (FP64) .. فتحقق بطاقة A100 الجديدة ضعفي ونصف قدرة بطاقة V100 و Titan RTX بمعدل 20 مليار عملية 20TFLOPs.

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

باختصار تتفوق بطاقة A100 علي بطاقات الجيل السابق المتفوقة أصلا علي المنافسين بمعدلات تصل الي عدة اضعاف، أقلها ضعفين ونصف واعلاها عشرين ضعفا، وهي مستويات تفوق جنونية لم نعتد أن نحصل عليها في أي مجال حوسبي آخر. لا في المعالجات المركزية CPUs و لا الرسومية GPUs، ولا المسرعات!

مستويات مكنت NVIDIA من القفز من جديد فوق جميع المنافسين امثال Google و Intel و Xilinx و AMD .. قفزة ضخمة تخطتهم بها جميعا لتتركهم يأكلون تراب قفزتها! ولقد حققت NVIDIA ذلك باستخدام المعالجات الرسومية GPUs فقط .. وهي في هذا تواجه معالجات رسومية GPUs منافسة من AMD، ومسرعات ذكاء اصطناعي TPUs منافسة من Google و Intel و Xilinx .. إضافة الي معالجات مركزية CPUs من Intel و AMD.

لقد أوصل تفوق NVIDIA السابق في الذكاء الاصطناعي الي مكانة حصينة، فطبقا لاخر الاحصائيات في 2019، فان حصة NVIDIA السوقية في قطاع الخدمات السحابية Cloud Services والذكاء الاصطناعي Artificial Intelligence ومراكز البيانات Data Centers قد تعدت نسبة ال 97% .. وهي نسبة مخيفة للغاية. ونتوقع لها أن تزيد أكثر وأكثر من اطلاق معمارية Ampere ومعالجات الذكاء الاصطناعي الفائقة أمثال A100.

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

حتي في العمليات الحسابية خارج نطاق الذكاء الاصطناعي فقد حققت بطاقة A100 نسب زيادات قوية فوق V100، تراوحت ما بين نسب 50% الي 90% ، بمتوسط 70% في تلك العمليات الحسابية العادية، وكان ذلك بفضل كميات الذاكرة المساعدة Cache الضخمة بداخل A100.

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

والأسوأ من كل هذا أن A100 يفعل هذا وهو بالأساس معالج رسومي غير مكتمل، حيث يحوي أجزاء معطلة! فهو يحوي 6912 نواة رسومية CUDA Core فقط من أصل 8192! ويأتي ب 432 مصفوفة ذكاء اصطناعي Tensor Core فقط من أصل 512! ويأتي بتردد 1400MHz فقط! مما يعني أن المعمارية لديها المزيد من القوة الحوسبية التي يمكن تقديمها مستقبلا في إصدارات جديدة!

أما من جهة الشرائح المصغرة، فلقد أطلقت NVIDIA الجيل الجديد منها رسميا كذلك، وهو الجيل الذي يلي شريحة Xavier المصغرة، ويسمي بشريحة Orin المصغرة والقائمة علي معمارية Ampere كذلك، والتي أتت بزيادة مخيفة في أداء الذكاء الاصطناعي تصل الي سبعة أضعاف قدرة Xavier، لتقدم Orin قدرة حوسبية بمعدل 200 مليار عملية ذكاء اصطناعي (200TOPs) في الثانية. وهو الأمر الذي سيعزز من تغلغل NVIDIA في أسواق الذكاء الاصطناعي الطرفية، مثل الأجهزة المحمولة والسيارات ذاتية القيادة والآلات ذاتية الحركة، اضافة الي مسرعات الشبكات 5G وسوق الأجهزة الطرفية التي تستخدم الذكاء الاصطناعي  Edge AI مثل أجهزة المراقبة والتصوير والمصانع المميكنة ..الخ

فخر المعالجات الرسومية: A100 من NVIDIA يسحق جميع أشكال المنافسة!

وفوق كل ذلك تمتلك NVIDIA أقوي منصة برمجية للحوسبة العمومية والتعلم العميق، وهي منصة CUDA، التي شاع استخدامها في غالبية مستويات الحوسبة، من الجامعات ومراكز الأبحاث، الي الشركات الصغري والكبري ومراكز الحواسيب الخارقة Super Computers وخوادم البيانات Data Centers، إن المنصة قد صارت الخيار الأول للجميع بسبب سهولة استخدامها وخلوها من الأخطاء والعيوب، اضافة الي كفاءتها الشديدة. وهي تعمل علي الغالبية العظمي من الحواسيب المحمولة laptops و المكتبية desktops و الشخصية PC ..الخ، الي جانب عملها علي كافة معماريات الحوسبة: PowerPC و X86 و ARM .. الخ.

لقد صارت NVIDIA بمعمارية Ampere المعيار الذي يطمح اليه المنافسون و الصناعة كلها، فلقد أعادت معمارية Ampere تعريف معني مسرعات الذكاء الاصطناعي، وتعريف معني الابتكار في تسريع الذكاء الاصطناعي بالسبل غير التقليدية التي تعطينا زيادة في الأداء لم نعتد الحصول عليها في زمن تباطؤ دقات التصنيع وتباطؤ سرعات المعالجات، الآن لدي المنافسون سقف واضح يحاولون الوصول اليه ويقيسون أداءهم مقارنة به، سقف يبدو عاليا حقيقة، سقف يعرفون جميعا أنه سيتطلب منهم مجهودا جبارا كي يلامسوه، ولم لا؟ إنه السقف الذي صنعه فخر المعالجات الرسومية كلها!