ولقد حظت هذه البطاقات بنصيب وافر للغاية من المتابعة والاهتمام العلاميين ، ويرجع ذلك لِشركة NVIDIA نفسها، والتي لم تدّخر جهدا في الحديث عن قوّة معماريتها القادمة بمناسبة وبدون مناسبة .
واذا لم تكن ممن انتخبتهم الأقدار ليتشاركوا أجواء التأّهب والتهيأ لاستقبال هذا الحدث التقني ، فأنت -وللأسف- لا تعرف ما أتكلم عنه .
إن أجواء الحوسبة و عالم التقنية هي أجواء سريعة التغيّر والتقلّب ، لكنها تدفع للملل علي الرغم من ذلك ، فكل تطوير يتم فيها ، انما يتم بشكل تدريجي ، وبحذر شديد ، حتي لتشعر بخشية القائمين علي تلك العملية من الحسد ، أو بكراهيتهم لروح المغامرة وتحطيم الحواجز والحدود ، وهذا ينزع الاثارة والتشويق من تلك الأجواء ، ويتركها حال معظم متاع الدنيا ، بطيئة ، ثقيلة ، و مٌحفوظة .
لذا فانه و عندما تلوح في الأفق بشائر وصول ما يخرق هذه العادة .. ما يحطم الحدود ويقفز قفزات نوعية الي الأمام ، فان كل المتحمسين يهرعون الي الانضمام لوفد استقبال القادم الجديد ، مُمنّين أنفسهم بمشاهدة استعراض تقني ممتع ، يُخمد فيهم جوع الاثارة و رؤية الجديد الفريد .
والحق يقال أن الانسان في العصر الحديث يتعرض للأذي النفسي باستمرار ، عندما يصطدم بوابل من القصص والروايات والأفلام التي تلبس عباءة الخيال العلمي و المستقبل فائق التطور والتقدم التقني الذي لم يسبق له مثيل ، والذي لم تظهر بوادره بعد حتي يومنا هذا .
وكنتيجة لذلك فان الانسان يتطلع الي اليوم الذي تحقق فيه البشرية جزءا ولو ضئيلا من هذا التقدم ، وهو يتطلّع اليه بلهفته وعجلته المعتادة ، ولقد خلق الانسان عجولا حقّا .
فقط انظر الي الاستنتاجات العلميّة المتعجلّة التي يقفز اليها العلماء قفزا عن نشأة الكون وعن أصل الانسان ، لمجرد انهم كشفوا الستار عن بعض الفُتات من علوم الكون .
وكُلّما يكتشف الانسان شيئا جديدا ، يزداد يقينه بأنه لا يعلم شيئا ، وان أمامه الكثير ليحاول فهمه ، ومع ذلك تجده يٌكابر ويتعجّل في عمل النظريّات والفرضيّات ، ثم لا يكتفي بذلك بل يدافع عنها في استماتة وكأنها الحقيقة المُطلقة ، وأن ما دونها هو أوهام وضلالات (*) .
لكن الحديث في هذه النقطة يطول ، علي الرغم من أنها ليست بعيدة تماما عن موضوعنا اليوم ، والذي يتعلّق بطموح الانسان ، والذي يدفعه الي التسرّع و استباق الأحداث ، والتظاهر بأنه قد تقلّد مفاتيح الكون .
ولقد وضعت NVIDIA طموحها في صاروخ ، وأطلقته الي السحاب ، ثم انطلقت لتلحق به ، فهل تستطيع ؟ أم تهوي الي أسفل بلا رحمة ؟
سوف نبدأ بنبذة مختصرة عن المعالج الرسومي ، وسنقول أنه نواة ضخمة مقسمة الي معالجات صغيرة ذات تصميم خاص، كل نوع من هذه المعالجات يغير من البيانات الرسومية بطريقة معينة يُمكّنها تصميمه الفريد ، بحيث تدخل البيانات الرسومية الي واجهة المعالج الرسومي ، وتمرّ علي هذه المعالجات بالتسلسل والترتيب لتخرج من خلفيته في نظام .
وسوف نستهل المقال بالحديث عن واجهة بطاقات Fermi/GF100 .
___________________________________________
القلب Core :
أول ما يواجهنا في مقدمة البطاقات هو عتاد التوزيع Thread Scheduler ، وهو أعقد جزء فيها علي الأغلب ، ذلك لأنه يختص باستقبال البيانات من المعالج المركزي ، أو الذاكرة الرسومية أو أي مكان .. ثم يقوم بتوزيعها كيفما يشاء علي مُظللات البطاقة (Shader Units / Stream Processors /Cuda Cores) ، أي كأنه القلب الذي يمد اجزاء البطاقة بالبيانات .
يتّصل هذا القلب بـ512 مرفأ (بوابة) توزيع ، كل بوابة تقوم بتوزيع البيانات الي وحدة تظليل (مُظلل ) واحدة ، مما يعني أن كل مظللات البطاقة تتصل بهذا القلب ، أي أن نسبة الاتصال هي 100% .
يجب الانتباه جيدا الي هذه النقطة ، حيث أنها أول شئ سيتغيّر في معمارية GF104 ، كما أنها نقطة الاختلاف الأساسية بين بطاقات NVIDIA و AMD ، حيث يبلغ معدّل اتصال القلب بالمظللات في بطاقات Radeon HD5000 ، نسبة 20% فقط ، أي خمس نُسبة NVIDIA ، وتعوّض AMD الباقي باستخدام برنامج القيادة Driver.
يتيح هذا تدفّق مباشر ومُتشعّب للبيانات الرسومية في بطاقات NVIDIA ، مقارنة ببطاقات AMD ، كما يتيح استخدام كل امكانيات بطاقات NVIDIA العتاديّة ، بينما يصبح ذلك صعبا للغاية في حالة بطاقات AMD .
قلب نواة GF100 في منتصف البطاقة (مُحدد باللون الأصفر ) .
لكن هذا يأتي علي حساب تعقيد النواة الرسومية ، وتضخّم حجمها ، فتأتي أنوية NVIDIA بأحجام أكبر من أنوية AMD حتي لو كانت بنفس معدّل الأداء.
يعمل القلب بتردد 700MHz في بطاقة GTX 480 ، و 600MHz في بطاقة GTX 470 .
تبدو الأمور مُبشّرة علي جبهة القلب ، لذا سننتقل الي جبهة المظللات ..
___________________________________________
المُظللات (Shader Units / Stream Processors /Cuda Cores) :
عدد المظللات هو 512 مظلل ، ولكل مظلل مرفأ أو بوابة توزيع .
دور المظللات هنا سيكون معالجة
المضلّعات .
أتت مظللات GF100 بحجم ضخم للغاية مقارنة بمظللات ATi ، فكل مظلل من NVIDIA أكبر من كل مظلل في AMD بنسبة 30% الي 40% .
وسبب ذلك أن كل مظللات NVIDIA تأتي بدوائر فرعية وجانبية ، حتي تعمل بترددات مرتفعة دون أن تؤثر عليها مشكلة التشويش الموجيّ ، والتي تنتج عند الترددات العالية .
وهذا هو ما يمكّن بطاقات Fermi من الوصول الي ترددات تتعدّي 1200MHz.
وعلي الرغم من الحجم المتضخم للمظللات ، فان منظومة التردد المرتفع ، والاتصال الكامل بالقلب (عتاد التوزيع) ، تعطي لبطاقات NVIDIA اليد العليا في أي تطبيق رسومي (ألعاب ) أو حوسبي (برامج) ، فالمنظومة تحقق تشعّب كفأ للبيانات مع سرعة معالجة ممتازة في نفس الوقت ، ولقد علّق المستخدمون عليها آمالا عريضا لتُحقق أداء عاليا في كل التطبيقات .
مناطق المظللات محددة باللون الأحمر ، ويمكنك أن تعد 16 منطقة تتجمع فيها المظللات ، 8 بالأعلي و 8 بالأسفل .
لكن هذه المنظومة المٌكلفة قدّمت أولي احباطاتها عندما أتت بترددات قليلة ، فمظللات بطاقة GTX 480 تعمل بتردد 1400MHz ، بعد أن كان من المتوقع أن تأتي بـ1600MHz ، وبطاقة GTX 470 ، أتت بتردد 1200MHz فقط بعد أن كان المتوقع هو 1400MHz .
وسبب هذه الترددات المنخفضة هو رغبة NVIDIA في تقييد الخرج الحراري واستهلاك الطاقة للأنوية قدر الامكان .
ولم يساعد في ذلك تضخم هذه المظللات أكثر وأكثر بعد أن قامت NVIDIA بلصق عتاد اضافي لتطبيقات الحوسبة في كل مظلل ، حيث أرادت NVIDIA توسيع قوة بطاقاتها في الجهة الحوسبية ، حتي لو أتي ذلك علي حساب الحرارة وحجم النواة .
ونتيجة لهذا ، تراجع اداء منظومة القلب/المظللات عن التوقعات الأوليّة ، وتقلّص الفارق بينه وبين منظومة ATi التي تتميّز باتصال ضعيف للقلب لكن بعدد هائل من المظللات (يصل الي 1600 مظلل ) ، اي ثلاثة اضعاف NVIDIA .
والأسوأ من كل ذلك أن بطاقة GTX 480 تأتي بعدد 480 مظلل فقط ، من أصل 512 ، حيث تم فيها تعطيل 32 مظلل بكامل عتادهم الحوسبي وبوابات التوزيع ، ولقد ساهم هذا في تقليص الأداء أكثر وأكثر .
لم تخلو جبهة المظللات من احباط نسبي .. السؤال هو هل يتكرر ؟
___________________________________________
وحدات الرسم Rasterizers :
وحدات الرسم هي المسئولة عن عملية ملأ الألوان بين المضلّعات ، وفي بطاقات GF100 توجد أربعة وحدات قادرة علي التعامل مع أربعة مضلعات ، وهذا في مقابل وحدة رسم واحدة في بطاقات AMD .
ونتيجة لهذا تستطيع بطاقات NVIDIA التعامل مع عدد كبير من المضلعات بكفاءة أفضل من AMD ، وخصوصا في
حالات الترصيع Tessellation.
تستطيع بطاقة GTX 480 معالجة 2800 مليون مضلّع في الثانية الواحدة، وتستطيع بطاقة GTX 470 معالجة 2400 مليون مضلع في مقابل 850 مليون فقط في HD5870 .
لكن العجيب أن كفاءة بطاقات Geforce في معالجة المضلعات لا تصل الي قدرتها الكاملة أبدا ، فبطاقة GTX 480 تستخدم وحدتي رسم فقط ، لتحقق 1800 مليون مضلع/ثانية ، بينما تستطيع شقيقاتها من بطاقات Quadro استخدام الأربعة وحدات والوصول الي أقصي كفاءة في معالجة المضلعات .
قد تكون هذه مشكلة من تطبيقات الألعاب الحالية ، والتي لا تحتوي علي عدد كاف من المضلّعات ، وقد تكون تقييدا تجاريا من NVIDIA ، حتي تحصل بطاقات Quadro علي مميزات أفضل .
جبهة المضلعات هي تاج معمارية Fermi .. ماذا عن جبهة الكساءات ؟
___________________________________________
وحدات الاكساء Texture Units :
وحدات الاكساء هي المسئولة عن القيام بعمليّة
تطبيق الاكساءات علي الأجسام ثلاثية الأبعاد ، بالاضافة الي
عملية ترشيح الاكساءات .
أتت بطاقات GF100 بـ64 وحدة اكساء فقط ، مقارنة بـ80 وحدة في بطاقات GTX 280/285 ، و 80 وحدة في بطاقة HD 5870 ، اي اقل منهما بواقع 16 وحدة .
سبب تقليل الوحدات هو ايمان NVIDIA بأنها لا تشكّل أهمية قصوي في ألعاب الجيل الحالي ، وبدلا من ذلك اختارت الشركة أن تركز أكثر علي قوة معالجة المضلعات و عتاد الحوسبة .
ربما يرجع ذلك ايضا الي الظروف التي جمعت بطاقات الجيل السابق في مستوي واحد للأداء علي الرغم من اختلاف عدد وحدات الاكساء بينهم .
فبطاقة HD 4870 احتوت علي 40 وحدة اكساء فقط ، واحتوت بطاقة GTX 260 علي 72 وحدة ،وعلي الرغم من ذلك فان البطاقتين أتيتا بأداء مُتماثل علي كل الدقّات .
لكن مما لا شك فيه أن اضافة المزيد من وحدات الاكساء علي بطاقات NVIDIA لم يكن ليضرّ ، بل علي العكس كان سيزيد من فارق الأداء بينها وبين بطاقات AMD .
أتت هذه الخطوة بشكل غير متوقع علي الاطلاق ، حيث انتظر الجميع أن تُدجج NVIDIA بطاقات Fermi بـ128 وحدة اكساء .
مناطق وحدات الاكساء ، محددة باللون الأصفر ، ويمكنك أن تعد 16 منطقة ، 8 بالأعلي و 8 بالأسفل.
ومما يزيد الأمور سوءا أن بطاقة GTX 480 اتت بأربع وحدات معطلة ، أي بواقع 60 وحدة اكساء فقط من أصل 64 ، وهو الأمر الذي لم يساعد الأداء كثيرا .
احباط نسبي جديد .. ماذا عن جبهة دقّة العرض ؟
___________________________________________
وحدات اخراج الألوان ROPS :
وحدات اخراج الألوان هي المسئولة عن اخراج
دقّة العرض Resolution ، والقيام بعملية
تنعيم الحواف Anti-Aliasing.
جاءت بطاقات GF100 بعدد 48 وحدة اخراج ، في مقابل 32 وحدة في GTX 280/285 ، وفي HD 5870/5850 ، وهي زيادة كبيرة في العدد ، تكفُل لبطاقات GF100 التمتّع بأداء قوي علي الدقات العالية و تنعيم الحواف .
لكن هذا للأسف لم يتحقق ، والسبب هو عيب تصميمي خطير ، أدّي الي تكوين أغرب نقطة اختناق في تاريخ البطاقات الرسوميّة الحديثة .
تأخذ وحدات الاخراج نقاط الألوان من المظللات عبر ناقل بيانات بعرض معين ، بحيث يناسب هذا العرض عدد المظللات وعدد وحدات الاخراج ، وفي حالة استخدام 48 وحدة اخراج ، فان هذا العرض يجب أن يكون 1536 بت (32 بت لكل وحدة اخراج) ، 48x32 أي 1536 بت .
لكن بدلا من ذلك ،استخدمت NVIDIA عرض 1024 بت فقط ، لاغية بذلك وصول البيانات الي 16 وحدة كاملة ، أي أن البيانات تصل الي 32 وحدة فقط من أصل 48 ، مما يضع بطاقات Fermi في نفس مستوي GTX 285/280 و HD 5870/5850 في هذا الشأن .
وعندما جاءت بطاقة GTX 480 بمظللات مُعطلة ، فقدت البطاقة 64 بت اضافية من عرض هذا الناقل ، ليصبح بعرض 960 بت بدلا من 1024 بت ، وتنقطع صلة البطاقة بوحدتي اخراج اضافيتين ، ليصبح مجموع وحدات الاخراج التي تتعامل معها البطاقة هو 30 وحدة من أصل 48 ، وهو عدد أقل من GTX 280/285 و HD5870/5850 .
ونتيجة لهذا يقلّ أداء البطاقة بدرجة ملحوظة كلما زادت دقة العرض ، ويتقلّص الفارق بينها وبين كل البطاقات .
ولحسن الحظ ، فان هذا لا ينطبق علي عملية تنعيم الحواف ، لأنها لا تحتاج لأي اتصال بين المظللات ووحدات الاخراج ، حيث تتم بين وحدات الاخراج وبعضها البعض ، وهنا تستطيع بطاقات GF100 استغلال كل وحدات الاخراج ، وتحقيق أداء أعلي في تنعيم الحواف من بطاقات AMD وبطاقات GTX 200 ، حتي علي أعلي الدقّات .
نقطة اختناق غير متوقعة .. ماذا عن الذاكرة ؟
___________________________________________
منظومة الذاكرة :
أخرّت NVIDIA من استخدامها لذواكر GDDR5 حتي أواخر جيل GT200 ، وتحديدا بطاقة GT 240 ، ولقد انتظر الكثيرون تأثير استخدام NVIDIA لهذه الذواكر في بطاقات Fermi ، متوقعين أن يساهم ذلك في رفع قوة البطاقات أكثر .
سرعان ما خابت هذه التوقعات ، ففي الوقت الذي جاءت فيه بطاقة HD 5870 بتردد 4800MHz ، تعمل بطاقة GTX 480 بتردد 3700MHz فقط ، أي أقل بـ1000MHz تقريبا من HD 5870 ، أما بطاقة GTX 470 فاستخدمت تردد 3400MHz ، أي أقل بحوالي 1500MHzتقريبا من HD5870 .
والسبب ؟ قلة خبرة NVIDIA في تصميم ذواكر GDDR5 ، مما جعلها تخطئ في تقدير العدد المناسب من الدارات والأسنان الكهربية اللازمة للوصول لترددات مرتفعة للذواكر .
استخدمت NVIDIA ناقلا بعرض 384 بت ، لـ GTX 480 ، وآخر بعرض 320 بت لـ GTX 470 ، مما خفف من سوء الموقف الي حد كبير ، حيث استطاعت بطاقة GTX 480 أن تغلب HD 5870 بفارق 20 جيجابايت/ثانية من سعة تبادل البيانات ، بينما انهزمت GTX 470 بفارق 20 جيجابايت/ثانية أيضا .
لم يكن هذا في مصلحة البطاقات علي الاطلاق ، والتي كانت ستسفيد بلا شك من الترددات المرتفعة للذاكرة .
وعلي الرغم من ذلك .. يحسب للشركة تصميمها لبنية تحتية قوية من الذاكرة المخبأة Cache ، والتي تشارك النواة كلها بما فيها من بيانات (بدلا من أجزاء معينة فيها في السابق ) ، محققة بذلك تحسينات عديدة علي كلّ المستويات (اكساء ، تظليل ، حوسبة ) ، عن طريق تعزيز تدفق البيانات في كافة ارجاء النواة .
ونتيجة لذلك ، تحقق بطاقات GF100 معدلا عاليا لاستهلاك النواة ، نتيجة تقليل اختناقات الوصول للذاكرة ، مما انعكس بشكل مباشر علي معدّل الاطارات الأدني في الألعاب Minimum Frames ، والذي تميز بانه الأعلي علي الاطلاق في معظم الألعاب .
___________________________________________
جودة الصورة :
وعلي صعيد جودة الصورة احتفظت بطاقات GF100 بجودة أعلي لترشيح الاكساءات Anisotropic Filtering من بطاقات AMD ، وكذلك
لتنعيم الحواف الشفّاف Transparency Anti-Aliasing ، كما أًصبحت تدعم مستويات تنعيم الحواف الفائقة SuperSampling في تطبيقات DX9/DX10/DX10.1/DX11 ، بينما تدعم AMD ذلك في DX9 فقط .
مازالت بطاقات NVIDIA تدعم اضافة الظلال الدقييقة للأجسام التي بلا ظلال في عدد من الألعاب القديمة تحت خاصية Ambient Occlusion من برنامج القيادة بالاضافة الي دعم مؤثّرات PhysX البصرية بالطبع .
___________________________________________
الخاتمة:
توقّع الكثيرون أن تتفوّق بطاقات GF100 بفارق كبير علي بطاقات HD 5000 ، الي حد أن تناطح بطاقة GTX 480 البطاقة المزودجة HD 5970 .
لم يكن هذا التوقع غير منطقيا أو خياليا ، أو مفرطا في التمّني ، حيث امتلكت معمارية Fermi كل المزايا التقنية المتفوقة ، من رابطة قوية للقلب والمظللات ذات الترددات المرتفعة ، ومن عدد كبير لوحدات الاكساء ووحدات الاخراج الفعّالة ، ومنظومة ذاكرة منيعة مزودة بنطاق تبادل مخيف للبيانات .
المشكلة كانت في أن كل هذه المميزات أشرقت علي الورق فقط ، لكن عندما حانت لحظة التنفيذ فوجئ الجميع بمجموعة من العيوب والمشكلات لم تكن لتخطر لاحد علي بال .
دقة تصنيع غير ناضجة سببت حرارة عالية خفّضت من الترددات ، نقص في تصميم مُتحكمات الذواكر ، نقص في تصميم منظومة دقة العرض ووحدات الاخراج ، التركيز علي عتاد الحوسبة والاهمال النسبي للاكساءات .
كل هذه العيوب أكلت من نسبة التقوق المتوقعة لبطاقات Fermi حتي تركتها كالهيكل العظمي ، وانها لمعجزة أن تتفوق بطاقات GTX 480 و GTX 470 علي HD 5870 و HD 5850 بعد كل هذا .
لكن لا مجال للمعجزات في عالم التقنيات ، والذي تحسب فيه كل خطوة بدقة .
ان تفوّق بطاقات GTX 480 و GTX 470 علي منافسيهما بالرغم من كل هذا لهو شهادة ، شهادة علي القوة المفترضة للمعمارية ، والتي تلقّت من الرصاصات ما حولها الي مصفاة ، لكنها خرحت ظافرة رغم كل الظروف .
لم تخرج ظافرة تجاريا ، لكنها خرجت ظافرة تقنيا ، وفي هذا انجاز كبير .
لقد رفعت NVIDIA طموحها عاليا ، وأردات صنع بطاقة تسود بها عالم الرسوميات وعالم الحوسبة معا ، لكن تحقيق هذا عسير من المرة الأولي ، ولا وجود لشئ كامل قط ، وعندما تنظر الي قمة الجبال وتحاول صعودها ، فانك تركب علي أمواج الخطر ، وترتكب من الأخطاء ما قد يجلب لك حتفك .
لقد هوت NVIDIA من علّ طموحها ، سقطت الي أسفل بلا رحمة عندما عجزت عن تنفيذ معمارية GF100 كما وعدت ، وكما ينبغي ، لكن طموحها أنقذها بمعجزة في منتصف المسافة ، والمعجزات لا تحدث ، واذا حدثت فانها لا تكرر ثانية .
المفضلات