ماذا يعني توسيع NVIDIA دعم تقنية DXR لبعض بطاقات GeForce GTX القديمة؟
منذ اول يوم لإطلاق تقنية تتبع الأشعة مع جيل بطاقات RTX 20 الرسومية تنوعت ردات الفعل بين مرحب بهذا القدر من الجمالية والواقعية على المشهد الرسومي وبين من شعر بأنها تقنية مخيبة للأمال بسبب استهلاكها لموارد البطاقة بشكل كبير مما يجعل الاداء بعد تفعيلها لا يصل لطموح الجميع. اما من شعر بالغضب هم أصحاب الجيل القديم بعد الحديث عن عدم دعم التقنية لبطاقات الجيل القديم بسبب حاجتها الهائلة لقوة معالجة كبيرة وهو ما تتطلبه تقنية تتبع الأشعة, حيث كما تعلمون جيل بطاقات RTX 20 يضم في بنية تصميم معماريته انوية RT خاصة مسؤولة عن معالجة تتبع أشعة في الوقت الفعلي بسرعة أكبر مما تقوم به الأنوية الاخرى وذلك لتسرع من عمليات معالجة التصميمات في المشاهد الرسومية من خلال إضاءة, انعكاسات، انكسارات وظلال دقيقة وواضحة للغاية.
اليوم ماذا يمكن أن نقول لهؤلاء الغاضبين؟
سنقول لهم مبروك فلقد وسعت NVIDIA بشكل رسمي من اليوم "من خلال التعريف الجديد 425.31" دعمها لتقنية DXR لتشمل عدد من بطاقات الجيل القديم ونقصد هنا TITAN, GTX 1080 Ti, GTX 1080, GTX 1070 Ti, GTX 1070, GTX 1660 Ti, GTX 1660, GTX 1060 6 GB التي تستند على معمارية Pascal و Volta بجانب Turing. لكن كيف كان ذلك ممكناً؟ وماذا عن الاداء؟ هل سنحصل على معدل إطارات مقبولة مع جيل بطاقات GTX 10؟ لنتعرف على ذلك سويتاً.
عملية المعالجة التي تتطلبها تقنية تتبع الأشعة ليست بالامر سهل إطلاقاً فهي تحتاج إلى قوة حوسبية كبيرة, وتوجيه كل ذلك الحمل على جهة واحدة سيكون خانقاً لأداء البطاقة على صعيد الفريمات كما هو الحال مع الدعم الجديد الذي سيجعل تقنية DXR تعمل بشكل كامل عبر المظللات أي عبر انوية CUDA, بعكس الجيل الجديد الذي خصص في بنية تصميم معمارية Turing انوية أطلق عليها إسم RT وكما شرحت لكم هي مخصصة لمعالجة هذا النوع من المهام مما يجعل باقي الأنوية مخصصة لمهام اخرى مثل انوية Tensor التي تسرع من عمليات تنعيم الحواف DLSS لتحسين الأداء أكثر "كما رأينا ذلك في نتائج سابقة وحالياً" و انوية CUDA. مع البطاقات القديمة التي ذكرتها لكم سيكون الحمل على انوية CUDA مما سيعني بلغة الأرقام حصول هبوط بالأداء وبطئ في عملية المعالجة بلا شك وهو امر متوقع ومنطقي نظراً لتطلب التقنية لذلك القدر من القدرة الحوسبية.
لربما الكثير منكم لا يعلم أن تقنية تتبع الأشعة تحتاج إلى أعباء عمل متعددة سيكون على المعالج الرسومي القيام بها ولكن لن يكون من الممكن ان يقوم بها أي معالج رسومي فهناك متطلبات يجب أن تتوفر في البطاقة لتكون النتائج جيدة كما هو الحال مع بطاقات الجيل الجديد من انفيديا RTX 20. بالعودة لاعباء العمل التي تتطلبها تقنية تتبع الأشعة فالنوع الأول هو كيفية تحديد المثلث في مشهد اللعبة الذي ستتقاطع معه الأشعة, وهي تقنية مكثفة حسابيا تُسمى Bounding Volume Hierarchy، أو BVH اختصاراً التي تُستخدم لحساب هذا النوع من العمليات الحسابية. بعد حساب الأشعة في المشهد الرسومي، فإن خوارزمية denoising يتم تطبيقها على بنية المشهد لتحسين الجودة البصرية للصورة الناتجة، مما يسمح للمشهد ككل أن يكون قابل لعملية تصيير رسومي بالوقت الفعلي.
أي أن انوية RT على بطاقات RTX تقدم هاردوير مخصص لتسريع عمليات حساب تقاطع المثلث/الشعاع و BVH، مما يسرع بشكل كبير من العملية الحسابية الخاصة بتقنية تتبع الأشعة. أما مع بطاقات GTX فإن تلك الحسابات تتم على نواة التظليل Shader أو كما تعرف بأنوية CUDA وهو مصدر مشترك مع العديد من الوظائف الرسومية الأخرى التي يقوم بها المعالج الرسومي. معمارية Turing التي تستخدمها بطاقات RTX كانت مصممة منذ البداية لتحمل أعباء العمل التي تتطلبها تقنية DXR. بينما معمارية Pascal كانت مصممة لـDirectX 12 فقط دون احتساب أعباء عمل تقنية تتبع الأشعة.
أنوية CUDA سيكون الحمل عليها في عملية تصيير تقنية تتبع الأشعة مع مشاهد الألعاب أي سيكون عليها احتساب عمليات تصيير وحوسبة BVR، التقاطع، الانعكاس والانكسار في الظلال والإضاءة مما يعني بلا شك حمل كبير على تلك البطاقات GTX 10 على صعيد الأداء, بينما سكون الحال أفضل بقليل مع بطاقات GTX 16 مثل GTX 1660 Ti, GTX 1660 رغم أنها لا تتمتع بأنوية RT والسبب في ذلك هو ان انوية CUDA في معمارية Turing تدعم تنفيذ عمليات حسابية من خلال انوية INT و FP ليسمح بتحقيق نتائج أفضل.
السؤال الأكثر أهمية كيف سيكون من الممكن الاستمتاع بها رغم هذا الهبوط في الأداء مع الالعاب؟
من الجيد بنظري وصول تلك التقنية لمالكي تلك البطاقات ليكون من الممكن تجريبها على الأقل رغم هبوط الأداء الواضح. بالعودة للسؤال فمن خلال شرائح العرض المفصلة التي نشرتها انفيديا, فهي تبين لنا أنواع مؤثرات تتبع الأشعة في الوقت الفعلي المتوفر من قبل DXR API بداية مع الانعكاسات، الظلال، الانعكاسات والظلال المتقدمة، الظلال المحيطة بالأسطح المتقاربة، والإضاءة العالمية, كما شاركتنا بنتائج وأرقام مفصلة لأداء بطاقات GTX 16/GTX 10 مع تقنية تتبع الأشعة وقارنتها مع بطاقات RTX 20 المهيئة لهكذا نوع من العمليات الحوسبية.
المنطق يقول ان اللاعبين المالكين لبطاقات GTX 10 سيمتلكون فرصة استخدام تقنية تتبع الأشعة مع الالعاب الداعمة عند دقات وإعدادات جودة أقل، بينما مالكي بطاقات RTX فسيختبرون أداء أسرع بمرتين إلى ثلاث مرات بفضل أنوية RT المخصصة لهذا النوع من المهام ليتيح استخدام إعدادات جودة ودقات أعلى عند معدلات إطارات سلسة ولكن ليست مثالية, فحتى اليوم لم نصل إلى الأرقام التي يمكن أن نقول فيها ان جيل باكمله مهيئ لتشغيل تلك التقنية بشكل مثالي.
من خلال المقارنة التي تمت بين البطاقات وعلى دقة 1440p التي اختارتها انفيديا مع كل اختباراتها تبين لنا بشكل واضح انك ولكي تلعب تلك الالعاب مع تفعيل تقنية تتبع الأشعة بإعدادات مرتفعة فأنت بحاجة إلى بطاقة GTX 1080 Ti أو GTX 1080 لا أقل من ذلك حتى تحصل على معدلات إطار تصل إلى 30 فريم! طبعاً كلما قمت بتخفيض الإعدادات الرسومية في اللعبة وتقليل كذلك جودة تقنية تتبع الأشعة DXR المستخدمة من مرتفعة إلى متوسطة "حسب اللعبة" ستحصل على تجربة أفضل أي معدل إطارات أكثر سلاسة.
مع لعبة Battlefield V "التي اعشقها شخصياً" تبين أن بطاقة مثل GTX 1080 Ti استطاعت فقط أن تحقق 30 فريم على إعدادات رسومية Ultra وجودة DXR كذلك Ultra بينما بطاقة GTX 1080 فلقد حصلت على 25 فريم فقط! بينما كان مستوى بطاقات GTX 1070 و GTX 1060 6 GB عند معدلات إطار أقل من 20 فريم. لكن الملاحظ هو تحقيق بطاقة GTX 1660 Ti معدلات إطار 23 فريم متقاربة مع GTX 1080 على نفس اللعبة.
بينما لعبة Shadow of the Tomb Raider فلقد حصدت بطاقة GTX 1080 Ti معدل إطارات 34 فريم على دقة 2k بجانب استخدام اعدادات رسومية وجودة DXR مرتفعة. اما لعبة Atomic Heart التي تستخدم في بنية تصميمها الانعكاسات المتقدمة الخاصة بتقنية تتبع الأشعة فلقد فشلت أقوى بطاقات GTX 1080 Ti من تحقيق معدل إطارات يتجاوز 15.4 فريم. بينما كانت النتائج مع برنامج بينشمارك 3DMark Port Royal أيضاً متوقعة ومنخفضة للغاية بسبب استخدامها لكل من الانعكاسات والظلال المتقدمة ضمن تقنية DXR....نفس الكلام يتكرر مع Justice التي حققت فيها بطاقات GTX 10 أداء افضل بقليل. وأخيراً مع لعبة Metro Exodus محققة نتائج منخفضة كذلك. أعيد وأكرر أن النتائج تم اختبارها على إعدادات رسومية Ultra وكذلك جودة DXR كانت Ultra على دقة 2K أي أنه من الممكن لكل تلك البطاقات من عائلة GTX 10 أن تعرض نتائج أفضل مما رأيناها عندها نقلل من تلك الإعدادات الرسومية في حالة وجدت نفسك بحاجة شديدة لتجربة تقنية تتبع الأشعة.
التفاوت في هذا الاداء الحاصل مع بطاقات الجيل القديم والحالي يعود كما شرحنا في الأعلى إلى بنية تصميم نواة المعالج الرسومي, لأن تشغيل تقنية تتبع الأشعة بالوقت الفعلي DXR على بطاقات رسومية لا تتمتع بانوية RT المخصصة لهكذا مهام وجعلها تعمل على انوية المظللات التي أصلاً تستخدم في مهام أخرى سيجعل من النتائج نظرياً وعملياً غير مرغوب بها. إنما السبب وراء السماح بتفعيلها من قبل انفيديا هو خيبة أمل اللاعبين من عدم قدرتهم على تشغيل تلك التقنية على الجيل السابق ليكون الان بمقدورهم فعلها مع مراعاتهم للإعدادات الرسومية المستخدمة حتى يحصلون على معدلات إطار سلسة.
من خلال هذا البيان الرسومي الذي تشاهده مع لعبة Metro Exodus نرى مقارنة بين بطاقة من معمارية Pascal و معمارية Turing مع تعطيل RT cores تارة وتفعيل RT cores وتمكين DLSS تارة أخرى مع بطاقة RTX 2080. فهذه اللعبة Metro Exodus تستخدم إضاءة عالمية بتتبع أشعة في الوقت الفعلي لتصيير المشاهد الديناميكية مع إضاءة غير مباشرة أكثر واقعية تحدث في الوقت الفعلي عند تغيرات الإضاءة وحدوث الأحداث مختلفة في بيئة اللعبة. بمعنى آخر، الإضاءة ترتد بشكل طبيعي في محيط اللعبة، بحيث تسطع وتضيء التفاصيل المحيطة بناء على الحركة التي تقوم بها والعوامل المحيطة بك. فمثلاً إن تحركت الشمس أو ظلال النافذة فتحت، فإن إضاءة الغرفة تتغير على نحو واقعي، بحيث تظهر الغرفة بإضاءة جديدة كليا. هذه العملية تتطلب للأشعة أن تُسلط على كل بكسل، مما يجعل الإضاءة العالمية المتتبعة للأشعة بحاجة إلى كم كبير من الأداء مقارنة مع تصيير مؤثرات أبسط مثل الانعكاسات المحدودة المتتبعة بالأشعة.
هذا الرسم البياني يعطينا بشكل أوضح ان كل البطاقات الرسومية من معمارية Pascal تقوم بعمليات تتبع الأشعة وجميع مهام تصيير الرسوميات الأخرى بواسطة انوية المظللات FP32 التي تتطلب وقتا أطول لإجراء كل تلك العمليات الحوسبية لتكون النتيجة حصولنا على معدلات إطارات أقل, بينما معمارية Turing فهي تجمع بين أنوية FP32 بجانب INT32 المتوفرة مع بطاقات RTX 20 و GTX 1660 Ti + GTX 1660 ليكون دورها عندما تعملان مع بعضهما البعض مساعداً في تحسين معدلات الإطار بسبب تقليل الفترة الزمنية التي تحتاجها العمليات الحسابية. بينما وعند تفعيل انوية RT المخصصة لهذه المهام فهي تقوم برفع كامل الحمل الموجه نحو انوية التظليل أو كما تعرف بانوية CUDA لتترجم إلى تحقيق معدلات إطار سريعة. وبعد تفعيل تنعيم الحوافDLSS التي تستند في عملياتها الحسابية على أنوية Tensor حصلت البطاقة على معدلات إطارت أسرع بثلاث مرات من بطاقة GTX 1080 Ti.
الجيد هو تأكيد انفيديا ضمن شرحها أن هناك جوانب وتطبيقات متنوعة لتتبع الأشعة مع التوضيح أي هي الأنواع الأكثر أو الأقل تطلبا. مبدئياً تخبرنا انفيديا بأن الانعكاسات الحاصلة مع تتبع الأشعة يمكن أن تكون ذات عمليات حسابية سهلة على البطاقة وذلك في حالة تم استخدامها على سطح مستوي أي كما هو الحال مع البرك المائية في لعبة Battlefield V لكن الانعكاسات المتقدمة التي تحدث على أسطح ملتوية ومعقدة يمكن أن تؤدي إلى تطلبها لعمليات حسابية أكبر أي جهد أكبر على البطاقة الرسومية كما هو الحال مع لعبة Atomic Heart. أما بالنسبة للظلال التي رأيناها مع لعبة Shadow of the Tomb Raider وغيرها فهي يمكن أن تكون أكثر تطلباً بكثير خاصة في حالة كانت هناك عدة مصار من الإضاءة ضمن تصميم المشهد الرسومي. أما الظلال المحيطة بالأسطح فهي تعالج على نحو أفضل بواسطة تتبع الأشعة وهي ليست شديدة التطلب من ناحية الأداء لأنها تحدث على مناطق معينة فقط.
أما الإضاءة العالمية والتي تم استخدامها في لعبة Metro Exodus، فهي تعتبر الأكثر تطلبا في عالم تقنية تتبع الأشعة. لأن ظل كل غرض، كل بكسل يمكن أن يتغير في تأثيره بواسطة الأغراض التي حوله لتكون بحاجة إلى بطاقة من عائلة RTX بلا شك, لأنها تحتاج إلى عمليات حسابية كبيرة.
بالمناسبة هل لاحظتم تحسن الأداء بشكل واضح مع بطاقات RTX 20 بعد تفعيل DLSS؟ كما ترون في النتائج هناك زيادة واضحة في الأداء بعد عملية تفعيلها وهو أمر جيد لنا كلاعبين لنحصل على جودة أفضل مع معدلات إطار أعلى. بالمناسبة لمن لا يعرف DLSS فهي تعتبر ميزة مساعدة على تنعيم الحواف لتتيح لنا أداء أفضل “معدل إطارات أفضل” من تنعيم الحواف التقليدي عند دقات عالية مثل 2K و 4K، وبنفس الوقت تحقق جودة صورة أفضل مما تمنحنا إياه تلك الأنماط الأخرى, حيث يمكن أن تسميه بنمط “Ultra AA”. فهذه التقنية قادرة على عرض مشهد رسومي بجودة عالية عند معدلات إطار أسرع.
في الختام يمكن القول أن انفيديا كان هدفها الرئيسي عدة أمور أولاً هو السماح لنا كلاعبين مالكين للجيل السابق من تجربة هذه التقنية من خلال تفعيلها مع الالعاب مع مراعاتنا للإعدادات الرسومية المستخدمة حتى نحصل على إعدادات رسومية مقبولة أو قابلة للعب, ثانياً هو توضيح تقني لقدرة الجيل الحالي وكيف انه قادر فعلياً على معالجة تلك المهام بفضل أنوية RT بشكل منفصل عن الجهد المبذول من قبل انوية CUDA. ثالثاً وهو الاهم ان تقنية تتبع الأشعة لها خيارات متدرجة أي بمعنى هناك خيارات جودة مختلفة مع DXR يسمح لنا كلاعبين ومطورين بختيار الجودة المناسبة وليس فقط خيار تفعيل أو تعطيل التقنية. أي أن الالعاب التي تدعم تقنية تتبع الأشعة الحالية والقادمة ينبغي أن تسمح لك باختيار جوانب متعددة من تتبع الأشعة، رفع وتخفيض مستوى المؤثرات لتستطيع أن تحصل على لمحة لما يمكن لتلك الميزات أن تقوم به, وهو أمر جيد ويسمح لنا بالمحصلة من تجربتها بدلاً من إجبارنا على تفعيل كل المميزات الخاصة بتقنية تتبع الأشعة دفعة واحدة لتؤدي بمعدل الإطارات بالهبوط بشكل كبير.