
تحديث Grok 1.5 Vision | الآن .. جروك قادر على رؤية وفهم الصور!
أعلنت شركة xAI المُطورة لنموذج Grok للذكاء الاصطناعي عن تحديث Grok 1.5 Vision الجديد، والذي سيُضيف إمكانيات جديدة وثورية لأحد أهم نماذج الذكاء الاصطناعي حاليًا. سيُضيف هذا التحديث خاصية تعدد الوسائط إلى جروك، إذ يصبح جروك الآن قادرًا على رؤية الصور، وفهم محتوياتها، والربط بينها وبين سياق الأوامر النصية التي يدخلها المستخدم. بهذه الإضافة؛ يُصبح جروك ضمن النماذج القليلة التي تُقدم خدمات الذكاء الاصطناعي متعدد الوسائط؛ مثل نموذج جيميناي من جوجل، ونموذج GPT 4 من OpenAI.
قد يُهمك أيضًا:
- Gemini Advanced | كيف يبدو جيميناي برو أمام جيميناي ألترا؟
- الذكاء الاصطناعي بين يديك | كيف تستخدم شات جيميناي؟
- تواصل مع الذكاء الاصطناعي | 7 مواقع ذكية قادرة على تغيير حياتك للأفضل

تأسست شركة xAI يوم 9 مارس 2024، بواسطة الملياردير الأمريكي إيلون ماسك، المالك لمنصة إكس (تويتر سابقًا)، والذي شارك أيضًا في تأسيس أقوى وأشهر شركات الذكاء الاصطناعي في العالم؛ OpenAI. يُقدم نموذج جروك إمكانيات متقدمةً وغير مسبوقة في مجال الذكاء الاصطناعي التوليدي، إذ يحصل جروك على كافة البيانات الموجودة على منصة إكس بشكل مُحدث يومًا بعد يوم؛ ما يجعله قادرًا على متابعة أحدث الأخبار بشكل يومي، بعكس أغلب نماذج الذكاء الاصطناعي الأخرى الموجودة على الساحة.
طالع أيضًا: القصة الكاملة لعداء إيلون ماسك مع OpenAI و Sam Altman
تحديث Grok 1.5 Vision متعدد الوسائط
أعلنت شركة xAI عن وصول مزايا تعددية الوسائط لنموذج جروك، وذلك في تحديث Grok 1.5V الذي أطلقته الشركة منذ أيام. ويُقدم هذا التحديث إمكانيات تعددية الوسائط إلى نموذج جروك؛ والتي تجعل النموذج قادرًا على فهم الوسائط المختلفة والتعامل معها؛ فالنماذج اللغوية الكبيرة (LLMs) قادرةً على التعامل مع نوع واحد فقط من الوسائط؛ وهي النصوص.
وكما يبدو من اسم التحديث (Grok 1.5 Vision)؛ يُركز هذا التحديث بشكل أساسي على الوسائط المرئية؛ إذ سيكون النموذج قادرًا على رؤية الصور ومقاطع الفيديو، بالإضافة إلى التعرف على محتوياتها وفهم السياق الصور مع النصوص التي يُدخلها المستخدم في النموذج. وبالتالي؛ يُمكن للمستخدم إدخال أوامر نصية أو أسئلة مكتوبة في الصور؛ كما سيكون النموذج قادرة على فهم ورؤية النصوص المكتوبة بخط اليد، والتي تكون موجودة عادةً داخل الصور ومقاطع الفيديو.
أظهرت شركة xAI عددًا من إمكانيات هذا التحديث الجديد؛ والتي تتضمن فهم وتحليل البيئة المحيطية، إذ بينت الشركة أن النموذج قادر على تحليل الرؤية عبر كاميرا الموبيل المُثبتة في السيارة أثناء القيادة لإعطاء السائق بعض التعليمات، ومساعدته على القيادة في الشوارع الضيقة.
ولهذا؛ أنشأت شركة xAI اختبارًا جديدًا لأداء نماذج الذكاء الاصطناعي؛ وهو RealWorldQA. ويُعد هذا الاختبار مُوجهًا إلى قياس أداء النماذج متعددة الوسائط على رؤية وفهم البيئة المحيطية في العالم الفعلي؛ فهي أبرز المزايا التي يُقدمها هذا التحديث في نموذج جروك. وبالفعل؛ تمكن جروك من التفوق على كافة النماذج الأخرى متعددة الوسائط في هذا الاختبار؛ مثل Gemini 1.5 Pro، وGPT 4V.
في النهاية؛ خطف جروك قلوب محبي التقنية بأسلوبه الفريد المُمزوج بالفكاهة والذكاء. ويمتلك جروك قدرةً مُذهلةً على مُواكبة كل جديد بشكل يومي؛ فهي إحدى المزايا التي ينفرد بها جروك عن أغلب النماذج الأخرى. ومع هذا التحديث المُذهل؛ يدخل جروك عالمًا جديدًا من نماذج الذكاء الاصطناعي؛ مُجاوزًا حدود النصوص ليُبهرنا بقدراته المُتنوعة متعددة الوسائط.
?xml>