بدأت جوجل اليوم تحديثاتها المُنتظرة في شات Bard للذكاء الاصطناعي، إذ أعلنت جوجل في نهاية العام السابق أن عام 2024 سيشهد إطلاق العديد من التقنيات الجديدة في نظام بارد ليصبح قادرًا على تصدر ساحة الذكاء الاصطناعي دون منافس. وبالفعل، بدأت جوجل اليوم إطلاق أولى تقنياتها الجديدة إلى بارد، والتي تضمنت نموذجًا لتوليد الصور بالذكاء الاصطناعي، بالإضافة إلى مد دعم نموذج جيميناي برو الخارق ليشمل 40 لغةً؛ من بينها العربية. 

نموذج Gemini Pro

في ديسمبر الماضي، أطلقت جوجل نموذجها الجديد للذكاء الاصطناعي Gemini، وهو نموذج خارق متعدد الوسائط والمهارات، والذي يمكن وصفه فعلًا بالمحاكي الأقرب للعقل البشري ضمن كافة النماذج الأخرى للذكاء الاصطناعي. يعتبر جيميناي هو النموذج الأول الذي صُمم من البداية على أساس متعدد الوسائط؛ فهو مختلف عن بقية النماذج اللغوية الكبيرة (LLMs)، مثل GPT، والتي بدأت كنماذج لغوية كبرى فقط؛ لتبدأ الشركات المُطورة لها في إضافة قدرة تعددية الوسائط إليها مع الوقت. وبالطبع لن تعمل أبدًا في نفس كفاءة نموذج جيميناي الذي طُور من البداية ليكون متعدد الوسائط.

أظهرت جوجل بعض القدرات الخارقة لهذا النموذج؛ فهو قادر على حل الواجبات المدرسية وتصحيحها وتقديم شرحًا لطرق حلها، وذلك من خلال الاطلاع على صورة لها، حتى ولو كانت مكتوبةً بخط اليد. والآن، يمكنك الاستفادة بكل هذه المزايا باللغة العربية.

في البداية، كان Bard يعمل على نموذج جيميناي برو، ولكن باللغة الانجليزية فقط في عدد محدود من الدول. والآن، أعلنت جوجل مد دعم نموذج جيميناي برو ليعمل في أكثر من 230 دولةً بأكثر من 40 لغةً. ولم يكتفي جيميناي بقدرته على فهم اللغة العربية فحسب؛ فهو أيضًا قادر على التعامل مع اللهجة المصرية باتقان شديد، إذ يمكن اعتباره النموذج الأقوى في فهم اللهجة المصرية والتحدث بها بشكل كامل. 

ومع ذلك، أخبرنا جيميناي عبر Bard أنه ما زال في طور التعلم والتدرب على اللهجة المصرية؛ فهو الآن بحاجة إلى مزيد من المحادثات المصرية ليتمكن من تعزيز إتقانه للهجة. وبالتالي، يمكنك المساهمة في تدريبه بنفسك عبر إجراء محادثات معه باللهجة المصرية! ولكن ستحتاج إلى إخباره في كل سؤال أن يجيب باللهجة المصرية.

بهذه الإضافة، وبعد دعم أكثر من 40 لغةً مختلفةً، نتوقع أن يتصدر Bard ساحة أنظمة الذكاء الاصطناعي باكتساح؛ فهو الآن قادر على المنافسة بقوة مع كافة الأنظمة الأخرى، مثل ChatGPT-4، وCopilot الخاص بميكروسوفت.

إضافة نموذج Imagen 2 إلى Bard

أطلقت جوجل نموذج Imagen 2 في ديسمبر الماضي أيضًا، وهو نموذج لتوليد الصور اعتمادًا على الأوصاف النصية التي يُدخلها المستخدم؛ تمامًا مثل نماذج Midjourney وDALL-E 3. وكان الهدف الرئيسي من هذا النموذج، طبقًا لجوجل، هو القدرة على توليد صور شديدة الواقعية؛ خاصةً للأنماط البشرية مثل الملامح وأجزاء الجسم المختلفة، وهو تحدي ما زال قائمًا أمام أغلب هذه النماذج. فعلى سبيل المثال، ما زالت تُخطئ هذه النماذج في عدد أصابع اليد مثلًا!

صورة بشرية واقعية في غاية الدقة من توليد Imagen 2 عبر شات Bard

 

طبقًا لجوجل؛ فإنها حرصت على تدريب Imagen 2 ليكون دقيقًا بشكل كبير في توليد الصور، إذ تُركز في هذا النموذج على الدقة في تمثيل الأوصاف النصية بشكل مُفصل؛ ذلك لتقليل أي أخطاء شائعة، خاصةً في الصور البشرية.

والآن، أصبح Imagen 2 مُضافًا إلى بارد؛ ولكن باللغة الإنجليزية فقط. ولاستخدامه؛ كل ما عليك هو الدخول إلى بارد وكتابة أوصاف الصورة التي ترغب في الحصول عليها؛ ليبدأ بارد فورًا في توليد الصور طبقًا للأوصاف النصية التي أدخلتها. ومع ذلك؛ فكما ذكرنا يحتاج النموذج إلى وصف شامل ودقيق للصورة للحصول على أفضل نتائج.

ولهذا، أضافت جوجل بعض النصائح لمن يرغب في الحصول على أفضل نتيجة ممكنة من هذا النموذج؛ وهي:

  • ابدأ الأمر بكلمة من الكلمات الآتية: Draw أو Generate أو Create.
  • حدد النمط المُفضل للصورة، مثل النمط الواقعي، أو نمط الرسم بالفحم، أو نمط الرسم الكارتوني، وغيرها من الأنماط المختلفة.
  • أخيرًا، تؤكد جوجل على أهمية كتابة وصف شامل ومفصل للصورة، مثل عناصر الصورة، والموضوع العام للصورة، بالإضافة إلى وصف كامل للخلفية والعناصر الموجودة فيها.

وللأغراض الأمنية، أعلنت جوجل أن الصور التي يُولدها هذا النموذج ستحتوي على علامات مائية رقمية لن تظهر لنا، ولكن ستتمكن أنظمة الكشف عن الصور المُولدة بالذكاء الاصطناعي في التعرف عليها، وذلك لتحديد الصور المُزيفة؛ خاصةً بعد تداول العديد من الصور الفاضحة المزيفة للمشاهير على منصة X، مثل أزمة صور تايلور سويفت الأخيرة. وأضافت جوجل أنها لن تسمح بتوليد أي محتويات إباحية بواسطة هذا النموذج، كما ستحظر تمامًا توليد أي صور للمشاهير والشخصيات العامة.

في النهاية، كانت هذه أبرز الإضافات التي أعلنت عنها جوجل في تحديثها الأخير لشات Bard، والتي جاءت بعد أيام من إعلانها عن نموذج لوميير (Lumiere) الجديد الخاص بتوليد مقاطع الفيديو، والذي سيقدم أيضًا إمكانيات غير مسبوقة في هذا المجال. ومن المتوقع أيضًا أن يُضاف هذا النموذج إلى بارد، إذ تسعى جوجل أن تجعل منه نظامًا متكاملًا قادرًا على فعل أي شيء!