منذ أيام أطلقت OpenAI نموذجًا جديدًا لتوليد الصور وهو ChatGPT Images 1.5، وذلك لمنافسة جوجل التي أطلقت نموذج Nano Banana في أغسطس ثم نسخة Pro منه مع جيميناي 3.

حاز نموذج جوجل على إشادة واسعة وإعجاب كبير، ولكن شات جي بي تي هو أكثر تطبيقات الذكاء الاصطناعي استخدامًا، وهو ما يعتمد عليه أغلب الناس.

لذا نقدم لك مقارنة شاملة بين كلا النموذجين، لتحديد أيهما الأفضل في توليد الصور.

ملحوظة: تعمّدتُ في هذه المقارنة عدم استخدام أوامر طويلة أو معقدة، إذ من النادر أن يلجأ المستخدم العادي إلى هذا النوع من التعليمات، لذلك ركّزت على اختبار النتائج في سيناريو استخدام طبيعي وواقعي.

تعديل الصور العادية

هذه المقارنة تشمل: توسيع الصور، وإزالة الأشخاص، وتغيير بعض المعالم في صورة ملتقطة بالفعل لديك.

الصورة: فريق عرب هاردوير
الصورة الأصلية. المصدر: فريق عرب هاردوير

الأمر: وسع هذه الصورة لتصبح مناسبة لمنشور إنستجرام.

chatgpt images 1.5 vs nano banana proنلاحظ أن صورة نانو بنانا بمقاس 1856 * 2304 أي تقريبًا 4 * 5 وهي أبعاد إنستجرام الصحيحة، أما صورة شات جي بي تي كانت مربعة بمقاس 1024 * 1024، وهي أبعاد منشورات الإنستجرام القديمة.

ألوان صورة جوجل مختلفة قليلًا عن الواقع ولكنها منطقية أكثر، أما صورة ChatGPT لا تختلف كثيرًا عن الصورة الأصلية.

النتيجة: صورة نانو بنانا برو أفضل، اتبع التعليمات بشكل أدق وقدم صورة جيدة.

الصورة: فريق عرب هاردوير
الصورة الأصلية. المصدر: فريق عرب هاردوير

الأمر: أزل الأشخاص من الصورة واستبدل أعمدة الإنارة بأخرى حديثة

مقارنة بين نموذج chatgpt images 1.5 و جوجل nano banan pro. الصور: فريق عرب هاردوير

مرة أخرى نجد أن أبعاد صورة نانو بنانا برو منطقية أكثر، فهي تقريبًا 3 * 4 نفس أبعاد الصورة من كاميرا هاتفي، أما صورة شات جي بي تي بأبعاد 2 * 3.

كلا النموذجين أزال الأشخاص بالكامل بصورة جيدة، وحافظا أيضًا على تفاصيل الصورة حتى الانعكاس الغريب من الكاميرا.

يعجبني شكل الأعمدة أكثر في صورة ChatGPT ولكن صورة Nano Banana Pro حافظت على تفاصيل أكثر، على سبيل المثال اللوحة التي على يسار أعمدة الإنارة أو المبنى في نهاية الشارع.

النتيجة: صورة شات جي بي تي جمالية أكثر، أما نانو بنانا واقعية ودقيقة أكثر.

الصورة الأصلية. المصدر: فريق عرب هاردوير
الصورة الأصلية. المصدر: فريق عرب هاردوير

الاختبار الثالث: غير لون الهاتف إلى البنفسجي

مقارنة بين نموذج chatgpt images 1.5 و جوجل nano banan pro. الصور: فريق عرب هاردوير

نفس موضوع الأبعاد تمامًا في الصورة السابقة، أما بالنسبة للون، صورة شات جي بي تي تظهر اللون مشبعًا وبنفسجيًا بالفعل، أما صورة نانو بنانا فاللون أهدأ وأقرب للوردي.

الملخص: صورة شات جي بي تي أفضل.

نستنتج من هذه الاختبارات أن جيميناي أفضل للحصول على تعديلات دقيقة، أما شات جي بي تي أفضل للحصول على صورة جميلة بغض النظر عن مدى واقعيتها.

التعامل مع النصوص العربية

هنا نقارن بين قدرة النموذجين على كتابة النصوص العربية داخل الصور.

الأمر: ولّد صورة شعار لمحل ملابس رجالي عليه اسم المحل (ضع اسمًا من اختيارك) ورقم للتواصل. اليافطة مكتوبة بخط عربي رقعة.

chatgpt images 1.5 vs nano banana pro chatgpt images 1.5

اتجه شات جي بي تي لتوليد صورة يمكن طباعتها أو وضعها غلافًا لصفحة المحل، أما جيميناي فأخذ اتجاهًا لنقل غير عملي بل فني أكثر، فالمستخدم على الأرجح يريد صورة نهائية جاهزة للطباعة.

ولكن جيميناي تفوق في دقة النص، نعم، نتيجة ChatGPT قريبة جدًا من أن تصبح كاملة.

الأمر: اعمل صورة دفتر عليه اللوجو ده ومكتوب عليه "دفتر وعود عرب هاردوير غير المنفذة"

مقارنة بين نموذج chatgpt images 1.5 و جوجل nano banan pro. الصور: فريق عرب هاردوير

في هذا الاختبار، يظهر تفاوت القدرات بوضوح؛ إذ نجح جيميناي في كتابة العبارة بدقة كاملة بنسبة 100%، بينما قدّم شات جي بي تي نصًا غير مقروء. ومع ذلك، وكما في المثال السابق، جاءت صورة الدفتر التي أنشأها شات جي بي تي أفضل من نظيرتها لدى جيميناي.

لكن، عند طلب التعديل من جيميناي، حصلت على نتيجة جيدة ومرضية.

الأمر: صورة من الريف المصري تظهر حائط منزل مكتوب عليه "تابعوا منصات عرب هاردوير" بخط النسخ

chatgpt images 1.5 vs nano banana pro chatgpt images 1.5 vs nano banana pro

نجح كلا النموذجين في كتابة النص العربي بشكل صحيح، الخط في صورة شات جي بي تي هو خط النسخ فعلًا، أما جيميناي فأعطى صورة أجمل في العموم وبخط احترافي أكثر، لكنه ليس خط النسخ.

النتيجة: صورة Nano Banana Pro أجمل رغم اختلاف الخط.

توليد الصور بناء على أمر

هنا مقارنة لتوليد الصور بناء على نص بشكل عادي، بدأت بسيناريو طبيعي وهو صورة غلاف لهذا المقال.

الأمر:

أنشئ صورة غلاف لمقال استعراض وشرح لأداة NotebookLM
هذا هو اللوجو الخاص بها
لا تضع أي نصوص، إلا اسم الأداة لو احتجت.
المقال بعنوان (تعلم أي شيء باستخدام أداة notebookLM الخارقة من جوجل)

chatgpt images 1.5 vs google nano banana pro chatgpt images 1.5 vs google nano banana pro

صورة جيميناي أبعادها مناسبة أكثر للمقال، وجذابة للعين أكثر، أما صورة شات جي بي تي فهي جيدة ولكن اختيار اللون الأبيض جعل بعض العناصر غير واضحة؛ لذا أفضل صورة نانو بنانا برو.

الأمر: أنشئ صورة تبدو وكأنها من الثمانينيات، تظهر شبابًا يرتدون الزي المصري التقليدي ويمسكون بهواتف حديثة، ويلبسون سماعات حديثة على رؤوسهم.


الهواتف تبدو حديثة أكثر في صورة نانو بنانا، ولكن في العموم أفضل مظهر صورة شات جي بي تي.

دمج عدة صور معًا

نختبر قدرة كل من النموذجين على توليد صورة عبر دمج عدة صور معًا، هذا الاختبار يحاكي فناني الجرافيك ديزاين إلى حد ما، ويعد الجانب الإبداعي فيه ذا أهمية.


الأمر: ادمج هذه الصور معًا.

كلا من الصورتين بأسلوب مختلف، لكني هنا أفضل صورة نانو بنانا برو، فقد فهم ما كان يدور في ذهني من هذه الصور الثلاثة.


الأمر: ادمج هذه الصور معًا واجعل الطاحونات الهوائية تشبه سماعات ايربودز.



نجد أن صورة شات جي بي تي تجاهلت تمامًا الحقل، وصورة جيميناي أقرب للوصف غير الدقيق الذي كتبته، ونلاحظ أيضًا أن متجر آبل يبدو غير متناسق مع المكان، ربما نعتبر هذه الصورة تعادلًا.

ملاحظة: هناك حد لعدد الصور المرفوعة لشات جي بي تي في المرة الواحدة وهو ثلاث صور، ما يحد من استخدامه في دمج عدة صور معًا، أما نانو بنانا برو فيقبل حتى 10 صور.

الإنفوجراف والرسوم البيانية

هذه الفئة صعبة، فهناك تحدي الكتابة الكثيرة، وتحدي اللغة العربية، وتحدي دقة المعلومات وصحتها.

الاختبار: أنشئ إنفوجراف باللغة العربية يوضح أزمة ارتفاع أسعار الرام والذاكرة بسبب الذكاء الاصطناعي.



نجد أن صورة شات جي بي تي جذابة أكثر، ولكنها تفتقر لمزيد من المعلومات والتفاصيل، بالإضافة لعدم وضوح النص العربي.

صورة جيميناي (نانو بنانا برو) أوضح وأكثر دقة وتحمل معلومات أكثر.

النتيجة: جيميناي هو الفائز.

التعديلات المتتالية

الآن، نختبر القدرة على القيام بعدة تعديلات متتالية على الصور المولدة.

الاختبار الرابع: أزل سلك الحماية ضد السرقة من على الهاتف

لسبب ما عانى كلا النموذجين مع هذا الأمر، جوجل نانو بنانا غير الهاتف بالكامل ليصبح أشبه بآيفون 16، أما صورة شات جي بي تي فهي أفضل حالًا، فقد حافظ على مربع الكاميرات الجديد ولكنه تخلص من المنطقة الزجاجية بالأسفل ولم يضع شعار آبل.

النتيجة: كلا النموذجين فشل في المهمة، ولكن صورة شات جي بي تي أفضل عن نانو بنانا من جوجل.

نعود لصورة الشباب والأهرامات، الآن طلبت من النموذجين تبديل الملابس بأخرى حديثة.

chatgpt images 1.5 vs google nano banana pro chatgpt images 1.5 vs google nano banana pro

ثم جعلهم أمام الأهرامات

chatgpt images 1.5 vs google nano banana pro chatgpt images 1.5 vs google nano banana pro

كلا النموذجين نجح بشكل جيد في التعديلات هذه المرة.

العلامة المائية والتعرف على الصور

الآن، بعد أن قارنا قدرة النموذجين على توليد الصور، يجب مقارنة الأدوات الموفرة للتعرف على الصور المولدة بالذكاء الاصطناعي، خصوصًا مع انتشارها الواسع والاستخدام المحتمل لها في التضليل ونشر الأخبار الكاذبة.

هذه النقطة بالكامل لصالح جيميناي، فهناك علامة مائية في أسفل جميع الصور تساعد على تحديد تلك الصور، لأن أغلب الناس لن يكترثوا بإزالتها.

وكذلك يستطيع Gemini 3 التعرف على الصور المولدة بأحد أدوات جوجل بفضل بصمة SynthID، ومؤخرًا الفيديوهات أيضًا.

نعم، دقة التعرف من جيميناي ليست 100%، ولكنها مفيدة في كثير من الأوقات.

أما ChatGPT لا يقدم أدوات مفيدة في هذه النقطة، مثلًا رفعت له صورة من جيميناي تحمل عنوان Gemini_Generated_Image_14czn314czn314cz وعلامة جيميناي المائية أسفل الصورة، وآيفون بلون غير موجود ومع ذلك أخبرني أنها صورة واقعية وليست مولدة بالذكاء الاصطناعي، أما اللون غير الواقعي ففسره على أنه تعديل في الصورة أو أنها نسخة تجريبية.

النتيجة النهائية - ما هو أفضل نموذج لتوليد الصور

نموذج جيميناي نانو بنانا برو يتيميز بـ:

  • التزام أدق بالتعليمات وتعديل أفضل للصور العادية.
  • كتابة النصوص العربية بطريقة صحيحة.
  • الإنفوجراف والرسوم البيانية.
  • جودة وأبعاد أفضل للصور.
  • وجود علامة مائية وقدرته على كشف الصور المولدة بالذكاء الاصطناعي.

يعيبه الآتي:

  • حد يومي قليل في النسخة المجانية ( ثلاث صور).
  • لا يقبل توليد صور للمشاهير.
  • يحتاج لأمر دقيق وطويل في بعض الأحيان لتحصل على صورة جيدة.

أما نموذج ChatGPT Images فيتميز بـ:

  • مخيلة أوسع ويميل لإعطائك صورة أجمل بغض النظر عن واقعيتها.
  • توليد خمس صور في اليوم مجانًا.
  • أسرع قليلًا من جيميناي.

ويعيبه:

  • عدم القدرة على رفع أكثر من ثلاث صور معًا.
  • لا يستطيع توليد الصور بالأبعاد المطلوبة.
  • صوره ليست واقعية بما فيه الكفاية.

في النهاية، أظن هذه المقارنة كافية لك لتحدد أي نموذج هو الأفضل لاستخدامك، وربما تدمج النموذجين معًا!

هل تستطيع تخمين أي نموذج استخدمنا لإنشاء صورة المقال :)