أعلنت مايكروسوفت عن إطلاق نموذج جديد لتوليد الصور بالذكاء الاصطناعي يحمل اسم MAI-Image-2-Efficient، وهو إصدار أخف من نموذجها الرئيسي MAI-Image-2، صُمم خصيصًا لتقليل تكلفة إنتاج الصور في البيئات التي تعتمد على كميات كبيرة من المحتوى المرئي.

  • MAI-Image-2-Efficient يخفض تكلفة توليد الصور مع سرعة أعلى واستهلاك موارد أقل.
  • النموذج يستهدف إنتاج كميات كبيرة من الصور للحملات التسويقية والمتاجر الرقمية.
  • مايكروسوفت توسع منظومة نماذج الذكاء الاصطناعي عبر تطوير حلول داخلية متكاملة.
  • خطة مستقبلية لدمج النموذج في Copilot و Bing لتعزيز الاستخدام اليومي.

جاء تطوير النموذج الجديد استجابة لحاجة متزايدة لدى الشركات والمؤسسات التي تعتمد على إنتاج أعداد كبيرة من الصور يوميًا، مثل الحملات التسويقية الرقمية، وإعلانات وسائل التواصل الاجتماعي، ومحتوى المتاجر الإلكترونية.

نموذج MAI-Image-2-Efficient

تركز مايكروسوفت في هذا الإصدار على تحقيق توازن واضح بين الأداء والتكلفة، بحيث يصبح بالإمكان توليد صور بكميات ضخمة دون تحميل الشركات أعباء مالية مرتفعة، وهو ما يعكس التحول الملحوظ في طريقة تصميم نماذج الذكاء الاصطناعي لتناسب الاستخدامات العملية الواسعة.

أوضحت مايكروسوفت أن تكلفة استخدام MAI-Image-2-Efficient تبلغ نحو 19.50 دولار لكل مليون رمز إخراج خاص بالصور، وهو سعر أقل بشكل ملحوظ مقارنة بسعر 33 دولار لكل مليون رمز في نموذج MAI-Image-2 الكامل. يعكس هذا الفارق السعري توجهًا واضحًا نحو تقديم خيارات متعددة تناسب احتياجات الشركات المختلفة، حيث يمكن للمستخدمين اختيار النموذج الأنسب حسب طبيعة العمل وحجم الإنتاج المطلوب.

أظهرت البيانات التي نشرتها الشركة أن النموذج الجديد يعمل بسرعة أعلى بنحو 22 في المئة مقارنة بالنموذج الأساسي، كما يستخدم موارد حوسبية أقل بنحو أربعة أضعاف. يسهم هذا التحسن في تقليل استهلاك الطاقة وتخفيض تكاليف تشغيل البنية التحتية، وهو عامل مهم للمؤسسات التي تعتمد على تشغيل نماذج الذكاء الاصطناعي بشكل مستمر وعلى نطاق واسع.

تستهدف مايكروسوفت من خلال هذا النموذج حالات استخدام تعتمد على الإنتاج الكثيف أكثر من اعتمادها على الدقة الفنية العالية. تشمل هذه الحالات إنشاء صور للإعلانات على وسائل التواصل الاجتماعي، وإنتاج نماذج أولية للتصميمات، وصور مصغرة للمنتجات، بالإضافة إلى مواد تسويقية يتم إنشاؤها على دفعات كبيرة. في هذه السيناريوهات، تصبح سرعة التنفيذ وتكلفة الإنتاج عنصرين أساسيين يفوقان أهمية التفاصيل الدقيقة في كل صورة.

أشارت الشركة أيضًا إلى أن النموذج الجديد يحتفظ بالعديد من القدرات الأساسية التي تتميز بها عائلة MAI، مثل القدرة على إنتاج صور واقعية، وإدراج النصوص داخل الصور بطريقة واضحة، وهي ميزات تم تطويرها بالتعاون مع مصممين ومصورين محترفين لضمان تلبية احتياجات الاستخدامات العملية.

مايكروسوفت تطلق نموذج MAI-Image-2-Efficient منخفض التكلفة لتوليد الصور

تطوير نماذج الذكاء الاصطناعي

واصلت مايكروسوفت تطوير منظومة نماذج الذكاء الاصطناعي الخاصة بها بوتيرة متسارعة خلال الفترة الأخيرة. شهدت الأشهر الماضية إطلاق عدد من النماذج الجديدة ضمن سلسلة MAI، حيث ظهر نموذج MAI-Image-1 في أكتوبر 2025، تلاه إطلاق نموذج MAI-Image-2 في مارس 2026، قبل أن تكشف الشركة في وقت سابق من الشهر الحالي عن نموذجين إضافيين هما MAI-Voice-1 وMAI-Transcribe-1.

تعكس هذه الإصدارات المتتابعة توجه مايكروسوفت نحو بناء منظومة نماذج متكاملة داخل الشركة، بدلًا من الاعتماد على مزودين خارجيين. يمتد هذا التوجه إلى مجالات متعددة تشمل الصوت والكلام وتوليد الصور، وهو ما يمنح الشركة قدرة أكبر على التحكم في التكلفة والتطوير، إضافة إلى تعزيز تنافسيتها في سوق الذكاء الاصطناعي العالمي.

تتيح مايكروسوفت الوصول إلى نموذج MAI-Image-2-Efficient للمطورين بشكل فوري عبر منصتي Microsoft Foundry و MAI Playground، مع تحديد تكلفة إدخال النصوص عند 5 دولارات لكل مليون رمز، وهي التكلفة نفسها المطبقة في نموذج MAI-Image-2. أشارت الشركة كذلك إلى أن النموذج الجديد يقدم أداء أسرع بنسبة تصل إلى 40 في المئة مقارنة بعدد من نماذج الصور المنافسة لدى شركات تقنية كبرى، من بينها نماذج تقدمها جوجل.

تخطط مايكروسوفت لتوسيع نطاق استخدام النموذج مستقبلًا ليشمل خدماتها الموجهة للمستخدمين النهائيين، حيث يجري العمل على دمجه في أدوات مثل Copilot ومحرك البحث Bing. لم تحدد الشركة موعدًا دقيقًا لبدء هذا التوسع، إلا أن هذه الخطوة تعكس توجهًا واضحًا نحو تعميم قدرات توليد الصور في التطبيقات اليومية التي يعتمد عليها المستخدمون.

يأتي إطلاق هذا النموذج في سياق تنافسي سريع بين شركات التقنية الكبرى لتقديم نماذج أكثر كفاءة من حيث استهلاك الموارد، مع الحفاظ على مستوى جودة يلبي متطلبات الاستخدام التجاري. وأتوقع أن تسهم هذه التحركات في تسريع انتشار أدوات توليد الصور بالذكاء الاصطناعي داخل المؤسسات، خصوصًا مع تزايد الحاجة إلى إنتاج محتوى بصري بكميات كبيرة وبأقل تكلفة ممكنة.