Anthropic تطلق Claude Opus 4.1 قبل وصول GPT-5

أعلنت شركة Anthropic عن إصدار النموذج الجديد Claude Opus 4.1، في خطوة تعكس تصاعد حدة المنافسة في سوق الذكاء الاصطناعي، خاصة مع اقتراب OpenAI من إطلاق نموذج GPT-5 المرتقب في أغسطس.

ويمثل هذا التحديث تحسينًا تدريجيًا للنموذج الرئيسي لدى الشركة، مع تركيز ملحوظ على الأداء في مجالات الترميز والاستدلال والمهام الوكيلة، مع الحفاظ على نفس تسعيرة الإصدار السابق.

قفزة نوعية في أداء البرمجة

حقق النموذج الجديد Opus 4.1 دقة بلغت 74.5 بالمئة على معيار SWE-bench Verified الخاص بهندسة البرمجيات، مقارنة بنسبة 72.5 بالمئة التي سجلها الإصدار السابق Opus 4. ويؤكد هذا التحسن المتقدم مكانة Anthropic في سوق البرمجة المؤسسية، حيث تستحوذ الشركة حاليًا على حصة سوقية تبلغ 42 بالمئة، متفوقة على OpenAI التي تبلغ حصتها 21 بالمئة فقط.

أكدت منصة GitHub أن Opus 4.1 يحقق مكاسب أداء ملحوظة في عمليات إعادة هيكلة الشيفات متعددة الملفات، بينما أشادت شركات تطوير مثل Rakuten Group بقدرة النموذج على تحديد التصحيحات الدقيقة داخل قواعد بيانات ضخمة من الشيفات، من دون إدخال تعديلات غير ضرورية أو التسبب بأخطاء.

أصبح النموذج متاحًا مباشرة من خلال GitHub Copilot للمشتركين في خطط Enterprise وPro Plus، ما يسهل على المطورين والمؤسسات الاستفادة منه في الوقت الفعلي.

توقيت استراتيجي في خضم التنافس

جاء إصدار Claude Opus 4.1 في لحظة حساسة، حيث تتهيأ OpenAI لإطلاق GPT-5، وسط توقعات بإصداره في أوائل أغسطس. وفي هذا السياق، صرح مايك كريغر، رئيس المنتجات في Anthropic، لموقع بلومبرغ قائلًا إن الشركة تركز على ما تملكه من إمكانات، بينما ما ستفعله الشركات الأخرى يبقى أمرًا خارج سيطرتهم.

ورغم أن ChatGPT يهيمن على السوق الاستهلاكية بأكثر من 100 مليون مستخدم، فإن Anthropic تواصل تعزيز موقعها في السوق المؤسسية. وتشير بيانات من شركة Menlo Ventures إلى أن Anthropic باتت تمتلك 32 بالمئة من سوق نماذج اللغة الكبرى الموجهة للمؤسسات، متقدمة على OpenAI التي تراجعت إلى 25 بالمئة، في انعكاس دراماتيكي للواقع في عام 2023، حين كانت حصة OpenAI تبلغ 50 بالمئة مقابل 12 بالمئة فقط لـ Anthropic.

تحسينات تدريجية في اختبارات الأداء

رغم أن Opus 4.1 يعد تحديثًا طفيفًا من حيث الرقم، إلا أنه يقدم تحسينات واضحة على مستوى عدة معايير. فقد ارتفعت نسبة النجاح في اختبار GPQA Diamond الخاص بالاستدلال على مستوى الدراسات العليا من 79.6 بالمئة إلى 80.9 بالمئة. كما سجل النموذج أداءً قويًا في اختبارات AIME للرياضيات لعام 2025 بنسبة 78.0 بالمئة، مقارنة بـ 75.5 بالمئة في النسخة السابقة.

لكن في المقابل، تراجع أداء النموذج في بعض المعايير مثل TAU-bench في فئة الطيران، حيث انخفضت النسبة من 59.6 بالمئة إلى 56.0 بالمئة، ما يعكس وجود تباين في مكاسب الأداء حسب نوعية المهام.

نفس السعر مع قدرات أكثر دقة

يحافظ Opus 4.1 على نفس هيكل التسعير المعتمد في الإصدار السابق، حيث تبلغ تكلفة المعالجة 15 دولارًا لكل مليون توكن إدخال، و75 دولارًا لكل مليون توكن إخراج، مما يجعله واحدًا من أغلى النماذج في السوق. ومع ذلك، تصفه الشركة بأنه بديل مباشر يمكن استبداله مكان Opus 4 دون الحاجة لتعديل التطبيقات أو البنى التحتية، مع تحسينات حقيقية في القدرة على التعامل مع التعليمات المعقدة والمهام الواقعية.

وتركز Anthropic في هذا التحديث على منح المؤسسات والمطورين نموذجًا أكثر دقة في التعامل مع التعليمات، خصوصًا في بيئات التطوير البرمجي، ما يجعل النموذج مناسبًا لتطبيقات تتطلب موثوقية عالية وسرعة في التفاعل.

سباق لا يهدأ في عالم الذكاء الاصطناعي

يعكس إطلاق Claude Opus 4.1 الواقع المتسارع لسوق الذكاء الاصطناعي، حيث تتسابق الشركات لتقديم نماذج أقوى وأدق قبل المنافسين. وبينما تستعد OpenAI للكشف عن GPT-5، تسعى Anthropic لتثبيت أقدامها في سوق المؤسسات، معززة سجلها في مجالات الترميز، والمنطق، والاستجابة الدقيقة للتعليمات.

ويبدو أن السنوات القادمة ستشهد مزيدًا من التنافس بين الشركات الكبرى مثل OpenAI وAnthropic وGoogle، حيث تتقاطع الابتكارات التقنية مع احتياجات المستخدمين في القطاعات المختلفة، وتصبح دقة النموذج وفعاليته معيارًا أساسيًا للتفوق في هذا المجال شديد الديناميكية.