أوقفت شركة OpenAI استخدام صوت Sky الشهير في ChatGPT مؤقتًا بسبب مخاوف من أنه يشبه إلى حدٍ كبير صوت المُمثلة سكارليت جوهانسون. تقول الشركة إن الأصوات في ChatGPT كانت من ممثلين صوتيين بأجر مدفوع، واختارت في النهاية 5 أصوات من مجموعة أوّلية مُكوّنة من 400 شخص، والصدفة العجيبة أنّ المُؤدية التي لم يُذكر اسمها والتي تقف وراء صوت Sky لها نبرة صوت مُشابهة لسكارليت.

الدردشة الصوتية مع الذكاء الاصطناعي هي الأكثر طلبًا ورواجًا بالنسبة لـ OpenAI، بعد إعلانها عن تقديم نموذج GPT-4o الجديد في ChatGPT، والذي سيأتي معه واجهة مُحادثة جديدة تُمكّن المُستخدمين من التحدث في الوقت الفعلي إلى الذكاء الاصطناعي الذي يبدو طبيعيًا ويُحاكي المشاعر البشرية.

في حين أنّ صوت Sky ونسخة من ChatGPT الصوتية موجودة منذ وقت ليس بالقصير، إلا أن المُقارنة مع سكارليت جوهانسون أصبحت أكثر وضوحًا بفضل الرئيس التنفيذي Sam Altman لشركة OpenAI، الذي رسم التشابه بين نموذج الذكاء الاصطناعي الجديد وفيلم "Her".

في فيلم "Her"، تؤدي Scarlett Johansson صوت نظام تشغيل مُتقدم للذكاء الاصطناعي تُدعى سامانثا، والتي تطوّر علاقة رومانسية مع كاتب وحيد يلعب دوره جواكين فينيكس. وبفضل قدرته على محاكاة الاستجابات العاطفية، كانت أوجه التشابُّه مع GPT-4o واضحة.



 

ما يجعل GPT-4o مُختلفًا عن النماذج السابقة، أو حتى الإصدار السابق من ChatGPT Voice هو تعدُّد الوسائط، ويمكنه فهم وإنشاء الصور والنصوص والفيديو، وبالطبع الكلام، وعلى عكس النماذج مُتعددة الوسائط الأخرى، فإنه سيسمح بإجراء مُحادثات في الوقت الفعلي وحتى بصوت عاطفي وقابل للتكيف.

نظرًا لهذه العاطفة المُتزايدة في الطريقة التي يبدو بها ChatGPT Voice، هناك خطر من إساءة استخدامه أو استخدامه لإنشاء مقاطع مُزيفة عميقة "Deepfakes"، لذلك نحن بالتأكيد نتفهم أي مخاوف من فريق جوهانسون بشأن هذا لأن الأصوات تبدو مُتشابهة جدًا.

تتوفر الآن 5 أصوات للإصدار الحالي من ChatGPT Voice وستستخدم أيضًا عند إطلاق الإصدار الجديد (Breeze وCove وEmber وJuniper وSky).

تقول OpenAI إنها دخلت في شراكة مع المُمثلين الصوتيين المُختارين، ورخّصت أصواتهم وأخذت عينات منها لاستخدامها في التطبيق. وكتب OpenAI في منشور بالمدونة: "يحصل كل ممثل على تعويض أعلى من أعلى مُعدلات للرواتب في السوق، وسيستمر هذا طالما تُستخدم أصواتهم في مُنتجاتنا".

بحثّت OpenAI عن مُمثلين بأجر مادي، واستخدمت مديري اختيار المُمثلين الحائزين على جوائز للعثور عليهم. كان هذا في أوائل العام الماضي وكان لديهم أكثر من 400 طلب.

لقد اختاروا 5 من القائمة ونقلوا كل ممثل جواً إلى سان فرانسيسكو لحضور جلسة تسجيل. ودربت بعض من حضر جلسة التسجيل على النماذج الصوتية الجديدة للذكاء الاصطناعي بحيث يتوافق كل ممثل مع صوت مُختلف من الأصوات الخمسة.

وقالت الشركة: "نعتقد أن أصوات الذكاء الاصطناعي لا ينبغي أن تُحاكي عمدًا الصوت المُميّز لأحد المشاهير، فصوت سكاي ليس تقليدًا لسكارليت جوهانسون، ولكنه ينتمي إلى ممثلة مُحترفة مُختلفة تستخدم صوتها الطبيعي"، مضيفةً؛ أنها لا تستطيع مُشاركة اسمها!