صوت AI المتولد يشبه الصوت الحقيقي لجو روغان


قال جو أورجان في مقطع الفيديو الأخير الخاص به إنه يريد رعاية فريق هوكي يتكون بالكامل من شمبانزي. علاوة على ذلك ، ادعى أنه تحت سيطرة الروبوت. ومع ذلك ، لم يكن صوت الجهاز ، لقد كان صوتًا تم إنشاؤه من قبل الذكاء الاصطناعى ويمكن أن يشبه صوت أي ممثل كوميدي أو بودكاستير.

تم إنشاء خداع صوت المضيف جو روغان إكسبيرينس من قبل شركة الذكاء الاصطناعي ديسا ومهندسي التعلم الآلي الذين استخدموا صوت المضيف لصنع أدوات لتعلم أنماط الصوت والأناقة ، وفقا لوصف الفيديو. يمكن أن يساعد هذا الذكاء الاصطناعي المبدعين ، المدونين ومستخدمي اليوتيوب الذين ينتجون الكثير من المحتوى لجمهورهم بشكل متكرر.

من ناحية أخرى ، أوضحت الشركة أن الذكاء الاصطناعى كان قادرًا على توليد الصوت المشابه لأن المهندسين كتبوا أكواد معقدة - "باستخدام نظام تعليمي عميق لتحويل النص إلى كلام قاموا بتطويره باسم RealTalk ، والذي يولد خطابًا يشبه الحياة باستخدام مدخلات النص فقط "- بسبب قدرة الجهاز على إنتاج نسخة متماثلة من صوت أي شخص باستخدام البيانات المخزنة فيه.

علاوة على ذلك ، قال المتحدث الرسمي باسم Dessa أيضًا إن AI تم تدريبه على صوت روغان ، وما كان يستمع إليه المشاهدون هو نتيجة إدخال النص.


هذا البرنامج يشبه تلك الخوارزمية التي جعلت موسيقى الراب الأردني بيترسون تبدو مثل إيمينيم. ومع ذلك ، فإن تلك الخوارزمية تحتاج إلى صوت مدته ست ساعات للحصول على تدريب. ومع ذلك ، تحتاج البرامج ، مثل Modulate.ai و Lyrebird ، أيضًا إلى صوت طويل مدته بضع دقائق لإنشاء نسخة متماثلة.

وبالتالي ، تبرز النسخة المتماثلة لـ Dessa ، ولكن الشركة لم توافق على نشر معلومات خوارزمية العمل والرموز. ومع ذلك ، وعد الفريق بنشر بعض النظرة الفنية حوله ، في الأيام القليلة المقبلة.

حاليًا ، هناك العديد من الشركات الناشئة التي تحاول تكوين صورتها المزيفة ، بعد ظهور مقاطع الفيديو العميقة - مقاطع فيديو مبادلة للوجه مبنية على أساس الخوارزمية ، والتي لها بعض التأثير السلبي على المجتمع. سلطت Dessa الضوء على تلك التأثيرات مثل المضايقات وانتحال الهوية والمخادعين ومكالمات الاحتيال ، ولكن من ناحية أخرى ، أعطت المراجعة نقاطًا حول كيفية تحسين جودة الصوت المزيف.

إذا كنت تعتقد أنه يمكنك فهم الفرق بين الصوت الذي تم إنشاؤه من قبل الذكاء الاصطناعي والصوت الحقيقي ، فقم بإجراء الاختبار الذي ابتكره العالم ليعرف أنه يمكنك التمييز بين صوت روغان الحقيقي والصوت المزيف. صوت اثنين لديها اختلاف طفيف في انعطاف.