الذكاء الاصطناعي يمكن أن يجلب الحياة في صورة الموناليزا

Share:

الذكاء الاصطناعي يمكن أن يجلب الحياة في صورة الموناليزا

ابتكر خبراء التعلم الآلي في نظامًا يمكنه عمل رسوم متحركة ومقاطع فيديو صغيرة للحركة باستخدام صورة واحدة فقط أو لوحة.

تم نشر ورقة هذا النموذج في Samsung AI Center والذي يمكن قراءته على Arxiv. وفقا للدراسة ، استخدم الباحثون تقنيات الشبكة العصبية الاصطناعية لجلب تعبيرات الوجه وحركة الجسم في الصور المصدر. سوف يعرض الذكاء الاصطناعى الوجه المستهدف وهو يتحدث ويجعله يفعل ما يفعله وجه المصدر

هذه التقنية والنظام ليس جديدًا تمامًا. إنها جزء من الصور الاصطناعية المرتبطة بـ الذكاء الاصطناعي. يمكن للتقنيات إنشاء مقاطع فيديو من صورة واحدة لشخص يتحدث ، ولكنها تتطلب الكثير من البيانات لإنشاء فيديو مدته دقيقة إلى دقيقتين لتحليل الصورة.


كتب باحثون مقيمون في موسكو في الورقة أن مقاطع الفيديو التي تم إنشاؤها من صورة أو لوحة واحدة والتي يمكن أن تظهر للشخص في الصورة يتحدث أو يتحرك هي مقنعة ، ولكن لا تشوبه شائبة.

تتضمن هذه التقنية التحميل الأمامي لعملية تحديد الوجه باستخدام البيانات لإنشاء نموذج يمكنه العثور على أجزاء من وجه المصدر يتوافق مع الوجه المستهدف. المزيد من البيانات سيؤدي إلى تحسين الفيديو والرسوم المتحركة. لذلك ، من الممكن أيضًا باستخدام صورة واحدة من أينشتاين أو الموناليزا لإنشاء وجوه متحركة بتقنية التعلم المفرد.

تستخدم شبكة الخصومة التوليدية أيضًا في العملية لدمج نموذجين لإنتاج ناتج يمكن أن يشبه وجه الإنسان بنسبة 90 بالمائة. تستخدم الشبكة صورتين متعارضتين لإنشاء أداة تمييز يمكن أن تلبي توقعاتهم.

تضمنت الورقة أيضًا مثالًا آخر حاول أن يصور نوعية الوجه الحديث المزيف الذي تم فيه التقاط صور لشخص ما من أخبار الكبل لتكرار صوره. في النتيجة تم إعادة إنشاء شريط الأخبار. الفيديو لديه بعض التحف الغريبة التي ينبغي النظر فيها.

هذا النظام الجديد رائع ، لكن يمكن تطبيقه على الوجه أو الجذع العلوي فقط. لا يمكن إنشاء رسوم متحركة لأصابع الالتقاط.