التخطي إلى المحتوى

يشهد الذكاء الاصطناعي تحسّنًا في الأداء لجهة خلق صورة باستعمال عدد قليل من الكلمات، مع مولّدات صور الذكاء الاصطناعيّ  AI المتاحة للجمهور مثل Dalle E 2 وStable Difusion. حالياً، تستعدّ “ميتا” لخطوة جديدة في هذا المجال، حيث تستخدم الذكاء لإنشاء مقاطع فيديو بناء على عدد قليل من الكلمات فقط!

ونشر الرئيس التنفيذيّ لشركة “ميتا” مارك زوكربيرغ على “فايسبوك” مقطع فيديو مدته 20 ثانية يوضح كيفية عمل التقنية الجديدة، وتضمّن مقطع الفيديو “دبدوب يرسم صورة ذاتية” “سفينة فضاء تهبط على سطح المريخ”، “طفل كسلان يرتدي قبعة محبوكة يحاول اكتشاف جهاز كمبيوتر محمول” ، و “روبوت يركب موجة في المحيط”.

ورغم كون مقاطع الفيديو قصيرة ومنخفضة الجودة إلى حدّ ما، إلّا أنّها تظهر اتّجاهًا جديدًا تتخذه أبحاث الذكاء الاصطناعيّ حيث تتحسّن طريقة عمله بشكل متزايد في خلق الصور من الكلمات.

وتوضح ورقة بحثية تصف العمل أنّ المشروع يستخدم نموذجًا للذكاء الاصطناعي لتحويل النص إلى صورة لمعرفة كيفية توافق الكلمات مع الصور، وتقنية الذكاء الاصطناعي المعروفة باسم التعلّم غير الخاضع للإشراف، حيث تقوم الخوارزميات بالتعمّق في البيانات التي لم يتمّ تصنيفها لتمييز أنماط داخلها، لمشاهدة مقاطع الفيديو وتحديد شكل الحركة الواقعية.

إلى ذلك، أوضح الباحثون أنه كما هو الحال مع أنظمة الذكاء الاصطناعي الضخمة والشائعة التي تولّد صورًا من النص، أشار الباحثون إلى أنّ نموذج الذكاء الاصطناعي الخاصّ بتحويل نصّ إلى صورة قد تمّ تدريبه على بيانات الإنترنت، مما يعني أنه تعلم “ومن المحتمل أن يكون هناك تحيزات اجتماعية مبالغ فيها، بما في ذلك التحيزات الضارة”.