“المستقبل هنا”: يعرض Sam Altman مولد الفيديو المتطور من OpenAI والذي يمكنه تحويل أي أمر إلى فيلم عالي الدقة

في حديقة حيوانات بلينغ، يرتدي نمر ميدالية ذهبية عملاقة، ويرتدي قرد تاجًا مرصعًا بالجواهر، وتأكل سلحفاة وعاءً من الماس.

لسوء الحظ، هذه الوجهة الخيالية غير موجودة. إنه من ابتكار Sora، برنامج الذكاء الاصطناعي الجديد لتحويل النص إلى فيديو من OpenAI، صانع ChatGPT.

كان “Bling Zoo” مجرد واحد من سلسلة مقاطع الفيديو التي أنشأها Sora يوم الخميس عندما طلب الرئيس التنفيذي Sam Altman من متابعيه على X (Twitter سابقًا) إرسال الأوامر التي تم إنشاؤها في الأفلام.

وكانت النتائج واقعية للغاية، مما دفع أحد المراقبين إلى التعليق: “هذا أقنعني أن المستقبل هنا وسيكون على ما يرام.”

طلب أحد المستخدمين من سورا إنشاء “جلسة طبخ تعليمية للجنوكتشي محلية الصنع تستضيفها إحدى الجدات المؤثرة على وسائل التواصل الاجتماعي في مطبخ ريفي توسكاني مع إضاءة سينمائية”.

أدت هذه المطالبة إلى الفيديو الأكثر واقعية الذي يحتوي على إنسان والذي نشره ألتمان يوم الخميس.  وتعجب المستخدمون من مدى واقعية يدي المرأة، وهو موضوع صعب للغاية بالنسبة لصور الذكاء الاصطناعي لإعادة إنشائه

أدت هذه المطالبة إلى الفيديو الأكثر واقعية الذي يحتوي على إنسان والذي نشره ألتمان يوم الخميس. وتعجب المستخدمون من مدى واقعية يدي المرأة، وهو موضوع صعب للغاية بالنسبة لصور الذكاء الاصطناعي لإعادة إنشائه

بدأ ألتمان الحيلة بتغريدة قائلاً: “نود أن نظهر لك ما يمكن أن يفعله سورا، يرجى الرد مع التسميات التوضيحية لمقاطع الفيديو التي ترغب في مشاهدتها وسنبدأ في إنشاء بعضها!” هو كتب.

“لا تتراجع عن التفاصيل أو الصعوبة!” وأضاف في متابعة وظيفة.

بدأت المطالبات تأتي بسرعة:

كتب أحد الردود: “ساحر يرتدي قبعة مدببة ورداء أزرق به نجوم بيضاء يلقي تعويذة تطلق البرق من يده ويحمل مجلدًا قديمًا في يده الأخرى”.

وكتب آخر: “نصف بطة ونصف تنين يطير عبر غروب الشمس الجميل وعلى ظهره هامستر يرتدي معدات المغامرة”.

قام ألتمان بتسليم النتائج، ونشر بعض إبداعات سورا، والتي تم تجميعها في الفيديو التالي:

شبهه أحد المراقبين بـ كابل متعدد الأبعاد، وهي حلقة من برنامج الخيال العلمي التلفزيوني ريك ومورتي حيث سمح صندوق كابل خاص للمشاهدين بإلقاء نظرة خاطفة على التلفزيون في حقائق بديلة – عالم حيث كل شخص مصنوع من الذرة، على سبيل المثال.

“Bling Zoo” ومقاطع الفيديو الأخرى المشابهة لم تكن بعيدة عن ذلك.

ردًا على مقطع فيديو سورا بعنوان “سباق دراجات في المحيط مع حيوانات مختلفة حيث يركب الرياضيون الدراجات مع عرض كاميرا الطائرة بدون طيار،” قدم سورا مقطع فيديو دفع أحد المعلقين إلى التكهن حول تفوق سورا على Dall-E، أحد أنظمة الذكاء الاصطناعي الحالية البرامج الفنية:

وكتبوا: “لدي شعور بأن أي إطار يتم التقاطه من سورا أفضل من دالي”.

أنشأ سورا مقاطع فيديو قصيرة لمطالبات المستخدم التي تم إرسالها عبر X، مما دفع البعض إلى تشبيه النتائج بوجهة نظر الخيال العلمي في عالم بديل

أنشأ سورا مقاطع فيديو قصيرة لمطالبات المستخدم التي تم إرسالها عبر X، مما دفع البعض إلى تشبيه النتائج بوجهة نظر الخيال العلمي في عالم بديل

وكانت النتائج واقعية بشكل مخيف

وكانت النتائج واقعية بشكل مخيف

وتساءل أحد المتابعين: “سباق دراجات على المحيط مع حيوانات مختلفة حيث يركب الرياضيون الدراجات الهوائية مع عرض كاميرا بدون طيار”.

وسلمت سورا.

نفس الشيء عندما طلب شخص ما من ألتمان أن يجعل سورا يعرض “اثنين من المستردات الذهبية يبثان على قمة الجبل”.

بالنسبة لمقطع فيديو واحد، طلب أحد المعلقين

أظهر الفيديو الناتج ذلك، حتى أن المرأة التي تم إنشاؤها بواسطة الذكاء الاصطناعي لوحت بيدها لتظهر أن لديها أصابع طبيعية – وهو أمر قد يكون صعبًا للغاية بالنسبة للذكاء الاصطناعي. غالبًا ما ينتهي الأمر بالأشخاص الذين يولدون بواسطة الذكاء الاصطناعي بأصابع كثيرة جدًا أو قليلة جدًا.

‘الثني الكبير يلوح بأصابعه في حركة بطيئة!’ كتب أحد المعلقين. “وهناك 10 فقط!” أجاب آخر.

تم إطلاق Sora في البداية لاختيار المبدعين، كما كتب Altman على X. ولم يعلن هو وOpenAI عن موعد إصداره لعامة الناس.

خلص أحد مستخدمي X المثيرين للإعجاب بشكل خاص إلى أن “AGI موجود هنا”.

عندما طلب مستخدم X

عندما طلب مستخدم X “اثنين من المستردات الذهبية يبثان على قمة الجبل”، أجابه سورا

يشير الاختصار إلى الذكاء العام الاصطناعي، وهو نظام ذكاء اصطناعي يمكنه العمل من تلقاء نفسه دون سيطرة بشرية، ويمكنه فهم نفسه، ويمكنه تعلم مهارات جديدة.

ويأمل بعض العلماء أن يكون مثل هذا النظام قادرًا على حل المشكلات الرياضية أو العلمية المعقدة التي قد يستغرق حلها سنوات من البشر.

الذكاء الاصطناعي العام هو هدف وخوف بين علماء الكمبيوتر الذين يعملون مع الذكاء الاصطناعي، حيث يشعر البعض بالقلق من أن مثل هذا النظام يمكن أن ينظر إلى البشر على أنهم تهديد يجب القضاء عليه.

في حالة سورا، لن تؤدي القوة الحاسوبية إلى تدمير البشرية، بل إلى إنشاء مقاطع فيديو مدتها 10 ثوانٍ من مطالبات الأشخاص المرحة.