ليوناردو D-AI فينشي؟ تقوم أداة Nifty AI بتحويل رسوماتك السيئة إلى عمل فني في ثوانٍ – ولا تحتاج إلى الإنترنت

ليوناردو D-AI فينشي؟ تقوم أداة Nifty AI بتحويل رسوماتك السيئة إلى عمل فني في ثوانٍ – ولا تحتاج إلى الإنترنت

يحلم الكثير منا بأن يصبح فنانًا في مرحلة ما من حياتنا ، ولكن غالبًا ما يمنعنا الرسم المراوغ من الوصول إلى هناك.

الآن ، قد تصبح هذه الأحلام ممكنة قريبًا ، حيث يمكن لأداة جديدة تحويل رسومات الشعار المبتكرة السيئة إلى روائع بفضل قوة الذكاء الاصطناعي (AI).

كشفت عملاق التكنولوجيا كوالكوم النقاب عن برنامج ControlNet الذي يغير قواعد اللعبة في وقت سابق من هذا الأسبوع ، والذي يحول مطالبات الصور إلى ما تريد في غضون 12 ثانية.

على عكس العديد من الطرز الأخرى من نوعها – مثل Adobe AI Firefly – من المستغرب أن ControlNet لا تحتاج إلى الإنترنت لتعمل ويمكن أن تصبح قريبًا تطبيقًا رئيسيًا للهاتف المحمول.

على الرغم من أنه لم يتم إصداره بعد ، إلا أن الشركة تدعي أن إنتاج الصور هنا سيكون خاصًا تمامًا ، مع عدم وجود بيانات احتياطيًا في سحابة تابعة لجهة خارجية.

يمكن تحويل الرسومات السيئة إلى روائع في أقل من 12 ثانية باستخدام ControlNet. في هذا العرض التوضيحي ، أدخل أحد المستخدمين رسمًا لقطط وحث النموذج على جعله “أصفر” و “صورة واقعية” وبجودة “4k” باستخدام موجه نص. يتم عرض الصورة النهائية على الجانب الأيمن

ما هي السحابة؟

تشير السحابة إلى الخوادم الموجودة في مراكز البيانات في جميع أنحاء العالم ولكن يمكن الوصول إليها عبر الإنترنت.

إذا كانت الشركات تستخدم الحوسبة السحابية ، فلن تضطر إلى إدارة هذه الخوادم بنفسها أو تشغيل برامج كثيفة الطاقة على أجهزتها.

تتيح السحابة أيضًا للمستخدمين الوصول إلى ملفاتهم من أي جهاز تقريبًا لأن بياناتهم مخزنة في مركز معين بدلاً من تخزينها على أجهزتهم الخاصة.

هذه هي الطريقة التي يمكن أن تنتقل بها بيانات حساب الوسائط الاجتماعية ، مثل عمليات تسجيل الدخول إلى Instagram ، من هاتف مكسور إلى هاتف جديد بسرعة كبيرة.

المصدر: Cloudfare

قال متحدث باسم شركة كوالكوم: “لقد أحدث الذكاء الاصطناعي التوليدي ثورة في العالم ، حيث عطل الطرق التقليدية لإنشاء المحتوى”.

“تسمح ControlNet للمستخدمين بإدخال وصف نصي لصورة بالإضافة إلى صورة إضافية للتحكم في العملية التوليدية.”

تأتي ControlNet وسط العديد من أدوات الذكاء الاصطناعي المماثلة من هذا النوع والتي يشار إليها عادةً باسم نماذج رؤية اللغة (LVMs).

تدمج هذه بشكل عام مشفر صورة ومشفّر نص لقراءة الإرشادات التي يقدمها المستخدم ، قبل إنتاج محتوى جديد.

في حين أن ControlNet ليست متاحة للاستخدام العام بعد ، تظهر العروض التوضيحية أنها يمكن أن تنتج عملًا فنيًا من المطالبات النصية ومطالبات الصور وكلاهما في وقت واحد.

يمكن أن تكون الصور المختارة أي شيء من الرسومات الشخصية إلى الصور الفوتوغرافية ، بينما يمكن أن تشير مدخلات النص إلى النمط أو “المادة” التي يجب أن يستخدمها الذكاء الاصطناعي لإنتاج نسخة جديدة.

يمكن استخدام اللون المائي أو الطلاء الزيتي لإنشاء صورة على سبيل المثال ، مع تصوير هذه الصور بجودة 4K.

نظرًا لأن هذه العملية تعمل فقط على جهاز معين ، تدعي شركة Qualcomm أن كلاً من وقت التشغيل واستهلاك الطاقة قد انخفض أيضًا بشكل كبير.

وأضاف المتحدث: “يتم إنشاء الصور في أقل من 12 ثانية لتوفير تجربة مستخدم تفاعلية موثوقة ومتسقة.

“يوفر الذكاء الاصطناعي على الجهاز مزايا من حيث التكلفة والأداء والتخصيص والخصوصية والأمان على نطاق عالمي.”

في هذا العرض التوضيحي لـ ControlNet ، أدخل أحد المستخدمين صورة فوتوغرافية لنفسه ، ويبدو أنه طُلب من النموذج إنتاج قطعة فنية قديمة الطراز

في هذا العرض التوضيحي لـ ControlNet ، أدخل أحد المستخدمين صورة فوتوغرافية لنفسه ، ويبدو أنه طُلب من النموذج إنتاج قطعة فنية قديمة الطراز

ليس من الواضح متى ستكون ControlNet متاحة للاستخدام العام ، ولكنها ستكون قابلة للاستخدام على الهواتف كما هو موضح في عرض Qualcomm هذا.  هنا ، استفاد المستخدم من موجه الصور وموجه النص ، وطلب صورة 4K

ليس من الواضح متى ستكون ControlNet متاحة للاستخدام العام ، ولكنها ستكون قابلة للاستخدام على الهواتف كما هو موضح في عرض Qualcomm هذا. هنا ، استفاد المستخدم من موجه الصور وموجه النص ، وطلب صورة 4K “واقعية” لهم

يتبع منتج Qualcomm الجديد رد فعل عنيفًا ضد نماذج الصور التي تم إنشاؤها بواسطة AI ، حيث أعرب العديد من الفنانين عن مخاوفهم بشأن حقوق النشر.

أثار هذا الأمر إلى حد كبير من قبل رسامة ديزني ، هولي مينجرت ، بعد أن اكتشفت أن عملها تم استخدامه دون موافقة لتدريب عارضة أزياء جديدة في كندا.

ومنذ ذلك الحين ، ناقش الكثيرون أخلاقيات استخدام العمل الفني لتدريب الذكاء الاصطناعي ، مع شرعية القيام بذلك أيضًا في منطقة رمادية في جميع أنحاء العالم.

لم يتضح بعد من تم استخدام صوره لتدريب ControlNet ، لكن MailOnline اتصل بشركة Qualcomm للحصول على مزيد من المعلومات.

تحويل النص إلى صورة أصبح بإمكان AI “DALL-E” الآن تخيل ما هو خارج إطار اللوحات الشهيرة

قامت شركة OpenAI ، وهي شركة مقرها سان فرانسيسكو ، بإنشاء أداة جديدة تسمى “Outpainting” لنظام AI الخاص بها لتحويل النص إلى صورة ، DALL-E.

يسمح Outpainting للنظام بتخيل ما هو خارج إطار اللوحات الشهيرة مثل Girl with The Pearl Earring و Mona Lisa و Dogs Play Poker.

كما أوضح المستخدمون ، يمكنه القيام بذلك بأي نوع من الصور ، مثل الرجل الموجود على شعار Quaker Oats وغلاف ألبوم Beatles “Abbey Road”.

يعتمد DALL-E على الشبكات العصبية الاصطناعية (ANNs) ، والتي محاكاة الطريقة التي يعمل بها الدماغ من أجل التعلم وإنشاء صورة من النص.

يتيح DALL-E بالفعل إجراء تغييرات داخل صورة تم إنشاؤها أو تحميلها – وهي إمكانية تُعرف باسم Inpainting.

إنه قادر على ملء التفاصيل تلقائيًا ، مثل الظلال ، عند إضافة كائن ، أو حتى تعديل الخلفية لتتناسب ، إذا تم نقل كائن أو إزالته.

يمكن لـ DALL-E أيضًا إنتاج صورة جديدة تمامًا من وصف نصي ، مثل “كرسي بذراعين على شكل أفوكادو” أو “عرض مقطع عرضي لجوز”.

مثال كلاسيكي آخر على عمل DALL-E هو “عمل دمى الدببة على بحث جديد للذكاء الاصطناعي تحت الماء باستخدام تقنية التسعينيات”.

اقرأ أكثر