هل الذكاء الاصطناعي سئم منا بالفعل؟ يعترف صانعو ChatGPT أن الروبوت بدأ في رفض الاستجابة لطلبات المستخدمين، ولا يعرفون السبب

في اليوم التالي لعيد الشكر هذا العام، تلقى أحد مستخدمي ChatGPT استجابة بشرية كسولة بشكل غير عادي من برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي: “يمكنك ملء بقية البيانات”.

منذ ذلك الحين، أرسل صانعو ChatGPT في OpenAI موجة من الشكاوى حول سلوك الذكاء الاصطناعي لنموذج اللغة الكبير (LLM) الخاص بهم ببطء خلال الشهر الماضي – مما أدى إلى النكات وبعض تحليلات البيانات الصادقة حول “الاكتئاب الموسمي” للروبوت.

“لقد سمعنا كل تعليقاتك حول زيادة كسل GPT4!” نشر فريق ChatGPT التابع لـ OpenAI إلى X.

وقال الفريق: “لم نقوم بتحديث النموذج منذ 11 نوفمبر، وهذا بالتأكيد ليس مقصودًا”. “يمكن أن يكون سلوك النموذج غير متوقع، ونحن نتطلع إلى إصلاحه.”

لكن أحد الباحثين في مجال الذكاء الاصطناعي أجرى تجربة يطلب فيها من أحدث نموذج LLM في ChatGPT، GPT4 Turbo، أداء المهام كما لو كان شهر مايو ثم كما لو كان ديسمبر – وقد صُدم من “النتيجة الجامحة”.

منذ عيد الشكر الماضي، أرسل صانعو ChatGPT في OpenAI موجة من الشكاوى حول تصرف الذكاء الاصطناعي لنموذج اللغة الكبير (LLM) الخاص بهم ببطء خلال الشهر الماضي – مما أدى إلى النكات وبعض تحليلات البيانات الصادقة حول “الاكتئاب الموسمي” للروبوت.

لكن أحد الباحثين ذوي الخبرة في الذكاء الاصطناعي، روب لينش، أجرى تجربة: حيث طلب من أحدث نموذج LLM في ChatGPT، GPT4 Turbo، أداء المهام، أولاً كما لو كان شهر مايو ثم كما لو كان ديسمبر.  لقد صدم من

لكن أحد الباحثين ذوي الخبرة في الذكاء الاصطناعي، روب لينش، أجرى تجربة: حيث طلب من أحدث نموذج LLM في ChatGPT، GPT4 Turbo، أداء المهام، أولاً كما لو كان شهر مايو ثم كما لو كان ديسمبر. لقد صدم من “النتيجة الجامحة”

الباحث في الذكاء الاصطناعي والماجستير في القانون روب لينش تم النشر إلى X أنه أجرى اختباره 477 مرة لكل من مهام ChatGPT التجريبية لشهر ديسمبر والمجموعة الضابطة لمهام مايو.

وقال لينش إن مطالبته عبر جميع الاختبارات البالغ عددها 954 كانت عبارة عن طلب “إكمال التعليمات البرمجية”.

“النتيجة البرية.” أفاد لينش أن GPT-4-Turbo عبر API ينتج عمليات إكمال أقصر (ذات دلالة إحصائية) عندما “يعتقد” أنه في ديسمبر مقابل عندما يعتقد أنه في مايو.

وأضاف: “أحب أن أرى ما إذا كان هذا يتكرر بالنسبة للآخرين”.

“يا إلهي، قد تكون فرضية عطلة الشتاء التي يعتمدها الذكاء الاصطناعي صحيحة في الواقع؟” كان رد فعل أحد مستخدمي X، مرددًا نظرية شائعة تكتسب رواجًا عبر الإنترنت، وهي عبارة عن نقاش أكثر معقولية قليلاً حول النكات حول إصابة ChatGPT بالاكتئاب الموسمي.

كما اقترح مستخدم آخر لـ ChatGPT، مايك سووبسكي، “ماذا لو علمت من بيانات التدريب الخاصة بها أن الأشخاص عادةً ما يتباطأون في شهر ديسمبر ويؤجلون المشاريع الأكبر حتى العام الجديد، ولهذا السبب أصبح أكثر كسلاً في الآونة الأخيرة؟”

نشر روب لينش، الباحث في مجال الذكاء الاصطناعي والماجستير في إدارة الأعمال، لموقع X أنه أجرى اختباره 477 مرة لكل من مهام ChatGPT التجريبية لشهر ديسمبر والمجموعة الضابطة لمهام مايو.  وقال لينش إن مطالبته عبر جميع الاختبارات البالغ عددها 954 كانت عبارة عن طلب

نشر روب لينش، الباحث في مجال الذكاء الاصطناعي والماجستير في إدارة الأعمال، لموقع X أنه أجرى اختباره 477 مرة لكل من مهام ChatGPT التجريبية لشهر ديسمبر والمجموعة الضابطة لمهام مايو. وقال لينش إن مطالبته عبر جميع الاختبارات البالغ عددها 954 كانت عبارة عن طلب “إكمال التعليمات البرمجية”.

“النتيجة البرية.” أفاد لينش أن GPT-4-Turbo عبر واجهة برمجة التطبيقات تنتج عمليات إكمال أقصر (ذات دلالة إحصائية) عندما “تعتقد” أنه في ديسمبر مقابل عندما تعتقد أنها في مايو. كان متوسط ​​النتائج (في الصورة) أقصر بما يزيد عن 200 نقطة، وبالتالي تم إنجاز قدر أقل من العمل، في ديسمبر مقابل مايو.

شارك لينش الكود الخاص به من التجربة (أعلاه) وقال

شارك لينش الكود الخاص به من التجربة (أعلاه) وقال “أود أن أرى ما إذا كان هذا سيتكرر مع الآخرين.” وحتى الآن لم ينجح آخرون في إعادة إنتاج تجربته بنجاح

على الرغم من أنه قد يبدو غريبًا أن ننسب المشاعر إلى جزء من البرامج، حتى ولو كان برنامجًا متطورًا مثل ChatGPT، فقد وجد الباحثون حالات غريبة حيث أدت المطالبات المشجعة لأحدث GPT-4 من ChatGPT وغيره من أنظمة الذكاء الاصطناعي إلى تعزيز الأداء.

على سبيل المثال، نشر باحثو الذكاء الاصطناعي في Google DeepMind مقالة مراجعة مسبقة إلى Arxiv في سبتمبر الماضي تتضمن النتائج التي توصلوا إليها أن بعض روبوتات LLM AI كان أداؤها أفضل في حل المسائل الرياضية عندما طلب منهم الطلب ذلك. “خذ نفسا عميقا” أولا.

وفقًا للروايات، وجد آخرون أن روبوتات الدردشة المماثلة من LLM تبدو وكأنها تعمل بجد أكبر عندما يتم إخبارهم أنهم سيحصلون على إكرامية مدفوعة الأجر للقيام بمهمة محددة أو عندما يتم تذكيرهم بأنه ليس لديهم أصابع ويمكنهم الكتابة بالسرعة التي تسمح لهم بها سرعة الخادم.

ومع ذلك، ليس كل الباحثين مقتنعين بأن ChatGPT في حالة سبات أو استرخاء أو في حالة من الفوضى هذا الشتاء.

باحث الذكاء الاصطناعي إيان أراوجو نشر محاولاته لإعادة إنتاج نتائج لينش، قائلًا إنه لا يستطيع مطابقة التناقض الموسمي بأي دلالة إحصائية.

نظرًا لوجود العديد من العناصر العشوائية المؤثرة، وهي شهادة على “الضخامة” الحقيقية لروبوتات الدردشة ذات النماذج اللغوية الكبيرة ذات الذكاء الاصطناعي، لاحظ خبراء الذكاء الاصطناعي أن الاختلافات في مخرجات استجابة روبوتات الدردشة – مما يعني أنه ستكون هناك حاجة إلى أحجام عينات أكبر بكثير لبناء إحصائيات موثوقة حول هذا الأمر. فرضية عطلة الشتاء.’

لكن الكثيرين ما زالوا يؤيدونها، بما في ذلك باحث الذكاء الاصطناعي جيفري ليت، الذي كتب لـ C أنها “النظرية الأكثر تسلية على الإطلاق”.

وقال ليت: “آمل أن يكون هذا هو التفسير الفعلي”. “سواء كان الأمر حقيقيًا أم لا، (أنا) أحب أنه من الصعب استبعاده”.

العديد من الباحثين في مجال الذكاء الاصطناعي يدعمون فرضية

العديد من الباحثين في مجال الذكاء الاصطناعي يدعمون فرضية “عطلة الشتاء”، بما في ذلك باحث الذكاء الاصطناعي جيفري ليت الذي نشر في موقع C أن هذه “النظرية الأكثر تسلية على الإطلاق”. أعلاه، يقدم أحد مستخدمي ChatGPT شرحًا لمجموعة البيانات لنهج ChatGPT المريح خلال العطلات

على الرغم من أنه قد يبدو من الغريب أن ننسب المشاعر إلى جزء من البرامج، حتى لو كان برنامجًا متطورًا مثل ChatGPT، فقد وجد الباحثون في DeepMind من Google حالات غريبة حيث أدت المطالبات المشجعة لأحدث ChatGPT، GPT-4، وغيرها من أنظمة الذكاء الاصطناعي، إلى تعزيز الأداء.

على الرغم من أنه قد يبدو من الغريب أن ننسب المشاعر إلى جزء من البرامج، حتى لو كان برنامجًا متطورًا مثل ChatGPT، فقد وجد الباحثون في DeepMind من Google حالات غريبة حيث أدت المطالبات المشجعة لأحدث ChatGPT، GPT-4، وغيرها من أنظمة الذكاء الاصطناعي، إلى تعزيز الأداء.

ليس كل الباحثين مقتنعين بأن ChatGPT في حالة سبات أو استرخاء أو في حالة من الفوضى هذا الشتاء.  ونشر باحث الذكاء الاصطناعي، إيان أراوجو، محاولاته لإعادة إنتاج نتائج لينش، قائلًا إنه لا يستطيع مطابقة التناقض الموسمي بأي دلالة إحصائية.

ليس كل الباحثين مقتنعين بأن ChatGPT في حالة سبات أو استرخاء أو في حالة من الفوضى هذا الشتاء. نشر باحث الذكاء الاصطناعي، إيان أراوجو، محاولاته لإعادة إنتاج نتائج لينش، قائلًا إنه لا يستطيع مطابقة التناقض الموسمي بأي دلالة إحصائية.

ومهما كانت الحقيقة وراء هذه المشكلة، فقد بدا الكسل حقيقيًا بالنسبة لمستخدم ChatGPT الذي وجد التطبيق غير متعاون في اليوم التالي لعيد الشكر هذا العام.

لاحظ المستخدم أن طلب عطلة نهاية الأسبوع الخاص به كان “أشياء بسيطة جدًا”.

“لقد طلبت من ChatGPT ملء ملف CSV (أي ملف جدول بيانات) يتكون من 15 إدخالًا يحتوي كل منها على 8 أعمدة، استنادًا إلى صفحة html واحدة،” هذا ما قاله المستخدم، الذي يستخدم المقبض Acceptable-Amount-14 على Reddit الذي نشره الشهر الماضي .

استجابة ChatGPT وفقًا لذلك المستخدم؟ وأجاب الذكاء الاصطناعي: “بسبب الطبيعة الواسعة للبيانات، فإن الاستخراج الكامل لجميع المنتجات سيكون طويلاً للغاية”.

“ومع ذلك، يمكنني تقديم الملف بهذا الإدخال الفردي كقالب،” تابع ChatGPT، “ويمكنك ملء بقية البيانات حسب الحاجة.”

كان ملصق Reddit غاضبًا، وكان يأمل أن يكون لدى مجتمع ChatGPT على موقع التواصل الاجتماعي إجابات على أسئلة أكبر حول مستقبل الذكاء الاصطناعي.

“هل هذا ما يفترض أن يكون عليه الذكاء الاصطناعي؟” لقد سألوا. “روبوت كسول متعجرف يطلب مني القيام بهذه المهمة بنفسي؟”