رفع زوجان من الروائيين الأكثر مبيعًا دعوى قضائية ضد الشركة الأم لـ ChatGPT ، مدعيا أنها انتهكت قانون حقوق النشر من خلال تدريب روبوت المحادثة الخاص بها على “استيعاب” كتبهما دون إذن.
الدعوى المرفوعة أمام المحكمة الفيدرالية يوم الأربعاء ، مقدمة من المؤلفين منى عوض وبول تريمبلاي ، وكلاهما من ولاية ماساتشوستس.
يزعمون أن ChatGPT تم تدريبه جزئيًا عن طريق “استيعاب” العديد من رواياتهم – كل ذلك بدون موافقتهم.
دعوى قضائية جماعية ، الإيداع هو الأول ضد شركة سان فرانسيسكو المسؤولة عن استقطاب chatbot بشأن حقوق النشر. قامت شركة OpenAI بإصداره مرة أخرى في نوفمبر – وشهدت منذ ذلك الحين ارتفاعًا في الأرباح.
ومع ذلك ، فإن النموذج الأساسي لـ ChatGPT يتم تدريبه باستخدام البيانات المتاحة للجمهور على الإنترنت – ويقول محامو المؤلفين إن ذلك يتضمن نسخًا من العديد من كتب موكلهم ، والمحمية بموجب حقوق النشر.
الدعوى المرفوعة أمام المحكمة الفيدرالية يوم الأربعاء ، مقدمة من المؤلفين منى عوض وبول تريمبلاي ، وكلاهما من ولاية ماساتشوستس. كلاهما من الكتاب الأكثر مبيعًا مع مجموعة من الأوسمة
نقلاً عن ثلاثة عناوين على وجه التحديد ، تنص الدعوى على ما يلي: “بدلاً من أن تتم برمجتها بالطريقة التقليدية ، يتم” تدريب “(ChatGPT) عن طريق نسخ كميات هائلة من النص واستخراج المعلومات التعبيرية منه.
يتابع الكتاب: “يسمى هذا النص بمجموعة بيانات التدريب”. بمجرد أن يقوم نموذج لغوي كبير بنسخ واستيعاب النص في مجموعة بيانات التدريب الخاصة به ، فإنه يكون قادرًا على إصدار مخرجات نصية طبيعية بشكل مقنع.
في كل مرة يقوم فيها بتجميع مخرجات نصية ، يعتمد النموذج على المعلومات التي يستخرجها من مجموعة بيانات التدريب الخاصة به.
ويمضي ليوضح كيف قال تريمبلاي ، مؤلف رواية الرعب الحائزة على جوائز The Cabin at the End of the World ، وعوض ، كاتب الرعب الذي تم اختيار كتابه لعام 2019 Bunny كأفضل رواية للعام عن طريق الزمن ، إن ChatGPT يمكن أن يولد ‘ ملخصات دقيقة للغاية لكتبهم – تشير إلى ظهورها في قاعدة بياناتها.
على وجه التحديد ، قال المحامون عند الطلب ، أرسل ChatGPT ملخصات مفصلة للغاية عن The Cabin at the End of the World – التي فازت بجائزة Bram Stoker من جمعية كتاب الرعب لأفضل رواية في عام 2019 – و Awad’s Bunny و 13 طريقة للنظر إلى فتاة سمينة.
قال المحامون ، عندما طُلب منهم ذلك ، أرسل ChatGPT ملخصات مفصلة للغاية عن The Cabin at the End of the World وأرنب عوض – دليل على أنه تم تعدينهم من أجل “ تدريب ” chatbot
لم تستجب شركة OpenAI ، الشركة الأم لـ ChatGPT ، لتلك الادعاءات ، مع الحفاظ على البيانات المستخدمة لتشغيل تقنيتها الجديدة يأتي فقط من المصادر المتاحة للجمهور عبر الإنترنت
يدعي كلا المؤلفين أن هذا دليل كاف على أن روايتهما تم استخراجها من أجل “تدريب” روبوت المحادثة. ويتضمن ردودًا متعمقة على المطالبات المتعلقة بهذه الروايات كدليل.
يسعى المؤلفون الآن للحصول على تعويض ، ويزعمون أن شركة OpenAI استفادت “بشكل غير عادل” مما يقولون إنه “الكتابة المسروقة”. وأضافوا أن OpenAI لديها “سرية متزايدة” حول كيفية جمع البيانات أثناء مرحلة “تدريب” الروبوت في المقام الأول.
في غضون ذلك ، لم تستجب شركة OpenAI لتلك الادعاءات ، مع الحفاظ على البيانات المستخدمة لتشغيل تقنيتها الجديدة فقط من المصادر المتاحة للجمهور على الإنترنت.
ومع ذلك ، في الأوراق التي تم إصدارها جنبًا إلى جنب مع التكرارات المبكرة لـ ChatGPT – والتي لديها قدرة مخيفة على محاكاة الكتابة البشرية – قدمت OpenAI بعض التلميحات حول حجم مجموعة الكتب المستندة إلى الإنترنت التي تستخدمها كمواد تدريبية.
في يونيو 2018 ، كشفت شركة OpenAI أنها دربت نموذجها الأولي GPT-1 باستخدام BookCorpus ، وهي مجموعة كبيرة من الكتب الروائية المجانية كتبها مؤلفون غير منشورين وتحتوي على 11038 كتابًا.
ومع ذلك ، وصفت الدعوى مجموعة البيانات هذه بأنها “مثيرة للجدل” ، حيث زعمت أن باحثي الذكاء الاصطناعي الذين قاموا بتجميعها في عام 2015 قاموا بنسخ الكتب من موقع على شبكة الإنترنت يسمى Smashwords.com الذي يستضيف روايات غير منشورة متاحة للقراء مجانًا.
Tremblay هو مؤلف رواية الرعب الحائزة على جوائز The Cabin at the End of the World، Disappearance at Devil’s Rock، A Head Full of Ghosts. ظهرت مقالاته وقصصه القصيرة في لوس أنجلوس تايمز ونيويورك تايمز وانترتينمنت ويكلي
تم تعديل كتاب Tremplay’s Cabin at the End of the World مؤخرًا في فيلم M. Night Shyamalan ‘Knock at the Cabin’ ، الذي صدر في فبراير
كتب محامو الكتاب أن “تلك الروايات تخضع لحقوق النشر إلى حد كبير”.
وجاء في الدعوى أن انتهاكات حقوق النشر المزعومة ساءت مع التكرارات اللاحقة.
يستشهد كيف في ورقة يوليو 2020 التي قدمت GPT-3 – النموذج الأولي الثالث للروبوت – كشفت الشركة أن 15 في المائة من مجموعة بيانات التدريب جاءت من “ مجموعتين من الكتب المستندة إلى الإنترنت ” تم وصفهما باسم “ Books1 ” و “ Books2 ” فقط.
واستنتج المحامون أنه بناءً على الأرقام التي تم الكشف عنها في ورقة OpenAI حول النموذج الأولي ، فإن Books1 سيحتوي على ما يقرب من 63000 عنوان ، وسيتضمن Books2 ما يقرب من 294000 عنوان.
نظرًا لحجمها ، قال المحامون إن الكتب لا يمكن أن تأتي من كتّاب غير منشورين ، وكان لابد من استخلاصها من مكتبات الظل مثل Library Genesis (LibGen) و Z-Library – وهي مواقع أخرى يمكن فيها تأمين الكتب عبر التورنت.
تمضي الدعوى لتذكر أنه في حين أنه قد تم استخدام مجموعة متنوعة من المواد لتدريب نماذج اللغة الكبيرة ، كان يجب أن تكون الكتب “مكونًا رئيسيًا في مجموعات البيانات التدريبية” نظرًا للاستجابات التفصيلية لروبوت الدردشة فيما يتعلق بـ “الكتابة الطويلة”.
أندريس غواداموز ، قارئ في قانون الملكية الفكرية بجامعة ساسكس. قال لصحيفة The Guardian إن الدعوى الجديدة بالتأكيد تستكشف “ حدود شرعية ” الإجراءات داخل الفضاء التوليدي للذكاء الاصطناعي حيث تخضع OpenAI للتدقيق.
قالت ليليان إدواردز ، أستاذة القانون والابتكار والمجتمع بجامعة نيوكاسل ، للصحيفة إن القضية “من المحتمل أن تعتمد على ما إذا كانت المحاكم تنظر إلى استخدام مواد حقوق الطبع والنشر بهذه الطريقة على أنه” استخدام عادل “، أو مجرد نسخ غير مصرح به.
تم تعديل كتاب ترمبلاي The Cabin at the End of the World مؤخرًا في فيلم M. Night Shyamalan “Knock at the Cabin” ، الذي صدر في فبراير.
تحدثت الأسطورة مارجريت أتوود مؤخرًا عن عوض ، التي تعمل أيضًا أستاذًا للكتابة الإبداعية في كلية الآداب والعلوم بجامعة نيويورك ، بصفتها “الوريثة الأدبية الظاهرة”.
قال الكاتب البائس لرواية Oryx and Crake و The Handmaiden’s Tale في مايو: “لقد كنت معجبًا برواية منى” الأرنب “لبعض الوقت. إنه شكل من أشكال الهجاء القوطي ، وقد وضعته في مدرسة للكتابة. إنه مضحك للغاية ، نوع من الرعب وهو بعيد تمامًا عن السطور ‘
تحدثت الأسطورة مارجريت أتوود مؤخرًا عن عوض ، التي تعمل أيضًا أستاذًا للكتابة الإبداعية في كلية الآداب والعلوم بجامعة نيويورك ، بصفتها “الوريثة الأدبية الظاهرة”.
قال الكاتب البائس لرواية Oryx and Crake و The Handmaiden’s Tale في مايو: “لقد كنت معجبًا برواية منى” الأرنب “لبعض الوقت.
إنه شكل من أشكال الهجاء القوطي ، وقد وضعته في مدرسة للكتابة. إنه مضحك للغاية ، نوع من الرعب وهو بعيد تمامًا عن السطور. تعتقد ، “إنها لن تذهب إلى هناك … نعم ، هي كذلك.”
الدعوى تشق طريقها حاليًا من خلال القنوات المناسبة.
اترك ردك