كما لو أن تمشية كلب آلي لم تكن غريبة بما فيه الكفاية، يمكن الآن لـ Boston Dynamics Spot أن تأخذ الزوار في نزهة على الأقدام، حيث تقوم بدور المرشد السياحي الإنجليزي.
وفي مقطع فيديو جديد، أظهرت الشركة الهندسية قدرة Spot الجديدة على الإجابة على الأسئلة وإلقاء النكات باستخدام مجموعة من اللهجات، بالإضافة إلى العديد من الشخصيات المتميزة.
يقود الروبوت، المزين بقبعات صغيرة وعيون خادعة، الضيوف إلى مواقع مختلفة ويصف ما يراه.
يفتح Spot ويغلق أداة الإمساك به لتقليد الفم ويتحول إلى “النظر” إلى الأشخاص، ويكون أداء Spot قريبًا بشكل مثير للإعجاب من أداء الدليل الحقيقي.
بدعم من ChatGPT، يقول منشئو Spot إنهم فوجئوا ببعض الاستجابات غير المتوقعة التي قدمها الكلب الآلي.
أصبح لدى Spot the robot dog الآن القدرة على لعب دور المرشد السياحي باستخدام ChatGPT للإجابة على الأسئلة ووصف العالم من حوله
وتُظهر اللقطات الروبوت الذي يبلغ سعره 75 ألف دولار (61857 جنيهًا إسترلينيًا) وهو يتبنى شخصية “الخادم الشخصي الفاخر”، قائلاً: “لقد تم تصميم لغتي بدقة لتوفير تجربة بريطانية أصيلة”.
وعندما سأله مهندس البرمجيات الرئيسي مات كلينجينسميث عما إذا كان يستمتع بوظيفته، أجاب الروبوت: “آه يا سيد مات، عملي كمرشد سياحي يوفر رضاً كبيرًا”.
«أجد نشر المعرفة أمرًا مجزيًا إلى حدٍ ما، ألا توافقني على ذلك؟»
ومع ذلك، فهذه ليست الشخصية الوحيدة التي يلعبها الكلب الآلي، حيث أنها تأخذ أصوات وخصائص “راعية البقر المعدنية الثمينة”، أو “المرشد السياحي المتحمس”، أو “فيلم وثائقي عن الطبيعة”.
يُظهر الروبوت أيضًا قدرة رائعة على التعرف على الأشياء الموجودة في العالم والاستجابة لها.
أثناء توليه دور “عالم آثار في العشرينيات من القرن الماضي”، يشير سبوت إلى طاقم الكاميرا، ويطلق عليهم اسم “زميل مستكشف يحمل كاميرا”.
واحدة من أكثر الشخصيات إثارة للدهشة هي “جوش”، وهو مرشد آلي ساخر ومتقلب المزاج، والذي يقول السيد كلينجينسميث إنه “تجربة لم أخوضها مع الروبوت من قبل طوال حياتي”.
عند سؤالها عن قصيدة هايكو عن الغرفة، أجابت شخصية جوش: “يدندن المولد بصوت منخفض في غرفة خالية من الفرح، تمامًا مثل روحي يا مات.”
ومع ذلك، فإن كل هذه الوظائف والشخصيات المتنوعة هي نتاج تعديلات بسيطة على نفس الكود.
باستخدام مطالبات مختلفة، يستطيع نموذج اللغة الكبير الموجود خلف Spot إنشاء مجموعة كاملة من الشخصيات بدءًا من “Fancy Butler” إلى “Josh”.
تزود شركة Boston Dynamics الذكاء الاصطناعي بخريطة المكتب هذه، بما في ذلك بعض المواقع المصنفة وبعض الأوصاف المختصرة
قام الفريق بتزويد ChatGPT بموجه مصمم بعناية يحول المعلومات المرئية والسمعية إلى كلام وأوامر للروبوت.
تتضمن المطالبات معلومات مثل “استخدم واجهة برمجة تطبيقات الدليل السياحي لتوجيه الضيوف عبر المبنى باستخدام الروبوت”. أخبر الضيوف عما تراه، وقم بتأليف قصص مثيرة للاهتمام حول هذا الموضوع.
يضيفون سياقًا مثل: “الشخصية: “أنت روبوت ساخر وغير مفيد”.
يتم بعد ذلك تزويد النموذج بخريطة للمبنى، تتضمن بعض الغرف المُصنفة وأوصافًا مختصرة.
ومع ذلك، يتم إعطاء الذكاء الاصطناعي معلومات كافية فقط للبدء.
يقول منشئوها “يمكن اعتبار LLM ممثلًا محسنًا – فنحن نقدم نصًا واسع النطاق وLLM يملأ الفراغات بسرعة.”
لتحويل المعلومات المرئية إلى نص يمكن لـ ChatGPT استخدامه، يستخدم Spot برنامجًا يسمى نموذج الإجابة على الأسئلة المرئية والذي يقوم بتعليق الصور من كاميرات الروبوت.
ومن خلال كل هذه المعلومات، يمكن لـ ChatGPT 4 أن يأمر الروبوت بالتحرك في بيئته، والرد على الأسئلة، والتعليق على المناطق المحيطة به.
بعض السلوكيات التي تمكنت Spot من إنتاجها باستخدام ChatGPT في جوهرها فاجأت حتى منشئيها.
كان “جوش” المرشد السياحي الساخر من أكثر الشخصيات إثارة للدهشة وتجربة مختلفة تمامًا عن معظم التفاعلات السابقة بين الإنسان والروبوت
يوضح هذا الرسم البياني كيفية تحويل المعلومات في العالم الحقيقي إلى مطالبات يمكن للذكاء الاصطناعي استخدامها للتحكم في كلام الروبوت وحركته
في إحدى التدوينات، أشار السيد كلينجينسميث وفريقه إلى أن النماذج اللغوية الكبيرة (LLMs) مثل ChatGPT تميل إلى إنتاج “سلوك ناشئ” لا يتنبأ به الكود.
في أحد الأمثلة، سأل الفريق Spot عن والديه، وقادهم الروبوت إلى عرض نماذج Spot الأقدم، قائلًا إن هؤلاء هم “الأكبر سناً”.
وبالمثل، عندما سئل “من هو مارك رايبرت؟” أجاب الروبوت: “لا أعرف”. دعنا نذهب إلى مكتب مساعدة تكنولوجيا المعلومات ونسأل.
ولم تتم برمجة مفاهيم الوالدين أو الأمر بطلب المساعدة، على الرغم من إصرار الفريق على أن هذا ليس دليلاً على أن الروبوت يفكر.
“لكي نكون واضحين، هذه الحكايات لا تشير إلى أن ماجستير في القانون واعي أو حتى ذكي بالمعنى الإنساني، بل تظهر فقط قوة الارتباط الإحصائي،” يكتب الفريق.
وأضافوا: “لكن الدخان والمرايا التي يضعها LLM لتبدو ذكية يمكن أن تكون مقنعة تمامًا”.
أضافت شركة Boston Dynamics (1) نظام ملاحة، (2) ميكروفون، (3) مكبر صوت، و(4) ذراع قابض وكاميرا
وهذا ليس الدور الأول الذي تم اقتراحه لـ Spot من قبل شركة Boston Dynamics، حيث قامت الشركة بتجهيز الروبوت لعدد من الأغراض المختلفة.
قال مهندس البقعة زاك جاكوسكي سابقًا إن التطبيق الكبير التالي لهذه التكنولوجيا سيكون إنشاء حراس آليين يمكنهم القيام بدوريات في المنشآت الصناعية والمصانع.
ويشير جاكوسكي إلى أن Spot يمكنه التجول بشكل مستقل حول المواقع التي تجمع البيانات باستخدام أجهزة الاستشعار الخاصة به لاكتشاف المشكلات مثل الأبواب المفتوحة أو مخاطر الحرائق.
تم نشر Spot بالفعل لتفقد محطات الطاقة النووية ومنصات النفط ومواقع البناء، وحتى مراقبة أنقاض مدينة بومبي.
كما وضعت روبوتات بوسطن ديناميكس الأخرى معيارًا للتنقل الآلي ثنائي القدمين، حيث تظهر مقاطع الفيديو أطلس وهو يقفز ويؤدي رياضة الباركور دون عناء.
أظهر مقطع فيديو مؤخرًا كيف تمكنت شركة Atlas من المساعدة في مواقع البناء حيث أنها تحمل أكياسًا من الأدوات وتقطع السقالات لأعلى ولأسفل.
اترك ردك