جوجل تقدم نموذجًا جديدًا للذكاء الاصطناعي يعلم الروبوتات التخلص من القمامة

لسنوات عديدة ، كان الناس يحلمون بمستقبل تلعب فيه الروبوتات دورًا مهمًا في مساعدة البشر في مختلف المهام. الآن ، هذا المستقبل أقرب من أي وقت مضى.

قدمت Google Google Robotics Transformer 2 ، أو RT-2 ، وهو نموذج ذكاء اصطناعي رائد مصمم لتدريب الروبوتات على أداء إجراءات واقعية مثل التخلص من القمامة ، مما يمثل قفزة كبيرة إلى الأمام في تطوير روبوتات مفيدة وقابلة للتكيف.

على عكس روبوتات الدردشة التي أصبحت مألوفة ، تتطلب الروبوتات فهمًا أعمق للعالم الحقيقي والقدرة على التعامل مع المواقف المعقدة وغير المألوفة.

قالت Google إن تعليم الروبوتات لأداء المهام العامة كان عملية تستغرق وقتًا طويلاً ومكلفة ، وتتضمن تدريبًا مكثفًا على كميات هائلة من نقاط البيانات عبر كائنات وبيئات وسيناريوهات لا حصر لها.

مع إطلاق RT-2 ، وجدت Google طريقة جديدة لمواجهة هذه التحديات. إنه نموذج رؤية – لغة – عمل (VLA) ، يعتمد على بنية Transformer ، والذي يمكنه فهم ومعالجة النصوص والصور من الويب.

مثلما تتعلم نماذج اللغة من بيانات الويب لفهم المفاهيم ، تنقل RT-2 هذه المعرفة إلى الروبوتات المباشرة حول كيفية تنفيذ إجراءات محددة.

تكمن القوة الرئيسية لـ RT-2 في قدرتها على “التحدث” مع الروبوت. إنه يمكّن الروبوتات من التفكير واتخاذ القرارات بناءً على بيانات التدريب الخاصة بهم ، مما يسمح لهم بالتعرف على الأشياء في السياق وفهم كيفية التفاعل معها.

على سبيل المثال ، يمكن لـ RT-2 تحديد القمامة والتقاطها دون تدريب مكثف لهذه المهمة المحددة ، لأنها تفهم الطبيعة المجردة للقمامة ، مدركًا أن ما كان يومًا كيسًا من رقائق البطاطس أو قشر الموز يصبح نفايات بعد الاستخدام.

كانت الأنظمة الروبوتية السابقة تتطلب حزمًا معقدة من الأنظمة ، حيث يتعين على التفكير عالي المستوى والمعالجة منخفضة المستوى التواصل للتحكم في تصرفات الروبوت. يقضي RT-2 على هذا التعقيد من خلال دمج المهام في نموذج واحد.

نتيجة لذلك ، يمكن للنموذج إجراء تفكير معقد وإخراج إجراءات الروبوت مباشرة ، مما يبسط عملية صنع القرار في الروبوت.

بعد اختبار RT-2 في أكثر من 6000 تجربة روبوتية ، وجد فريق Google نتائج رائعة في المهام التي تم تدريب النموذج عليها (المعروفة باسم مهام “المراقبة”).

ومع ذلك ، فقد تحسن أداءها في السيناريوهات الجديدة غير المرئية بشكل كبير ، حيث تضاعف تقريبًا إلى 62 بالمائة مقارنة بـ RT-1 بنسبة 32 بالمائة.

يمكن للروبوتات المجهزة بـ RT-2 التكيف بسرعة مع المواقف والبيئات الجديدة ، تمامًا مثل كيفية تعلم البشر من خلال نقل المفاهيم إلى سيناريوهات جديدة.

بينما لا يزال هناك عمل يتعين القيام به لتمكين الروبوتات بشكل كامل في البيئات التي تركز على الإنسان ، يقدم RT-2 لمحة واعدة عما ينتظرنا في المستقبل في مجال الروبوتات.