قام بيركلي ، وهو فريق بحث في مختبر باير بجامعة كاليفورنيا ، بتطوير إطار تعليمي تعزيز يسمى HIL-SERL والذي يعزز بشكل كبير من قدرة الروبوتات على تعلم المهارات التشغيلية المعقدة في العالم الحقيقي. إنه يجمع بذكاء بين المظاهرة البشرية والتصحيح والخوارزميات التعليمية الفعالة ، مما يسمح للروبوتات بإتقان عمليات دقة مختلفة في وقت قصير ، مما يخترق اختناقات الروبوتات البطيئة والمعرضة للخطأ السابقة. من المتوقع أن تحدث تقنية الاختراق هذه ثورة في الطريقة التي تتعلم بها الروبوتات وتطبيقها ، ووضع أساس قوي للأتمتة الصناعية وتعميم الروبوتات في الحياة اليومية.
في الآونة الأخيرة ، اقترح فريق Sergey Levine Research من مختبر بير بجامعة كاليفورنيا ، إطارًا للتعلم التعزيز الذي يسمى Hil-Serl لحل مشكلة تعلم المهارات التشغيلية المعقدة في العالم.
تجمع هذه التكنولوجيا الجديدة بين المظاهرة البشرية والتصحيح مع خوارزميات التعلم الفعالة في التعزيز ، مما يسمح للروبوتات بإتقان مجموعة متنوعة من مهام التشغيل المتطورة والبلدان مثل التشغيل الديناميكي ، والتجميع الدقيق ، والتعاون ثنائي الذراع في ساعة إلى 2.5 ساعة فقط.
في الماضي ، كان من الصعب للغاية ترك روبوت يتعلم مهارات جديدة ، تمامًا مثل تعليم طفل شقي للقيام بواجب منزلي ، والذي كان لا بد من تعليمه خطوة بخطوة وتصحيحه مرارًا وتكرارًا. الأمر الأكثر إثارة للقلق هو أن المواقف المختلفة في العالم الحقيقي معقدة ومتغيرة.

يشبه إطار HIL-SERL أن يطلب "مدرسًا" للروبوت.
ما عليك سوى إظهار عدة مرات ، ويمكن للروبوت إكمال العمليات المختلفة بطريقة لائقة ، من اللعب باستخدام لبنات البناء ، الفطائر التقليب ، إلى تجميع الأثاث وتثبيت لوحات الدوائر ، إنه ببساطة كلي القدرة!
من أجل جعل الروبوتات تتعلم بشكل أسرع وأفضل ، تقدم Hil-Serl أيضًا آلية تصحيح للتفاعل بين الإنسان والحاسوب. ببساطة ، عندما يرتكب الروبوت خطأ ، يمكن للمشغلين البشريين التدخل في الوقت المناسب لتصحيحه ، وتعليق معلومات التصحيح هذه على الروبوت. وبهذه الطريقة ، يمكن للروبوت أن يتعلم باستمرار من الأخطاء ، وتجنب ارتكاب الأخطاء مرارًا وتكرارًا ، وأصبح في النهاية سيدًا حقيقيًا.

بعد سلسلة من التجارب ، يكون تأثير HIL-SERL مذهلاً. في مختلف المهام ، حققت الروبوتات معدل نجاح يبلغ حوالي 100 ٪ في ساعة إلى 2.5 ساعة فقط ، وسرعة التشغيل أسرع مرتين تقريبًا من ذي قبل.
والأهم من ذلك ، Hil-Serl هو أول نظام ينفذ تنسيقًا مزدوجًا على إدخال الصور باستخدام التعلم التعزيز في العالم الحقيقي ، أي أنه يتيح أن يعمل اثنين من الأسلحة الروبوتان لإكمال مهام أكثر تعقيدًا. حزام المزامنة يتطلب عملية منسقة للغاية.
إن ظهور Hil-Serl لا يسمح لنا فقط برؤية الإمكانات الضخمة لتعلم الروبوت ، ولكن أيضًا يشير إلى اتجاه التطبيقات والبحث الصناعي المستقبلي. ربما في المستقبل ، سيكون لكل واحد منا "متدرب" روبوت في منزلنا ، والذي سيساعدنا على القيام بالأعمال المنزلية ، وتجميع الأثاث ، وحتى اللعب معنا.
بالطبع ، Hil-Serl لديه أيضًا بعض القيود. على سبيل المثال ، بالنسبة لبعض المهام التي تتطلب تخطيطًا طويل الأجل ، قد يبدو الأمر ساحقًا. بالإضافة إلى ذلك ، يتم اختبار HIL-SERL بشكل أساسي في البيئات المختبرية ولم يتم التحقق منه على نطاق واسع في سيناريوهات الحياة الواقعية. ومع ذلك ، أعتقد أنه مع تقدم التكنولوجيا ، سيتم حل هذه المشكلات تدريجياً.
عنوان الورق: https://hil-serl.github.io/static/hil-serl-paper.pdf
عنوان المشروع: https://hil-serl.github.io/
باختصار ، حقق إطار HIL-SERL تقدمًا كبيرًا في مجال تعلم الروبوت ، وقد مكنتها قدرتها على التعلم الفعال وآليات التفاعل بين الإنسان والأشكال الإلكترونية من إظهار إمكانات كبيرة في تطبيقات الحياة الواقعية. على الرغم من أنه لا تزال هناك بعض القيود ، إلا أن آفاق التطوير المستقبلية تستحق التطلع إليها.