ทีมวิจัยที่ห้องปฏิบัติการ Bair แห่งมหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์ได้พัฒนากรอบการเรียนรู้การเสริมแรงที่เรียกว่า Hil-Serl ซึ่งช่วยเพิ่มความสามารถของหุ่นยนต์ในการเรียนรู้ทักษะการปฏิบัติงานที่ซับซ้อนในโลกแห่งความเป็นจริง มันผสมผสานการสาธิตของมนุษย์การแก้ไขและอัลกอริธึมการเรียนรู้การเสริมแรงอย่างมีประสิทธิภาพทำให้หุ่นยนต์สามารถควบคุมการดำเนินงานที่แม่นยำต่าง ๆ ในเวลาอันสั้นทำลายคอขวดของการเรียนรู้ช้าและหุ่นยนต์ผิดพลาด เทคโนโลยีการพัฒนานี้คาดว่าจะปฏิวัติวิธีที่หุ่นยนต์เรียนรู้และนำไปใช้วางรากฐานที่แข็งแกร่งสำหรับระบบอัตโนมัติอุตสาหกรรมและความนิยมของหุ่นยนต์ในชีวิตประจำวัน
เมื่อเร็ว ๆ นี้ทีมวิจัย Sergey Levine จากห้องปฏิบัติการ Bair แห่งมหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์เสนอกรอบการเรียนรู้การเสริมแรงที่เรียกว่า Hil-Serl เพื่อแก้ปัญหาของหุ่นยนต์เรียนรู้ทักษะการปฏิบัติงานที่ซับซ้อนในโลกแห่งความเป็นจริง
เทคโนโลยีใหม่นี้ผสมผสานการสาธิตและการแก้ไขของมนุษย์เข้ากับอัลกอริธึมการเรียนรู้การเสริมแรงที่มีประสิทธิภาพช่วยให้หุ่นยนต์สามารถควบคุมงานที่มีความซับซ้อนและคล่องแคล่วได้หลากหลายเช่นการทำงานแบบไดนามิกการประกอบความแม่นยำและการทำงานร่วมกันสองแขนในเวลาเพียงหนึ่งถึง 2.5 ชั่วโมง
ในอดีตมันยากมากที่จะให้หุ่นยนต์เรียนรู้ทักษะใหม่เช่นการสอนเด็กซนเพื่อทำการบ้านซึ่งต้องสอนทีละขั้นตอนและแก้ไขซ้ำแล้วซ้ำอีก สิ่งที่ลำบากยิ่งกว่านั้นคือสถานการณ์ต่าง ๆ ในโลกแห่งความเป็นจริงนั้นซับซ้อนและเปลี่ยนแปลงได้

เฟรมเวิร์ก Hil-Serl เป็นเหมือนการถาม "ครูสอนพิเศษ" สำหรับหุ่นยนต์
คุณต้องแสดงให้เห็นเพียงไม่กี่ครั้งและหุ่นยนต์สามารถดำเนินการต่างๆให้เสร็จสมบูรณ์ในลักษณะที่เหมาะสมตั้งแต่การเล่นกับการสร้างบล็อกการพลิกแพนเค้กการประกอบเฟอร์นิเจอร์และติดตั้งแผงวงจรมันเป็นเพียงการมีอำนาจทุกอย่าง!
เพื่อให้หุ่นยนต์เรียนรู้ได้เร็วขึ้นและดีขึ้น Hil-Serl ยังแนะนำกลไกการแก้ไขสำหรับการมีปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ พูดง่ายๆเมื่อหุ่นยนต์ทำผิดพลาดผู้ประกอบการมนุษย์สามารถแทรกแซงได้ทันเวลาเพื่อแก้ไขและตอบกลับข้อมูลการแก้ไขเหล่านี้กับหุ่นยนต์ ด้วยวิธีนี้หุ่นยนต์สามารถเรียนรู้จากความผิดพลาดอย่างต่อเนื่องหลีกเลี่ยงการทำผิดพลาดซ้ำ ๆ และในที่สุดก็กลายเป็นอาจารย์ที่แท้จริง

หลังจากการทดลองหลายชุดเอฟเฟกต์ของ Hil-Serl นั้นยอดเยี่ยมมาก ในงานต่าง ๆ หุ่นยนต์ได้รับอัตราความสำเร็จเกือบ 100% ในเวลาเพียง 1 ถึง 2.5 ชั่วโมงและความเร็วในการดำเนินงานจะเร็วขึ้นเกือบ 2 เท่ากว่าเดิม
ที่สำคัญกว่านั้น Hil-Serl เป็นระบบแรกที่ใช้การประสานงานแบบคู่ที่ใช้ภาพโดยใช้การเรียนรู้การเสริมแรงในโลกแห่งความเป็นจริงนั่นคือมันช่วยให้แขนหุ่นยนต์สองตัวทำงานร่วมกันเพื่อทำงานที่ซับซ้อนมากขึ้น เข็มขัดการซิงโครไนซ์ต้องใช้การประสานงานสูง
การเกิดขึ้นของ Hil-Serl ไม่เพียง แต่ช่วยให้เราเห็นศักยภาพอันยิ่งใหญ่ของการเรียนรู้หุ่นยนต์ แต่ยังชี้ให้เห็นทิศทางสำหรับการใช้งานอุตสาหกรรมและการวิจัยในอนาคต บางทีในอนาคตเราแต่ละคนจะมีหุ่นยนต์ "เด็กฝึกงาน" ในบ้านของเราซึ่งจะช่วยให้เราทำงานบ้านประกอบเฟอร์นิเจอร์และแม้แต่เล่นเกมกับเรา
แน่นอนว่า Hil-Serl ยังมีข้อ จำกัด บางประการ ตัวอย่างเช่นสำหรับงานบางอย่างที่ต้องมีการวางแผนระยะยาวมันอาจดูล้นหลาม นอกจากนี้ปัจจุบัน HIL-SERL ได้รับการทดสอบส่วนใหญ่ในสภาพแวดล้อมของห้องปฏิบัติการและยังไม่ได้รับการตรวจสอบในสถานการณ์จริงในสถานการณ์จริง อย่างไรก็ตามฉันเชื่อว่าด้วยความก้าวหน้าของเทคโนโลยีปัญหาเหล่านี้จะค่อยๆแก้ไข
ที่อยู่กระดาษ: https://hil-serl.github.io/static/hil-serl-paper.pdf
ที่อยู่โครงการ: https://hil-serl.github.io/
โดยสรุปกรอบ HIL-SERL ได้นำความก้าวหน้าที่สำคัญมาสู่สาขาการเรียนรู้ของหุ่นยนต์และความสามารถในการเรียนรู้ที่มีประสิทธิภาพและกลไกการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ทำให้สามารถแสดงศักยภาพที่ยอดเยี่ยมในการใช้งานในชีวิตจริง แม้ว่าจะยังมีข้อ จำกัด บางประการ แต่โอกาสในการพัฒนาในอนาคตก็คุ้มค่าที่จะรอคอย