Sebuah tim peneliti di Bair Laboratory of University of California, Berkeley telah mengembangkan kerangka pembelajaran penguatan yang disebut Hil-Serl yang secara signifikan meningkatkan kemampuan robot untuk mempelajari keterampilan operasional yang kompleks di dunia nyata. Secara cerdik menggabungkan demonstrasi manusia, koreksi dan algoritma pembelajaran penguatan yang efisien, memungkinkan robot untuk menguasai berbagai operasi presisi dalam waktu singkat, menerobos kemacetan robot pembelajaran yang lambat dan rawan kesalahan sebelumnya. Teknologi terobosan ini diharapkan untuk merevolusi cara robot belajar dan menerapkan, meletakkan dasar yang kuat untuk otomatisasi industri dan mempopulerkan robot dalam kehidupan sehari -hari.
Baru-baru ini, tim peneliti Sergey Levine dari Laboratorium Bair dari University of California, Berkeley mengusulkan kerangka kerja pembelajaran penguatan yang disebut Hil-Serl untuk menyelesaikan masalah robot belajar keterampilan operasional yang kompleks di dunia nyata.
Teknologi baru ini menggabungkan demonstrasi dan koreksi manusia dengan algoritma pembelajaran penguatan yang efisien, yang memungkinkan robot untuk menguasai berbagai tugas operasi yang canggih dan cekatan seperti operasi dinamis, perakitan presisi dan kolaborasi dua lengan hanya dalam satu hingga 2,5 jam.
Di masa lalu, sangat sulit untuk membiarkan robot mempelajari keterampilan baru, seperti mengajar anak nakal untuk melakukan pekerjaan rumah, yang harus diajarkan langkah demi langkah dan diperbaiki berulang -ulang. Yang lebih merepotkan adalah bahwa berbagai situasi di dunia nyata adalah kompleks dan dapat diubah.

Kerangka kerja Hil-Serl seperti meminta "tutor" untuk robot.
Anda hanya perlu berdemonstrasi beberapa kali, dan robot dapat menyelesaikan berbagai operasi dengan cara yang layak, dari bermain dengan blok bangunan, membalik pancake, hingga merakit furnitur dan memasang papan sirkuit, itu hanya mahakuasa!
Untuk membuat robot belajar lebih cepat dan lebih baik, Hil-Serl juga memperkenalkan mekanisme koreksi untuk interaksi manusia-komputer. Sederhananya, ketika robot membuat kesalahan, operator manusia dapat melakukan intervensi pada waktunya untuk memperbaikinya, dan umpan balik informasi koreksi ini ke robot. Dengan cara ini, robot dapat terus belajar dari kesalahan, menghindari membuat kesalahan berulang kali, dan akhirnya menjadi master sejati.

Setelah serangkaian percobaan, efek hil-serl luar biasa. Dalam berbagai tugas, robot telah mencapai tingkat keberhasilan hampir 100% hanya dalam 1 hingga 2,5 jam, dan kecepatan operasi hampir 2 kali lebih cepat dari sebelumnya.
Lebih penting lagi, hil-serl adalah sistem pertama yang mengimplementasikan koordinasi ganda berbasis input gambar menggunakan pembelajaran penguatan di dunia nyata, yaitu, ini memungkinkan dua lengan robot untuk bekerja bersama untuk menyelesaikan tugas yang lebih kompleks. Sabuk sinkronisasi membutuhkan operasi yang sangat terkoordinasi.
Munculnya Hil-Serl tidak hanya memungkinkan kita untuk melihat potensi besar pembelajaran robot, tetapi juga menunjukkan arah untuk aplikasi dan penelitian industri di masa depan. Mungkin di masa depan, masing -masing dari kita akan memiliki robot "magang" di rumah kita, yang akan membantu kita melakukan pekerjaan rumah, merakit furnitur, dan bahkan bermain game dengan kita.
Tentu saja, Hil-Serl juga memiliki beberapa keterbatasan. Misalnya, untuk beberapa tugas yang membutuhkan perencanaan jangka panjang, mungkin tampak luar biasa. Selain itu, saat ini HIL-Serl terutama diuji di lingkungan laboratorium dan belum diverifikasi dalam skala besar dalam skenario kehidupan nyata. Namun, saya percaya bahwa dengan kemajuan teknologi, masalah ini akan diselesaikan secara bertahap.
Alamat kertas: https://hil-serl.github.io/static/hil-serl-paper.pdf
Alamat Proyek: https://hil-serl.github.io/
Singkatnya, kerangka kerja Hil-Serl telah membawa kemajuan yang signifikan ke bidang pembelajaran robot, dan kemampuan belajar yang efisien serta mekanisme interaksi manusia-komputer telah memungkinkannya untuk menunjukkan potensi besar dalam aplikasi kehidupan nyata. Meskipun masih ada beberapa keterbatasan, prospek pembangunan masa depan layak dinanti -nantikan.