Universitas Tokyo berkolaborasi dengan Alternative Machine Company untuk mengembangkan sistem robot humanoid yang disebut Alter3 yang dapat secara langsung memetakan perintah bahasa alami ke tindakan robot. Hal ini menandai kemajuan signifikan dalam penelitian berdasarkan kombinasi model dasar dan sistem robot. Model latar belakang Alter3 menggunakan teknologi GPT-4, yang memungkinkannya menyelesaikan serangkaian tugas kompleks, mulai dari selfie sederhana hingga perilaku kompleks seperti simulasi hantu, yang menunjukkan potensi penerapan yang besar. Meski masih dalam tahap penelitian, teknologi ini menunjukkan jalan bagi pengembangan robotika di masa depan.
Para peneliti dari Universitas Tokyo di Jepang telah membuat terobosan baru dalam penelitian kolaboratif mereka dengan Alternative Machine Company, mengembangkan sistem robot humanoid Alter3 yang dapat secara langsung memetakan perintah bahasa alami ke tindakan robot. Model latar belakangnya menggunakan teknologi GPT-4 dan dapat menyelesaikan serangkaian tugas kompleks, seperti mengambil foto selfie atau bermain hantu.

Ini adalah salah satu hasil penelitian yang semakin banyak berdasarkan kombinasi model dasar dan sistem robot. Meskipun sistem ini belum mencapai solusi komersial yang terukur, mereka memiliki penelitian robotika tingkat lanjut dalam beberapa tahun terakhir dan telah menunjukkan potensi besar.
Alter3 menggunakan teknologi GPT-4 sebagai model latar belakang untuk menerima instruksi bahasa alami yang menggambarkan tindakan atau situasi di mana robot perlu merespons. Pertama, model tersebut menggunakan "kerangka agen" untuk merencanakan urutan langkah tindakan yang perlu diambil robot untuk menyelesaikan tujuannya. Kedua, dengan mengkodekan agen, hasilkan perintah yang dibutuhkan robot untuk melakukan setiap langkah. Karena GPT-4 tidak dilatih menggunakan perintah pemrograman Alter3, para peneliti menggunakan kemampuan pembelajaran kontekstualnya untuk menyesuaikan perilakunya dengan API robot.

Oleh karena itu, prompt berisi daftar perintah dan serangkaian contoh yang menunjukkan cara menggunakan setiap perintah. Model kemudian memetakan setiap langkah ke satu atau lebih perintah API untuk dikirim ke robot untuk dieksekusi.
Para peneliti menambahkan fungsionalitas sehingga manusia dapat memberikan umpan balik, seperti "angkat tangan sedikit lebih tinggi". Instruksi ini dikirim ke agen GPT-4 lain, yang memberi alasan pada kode, melakukan koreksi yang diperlukan, dan mengembalikan urutan tindakan ke robot. Resep dan kode tindakan yang ditingkatkan disimpan dalam database untuk digunakan di masa mendatang.

Para peneliti melakukan beberapa tes pada Alter3, termasuk tindakan sehari-hari, seperti mengambil selfie dan minum teh, serta tindakan yang ditiru, seperti berpura-pura menjadi hantu atau ular. Mereka juga menguji kemampuan model untuk mengatasi situasi yang memerlukan tindakan yang direncanakan dengan cermat. Pemahaman luas GPT-4 tentang perilaku dan gerak manusia memungkinkan terciptanya rencana perilaku yang lebih realistis untuk robot humanoid seperti Alter3. Eksperimen para peneliti juga menunjukkan bahwa mereka mampu meniru emosi seperti rasa malu dan gembira pada robot.
Menyorot:
- Alter3 adalah robot humanoid terbaru yang menggunakan teknologi GPT-4 untuk penalarannya, mampu memetakan instruksi bahasa alami langsung ke tindakan robot.
- Para peneliti memanfaatkan kemampuan pembelajaran kontekstual teknologi GPT-4 untuk menyesuaikan perilakunya dengan API robot, sehingga robot dapat melakukan serangkaian langkah tindakan yang diinginkan.
- Menambahkan umpan balik dan memori manusia dapat meningkatkan kinerja Alter3, dan eksperimen para peneliti juga menunjukkan bahwa mereka mampu meniru emosi seperti rasa malu dan gembira pada robot.
Keberhasilan Alter3 membuktikan potensi besar GPT-4 di bidang pengendalian robot, membuka jalan bagi sistem robot yang lebih cerdas dan fleksibel di masa depan. Terobosan dalam penelitian ini menandai sebuah revolusi baru dalam interaksi manusia-komputer.