มหาวิทยาลัยโตเกียวร่วมมือกับ Alternative Machine Company เพื่อพัฒนาระบบหุ่นยนต์ฮิวแมนนอยด์ที่เรียกว่า Alter3 ซึ่งสามารถจับคู่คำสั่งภาษาธรรมชาติกับการกระทำของหุ่นยนต์ได้โดยตรง สิ่งนี้ถือเป็นความก้าวหน้าที่สำคัญในการวิจัยโดยอาศัยการผสมผสานระหว่างแบบจำลองพื้นฐานและระบบหุ่นยนต์ โมเดลพื้นหลังของ Alter3 ใช้เทคโนโลยี GPT-4 ซึ่งช่วยให้สามารถทำงานที่ซับซ้อนต่างๆ ได้สำเร็จ ตั้งแต่การเซลฟี่ง่ายๆ ไปจนถึงพฤติกรรมที่ซับซ้อน เช่น การจำลองผี ซึ่งแสดงศักยภาพการใช้งานที่ยอดเยี่ยม แม้ว่าจะยังอยู่ในขั้นตอนการวิจัย แต่เทคโนโลยีนี้ก็ชี้ให้เห็นถึงหนทางในการพัฒนาหุ่นยนต์ในอนาคต
นักวิจัยจากมหาวิทยาลัยโตเกียวในญี่ปุ่นได้สร้างความก้าวหน้าครั้งใหม่ในการวิจัยร่วมกับ Alternative Machine Company โดยพัฒนาระบบหุ่นยนต์ฮิวแมนนอยด์ Alter3 ที่สามารถจับคู่คำสั่งภาษาธรรมชาติกับการกระทำของหุ่นยนต์ได้โดยตรง โมเดลพื้นหลังใช้เทคโนโลยี GPT-4 และสามารถทำงานที่ซับซ้อนหลายอย่าง เช่น ถ่ายเซลฟี่หรือเล่นผี

นี่เป็นหนึ่งในผลการวิจัยที่มีจำนวนเพิ่มมากขึ้นโดยพิจารณาจากการผสมผสานระหว่างแบบจำลองพื้นฐานและระบบหุ่นยนต์ แม้ว่าระบบเหล่านี้จะยังไม่เข้าถึงโซลูชันเชิงพาณิชย์ที่สามารถปรับขนาดได้ แต่ก็มีการวิจัยด้านวิทยาการหุ่นยนต์ขั้นสูงในช่วงไม่กี่ปีที่ผ่านมา และได้แสดงให้เห็นศักยภาพที่ยอดเยี่ยม
Alter3 ใช้เทคโนโลยี GPT-4 เป็นโมเดลพื้นหลังเพื่อรับคำสั่งภาษาธรรมชาติที่อธิบายการกระทำหรือสถานการณ์ที่หุ่นยนต์ต้องการตอบสนอง ขั้นแรก โมเดลใช้ "กรอบงานตัวแทน" เพื่อวางแผนลำดับขั้นตอนการดำเนินการที่หุ่นยนต์จำเป็นต้องดำเนินการเพื่อให้บรรลุเป้าหมาย ประการที่สอง โดยการเข้ารหัสตัวแทน สร้างคำสั่งที่หุ่นยนต์จำเป็นต้องดำเนินการแต่ละขั้นตอน เนื่องจาก GPT-4 ไม่ได้รับการฝึกอบรมเกี่ยวกับคำสั่งการเขียนโปรแกรม Alter3 นักวิจัยจึงใช้ความสามารถในการเรียนรู้ตามบริบทเพื่อปรับพฤติกรรมให้เข้ากับ API ของหุ่นยนต์

ดังนั้น prompt จึงประกอบด้วยรายการคำสั่งและชุดตัวอย่างที่แสดงวิธีใช้แต่ละคำสั่ง จากนั้นโมเดลจะแมปแต่ละขั้นตอนกับคำสั่ง API หนึ่งคำสั่งขึ้นไปเพื่อส่งไปยังหุ่นยนต์เพื่อดำเนินการ
นักวิจัยได้เพิ่มฟังก์ชันการทำงานเพื่อให้มนุษย์สามารถให้ข้อเสนอแนะได้ เช่น "ยกแขนขึ้นอีกนิด" คำแนะนำเหล่านี้จะถูกส่งไปยังตัวแทน GPT-4 อื่น ซึ่งให้เหตุผลกับโค้ด ทำการแก้ไขที่จำเป็น และส่งคืนลำดับของการกระทำให้กับหุ่นยนต์ สูตรการดำเนินการและรหัสที่ได้รับการปรับปรุงจะถูกจัดเก็บไว้ในฐานข้อมูลเพื่อใช้ในอนาคต

นักวิจัยได้ทำการทดสอบ Alter3 หลายครั้ง รวมถึงการกระทำในชีวิตประจำวัน เช่น การถ่ายเซลฟี่และการดื่มชา ตลอดจนการกระทำเลียนแบบ เช่น การแกล้งเป็นผีหรืองู พวกเขายังได้ทดสอบความสามารถของโมเดลในการรับมือกับสถานการณ์ที่จำเป็นต้องมีการวางแผนอย่างรอบคอบ ความเข้าใจอย่างกว้างขวางเกี่ยวกับพฤติกรรมและการเคลื่อนไหวของมนุษย์ของ GPT-4 ช่วยให้สามารถสร้างแผนพฤติกรรมที่สมจริงยิ่งขึ้นสำหรับหุ่นยนต์ฮิวแมนนอยด์ เช่น Alter3 การทดลองของนักวิจัยยังแสดงให้เห็นว่าพวกเขาสามารถเลียนแบบอารมณ์ เช่น ความอับอายและความสุขในหุ่นยนต์ได้
ไฮไลท์:
- Alter3 เป็นหุ่นยนต์ฮิวแมนนอยด์รุ่นล่าสุดที่ใช้เทคโนโลยี GPT-4 เพื่อการให้เหตุผล สามารถทำแผนที่คำสั่งภาษาธรรมชาติเข้ากับการกระทำของหุ่นยนต์ได้โดยตรง
- นักวิจัยใช้ประโยชน์จากความสามารถในการเรียนรู้ตามบริบทของเทคโนโลยี GPT-4 เพื่อปรับพฤติกรรมให้เข้ากับ API ของหุ่นยนต์ ทำให้หุ่นยนต์สามารถดำเนินการตามขั้นตอนที่ต้องการได้
- การเพิ่มความคิดเห็นและความทรงจำของมนุษย์สามารถปรับปรุงประสิทธิภาพของ Alter3 ได้ และการทดลองของนักวิจัยยังแสดงให้เห็นว่าพวกเขาสามารถเลียนแบบอารมณ์ เช่น ความละอายและความสุขในหุ่นยนต์ได้
ความสำเร็จของ Alter3 พิสูจน์ให้เห็นถึงศักยภาพที่ยอดเยี่ยมของ GPT-4 ในด้านการควบคุมหุ่นยนต์ ซึ่งปูทางไปสู่ระบบหุ่นยนต์ที่ชาญฉลาดและยืดหยุ่นมากขึ้นในอนาคต ความก้าวหน้าในการวิจัยครั้งนี้ถือเป็นการปฏิวัติครั้งใหม่ในการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์