도쿄 대학은 Alternative Machine Company와 협력하여 자연어 명령을 로봇의 동작에 직접 매핑할 수 있는 Alter3이라는 휴머노이드 로봇 시스템을 개발했습니다. 이는 기본 모델과 로봇 시스템의 결합을 기반으로 한 연구에서 상당한 진전을 의미합니다. Alter3의 배경 모델은 GPT-4 기술을 사용하여 간단한 셀카부터 유령 시뮬레이션과 같은 복잡한 동작까지 일련의 복잡한 작업을 완료할 수 있어 뛰어난 응용 가능성을 보여줍니다. 아직 연구 단계에 있지만 이 기술은 로봇공학의 미래 발전 방향을 제시합니다.
일본 도쿄대학교 연구진이 Alternative Machine Company와의 공동 연구에서 자연어 명령을 로봇 동작에 직접 매핑할 수 있는 휴머노이드 로봇 시스템 Alter3를 개발하는 새로운 돌파구를 마련했습니다. 배경 모델은 GPT-4 기술을 사용하며 셀카 촬영, 유령 놀이 등 일련의 복잡한 작업을 완료할 수 있습니다.

이는 기본 모델과 로봇 시스템의 결합을 기반으로 하는 연구 결과가 늘어나고 있는 것 중 하나이다. 이러한 시스템은 아직 확장 가능한 상용 솔루션에 도달하지 못했지만 최근 몇 년 동안 로봇 공학 연구를 발전시켜 큰 잠재력을 보여주었습니다.
Alter3는 GPT-4 기술을 배경 모델로 사용하여 로봇이 응답해야 하는 동작이나 상황을 설명하는 자연어 지침을 수신합니다. 첫째, 모델은 "에이전트 프레임워크"를 사용하여 로봇이 목표를 완료하기 위해 취해야 하는 일련의 작업 단계를 계획합니다. 둘째, 에이전트를 코딩하여 로봇이 각 단계를 수행하는 데 필요한 명령을 생성합니다. GPT-4는 Alter3 프로그래밍 명령에 대한 교육을 받지 않았기 때문에 연구원들은 상황별 학습 기능을 사용하여 로봇의 API에 맞게 동작을 조정했습니다.

따라서 프롬프트에는 명령 목록과 각 명령을 사용하는 방법을 보여주는 예제 세트가 포함되어 있습니다. 그런 다음 모델은 각 단계를 하나 이상의 API 명령에 매핑하여 실행을 위해 로봇에 보냅니다.
연구원들은 인간이 "팔을 조금 더 높이 올려보세요"와 같은 피드백을 제공할 수 있도록 기능을 추가했습니다. 이러한 지침은 다른 GPT-4 에이전트로 전송되어 코드를 추론하고 필요한 수정을 수행하며 일련의 작업을 로봇에 반환합니다. 향상된 액션 레시피와 코드는 나중에 사용할 수 있도록 데이터베이스에 저장됩니다.

연구원들은 Alter3에 대해 셀카 찍기, 차 마시기 등 일상적인 행동은 물론 유령이나 뱀 흉내를 내는 등의 모방 행동을 포함해 여러 가지 테스트를 실시했습니다. 또한 신중하게 계획된 조치가 필요한 상황에 대처하는 모델의 능력도 테스트했습니다. GPT-4는 인간 행동과 모션에 대한 광범위한 이해를 통해 Alter3와 같은 휴머노이드 로봇에 대한 보다 현실적인 행동 계획을 생성할 수 있습니다. 연구진의 실험에서도 로봇이 수치심, 기쁨 등의 감정을 흉내낼 수 있다는 사실이 밝혀졌습니다.
가장 밝은 부분:
- Alter3는 추론을 위해 GPT-4 기술을 사용하는 최신 휴머노이드 로봇으로, 자연어 지시를 로봇의 행동에 직접 매핑할 수 있습니다.
- 연구원들은 GPT-4 기술의 상황별 학습 기능을 활용하여 동작을 로봇의 API에 적응시켜 로봇이 원하는 일련의 작업 단계를 수행할 수 있도록 했습니다.
- 인간의 피드백과 기억을 추가하면 Alter3의 성능이 향상될 수 있으며, 연구원의 실험에서는 로봇의 수치심, 기쁨과 같은 감정을 모방할 수 있음도 나타났습니다.
Alter3의 성공은 로봇 제어 분야에서 GPT-4의 큰 잠재력을 입증하여 미래에 더욱 스마트하고 유연한 로봇 시스템을 위한 길을 열었습니다. 이러한 연구의 획기적인 발전은 인간과 컴퓨터의 상호 작용에 새로운 혁명을 예고합니다.