오랫동안, 휴머노이드 로봇의 민첩한 움직임은 로봇 연구 분야에서 큰 도전이었습니다. 시뮬레이션 된 환경과 현실 세계의 물리적 차이로 인해 로봇이 시뮬레이션 교육 결과를 현실에 직접 적용하기가 어렵습니다. 이 기사는 ASAP (Aligning Simulation and Real Physics)라는 새로운 프레임 워크를 소개합니다.이 프레임은 시뮬레이션과 실제 물리적 특성을 영리하게 정렬 하여이 문제를 효과적으로 해결하여보다 유연하고 조정 된 전신 운동을 달성 할 수 있습니다.
오랫동안 사람들은 휴머노이드 로봇이 인간만큼 유연하고 심지어 인간을 능가 할 수 있다는 꿈을 꾸었습니다. 그러나 시뮬레이션 된 환경과 현실 세계의 물리적 차이로 인해 로봇의 전신 조정과 민첩한 움직임을 달성하는 것은 여전히 큰 도전입니다. 시스템 식별 및 도메인 무작위 배정의 전통적인 방법은 종종 번거로운 매개 변수 조정에 의존하거나 로봇 이동이 너무 보수적이고 민첩성을 희생합니다. 이제 시뮬레이션과 실제 물리학을 정렬하여 ASAP (정렬 시뮬레이션 및 실제 물리학)라는 새로운 프레임 워크가 나타납니다.

ASAP 프레임 워크는 두 가지 주요 단계로 나뉩니다. 먼저, 사전 훈련 단계에서 연구원들은 인간 모션 비디오 데이터를 사용하여 이러한 동작을 휴머노이드 로봇으로 다시 비운 다음 시뮬레이션 된 환경에서 이러한 동작을 배우도록 로봇을 훈련시킵니다. 그러나 시뮬레이션 된 환경에서 훈련 된 전략을 실제 로봇에 직접 적용하면 시뮬레이션 된 환경과 실제 세계 사이에 동적 차이가 있기 때문에 종종 성능 저하로 이어질 수 있습니다. 이 문제를 해결하기 위해 ASAP 프레임 워크는 두 번째 단계 인 교육 후 단계로 들어갑니다. 이 단계에서 연구원들은 로봇에게 현실 세계에서 미리 훈련 된 행동을 수행하고 로봇의 실제 모션 궤적을 기록하도록 요청할 것입니다.
다음으로 ASAP 프레임 워크는이 실제 모션 데이터를 사용하여 시뮬레이터에서 로봇의 움직임을 재현합니다. 시뮬레이션 된 환경과 실제 세계의 차이로 인해 시뮬레이션 된 모션 궤적은 종종 실제 모션 궤적에서 벗어납니다. 이 차이는 단지 연구원들에게 배울 신호를 제공하는 것입니다. ASAP는 시뮬레이션과 현실 사이의 동적 차이를 배우고 보완하는 "차이 액션 모델"을 훈련시킵니다. 이 모델은 시뮬레이터의 단점을 수정하고 실제 물리적 특성에 더 가깝게 만드는 "오류 수정"과 같습니다. 마지막으로, 연구원들은이 "차이 행동 모델"을 시뮬레이터에 통합하여 미리 훈련 된 모션 추적 전략을 미세 조정하여 로봇의 움직임이 실제 물리적 특성에 더 잘 적응할 수 있도록합니다. 미세 조정 전략은 "차이 작업 모델"을 사용할 필요없이 실제 로봇에 직접 배포 할 수 있습니다.
ASAP 프레임 워크의 효과를 확인하기 위해 연구원들은 다른 시뮬레이터 간의 마이그레이션과 실제 휴머노이드 로봇 유닛 G1에 대한 테스트를 포함하여 여러 실험을 수행했습니다. 실험 결과에 따르면 ASAP 프레임 워크는 다양한 역동적 인 움직임에서 로봇의 민첩성과 전신 조정을 크게 향상시킵니다.
ASAP 프레임 워크의 성공은 시뮬레이션 된 환경과 현실 세계의 동적 차이를 효과적으로 연결 시켜서 시뮬레이션 된 환경에서 훈련 된 휴머노이드 로봇이 실제 세계에서 훌륭한 민첩성을 보여줄 수 있도록 개발을보다 유연하고 유연하게 만듭니다. 다기능적인 휴머노이드 로봇은 새로운 방향을 지적합니다.
ASAP 프레임 워크의 주요 기술에는 다음이 포함됩니다.
인간 모션 데이터를 사용한 사전 훈련 : 인간의 민첩한 움직임을 로봇 학습 목표로 변환하여 로봇에게 고품질 모션 데이터를 제공합니다.
미분 행동 모델의 교육 : 실제 세계와 시뮬레이션 환경의 차이점을 배우면 시뮬레이터의 단점을 동적으로 보상하고 시뮬레이션의 정확성을 향상시킵니다.
차등 행동 모델을 기반으로 한 전략 미세 조정 : 로봇 전략이 실제 물리적 특성에 적응하고 궁극적으로 더 높은 모션 성능을 달성 할 수있게합니다.
ASAP 프레임 워크의 실험적 검증은 다음을 보여줍니다.
시뮬레이터 간의 마이그레이션에서 ASAP는 동작 추적 오류를 크게 줄일 수 있으며 이는 다른 벤치 마크 방법보다 우수합니다.
실제 로봇 테스트에서 ASAP는 로봇의 모션 성능을 크게 향상시켜 로봇이 어려운 민첩한 움직임을 완료 할 수 있습니다.
이 연구는 또한 데이터 세트 크기, 훈련 기간 및 행동 규범 중량을 포함한 훈련 차이 액션 모델의 주요 요소를 심층적으로 탐구합니다. 또한 연구원들은 다른 차등 행동 모델 사용 전략을 비교했으며 최종적으로 강화 학습 미세 조정 방법이 최적의 성능을 달성 할 수 있음을 확인했습니다.
ASAP 프레임 워크의 놀라운 진행에도 불구하고 여전히 하드웨어 제한, 모션 캡처 시스템에 대한 의존성 및 높은 데이터 요구와 같은 몇 가지 제한 사항이 있습니다. 향후 연구 방향에는 하드웨어 손상을 인식하고, 마크없는 포즈 추정 또는 온보드 센서 융합을 활용하여 모션 캡처 시스템에 대한 의존성을 줄이고, 차등 동작 모델을위한보다 효율적인 적응 기술을 탐색하는 전략적 아키텍처 개발이 포함될 수 있습니다.
ASAP 프레임 워크의 출현은 인간형 로봇 분야에 새로운 희망을 가져 왔습니다. ASAP는 시뮬레이션과 현실 사이의 역동적 인 차이를 영리하게 해결함으로써 Humanoid Robot은 더 민첩하고 조정 된 운동 기술을 습득하여 미래에 실제 인간화 로봇의 광범위한 적용을위한 견고한 토대를 마련 할 수 있도록합니다.
프로젝트 주소 : https://agile.human2humanoid.com/
종이 주소 : https://arxiv.org/pdf/2502.01143
ASAP 프레임 워크는 인간형 로봇 시뮬레이션과 현실 사이의 격차를 해결하기위한 효과적인 솔루션을 제공합니다. . 곧 올 것입니다. 향후 연구는 ASAP 프레임 워크를 더욱 최적화하여 실제 응용 분야에서보다 강력하고 효율적으로 만들 수 있습니다.