Google Deepmind는 최근 최신 로봇 공학 기술인 Gemini Robotics를 발표했습니다. 전통적인 홈 로봇과 달리 Gemini Robotics는 고급 AI 기술을 로봇 엔티티에 통합하여 인간의 기능을 넘어 실제 세계에서 복잡한 작업을 수행 할 수 있습니다.
Gemini Robotics의 핵심 기술은 Gemini 2.0 모델을 기반으로하며 텍스트, 이미지, 오디오 및 비디오 처리에서 강력한 기능을 보여주었습니다. Gemini Robotics는 추가 기술 혁신을 통해 로봇이 물리적 공간을 이해하고 운영 할 수 있도록합니다. 이는 로봇이 다양한 형태의 지시를 받고 처리 할 수있을뿐만 아니라 이러한 지시 사항을 실제 신체 행동으로 변환하여 가정 및 산업과 같은 많은 분야에서 중요한 역할을합니다.
Gemini Robotics의 일반화 능력은 가장 눈길을 끄는 기능 중 하나입니다. 사전 설정 프로그램 만 실행할 수있는 전통적인 로봇과 달리 Gemini Robotics는 풍부한 세계 지식을 활용하여 새로운 물체, 새로운 지침 및 새로운 환경에 신속하게 적응하고 효과적인 솔루션을 찾을 수 있습니다. Google의 테스트 데이터에 따르면 Gemini Robotics는 포괄적 인 일반화 벤치 마크에서 다른 시각적 언어 작용 모델을 훨씬 능가하여 우수한 적응성과 문제 해결 능력을 보여줍니다.

Gemini Robotics는 또한 인간 컴퓨터 상호 작용에서도 우수합니다. 매일 구어체 지침을 이해하고 환경의 지침 또는 변화의 변화에 신속하게 대응할 수 있습니다. 또한 Gemini Robotics는 과도한 수동 개입없이 예비 지침을받은 후에 독립적으로 작업을 완료 할 수 있습니다. 이러한 높은 자율성과 유연성으로 인해 Gemini Robotics는 사용자가 다양한 일상 업무를 완료하는 데 도움이되는 이상적인 홈 비서입니다.
Gemini Robotics의 유연성은 지능뿐만 아니라 미세 운동을 실행하는 능력에도 반영됩니다. 종이 접기, 점심 포장 또는 절묘한 샐러드를 만들 든 Gemini Robotics는 섬세한 움직임과 정확한 조정을 보여줄 수 있습니다. 이 기능은 Gemini Robotics가 고급 작동이 필요한 작업에서 잘 수행하고 사용자에게 고품질 서비스를 제공 할 수 있도록합니다.
Gemini Robotics의 다형 적응성은 또 다른 하이라이트입니다. Double-Arm Robot 플랫폼 Aloha2이든 Humanoid Robot Apptronik의 Apollo 등 다양한 로봇 양식에 적응할 수 있습니다. Gemini Robotics는 쉽게 제어 할 수 있습니다. 이 광범위한 적응성은 미래에 다른 분야에서 Gemini Robotics가 장착 된 지능형 로봇을 볼 수있어 모든 생계에 혁명적 인 변화를 가져올 수 있음을 의미합니다.

Gemini Robotics 외에도 Google은 물리적 세계에 대한 로봇의 공간적 이해를 향상시키는 데 더 중점을 둔 모델 인 Gemini Robotics-ER도 출시했습니다. Gemini Robotics-ER은 기존의 저수준 컨트롤러와 결합하여 객체 식별 및 3D 탐지에서 Gemini2.0의 기능을 크게 향상시킬 수 있으며 새로운 로봇 기능을 "즉시"만들 수도 있습니다. 이 혁신적인 기술은 복잡한 환경에서 로봇을 적용 할 수있는 더 많은 가능성을 제공합니다.
Google은 AI 기술의 개발을 홍보하는 동안 보안 문제에 큰 중요성을 부여합니다. Gemini Robotics-ER은 로봇의 원래 보안 컨트롤러와 상호 작용하여 잠재적 행동의 안전을 보장하고 적절한 응답을 생성합니다. 또한 Google은 구체화 된 AI 및 로봇의 시맨틱 보안을 평가하고 개선하기 위해 새로운 데이터 세트 ASIMOV를 출시했습니다. Google은 내부 및 외부 전문가, 정책 입안자 및 책임 및 보안위원회와의 협력을 통해 Gemini Robotics가 윤리 및 보안 표준을 개발하도록합니다.
Gemini Robotics의 구현을 가속화하기 위해 Google은 Apptronik, Agile Robots, Agility Robotics, Boston Dynamics 및 Enchanted Tools를 포함한 여러 로봇 회사와 협력했습니다. 이러한 협력은 더 많은 분야에서 Gemini Robotics의 적용을 촉진하고 우리의 삶과 일에 더 편리하게 제공 할 것입니다.
Google의 Gemini Robotics는 의심 할 여지없이 인공 지능과 로봇 공학 분야에 새로운 활력을 주입했습니다. 강력한 멀티 모달 이해 능력, 탁월한 일반화, 자연적인 인간 컴퓨터 상호 작용 및 훌륭한 운영 기술 모두 지능형 로봇 시대의 오심을 예고합니다. 홈 보조원이든 산업, 의료 및 기타 분야의 응용 분야에 관계없이 Gemini Robotics는 전례없는 편의성과 효율성을 가져올 것입니다.
공식 블로그 : https://deepmind.google/discover/blog/gemini-robotics-rings-ai-into-the-physical-world/