Waymo의 최신 엔드 투 엔드 멀티 모달 자율 주행 모델 Emma는 업계로부터 광범위한 관심을 끌었습니다. Emma 모델은 Google의 Gemini 대형 언어 모델 (예 : 카메라 이미지 및 텍스트 데이터)을 통합하여 복잡한 도로 시나리오와 효율적인 자율 주행 결정에 대한 정확한 이해를 달성합니다. 이 모델은 경로 예측, 객체 감지 및 로드맵 이해와 같은 중요한 작업에서 우수한 성능을 가지고 있습니다. 획기적인 획기적인 자율 주행 작업을 통합 모델로 통합하여 시스템의 전반적인 효율성을 향상시키고 적응이 새로운 방향을 제공합니다. 자율 주행 기술의 미래 개발을 위해.
최근 Waymo는 공식적으로 "엔드 투 엔드 멀티 모달 자율 주행 모델"(EMMA)이라는 AI 연구 모델을 공식적으로 발표했습니다. 이 모델은 자율 주행 기술을 위해 특별히 훈련되고 미세 조정되어 복잡한 도로 시나리오를 더 잘 이해하기 위해 Gemini의 광범위한 지식을 활용합니다. Waymo는 출판 된 연구 논문에서 모델의 디자인 철학과 기술적 장점을 자세히 설명하고 순수한 엔드 투 엔드 접근법의 장점과 단점을 탐구합니다.

Waymo는 Emma 모델은 Gemini를 기반으로하며 모션 계획 및 3D 객체 감지와 같은 자율 주행 작업에 중점을두기 위해 기능을 완전히 활용했습니다. 이 모델은 여러 중요한 자율 주행 작업에서 우수한 작업 마이그레이션 기능을 보여줍니다. Waymo는 Emma가 각 작업에 대한 개별 모델을 교육하는 것과 비교하여 경로 예측, 객체 감지 및 로드맵 이해력의 성능을 크게 향상 시켰다고 지적했습니다.
Waymo의 연구 결과에 따르면 Emma의 건설은 향후보다 핵심 자율 주행 작업의 조합에 대한 유망한 연구 방향을 제공합니다. Waymo의 연구 책임자 인 Drago Anguelov는 다음과 같이 말했습니다 :“Emma는 자율 주행 분야에서 멀티 모달 모델의 강력한 기능과 중요성을 보여줍니다. 우리는 멀티 모달 방법과 구성 요소가보다 다재다능하고 다재다능하고 어떻게 구축하는 데 도움이 될 수 있는지를 기대합니다. 적응 가능한 운전 시스템.”
Emma는 또한 원시 카메라 입력 및 텍스트 데이터를 처리 할 수있는 능력을 잘 수행했습니다. 통합 언어 공간을 설정하여 Gemini의 세계 지식과 추론 능력을 최대한 활용하여 다양한 주행 출력을 생성하고 엔드 투 엔드 계획의 효율성을 향상시킬 수 있습니다.
Waymo는이 연구의 중요성이 자율 주행 차량의 적용에만 국한된 것이 아니라 실제 작업에 고급 AI 기술을 적용하여 복잡한 동적 환경에서 AI의 기능을 확장한다고 강조했다.
핵심 사항 :
Emma 모델은 Gemini 지식을 사용하여 복잡한 도로 시나리오를 이해하는 자율 주행 교육을 위해 설계되었습니다.
전통적인 모델과 비교하여 Emma는 미션 크리티컬 목적에서보다 효율적인 성능을 보여줍니다.
연구 결과는 자율 주행에 적용될뿐만 아니라 동적 환경에서 AI의 응용 잠재력을 확장합니다.
요컨대, Emma 모델의 출시는 자율 주행 기술 분야에서 상당한 진전을 보인다. 인공 지능 기술은 복잡한 실제 시나리오에서 응용 프로그램이 귀중한 경험을 제공합니다.