A mais recente modelo de direção autônoma multimodal de ponta a ponta de Waymo, Emma, atraiu atenção generalizada da indústria. O modelo EMMA é construído no Modelo de Linguagem de Gemini do Google. Ao integrar dados multimodais (como imagens de câmera e dados de texto), ele atinge a compreensão precisa dos cenários complexos da estrada e das decisões de direção autônoma eficientes. O modelo tem um excelente desempenho em tarefas críticas, como previsão de caminho, detecção de objetos e entendimento de mapas. Para o desenvolvimento futuro da tecnologia de direção autônoma.
Recentemente, Waymo divulgou oficialmente um modelo de pesquisa de IA chamado "Modelo de direção autônoma multimodal de ponta a ponta" (Emma). O modelo é especialmente treinado e ajustado para a tecnologia de direção autônoma, aproveitando o amplo conhecimento de Gemini para entender melhor os complexos cenários de estradas. A Waymo detalha a filosofia de design e as vantagens técnicas do modelo em seu artigo de pesquisa publicado e explora as vantagens e desvantagens de abordagens puras de ponta a ponta.

Waymo disse que o modelo Emma é baseado em Gemini, aproveitando totalmente seus recursos para se concentrar em tarefas de direção autônoma, como planejamento de movimento e detecção de objetos 3D. Este modelo demonstra bons recursos de migração de tarefas em várias tarefas críticas de direção autônoma. Waymo apontou que Emma melhorou significativamente o desempenho na previsão de caminho, detecção de objetos e compreensão do roteiro, em comparação com o treinamento de modelos individuais para cada tarefa.
Os resultados da pesquisa de Waymo mostram que a construção da Emma fornece uma direção de pesquisa promissora para a combinação de tarefas de direção autônoma mais centrais no futuro. Drago Angelov, vice -presidente e chefe de pesquisa da Waymo, disse: “Emma demonstra as poderosas capacidades e importância de modelos multimodais no campo da direção autônoma, e esperamos explorar ainda mais como métodos e componentes multimodais podem ajudar a construir mais versáteis e sistema de direção adaptável. ”
A Emma também teve um bom desempenho em sua capacidade de processar dados de entrada e texto da câmera bruta. Ele pode gerar várias saídas de direção e melhorar a eficiência do planejamento de ponta a ponta, estabelecendo um espaço de idioma unificado, fazendo pleno uso do conhecimento mundial e das capacidades de raciocínio de Gêmeos.
Waymo enfatizou que a importância desta pesquisa não se limita à aplicação de veículos autônomos, mas também expande as capacidades da IA em ambientes dinâmicos complexos, aplicando tecnologias avançadas de IA a tarefas do mundo real.
Pontos -chave:
O modelo Emma foi projetado para treinamento autônomo de direção, usando o conhecimento de Gêmeos para entender cenários complexos de estradas.
Comparado aos modelos tradicionais, a EMMA mostra um desempenho mais eficiente em fins de missão crítica.
Os resultados da pesquisa não são aplicados apenas à direção autônoma, mas também expandem o potencial de aplicação da IA em ambientes dinâmicos.
Em suma, o lançamento do modelo Emma marca um progresso significativo no campo da tecnologia de direção autônoma. Tecnologia de inteligência artificial.