O editor do Downcodes soube que a Waymo lançou um novo modelo de IA EMMA - um modelo de direção autônoma multimodal de ponta a ponta. Este modelo baseia-se no poderoso sistema de inteligência artificial Gemini e visa melhorar a compreensão e a capacidade de tomada de decisão da tecnologia de condução autónoma em condições de estrada complexas. O modelo EMMA demonstrou excelente desempenho em diversas tarefas importantes, como planejamento de movimento e detecção de objetos 3D e, ao integrar dados multimodais, melhorou significativamente a precisão da previsão de caminhos, detecção de objetos e compreensão de roteiros. Os resultados da pesquisa da Waymo fornecem novas direções para a inovação futura em tecnologia de condução autônoma.

Waymo disse que o modelo EMMA faz pleno uso do amplo conhecimento e capacidade de raciocínio do Gemini e pode processar entradas brutas de câmera e dados de texto para gerar vários resultados de direção e, ao estabelecer um espaço de linguagem unificado, aprimorar o processo de tomada de decisão e melhorar a eficiência do planejamento de ponta a ponta. Isto marca o enorme potencial dos modelos multimodais no domínio da condução autónoma e também abre novas possibilidades para a aplicação da tecnologia de IA em ambientes dinâmicos complexos. Drago Anguelov, vice-presidente e chefe de pesquisa da Waymo, está confiante no desenvolvimento futuro do EMMA e espera explorar ainda mais o papel dos métodos multimodais na construção de sistemas de condução mais versáteis e adaptáveis.
Os resultados da investigação da Waymo mostram que a construção do EMMA fornece uma direção de investigação promissora para a combinação de tarefas de condução autónoma mais essenciais no futuro. Drago Anguelov, vice-presidente e chefe de pesquisa da Waymo, disse: “O EMMA demonstra o poder e a importância dos modelos multimodais no campo da direção autônoma. Esperamos explorar ainda mais como os métodos e componentes multimodais podem ajudar a construir modelos mais versáteis e adaptáveis. sistema de condução.”
O EMMA também tem um bom desempenho em termos de capacidade de lidar com entrada bruta de câmera e dados de texto. Ele pode gerar vários resultados impulsionadores e fazer pleno uso do conhecimento mundial e das capacidades de raciocínio da Gemini, estabelecendo um espaço linguístico unificado para aprimorar o processo de tomada de decisão e melhorar a eficiência do planejamento de ponta a ponta.
Waymo enfatizou que a importância desta pesquisa não se limita à aplicação de carros autônomos, mas também expande as capacidades da IA em ambientes dinâmicos complexos, aplicando tecnologia avançada de IA em tarefas do mundo real.
O modelo EMMA divulgado pela Waymo não é apenas um salto tecnológico no campo da condução autônoma, mas também traz novas ideias para a aplicação de inteligência artificial em cenários complexos. A sua integração multimodal e o seu conceito de design de ponta a ponta promoverão o desenvolvimento da tecnologia de condução autónoma numa direção mais segura e fiável. Esperamos que o modelo EMMA nos traga mais surpresas no futuro!