El último modelo de conducción autónoma multimodal de Waymo, Emma, ha atraído una atención generalizada de la industria. El modelo EMMA se basa en el modelo de lenguaje grande de Google. El modelo tiene un excelente rendimiento en tareas críticas como la predicción de la ruta, la detección de objetos y la comprensión de la hoja de ruta. Para el desarrollo futuro de la tecnología de conducción autónoma.
Recientemente, Waymo lanzó oficialmente un modelo de investigación de IA llamado "modelo de conducción autónoma multimodal de extremo a extremo" (EMMA). El modelo está especialmente capacitado y ajustado para la tecnología de conducción autónoma, aprovechando el amplio conocimiento de Gemini para comprender mejor escenarios de carreteras complejos. Waymo detalla la filosofía de diseño y las ventajas técnicas del modelo en su trabajo de investigación publicado y explora las ventajas y desventajas de los enfoques puros de extremo a extremo.

Waymo dijo que el modelo EMMA se basa en Gemini, aprovechando completamente sus capacidades para centrarse en tareas de conducción autónoma, como la planificación de movimiento y la detección de objetos 3D. Este modelo demuestra buenas capacidades de migración de tareas en múltiples tareas de conducción autónoma crítica. Waymo señaló que Emma ha mejorado significativamente el rendimiento en la predicción de la ruta, la detección de objetos y la comprensión de la hoja de ruta, en comparación con el entrenamiento de modelos individuales para cada tarea.
Los resultados de la investigación de Waymo muestran que la construcción de EMMA proporciona una dirección de investigación prometedora para la combinación de tareas de conducción autónoma más centrales en el futuro. Drago Anguelov, vicepresidente y jefe de investigación de Waymo, dijo: “Emma demuestra las poderosas capacidades y la importancia de los modelos multimodales en el campo de la conducción autónoma, y esperamos explorar aún más cómo los métodos y componentes multimodales pueden ayudar a construir más versátiles y versátiles. sistema de conducción adaptable ".
Emma también se desempeñó bien en su capacidad para procesar la entrada de cámara sin procesar y los datos de texto. Puede generar diversos resultados de conducción y mejorar la eficiencia de la planificación de extremo a extremo al establecer un espacio de idiomas unificado, haciendo un uso completo de las capacidades de conocimiento y razonamiento mundial de Gemini.
Waymo enfatizó que la importancia de esta investigación no se limita a la aplicación de vehículos autónomos, sino que también amplía las capacidades de IA en entornos dinámicos complejos aplicando tecnologías de IA avanzadas a tareas del mundo real.
Puntos clave:
El modelo EMMA está diseñado para el entrenamiento de conducción autónoma, utilizando el conocimiento de Gemini para comprender escenarios de carretera complejos.
En comparación con los modelos tradicionales, EMMA muestra un rendimiento más eficiente con fines de misión crítica.
Los resultados de la investigación no solo se aplican a la conducción autónoma, sino que también amplían el potencial de aplicación de la IA en entornos dinámicos.
En resumen, el lanzamiento del modelo EMMA marca un progreso significativo en el campo de la tecnología de conducción autónoma. La tecnología de inteligencia artificial.