Google Deepmind lanzó recientemente su última tecnología de robótica: Gemini Robotics, una tecnología que marca un paso importante en la aplicación práctica de la inteligencia artificial en el mundo físico. A diferencia de los robots del hogar tradicionales, Gemini Robotics tiene como objetivo incorporar tecnologías de IA avanzadas en entidades robóticas, lo que les permite realizar tareas complejas en el mundo real, incluso más allá de las capacidades humanas.
La tecnología central de Gemini Robotics se basa en el modelo Gemini 2.0, que ha demostrado sus poderosas capacidades en el procesamiento de texto, imágenes, audio y video. A través de una innovación tecnológica adicional, Gemini Robotics permite a los robots comprender y operar el espacio físico. Esto significa que los robots no solo pueden recibir y procesar varias formas de instrucciones, sino también convertir estas instrucciones en acciones físicas reales, así que juega un papel importante en muchos campos, como el hogar y la industria.
La capacidad de generalización de Gemini Robotics es una de sus características más llamativas. A diferencia de los robots tradicionales que solo pueden ejecutar programas preestablecidos, Gemini Robotics puede aprovechar su rico conocimiento del mundo para adaptarse rápidamente a nuevos objetos, nuevas instrucciones y nuevos entornos y encontrar soluciones efectivas. Los datos de la prueba de Google muestran que Gemini Robotics supera con creces otros modelos de acción visual-idioma visual en el punto de referencia de generalización integral, que muestra su excelente adaptabilidad y capacidad de resolución de problemas.

Gemini Robotics también es excelente en la interacción humana-computadora. Puede comprender las instrucciones coloquiales diarias y responder rápidamente a los cambios en las instrucciones o cambios en el entorno. Además, Gemini Robotics puede completar las tareas de forma independiente después de recibir instrucciones preliminares sin una intervención manual excesiva. Este alto grado de autonomía y flexibilidad hace que Gemini Robotics sea un asistente de casa ideal que puede ayudar a los usuarios a completar varias tareas diarias.
La flexibilidad de Gemini Robotics no solo se refleja en su inteligencia, sino también en su capacidad para ejecutar movimientos finos. Ya sea que se trate de origami, empacando almuerzos o haciendo ensaladas exquisitas, Gemini Robotics puede mostrar movimientos delicados y una coordinación precisa. Esta capacidad hace que Gemini Robotics funcione bien en las tareas que requieren una buena operación y proporcionan a los usuarios un servicio de alta calidad.
La adaptabilidad multimórfica de Gemini Robotics es otro punto destacado. Puede adaptarse a una variedad de formas de robot, ya sea la plataforma de robot de doble brazo Aloha2, o el Apolo del robot humanoide Apolo, Gemini Robotics puede controlarlo fácilmente. Esta amplia adaptabilidad significa que en el futuro podemos ver robots inteligentes equipados con robótica de Géminis en diferentes campos, trayendo cambios revolucionarios a todos los ámbitos de la vida.

Además de Gemini Robotics, Google también ha lanzado Gemini Robotics-Er, un modelo que se centra más en mejorar la comprensión espacial de los robots del mundo físico. Al combinarse con los controladores de bajo nivel existentes, Gemini Robotics-ER puede mejorar en gran medida las capacidades de Gemini2.0 en la identificación de objetos y la detección 3D, e incluso puede crear nuevas funciones de robot "sobre la marcha". Esta tecnología innovadora proporciona más posibilidades para la aplicación de robots en entornos complejos.
Mientras promueve el desarrollo de la tecnología de IA, Google también atribuye una gran importancia a los problemas de seguridad. Gemini Robotics-ER interactúa con el controlador de seguridad original del robot para garantizar la seguridad de las acciones potenciales y generar respuestas apropiadas. Además, Google ha lanzado un nuevo conjunto de datos Asimov para evaluar y mejorar la seguridad semántica de la IA y los robots incorporados. A través de la colaboración con expertos internos y externos, responsables políticos y el Comité de Responsabilidad y Seguridad, Google asegura que Gemini Robotics desarrolle estándares éticos y de seguridad.
Para acelerar la implementación de Gemini Robotics, Google ha cooperado con varias compañías de robótica, incluidas Apptronik, Agile Robots, Agility Robotics, Boston Dynamics y Herramientas encantadas. Estas colaboraciones promoverán la aplicación de la robótica de Géminis en más campos y traerán más conveniencia a nuestras vidas y trabajo.
Géminis Robótica de Google ha inyectado sin duda una nueva vitalidad en los campos de la inteligencia artificial y la robótica. Su poderosa capacidad de comprensión multimodal, excelente generalización, interacción natural humano y excelentes habilidades operativas anuncian la llegada de una era de robots inteligentes. Ya sea como asistente de origen o en aplicaciones en industrias, médicos y otros campos, Gemini Robotics nos traerá conveniencia y eficiencia sin precedentes.
Blog oficial: https://deepmind.google/discover/blog/gemini-robotics-bings-ai-into-the-physical-world/