Google Deepmind a récemment publié sa dernière technologie robotique - Gemini Robotics, une technologie qui marque une étape importante dans l'application pratique de l'intelligence artificielle dans le monde physique. Contrairement aux robots domestiques traditionnels, Gemini Robotics vise à intégrer des technologies avancées d'IA dans des entités robotiques, leur permettant d'effectuer des tâches complexes dans le monde réel, même au-delà des capacités humaines.
La technologie de base de Gemini Robotics est basée sur le modèle Gemini 2.0, qui a démontré ses puissantes capacités dans le traitement du texte, des images, de l'audio et de la vidéo. Grâce à une nouvelle innovation technologique, Gemini Robotics permet aux robots de comprendre et d'exploiter l'espace physique. Cela signifie que les robots peuvent non seulement recevoir et traiter diverses formes d'instructions, mais également convertir ces instructions en actions physiques réelles, jouant ainsi un rôle important dans de nombreux domaines tels que la maison et l'industrie.
La capacité de généralisation de Gemini Robotics est l'une de ses fonctionnalités les plus accrocheuses. Contrairement aux robots traditionnels qui ne peuvent exécuter que des programmes prédéfinis, Gemini Robotics est en mesure de tirer parti de ses riches connaissances mondiales pour s'adapter rapidement aux nouveaux objets, de nouvelles instructions et de nouveaux environnements et de trouver des solutions efficaces. Les données de test de Google montrent que Gemini Robotics surpasse de loin les autres modèles d'action visuelle en langue visuelle dans la référence complète de généralisation, montrant son excellente adaptabilité et sa capacité de résolution de problèmes.

Gemini Robotics est également excellent dans l'interaction humaine-ordinateur. Il peut comprendre les instructions familières quotidiennes et répondre rapidement aux changements d'instructions ou de changements dans l'environnement. De plus, les Gemini Robotics peuvent effectuer des tâches indépendamment après avoir reçu des instructions préliminaires sans intervention manuelle excessive. Ce degré élevé d'autonomie et de flexibilité fait de Gemini Robotics un assistant à domicile idéal qui peut aider les utilisateurs à effectuer diverses tâches quotidiennes.
La flexibilité de Gemini Robotics se reflète non seulement dans son intelligence, mais aussi dans sa capacité à exécuter de beaux mouvements. Qu'il s'agisse d'origami, d'emballer des déjeuners ou de faire des salades exquises, la robotique des Gémeaux peut montrer des mouvements délicats et une coordination précise. Cette capacité fait que Gemini Robotics fonctionne bien dans les tâches qui nécessitent un bon fonctionnement et fournissent aux utilisateurs un service de haute qualité.
L'adaptabilité multimorphique de Gemini Robotics est un autre moment fort. Il peut s'adapter à une variété de formes de robot, qu'il s'agisse de la plate-forme de robot à double bras Aloha2, ou de l'Apollo, Gemini Robotics du robot humanoïde, les Gemini Robotics peuvent facilement le contrôler. Cette large adaptabilité signifie qu'à l'avenir, nous pouvons voir des robots intelligents équipés de Gemini Robotics dans différents domaines, apportant des changements révolutionnaires à tous les horizons.

En plus de Gemini Robotics, Google a également lancé Gemini Robotics-ER, un modèle qui se concentre davantage sur l'amélioration de la compréhension spatiale des robots du monde physique. En combinant avec des contrôleurs de bas niveau existants, Gemini Robotics-ER peut considérablement améliorer les capacités de Gemini2.0 dans l'identification des objets et la détection 3D, et peut même créer de nouvelles fonctions de robot "à la volée". Cette technologie innovante offre plus de possibilités pour l'application de robots dans des environnements complexes.
Tout en faisant la promotion du développement de la technologie de l'IA, Google attache également une grande importance aux problèmes de sécurité. Gemini Robotics-ER interagit avec le contrôleur de sécurité d'origine du robot pour assurer la sécurité des actions potentielles et générer des réponses appropriées. De plus, Google a publié un nouvel ensemble de données Asimov pour évaluer et améliorer la sécurité sémantique de l'IA et des robots incarnés. Grâce à la collaboration avec des experts internes et externes, des décideurs politiques et du comité de responsabilité et de sécurité, Google garantit que Gemini Robotics élabore des normes éthiques et de sécurité.
Afin d'accélérer la mise en œuvre de Gemini Robotics, Google a coopéré avec plusieurs sociétés de robotique, notamment Apptronik, Agile Robots, Agility Robotics, Boston Dynamics et Enchanted Tools. Ces collaborations favoriseront l'application de la robotique des Gémeaux dans plus de domaines et apporteront plus de commodité à nos vies et à notre travail.
La robotique des Gémeaux de Google a sans aucun doute injecté une nouvelle vitalité dans les domaines de l'intelligence artificielle et de la robotique. Sa puissante capacité de compréhension multimodale, excellente généralisation, interaction naturelle des ordinateurs humains et superbes compétences opérationnelles annoncent tous la venue d'une époque de robots intelligents. Que ce soit en tant qu'assistant à domicile ou dans les applications dans les industries, les domaines médicaux et autres, Gemini Robotics nous apportera une commodité et une efficacité sans précédent.
Blog officiel: https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/