Au Mobile World Congress (MWC) de cette année, Google a annoncé l'ajout d'analyses vidéo en temps réel et de capacités de partage d'écran à son assistant Gemini. Cette mise à jour majeure marque une autre percée dans les capacités interactives du monde réel des assistants de l'intelligence artificielle. Les utilisateurs d'abonnement Google AI Premium de Gemini Advanced seront les premiers à vivre, et ils seront les premiers à utiliser ces fonctionnalités innovantes plus tard ce mois-ci.
Cette mise à jour apporte deux capacités de base à Gemini Live: d'abord, il peut analyser le contenu vidéo en temps réel via des caméras externes, permettant à l'IA de "voir" et de comprendre l'environnement de l'utilisateur; Deuxièmement, la fonction de partage d'écran nouvellement ajoutée permet aux assistants d'IA d'interpréter directement les informations sur les téléphones des utilisateurs et de fournir des commentaires instantanés. L'ajout de ces fonctions rend l'interaction entre les utilisateurs et l'IA plus riche et intuitive. Par exemple, les utilisateurs peuvent laisser l'IA reconnaître les objets environnants, l'analyse de l'écran d'analyse ou fournir des suggestions basées sur des scénarios en temps réel, améliorant considérablement la pratique et l'interactivité des assistants d'IA.

Les nouvelles fonctionnalités seront lancées d'abord sur les appareils Android et prendront en charge plusieurs langues, reflétant l'accent mis par Google sur les utilisateurs du monde entier. Sur le site MWC, Google a démontré l'intégration transparente de ces fonctionnalités dans les principaux appareils Android, renforçant encore son leadership dans les assistants d'IA. Ce déploiement stratégique démontre non seulement la force technique de Google, mais démontre également sa détermination à fournir aux utilisateurs une expérience mobile plus intelligente et plus pratique.
Cette mise à jour est une étape importante pour Google dans le domaine de l'assistant AI et une étape clé de sa mise en œuvre de Project Astra Vision. Project Astra est un assistant d'IA multimodal universel que Google développe, visant à traiter le texte, la vidéo, l'audio et d'autres informations en temps réel, et a des capacités de mémoire à court terme. À l'avenir, Astra sera profondément intégré à des outils tels que Google Search, Lens et Maps pour fournir aux utilisateurs des services plus intelligents et personnalisés. Ce plan à long terme montre la grande vision de Google et la disposition stratégique dans le domaine de l'intelligence artificielle.
Avec le lancement de Gemini Live, la concurrence entre Google et Openai est entrée dans une scène féroce. Depuis décembre de l'année dernière, Chatgpt a pris en charge le partage vidéo et d'écran en temps réel en mode vocal avancé, et la mise à jour de Google est sans aucun doute un pas en avant. Cette compétition dans le domaine de l'IA favorise non seulement les progrès technologiques rapides, mais apporte également des fonctions plus innovantes aux utilisateurs. Que les Gémeaux puissent consolider davantage la position principale de l'IA à l'aide de cette nouvelle fonctionnalité mérite une attention continue. Cette concurrence des géants de la technologie favorisera finalement le développement de toute l'industrie de l'intelligence artificielle et apportera aux utilisateurs une expérience de vie numérique plus intelligente et plus pratique.