En el Mobile World Congress (MWC) de este año, Google anunció la incorporación de análisis de video en tiempo real y capacidades de intercambio de pantalla a su asistente de Géminis. Esta actualización importante marca otro avance en las capacidades interactivas del mundo real de los asistentes de inteligencia artificial. Los usuarios de suscripción de Google One AI Premium de Gemini Advanced serán los primeros en experimentar, y serán los primeros en utilizar estas características innovadoras a finales de este mes.
Esta actualización aporta dos capacidades centrales a Gemini Live: primero, puede analizar el contenido de video en tiempo real a través de cámaras externas, lo que permite a la IA "ver" y comprender el entorno del usuario; En segundo lugar, la función de intercambio de pantalla recientemente agregada permite a los asistentes de IA interpretar directamente la información sobre los teléfonos de los usuarios y proporcionar comentarios instantáneos. La adición de estas funciones hace que la interacción entre los usuarios y la IA sea más rica e intuitiva. Por ejemplo, los usuarios pueden permitir que la IA reconozca los objetos circundantes, el contenido de la pantalla de análisis o proporcionar sugerencias basadas en escenarios en tiempo real, mejorando en gran medida la practicidad y la interactividad de los asistentes de IA.

Las nuevas características se lanzarán primero en dispositivos Android y admitirán múltiples idiomas, lo que refleja el énfasis de Google en los usuarios de todo el mundo. En el sitio del MWC, Google demostró la integración perfecta de estas características en los principales dispositivos Android, fortaleciendo aún más su liderazgo en asistentes de IA. Esta implementación estratégica no solo demuestra la fuerza técnica de Google, sino que también demuestra su determinación de proporcionar a los usuarios una experiencia móvil más inteligente y más conveniente.
Esta actualización es un paso importante para Google en el campo del Asistente de IA y un paso clave en su implementación del Proyecto Astra Vision. Project Astra es un asistente de IA multimodal universal que Google está desarrollando, con el objetivo de procesar texto, video, audio y otra información en tiempo real, y tiene capacidades de memoria a corto plazo. En el futuro, Astra estará profundamente integrado con herramientas como Google Search, Lens y Maps para proporcionar a los usuarios servicios más inteligentes y personalizados. Este plan a largo plazo muestra la gran visión y el diseño estratégico de Google en el campo de la inteligencia artificial.
Con el lanzamiento de Gemini Live, la competencia entre Google y Operai ha entrado en una etapa feroz. Desde diciembre del año pasado, CHATGPT ha admitido videos en tiempo real y intercambio de pantalla en el modo de voz avanzado, y la actualización de Google es sin duda un paso adelante. Esta competencia en el campo de la IA no solo promueve un rápido progreso tecnológico, sino que también aporta funciones más innovadoras a los usuarios. Si Gemini puede consolidar aún más la posición principal de AI con la ayuda de esta nueva característica es digna de atención continua. Esta competencia de los gigantes tecnológicos promoverá en última instancia el desarrollo de toda la industria de inteligencia artificial y traerá a los usuarios una experiencia de vida digital más inteligente y conveniente.