El teclado Google Gboard ha lanzado una nueva función llamada "Corrección", que utiliza modelos de lenguaje grandes (LLM) para reparar errores de oraciones y párrafos con un solo clic. Esta característica innovadora mejora significativamente la eficiencia de la entrada de texto móvil, cambia el método tradicional de corrección de errores palabra por palabra y brinda a los usuarios una experiencia de escritura más fluida. Esta función está actualmente disponible en dispositivos Pixel 8 y sirve a miles de usuarios todos los días. Detrás de ella se encuentran la investigación en profundidad y los avances técnicos del equipo de investigación de Google en generación de datos, capacitación de modelos y optimización de servicios.
Gboard es un teclado inteligente creado por Google para dispositivos móviles que proporciona una experiencia de escritura fluida mediante decodificación estadística. Ahora, el equipo de investigación de Google le ha agregado una función innovadora de "corrección", aprovechando las poderosas capacidades de los modelos de lenguaje grandes (LLM) para lograr un gran avance en la reparación de errores en oraciones y párrafos completos con un solo clic.
Según el documento recientemente publicado por Google "Corrección: corrija todos los errores con un clic", esta nueva función de Gboard llamada "Corrección" se basa en el soporte de LLM del lado del servidor, lo que permite a los usuarios corregir sin problemas oraciones completas con un solo clic o varios errores. en un párrafo, cambiando por completo la experiencia tradicional de corrección palabra por palabra. La función se está implementando actualmente en dispositivos Pixel 8 y beneficia a miles de usuarios todos los días.

Este sistema incluye cuatro partes clave: generación de datos, diseño de indicadores, ajuste del modelo y servicio. El equipo de investigación generó conjuntos de datos simulados a través de un complejo marco de síntesis de errores, diseñó múltiples indicadores para evaluar el modelo desde diferentes ángulos y tomó prestadas ideas de InstructGPT para realizar ajustes primero mediante el aprendizaje supervisado y luego utilizar tecnología de aprendizaje por refuerzo para ajustar, mejorando significativamente la rendimiento del modelo.

Además, el modelo se implementa en la nube TPU V5 y optimiza la latencia mediante cuantificación, agrupación, entrada segmentada y decodificación especulativa, lo que en última instancia reduce el tiempo de respuesta medio en un 39,4 %.

Los analistas creen que esta investigación exploratoria demuestra plenamente el enorme potencial de los modelos grandes para mejorar la experiencia de interacción de entrada en terminales móviles y es una innovación disruptiva para los métodos tradicionales de interacción entre humanos y computadoras. Marca el poder transformador de los modelos grandes para mejorar la eficiencia de la entrada del usuario y brinda inspiración para el uso futuro de la inteligencia artificial para optimizar las experiencias interactivas diarias.
Dirección del artículo: https://arxiv.org/abs/2406.04523
Considerándolo todo, la función de “corrección” de Google Gboard es un caso exitoso de aplicación de tecnología de inteligencia artificial en el terminal móvil, lo que indica una experiencia de entrada más inteligente y conveniente en el futuro.