O teclado Google Gboard lançou um novo recurso chamado “Revisão”, que usa modelos de linguagem grandes (LLM) para reparar erros de frases e parágrafos com um clique. Este recurso inovador melhora significativamente a eficiência da entrada de texto móvel, altera o método tradicional de correção de erros palavra por palavra e fornece aos usuários uma experiência de digitação mais suave. Esse recurso está atualmente disponível em dispositivos Pixel 8 e atende milhares de usuários todos os dias. Por trás dele estão pesquisas aprofundadas e avanços técnicos da equipe de pesquisa do Google em geração de dados, treinamento de modelos e otimização de serviços.
Gboard é um teclado inteligente desenvolvido pelo Google para dispositivos móveis que oferece uma experiência de digitação suave por meio de decodificação estatística. Agora, a equipe de pesquisa do Google adicionou um recurso inovador de "revisão", aproveitando os poderosos recursos dos grandes modelos de linguagem (LLM) para alcançar um avanço na reparação de erros em frases e parágrafos inteiros com um clique.
De acordo com o artigo recém-lançado do Google “Revisão: corrija todos os erros com um clique”, esse novo recurso do Gboard chamado “Revisão” depende do suporte do LLM do lado do servidor, permitindo aos usuários corrigir frases inteiras perfeitamente com apenas um clique ou vários erros. em um parágrafo, mudando completamente a experiência tradicional de correção palavra por palavra. O recurso está sendo implementado atualmente em dispositivos Pixel 8, beneficiando milhares de usuários todos os dias.

Este sistema inclui quatro partes principais: geração de dados, desenho de indicadores, ajuste de modelo e serviço. A equipe de pesquisa gerou conjuntos de dados simulados por meio de uma estrutura complexa de síntese de erros, projetou vários indicadores para avaliar o modelo de diferentes ângulos e pegou emprestadas ideias do InstructGPT para primeiro fazer o ajuste fino por meio de aprendizagem supervisionada e depois usar a tecnologia de aprendizagem por reforço para ajustar, melhorando significativamente o desempenho do modelo.

Além disso, o modelo é implantado na nuvem TPU V5 e otimiza a latência por meio de quantização, bucketing, entrada segmentada e decodificação especulativa, reduzindo o tempo médio de resposta em 39,4%.

Os analistas acreditam que esta pesquisa exploratória demonstra plenamente o enorme potencial dos grandes modelos para melhorar a experiência de interação de entrada em terminais móveis e é uma inovação disruptiva em relação aos métodos tradicionais de interação humano-computador. Ele marca o poder transformador de grandes modelos na melhoria da eficiência da entrada do usuário e traz inspiração para o uso futuro da inteligência artificial para otimizar experiências interativas diárias.
Endereço do artigo: https://arxiv.org/abs/2406.04523
Em suma, a função de “revisão” do Google Gboard é um caso de sucesso de aplicação de tecnologia de inteligência artificial no terminal móvel, indicando uma experiência de entrada mais inteligente e conveniente no futuro.