Google Gboard キーボードは、大規模言語モデル (LLM) を使用して文章や段落のエラーをワンクリックで修復する「校正」と呼ばれる新機能を開始しました。この革新的な機能により、モバイル テキスト入力の効率が大幅に向上し、単語ごとの誤り訂正の従来の方法が変更され、ユーザーにスムーズな入力体験が提供されます。この機能は現在、Pixel 8 デバイスで利用可能であり、毎日何千人ものユーザーにサービスを提供しています。その背景には、データ生成、モデル トレーニング、サービスの最適化における Google 研究チームの綿密な研究と技術的進歩があります。
Gboard は、Google がモバイル デバイス向けに構築したスマート キーボードで、統計的なデコードを通じてスムーズな入力エクスペリエンスを提供します。今回、Google 研究チームはこれに革新的な機能「校正」を追加し、大規模言語モデル (LLM) の強力な機能を活用して、文全体および段落全体のエラーをワンクリックで修復するという画期的な成果を達成しました。
Googleが新たに発表した論文「校正: ワンクリックですべてのエラーを修正」によると、「校正」と呼ばれるこの新しいGboard機能はサーバー側のLLMのサポートに依存しており、ユーザーはワンクリックで文章全体やさまざまなエラーをシームレスに修正できるという。これにより、従来の単語ごとの修正エクスペリエンスが完全に変わります。この機能は現在、Pixel 8 デバイスに展開されており、毎日何千人ものユーザーに恩恵をもたらしています。

このシステムには、データ生成、指標設計、モデル調整、サービスという 4 つの主要な部分が含まれています。研究チームは、複雑な誤差合成フレームワークを通じてシミュレートされたデータセットを生成し、さまざまな角度からモデルを評価するための複数の指標を設計し、InstructGPT からアイデアを借用して、最初に教師あり学習を通じて微調整し、次に強化学習テクノロジーを使用して調整し、結果を大幅に改善しました。モデルの性能。

さらに、このモデルはクラウド TPU V5 にデプロイされ、量子化、バケット化、セグメント化された入力、および投機的デコードを通じてレイテンシーを最適化し、最終的に応答時間の中央値を 39.4% 削減します。

アナリストらは、この探索的研究は、モバイル端末での入力インタラクションエクスペリエンスを向上させる大規模モデルの大きな可能性を十分に実証しており、従来の人間とコンピュータのインタラクション方法に対する破壊的なイノベーションであると信じています。これは、ユーザーの入力効率を向上させる大規模モデルの変革力を示しており、日々のインタラクティブなエクスペリエンスを最適化するための人工知能の将来の使用にインスピレーションをもたらします。
論文アドレス: https://arxiv.org/abs/2406.04523
全体として、Google Gboard の「校正」機能は、モバイル端末に人工知能技術を応用した成功例であり、将来的にはよりインテリジェントで便利な入力体験が実現することを示しています。