Die Google Gboard-Tastatur hat eine neue Funktion namens „Korrekturlesen“ eingeführt, die große Sprachmodelle (LLM) verwendet, um Satz- und Absatzfehler mit einem Klick zu reparieren. Diese innovative Funktion verbessert die Effizienz der mobilen Texteingabe erheblich, verändert die traditionelle Methode der wortweisen Fehlerkorrektur und bietet Benutzern ein reibungsloseres Tipperlebnis. Diese Funktion ist derzeit auf Pixel 8-Geräten verfügbar und dient täglich Tausenden von Nutzern. Dahinter stecken die tiefgreifende Forschung und die technischen Durchbrüche des Google-Forschungsteams in den Bereichen Datengenerierung, Modelltraining und Serviceoptimierung.
Gboard ist eine von Google entwickelte intelligente Tastatur für Mobilgeräte, die durch statistische Dekodierung ein reibungsloses Tipperlebnis bietet. Jetzt hat das Google-Forschungsteam die innovative Funktion „Korrekturlesen“ hinzugefügt und nutzt die leistungsstarken Funktionen großer Sprachmodelle (LLM), um einen Durchbruch bei der Reparatur von Fehlern in ganzen Sätzen und Absätzen mit einem Klick zu erzielen.
Laut dem neu veröffentlichten Dokument „Korrekturlesen: Alle Fehler mit einem Klick beheben“ von Google basiert diese neue Gboard-Funktion namens „Korrekturlesen“ auf der Unterstützung von serverseitigem LLM und ermöglicht es Benutzern, ganze Sätze oder verschiedene Fehler nahtlos mit nur einem Klick zu korrigieren in einem Absatz, was das traditionelle Wort-für-Wort-Korrekturerlebnis völlig verändert. Die Funktion wird derzeit auf Pixel 8-Geräten eingeführt und kommt täglich Tausenden von Nutzern zugute.

Dieses System umfasst vier Schlüsselteile: Datengenerierung, Indikatordesign, Modellanpassung und Service. Das Forschungsteam generierte simulierte Datensätze über ein komplexes Fehlersynthese-Framework, entwarf mehrere Indikatoren, um das Modell aus verschiedenen Blickwinkeln zu bewerten, und übernahm Ideen von InstructGPT, um zunächst durch überwachtes Lernen eine Feinabstimmung vorzunehmen und dann die Reinforcement-Learning-Technologie zur Anpassung zu nutzen, was das Modell erheblich verbesserte Modellleistung.

Darüber hinaus wird das Modell auf der Cloud-TPU V5 bereitgestellt und optimiert die Latenz durch Quantisierung, Bucketing, segmentierte Eingabe und spekulative Dekodierung, wodurch die mittlere Antwortzeit letztendlich um 39,4 % reduziert wird.

Analysten glauben, dass diese explorative Forschung das enorme Potenzial großer Modelle zur Verbesserung des Eingabeinteraktionserlebnisses auf mobilen Endgeräten vollständig demonstriert und eine bahnbrechende Innovation gegenüber herkömmlichen Methoden der Mensch-Computer-Interaktion darstellt. Es unterstreicht die transformative Kraft großer Modelle bei der Verbesserung der Benutzereingabeeffizienz und liefert Inspiration für den zukünftigen Einsatz künstlicher Intelligenz zur Optimierung täglicher interaktiver Erlebnisse.
Papieradresse: https://arxiv.org/abs/2406.04523
Alles in allem ist die „Korrekturlese“-Funktion von Google Gboard ein gelungenes Beispiel für die Anwendung der Technologie der künstlichen Intelligenz auf dem mobilen Endgerät und deutet auf ein intelligenteres und komfortableres Eingabeerlebnis in der Zukunft hin.