Gboard는 타이핑 경험을 혁신하고 Google은 대형 모델을 사용하여 '클릭 한 번으로 모든 오류 수정'을 달성합니다.

저자：Eve Cole 업데이트 시간：2025-02-23 22:50:02

Google Gboard 키보드는 LLM(대형 언어 모델)을 사용하여 한 번의 클릭으로 문장 및 단락 오류를 수정하는 '교정'이라는 새로운 기능을 출시했습니다. 이 혁신적인 기능은 모바일 텍스트 입력의 효율성을 크게 향상시키고 기존의 단어별 오류 수정 방법을 변경하며 사용자에게 보다 부드러운 타이핑 경험을 제공합니다. 이 기능은 현재 Pixel 8 기기에서 사용할 수 있으며 매일 수천 명의 사용자에게 서비스를 제공하고 있습니다. 그 이면에는 데이터 생성, 모델 교육 및 서비스 최적화에 대한 Google 연구팀의 심층적인 연구와 기술 혁신이 있습니다.

Gboard는 통계 디코딩을 통해 부드러운 타이핑 경험을 제공하는 모바일 기기용으로 Google에서 제작한 스마트 키보드입니다. 이제 Google 연구팀은 여기에 혁신적인 기능인 '교정'을 추가했습니다. LLM(대형 언어 모델)의 강력한 기능을 활용하여 한 번의 클릭으로 전체 문장과 단락의 오류를 복구하는 획기적인 기능을 달성했습니다.

Google이 새로 발표한 논문 "교정: 한 번의 클릭으로 모든 오류 수정"에 따르면 "교정"이라고 불리는 이 새로운 Gboard 기능은 서버 측 LLM 지원을 기반으로 하여 사용자가 단 한 번의 클릭이나 다양한 오류로 전체 문장을 원활하게 수정할 수 있습니다. 단 한 문단으로 기존의 단어별 교정 경험을 완전히 바꿔 놓을 수 있습니다. 이 기능은 현재 Pixel 8 기기에 출시되어 매일 수천 명의 사용자에게 혜택을 주고 있습니다.

QQ截图20240620104503.png

이 시스템은 데이터 생성, 지표 설계, 모델 조정 및 서비스의 네 가지 주요 부분으로 구성됩니다. 연구팀은 복잡한 오류 합성 프레임워크를 통해 시뮬레이션된 데이터 세트를 생성하고 다양한 각도에서 모델을 평가하기 위해 여러 지표를 설계했으며 InstructGPT에서 아이디어를 빌려 먼저 지도 학습을 통해 미세 조정한 다음 강화 학습 기술을 사용하여 조정하여 성능을 크게 개선했습니다. 모델 성능 .

QQ截图20240620104510.png

또한 이 모델은 클라우드 TPU V5에 배포되고 양자화, 버킷팅, 분할된 입력 및 추측 디코딩을 통해 대기 시간을 최적화하여 궁극적으로 중앙값 응답 시간을 39.4% 줄입니다.

QQ截图20240620104521.png

분석가들은 이 탐색적 연구가 모바일 단말기의 입력 상호 작용 경험을 향상시킬 수 있는 대형 모델의 엄청난 잠재력을 충분히 보여주며 기존의 인간-컴퓨터 상호 작용 방법에 대한 파괴적인 혁신이라고 믿습니다. 이는 사용자 입력 효율성을 향상시키는 데 있어 대형 모델의 혁신적인 힘을 보여주고, 일상적인 대화형 경험을 최적화하기 위해 인공 지능을 미래에 사용하는 데 영감을 줍니다.

논문 주소: https://arxiv.org/abs/2406.04523

종합하면, 구글 지보드의 '교정' 기능은 인공지능 기술을 모바일 단말기에 적용한 성공적인 사례로, 앞으로 더욱 지능적이고 편리한 입력 경험을 선사할 것으로 보인다.