인공 지능 분야에서 Hume AI는 최근 LLM (Lange Language Model)으로 구동되는 첫 번째 텍스트 음성 음성 시스템으로 알려진 시스템 인 Octave의 출시를 발표했습니다. 옥타브의 혁신은 자연스러운 음성을 생성 할 수있을뿐만 아니라 상황에서 감정, 억양, 리듬 및 리듬을 이해하여 사용자에게보다 생생하고 인간화 된 음성 출력을 제공한다는 것입니다.
Hume AI의 공동 창립자이자 CEO 인 Alan Cowen은 미디어와의 인터뷰에서 옥타브 모델의 원래 의도는 텍스트 음성 생성 프로세스를보다 자연스럽고 유연하게 만드는 것이라고 말했다. 그는 옥타브가 입력 텍스트 내용에 따라 캐릭터의 성격과 감정 상태를 자동으로 식별하고 그에 따라 음성 성능을 조정할 수 있다고 언급했습니다. 예를 들어, 냉소 문장은 냉소적 인 톤으로 표현되며 긴급한 내용은 러시 톤으로 표시됩니다.

Octave는 또한 사용자가 간단한 자연어 지침을 통해 생성 된 사운드를 세심한 조정할 수있는 고유 한 기능을 가지고 있습니다. 이는 사용자가 "행복한"및 "Sader"와 같은 설명을 직접 입력하여 생성 된 목소리가 기대에 더 부합하도록 할 수 있음을 의미합니다. Cowen은 옥타브가 "냉소 중세 농민"과 같은 캐릭터의 특성에 따라 해당 목소리를 즉시 생성 할 수 있으며 감정 표현에 따라 조정할 수 있다고 덧붙였다.

전통적인 구두 처리 모델과 달리 옥타브는 컨텍스트 일관성을 높이고 문장 수준과 문장 사이에서 정서적 변화를 포착 할 수 있습니다. 이 능력은 복잡한 감정과 맥락을 다룰 때 옥타브 성능을 향상시킵니다.
인공 지능 기술의 빠른 개발로 Hume AI의 옥타브 시스템은 텍스트 음성 기술에 새로운 가능성을 가져 왔습니다. 영화 및 텔레비전 제작 및 게임 개발과 같은 산업에보다 현실적인 캐릭터 더빙을 제공 할뿐만 아니라 교육 및 고객 서비스와 같은 분야의 응용 프로그램을위한 새로운 방향을 열 수 있습니다. Hume AI의 이러한 혁신은 음성 기술의 개발을 더욱 촉진하고보다 자연스럽고 정서적 의사 소통 방법을 도울 것입니다.