이 프로젝트는 Android TTS 서비스를위한 아이슬란드 TTS 응용 프로그램을 제공합니다. 프로젝트의 현재 상태는 생산 준비가 되었습니다.
이 앱은 Google Play 스토어에서 사용할 수 있습니다.
Símarómur는 자산을 통해 번들로 제공되는 신경 네트워크 온거리 음성에 대한 액세스를 제공합니다.
현재 Steinn 이라는 남성 음성이 하나 있습니다. 이 목소리는 이해하기 쉬운 일뿐만 아니라 즐겁고 매력적인 톤을 가지고 있으며, 아이슬란드의 TTS (Tevice On-Device Teepeech) 기술의 표준을 설정하는 다목적 일반 목적 옵션으로 만듭니다. 짧고 긴 텍스트를 모두 읽고 일관된 청취 경험을 제공하는 데 적합합니다.
우리는 현재 향후 출시를 위해 예정된 여성 목소리를 포함 할 다중 스피커 모델을 개발하고 있습니다.
사용자는 단어 나 토큰의 대체 발음을 수용하기 위해 정규화 항목을 추가 할 수 있습니다. 이러한 대체 발음은 내장 정규화 규칙보다 우선하며 읽는 텍스트에서 발견 된 그러한 용어에 대해 지정된 대체품을 적용합니다.
사용법을 단순화하기 위해 정규 표현식 구문을 이해하거나 사용할 필요없이 Grapheme 수준에서 교체 할 수 있습니다. 사용자는 재생 버튼을 사용하여 입력 된 용어와 현재 음성으로 교체음 소리를 즉시들을 수 있습니다.
기본적으로 사용자 정규화 사전이 비어 시작됩니다. 현재 사전 수입 또는 내보내기는 지원되지 않습니다.
아이슬란드 텍스트 정규화는 텍스트가 G2P에 들어가기 전에 수행됩니다. 로컬 음성 G2P는 규칙 기반이며 JNI를 통해 액세스하는 C ++ 프레임 워크 Thrax & OpenFST를 사용하여 구현됩니다.
더 이상 사용되지 않은 Flite Voices와 이전 신경망 음색. 요즘 Flite Voices는 더 이상 사용되지 않으며 대신 순전히 신경망의 목소리를 사용하고 있습니다. Flite 프로젝트는 간신히 유지되며 신경망 음성의 런타임 성능이 Flite Voices에서 빠르게 닫히고 있습니다. 픽셀 6 전화의 신경망 모델로 25 배의 실시간 속도를 달성 할 수 있습니다.
신경망 모델은 VITS를 기반으로하며 Piper TTS를 통해 교육을받습니다.
이 프로젝트는 OpenFST & Thrax 버전을 사용하여 Branch android 내부의 Android 용으로 적절한 수정을합니다. Símarómur를 컴파일하기 전에 먼저 제작 및 설치하십시오.
CI 작업의 경우, 우리는 이미 모든 종속 라이브러리를 사전 제작하고 해당 프로젝트 사이트에서 Github 릴리스 자산으로 게시했습니다. 이를 활용하여 다음 절차를 통해 프로젝트 디렉토리 내부에 로컬로 설치할 수 있습니다.
중고 릴리스 버전의 환경 변수를 설정하십시오.
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-android그런 다음이 스크립트를 실행합니다.
.github/scripts/dl_3rdparty.sh 이것은 필요한 모든 바이너리를 하위 지사 3rdparty/ndk 에 다운로드하여 추출해야합니다.
음성 자산 서브 디렉토리를 통해 가져 오십시오
git submodule update --init 그런 다음 local.properties 아직 존재하지 않는 경우 파일을 작성하고 설치된 OpenFST/Thrax 라이브러리에 변수 3rdparty.dir 추가하십시오 (예 :
3rdparty.dir=/Users/fred/install-android
또는 dl_3rdparty.sh 를 통해 릴리스를 다운로드 한 경우이 변수를 프로젝트 디렉토리 simaromur/3rdparty/ndk 에 가리 킵니다.
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
설치된 NDK 버전에 따라 app/build.gradle 내부의 변수 ndkVersion 적응/무책임해야 할 수도 있습니다. 그런 다음 Android Studio 내부에서 프로젝트를 구축하십시오.
이 프로젝트를 포킹하고 지점을 만들고 새로운 풀 요청을 열어서이 프로젝트에 기여할 수 있습니다.
모든 코드는 저작권 © 2021-2024 Grammatek EHF입니다. 이 코드는 Apache 라이센스에 따라 라이센스가 부여됩니다.
우리는 오디오 속도 및 피치 조작을 위해 3rdparty 라이브러리 Sonic을 사용합니다. Sonic은 Bill Cox의 2011 년 Copyright 2011이며 Apache 라이센스에 따라 라이센스가 부여됩니다. Símarómur는 G2P에 적응 된 Thrax 및 OpenFST의 적응 된 버전을 사용합니다. 이들은 또한 Apache 라이센스에 따라 라이센스가 부여됩니다. 또한 토큰 화 및 문장 분할에 OpenNLP를 사용합니다. OpenNLP는 Apache 라이센스에 따라 라이센스가 부여됩니다.
이 소프트웨어의 큰 부분은 여기 및 여기에 설명 된 아이슬란드 정부 5 년 언어 기술 프로그램의 후원하에 개발되었습니다 (영어).