該項目為Android TTS服務提供了冰島TTS應用程序。該項目的當前狀態已準備就緒。
該應用程序可在Google Play商店中找到。
símarómur提供了通過資產捆綁的神經網絡的啟用神經網絡的訪問權限。
目前,有一個男性聲音,名為Steinn 。這種聲音不僅容易理解,而且具有令人愉悅且引人入勝的音調,使其成為一種多功能,通用的選項,為冰島的智障文本文本到語音(TTS)技術設定了標準。它非常適合閱讀簡短和冗長的文本,提供一致的聆聽體驗。
我們目前正在開發一種多演講型模型,該模型將包括女性聲音,計劃將來發行。
用戶可以添加歸一化條目,以適應單詞或令牌的替代發音。這些替代發音優先於內置的歸一化規則,並將指定的替代品應用於正在閱讀的文本中發現的任何此類術語。
為了簡化用法,可以在素水平上進行替換,而無需理解或使用正則表達語法。用戶可以通過使用播放按鈕立即聽到使用當前語音的輸入術語及其替換聲音的方式。
默認情況下,用戶歸一化詞典開始空。目前,不支持導入或導出字典。
冰島文本歸一化是在文本進入G2P之前進行的。本地語音G2P是基於規則的,並使用C ++框架Thrax&OpenFST實現,該框架可通過JNI訪問。
棄用的聲音和以前的神經網絡聲音。如今,Flite聲音已經過時,我們正在使用純粹的神經網絡聲音。 FLITE項目幾乎無法維護,並且神經網絡聲音的運行時性能正在迅速閉幕。我們可以在像素6手機上使用神經網絡模型實現25倍實時速度。
神經網絡模型基於VIT,並通過Piper TT進行了訓練。
該項目使用我們的OpenFST和Thrax版本和適當的修復程序,為Android內部的android構建。在編譯Símarómur之前,請先構建並安裝這些。
對於我們的CI工作,我們已經預先建立了所有依賴的庫,並在其相應的項目網站上以GitHub發布資產出版。您可以利用這些優勢,並通過以下過程在項目目錄中本地安裝它們:
設置了用於使用的版本版本的環境變量,例如:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-android然後運行此腳本:
.github/scripts/dl_3rdparty.sh這應該下載並將所有必要的二進製文件提取到子目錄3rdparty/ndk 。
通過
git submodule update --init然後創建local.properties如果尚不存在,並為已安裝的OpenFST/Thrax庫添加變量3rdparty.dir ,例如
3rdparty.dir=/Users/fred/install-android
或者,如果您已通過dl_3rdparty.sh下載了我們的發行版,請將這些變量指向您的項目目錄simaromur/3rdparty/ndk ,例如:
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
根據您已安裝的NDK版本,適應/build.gradle內部的可變ndkVersion也可能有必要。然後在Android Studio中構建項目。
您可以通過分配該項目,創建分支並打開新的拉力請求來為此項目做出貢獻。
所有代碼均為版權©2021-2024 Grammatek EHF。此代碼是根據Apache許可證獲得許可的。
我們使用3rdparty庫Sonic進行音頻速度和音高操縱。 Sonic是Bill Cox 2011年版權所有,並獲得Apache許可證的許可。 Símarómur為G2P使用改編版的Thrax和OpenFST。這些也是根據Apache許可證獲得許可的。此外,我們使用OpenNLP進行令牌化和句子分裂。 OpenNLP已獲得Apache許可證的許可。
該軟件的很大一部分是在此處和此處描述的冰島政府5年語言技術計劃的主持下開發的(英語)。