このプロジェクトは、Android TTSサービスにアイスランドのTTSアプリケーションを提供します。プロジェクトの現在の状態は生産対応です。
このアプリはGoogle Playストアで入手できます。
Símarómurは、資産を介してバンドルされるニューラルネットワーク上のデバイスの声へのアクセスを提供します。
現在、 Steinnという名前の男性の声が1つあります。この音声は非常にわかりやすいだけでなく、心地よく魅力的なトーンを持っているため、アイスランドのデバイステキスト(TTS)テクノロジーの標準を設定する多目的で汎用のオプションになります。短いテキストと長いテキストの両方を読むのに最適であり、一貫したリスニングエクスペリエンスを提供します。
現在、将来のリリースが予定されている女性の声を含むマルチスピーカーモデルを開発しています。
ユーザーは、単語やトークンの代替の発音に対応するために、正規化エントリを追加できます。これらの代替の発音は、組み込みの正規化ルールよりも優先され、読み取られているテキストで見つかったそのような用語に指定された代替品を適用します。
使用量を簡素化するために、正規表現の構文を理解または使用する必要なく、グラフェメレベルで交換を行うことができます。ユーザーは、プレイボタンを使用して、入力された用語とその交換音が現在の音声でどのようにサウンドするかをすぐに聞くことができます。
デフォルトでは、ユーザーの正規化辞書が空に起動します。現在、辞書のインポートまたはエクスポートはサポートされていません。
テキストがG2Pに入る前に、アイスランドのテキストの正規化が実行されます。 Local Voice G2Pはルールベースであり、JNIを介してアクセスされるC ++ Frameworks Thrax&OpenFstを使用して実装されています。
廃止されたFlite Voicesと以前のニューラルネットワークの声。最近では、Flite Voicesは時代遅れであり、代わりに純粋にニューラルネットワークの声を使用しています。 Fliteプロジェクトはほとんど維持されておらず、ニューラルネットワークの声のランタイムパフォーマンスは、Flite Voicesに急速に閉じられています。ピクセル6電話でニューラルネットワークモデルを使用して、25倍のリアルタイム速度を達成できます。
ニューラルネットワークモデルは、VITに基づいており、Piper TTSを介して訓練されています。
このプロジェクトでは、Branch android内のAndroid用に構築するための適切な修正を備えたOpenFst&Thraxのバージョンを使用しています。 Símarómurをコンパイルする前に、これらを最初に構築してインストールしてください。
CIジョブについては、すでにすべての従属ライブラリを事前に作成し、対応するプロジェクトサイトでGitHubリリース資産として公開されています。これらを利用して、次の手順を介してプロジェクトディレクトリ内にローカルにインストールできます。
使用されているリリースバージョンの環境変数を設定します。
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-android次に、このスクリプトを実行します。
.github/scripts/dl_3rdparty.shこれにより3rdparty/ndk必要なすべてのバイナリをダウンロードして抽出する必要があります。
音声アセットサブディレクトリを介して取得します
git submodule update --init次に、ファイルlocal.propertiesがまだ存在しない場合は、変数を追加します3rdparty.dir
3rdparty.dir=/Users/fred/install-android
または、 dl_3rdparty.shを介してリリースをダウンロードした場合、これらの変数をプロジェクトディレクトリsimaromur/3rdparty/ndkに指します。
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
また、インストールされているNDKバージョンに応じて、APP/build.gradle内の可変ndkVersion適応/解除することも必要かもしれません。次に、Android Studio内でプロジェクトを構築します。
このプロジェクトを分岐し、ブランチを作成し、新しいプルリクエストを開くことで、このプロジェクトに貢献できます。
すべてのコードは著作権©2021-2024 Grammatek EHFです。このコードは、Apacheライセンスの下でライセンスされています。
オーディオスピードとピッチ操作には、サードパーティライブラリソニックを使用します。 Sonicは2010年、2011年、Bill Coxによるもので、Apacheライセンスの下でライセンスされています。 Símarómurは、G2PにThraxとOpenFstの適応バージョンを使用しています。これらはまた、Apacheライセンスに基づいてライセンスされています。さらに、トークン化と文の分割にopenNLPを使用します。 OpenNLPは、Apacheライセンスに基づいてライセンスされています。
このソフトウェアの大部分は、アイスランドの政府5年間の言語技術プログラムの後援の下で開発されており、こことここ(英語)です。