TensorVoxのダウンロードTensorVoxソースコードのダウンロード

TensorVox

AI ソースコード

TensorVox V1.0.0.0

ダウンロード

Tensorvox

Tensorvoxは、そのような技術へのアクセシビリティを向上させることを目的とした、デスクトップでユーザーフレンドリーで軽量のニューラル音声合成を可能にするように設計されたアプリケーションです。

主にTensorflowtts、およびCoqui-Ttsとvitsによって駆動され、Tensorflow C APIを使用してTensorflowモデル（最初の2つ）、PytorchのもののLibtorchを使用して、純粋なC ++/QTで記述されています。これにより、ギガバイト相当のPythonライブラリをインストールすることなく、ほんの数dllsをインストールすることなく、推論を実行できます。

試してみてください

Googleドキュメントの詳細なガイド

リリースからコピーをつかみ、.zipを抽出し、モデルとインストール手順についてはGoogleドライブフォルダーを確認します

独自のモデルの使用に興味がある場合は、最初にトレーニングしてからエクスポートする必要があります。

サポートされているアーキテクチャ

Tensorvoxは、3つのレポのモデルをサポートしています。

Tensorflowtts ：fastspeech2、tacotron2、CharおよびPhonemeベースの両方、およびマルチバンドメルガン。これは、ljspeechが前処理された、charベースのTacotron2モデルをエクスポートする方法を示すコラブノートブックです。
Coqui-TTS： PytorchからTensorflowに変換した後、Tacotron2（PhonemeベースのIPA）およびマルチバンドメルガン。 LJSpeech DDCモデルをエクスポートする方法を示すノートブックは次のとおりです。
jaywalnut310/vits： vits、これは完全なE2Eモデルです。（Stressed IPAとしてのStressed IPA）エクスポートノート：

これらの2つの例は、必要なものを理解するのに十分なガイダンスを提供する必要があります。この目的のために特にモデルをトレーニングしたい場合は、Tensorflowttsをお勧めします。これは、言語のように完璧なものであるため、最良のサポートとvitsであるため、英語（コキとtftts、vits）、ドイツ語とスペイン語（Tensorflowttsのみ）に提供されるものが提供されるためです。つまり、何もする必要はありません。音素セットがIPA（ストレスまたはARPA、またはGlobalPhone（問題を開いて、説明して説明します）である限り、コードを変更せずに言語を追加できます。

指示を作成します

現在、Windows 10 X64のみ（8.1で実行されているという報告を聞いたことがあります）がサポートされています。

要件：

QT作成者
MSVC 2017（V141）コンパイラ

プライミングビルド（すべての提供されたライブラリを使用）：

プリコンパイルされたバイナリ依存関係をダウンロードし、含まれます
depsフォルダーが.Proおよびメインソースファイルと同じ場所にあるように解凍します。
QTクリエーターでプロジェクトを開き、コンパイラを追加してコンパイルします

光沢のある新しい実行可能ファイルを試すには、上記のようにプログラムのリリースをダウンロードし、そのリリースの実行可能ファイルを新しいものに置き換える必要があるため、すべてのDLLが配置されていることに注意してください。

TODO：ゼロからコンパイルの手順を追加します。

外観（そしてありがとう）

libtorch ：https：//pytorch.org/cppdocs/installing.html
Tensorflow C API ：https：//www.tensorflow.org/install/lang_c
CPPFLOW （TF C API-> C ++ラッパー）：https：//github.com/serizba/cppflow
audiofile （WAVエクスポート用）：https：//github.com/adamstark/audiofile
フレームレスダークスタイルのウィンドウ：https：//github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
json for modern c ++ ：https：//github.com/nlohmann/json
R8Brain-Free-Src （Resampling）：https：//github.com/avaneev/r8brain-free-src
rnnoise （cmakeバージョン、除去出力）：https：//github.com/almogh52/rnnoise-cmake
Logitech LED Illumination SDK （マウスRGB統合）：https：//www.logitechg.com/en-us/innovation/developer-lab.html
qcustomplot ：https：//www.qcustomplot.com/index.php/introduction
libnumbertext ：https：//github.com/numbertext/libnumbertext