Coquittsgui
これらのソースファイルは、Coqui-TTS VITSモデルを使用するユーザーにとってGUIです。

このプロジェクト
- これは、VITSで音声合成を実行することで得られたモデルを簡単に使用できるように設計されています。
- モデルファイル(.pth)、スピーカー(.pth)、Language_ids(.json)、config(.json)が必要です。
- モデルファイル、スピーカーファイル、Language_idsファイル、構成ファイルは同じ場所にある必要があります。
-
UI.pyファイルとdesign.uiファイルを、 setup.pyが配置されている場所にコピーするだけです。 -
UI.pyファイルを実行すると、GUIは実行されます。
前提条件
pip install pyqt5
pip install playsound==1.2.2
使い方

- パスボタンを押してモデルファイルを選択します。
- ボックスからスピーカーと言語を選択します。
- 音声合成のためにテキストボックスにテキストを入力します。
- 必要に応じて、出力ファイル名に印刷するWAVファイルの名前を書きます。デフォルト値はoutput.wavです。
- 必要に応じて、実行中のボイスボックスを確認してください。チェックした場合は、合成が完了したらすぐに音声を再生します。
- systhesisボタンを押します
注記
- 合計時間とは、合成ボタンがクリックされてからWAVファイルが生成されるまでの時間です。
- オーディオ時間は、生成されたオーディオの長さです。
- 出力ファイルは、モデルと同じ場所にあります。
- スピーカーファイルのファイル名、Language_idsファイル、構成ファイルはデフォルト値に従います。上記のファイル名を変更する場合は、config_name、lang_id_name、およびspeak_id_nameの値をコードで変更してください。
すぐ!
音声が出力される前の時間を短縮するモデルをプリロードする機能