Voicesmithは、コーディングエクスペリエンスなしでシングルモデルとマルチスピーカーモデルの両方をトレーニングおよび推測することを可能にします。データセットのDelightFulttsとUnivnetの変更されたバージョンに基づいて、かなり堅実なテキストをスピーチパイプラインに微調整します。両方のモデルは、独自の5000スピーカーデータセットで前提とされていました。また、自動テキストの正規化などのデータセット前処理のためのいくつかのツールを提供します。
このソフトウェアの以前のバージョンを使用して、非常に感情的な感情的な60スピーカーデータセットでトレーニングされたモデルをいじりたい場合は、ここをクリックしてください。

node.jsの最新バージョンがインストールされていることを確認してください
リポジトリをクローンします
git clone https://github.com/dunky11/voicesmith
依存関係をインストールすると、1分かかる場合があります
cd voicesmith
npm install
ここをクリックして、最新バージョンのフォルダーを選択し、すべてのファイルをダウンロードして、リポジトリアセットフォルダー内に配置します。
プロジェクトを開始します
npm start
上から手順1〜4に従ってください。
実行すると、これにより、内部にインストーラーが付いているという名前のフォルダーが作成されます。インストーラーは、オペレーティングシステムに基づいて異なります。
npm make
Voicesmithは現在、2段階の修正されたDelightFulttsとUnivnet Pipelineを使用しています。

プロジェクトによるサポートを示してください。プルリクエストはいつでも大歓迎です。
このプロジェクトは、Apache -2.0ライセンスの下でライセンスされています - 詳細については、license.mdファイルを参照してください。