e2tts mlx
1.0.0
MLXを使用した恥ずかしいほど簡単に完全に非自動的に非自動的ゼロショットTTSモデルの軽量実装。Appleシリコンでの依存性と効率的な計算を最小限に抑えます。
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .テキスト対スピーチに事前に訓練されたモデルを使用するには:
e2tts ' We must achieve our own salvation. 'これにより、 tts_0.wav現在のディレクトリに書き込み、再生できます。
デフォルト設定で新しいモデルをトレーニングするには:
e2ttsカスタムオプションでトレーニングするには:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32トレーニングオプションを選択します。
--batch_size :バッチサイズを設定します(デフォルト:32)--n_epoch :エポックの数を設定します(デフォルト:10)--lr :学習率を設定します(デフォルト:2E-4)--depth :モデルの深さを設定します(デフォルト:8)--n_ode :サンプリングの手順数を設定します(デフォルト:1)--more_dsパラメーター:2セットトレーニングを実装します(デフォルト: 'Josefalbers/lj-Speech') このプロジェクトに影響を与えたLucidrainsの素晴らしいコードと、LucasnewmanのThe Vocos実装に感謝します。
Apacheライセンス2.0