e2tts mlx
1.0.0
Une mise en œuvre légère du modèle TTS zéro-shot entièrement non autorégressif à l'aide de MLX, avec des dépendances minimales et un calcul efficace sur le silicium Apple.
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .Pour utiliser un modèle pré-formé pour le texte vestimentaire:
e2tts ' We must achieve our own salvation. ' Cela écrira tts_0.wav au répertoire actuel, que vous pouvez ensuite jouer.
Pour former un nouveau modèle avec des paramètres par défaut:
e2ttsPour s'entraîner avec des options personnalisées:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32Sélectionnez les options de formation:
--batch_size : définissez la taille du lot (par défaut: 32)--n_epoch : définissez le nombre d'époches (par défaut: 10)--lr : définissez le taux d'apprentissage (par défaut: 2e-4)--depth : définissez la profondeur du modèle (par défaut: 8)--n_ode : définissez le nombre d'étapes pour l'échantillonnage (par défaut: 1)--more_ds : implémente la formation en deux sets (par défaut: «JoseFalbers / LJ-Speech») Un merci spécial au code fantastique de Lucidrains qui a inspiré ce projet et à la mise en œuvre de Lucasnewman The Vocos qui a rendu cela possible.
Licence Apache 2.0