e2tts mlx
1.0.0
Eine leichte Implementierung von peinlich einfach einfach nicht autoregressiven TTS-Modell mit MLX mit minimalem Abhängigkeiten und effizienten Berechnung auf Apple Silicon.
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .Verwenden Sie ein vorgebildetes Modell für Text-to-Speech:
e2tts ' We must achieve our own salvation. ' Dies schreibt tts_0.wav in das aktuelle Verzeichnis, das Sie dann spielen können.
Um ein neues Modell mit Standardeinstellungen zu trainieren:
e2ttsMit benutzerdefinierten Optionen trainieren:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32Wählen Sie Trainingsoptionen:
--batch_size : Stellen Sie die Stapelgröße fest (Standard: 32)--n_epoch : Stellen Sie die Anzahl der Epochen fest (Standard: 10)--lr : Setzen Sie die Lernrate (Standard: 2E-4)--depth : Setzen Sie die Modelltiefe (Standard: 8)--n_ode : Setzen Sie die Anzahl der Schritte für die Stichprobe (Standardeinstellung: 1)--more_ds Parameter: Implementiert zwei Set-Training (Standard: 'Josefalbers/LJ-Speech') Besonderer Dank geht an Lucidrains 'fantastischer Code, der dieses Projekt inspirierte, und an Lucasnewmans The Vocos -Implementierung, die dies ermöglicht hat.
Apache -Lizenz 2.0