e2tts mlx
1.0.0
Una implementación liviana del modelo TTS de disparo cero vergonzosamente fácilmente no autorgresivo que usa MLX, con dependencias mínimas y un cálculo eficiente en Apple Silicon.
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .Para usar un modelo previamente capacitado para texto a voz:
e2tts ' We must achieve our own salvation. ' Esto escribirá tts_0.wav en el directorio actual, que luego puede jugar.
Para entrenar un nuevo modelo con configuración predeterminada:
e2ttsPara entrenar con opciones personalizadas:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32Seleccione Opciones de capacitación:
--batch_size : configure el tamaño de lote (predeterminado: 32)--n_epoch : establecer el número de épocas (predeterminada: 10)--lr : Establezca la tasa de aprendizaje (predeterminado: 2e-4)--depth : Establezca la profundidad del modelo (predeterminado: 8)--n_ode : establezca el número de pasos para el muestreo (predeterminado: 1)--more_ds Parámetro: implementa el entrenamiento de dos set (predeterminado: 'josefalbers/lj-speech') Un agradecimiento especial al código fantástico de Lucidrains que inspiró este proyecto, y a la implementación de Vocos de Lucasnewman que lo hizo posible.
Licencia de Apache 2.0