e2tts mlx
1.0.0
Uma implementação leve de um modelo TTS zero-tiro embaraçosamente fácil não-autorregressivo usando MLX, com dependências mínimas e computação eficiente no Apple Silicon.
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .Para usar um modelo pré-treinado para falar em fala:
e2tts ' We must achieve our own salvation. ' Isso escreverá tts_0.wav para o diretório atual, que você pode reproduzir.
Para treinar um novo modelo com configurações padrão:
e2ttsPara treinar com opções personalizadas:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32Selecione Opções de treinamento:
--batch_size : Defina o tamanho do lote (padrão: 32)--n_epoch : defina o número de épocas (padrão: 10)--lr : defina a taxa de aprendizado (padrão: 2E-4)--depth : Defina a profundidade do modelo (Padrão: 8)--n_ode : Defina o número de etapas para amostragem (padrão: 1)--more_ds Parâmetro: implementa o treinamento de dois set (Padrão: 'Josefalbers/LJ-declara') Agradecimentos especiais ao código fantástico da Lucidrains que inspirou este projeto e à implementação do VOCOS da Lucasnewman que tornou isso possível.
Licença Apache 2.0