e2tts mlx
1.0.0
Apple Silicon에 대한 최소한의 종속성과 효율적인 계산을 통해 MLX를 사용하여 당황스럽고 쉽게 부끄럽지 않은 완전성이없는 Zero-Shot TTS 모델의 가벼운 구현.
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .텍스트 음성에 미리 훈련 된 모델을 사용하려면 :
e2tts ' We must achieve our own salvation. ' tts_0.wav 현재 디렉토리에 작성한 다음 재생할 수 있습니다.
기본 설정으로 새 모델을 훈련하려면 :
e2tts사용자 정의 옵션으로 훈련하려면 :
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32교육 옵션 선택 :
--batch_size : 배치 크기 설정 (기본값 : 32)--n_epoch : 에포크 수 설정 (기본값 : 10)--lr : 학습 속도 설정 (기본값 : 2E-4)--depth : 모델 깊이 설정 (기본값 : 8)--n_ode : 샘플링 단계 수 설정 (기본값 : 1)--more_ds 매개 변수 : 2 세트 교육을 구현합니다 (기본값 : 'Josefalbers/LJ-Speech') 이 프로젝트에 영감을 준 Lucidrains의 환상적인 코드와 Lucasnewman의 The Vocos 구현에 특별한 감사를드립니다.
아파치 라이센스 2.0