e2tts mlx
1.0.0
การใช้งานที่มีน้ำหนักเบาของแบบจำลอง TTS แบบไม่เป็นศูนย์แบบไม่น่าอายอย่างเต็มที่โดยใช้ MLX โดยใช้การพึ่งพาน้อยที่สุดและการคำนวณที่มีประสิทธิภาพใน Apple Silicon
# Quick install (note: PyPI version may not always be up to date)
pip install e2tts-mlx
# For the latest version, you can install directly from the repository:
# git clone https://github.com/JosefAlbers/e2tts-mlx.git
# cd e2tts-mlx
# pip install -e .เพื่อใช้โมเดลที่ผ่านการฝึกอบรมมาล่วงหน้าสำหรับการพูดแบบข้อความ:
e2tts ' We must achieve our own salvation. ' สิ่งนี้จะเขียน tts_0.wav ไปยังไดเรกทอรีปัจจุบันซึ่งคุณสามารถเล่นได้
ในการฝึกอบรมรุ่นใหม่ที่มีการตั้งค่าเริ่มต้น:
e2ttsเพื่อฝึกอบรมด้วยตัวเลือกที่กำหนดเอง:
e2tts --batch_size=16 --n_epoch=100 --lr=1e-4 --depth=8 --n_ode=32เลือกตัวเลือกการฝึกอบรม:
--batch_size : ตั้งค่าขนาดแบทช์ (ค่าเริ่มต้น: 32)--n_epoch : ตั้งค่าจำนวนยุค (ค่าเริ่มต้น: 10)--lr : ตั้งค่าอัตราการเรียนรู้ (ค่าเริ่มต้น: 2E-4)--depth : ตั้งค่าความลึกของรุ่น (ค่าเริ่มต้น: 8)--n_ode : ตั้งค่าจำนวนขั้นตอนสำหรับการสุ่มตัวอย่าง (ค่าเริ่มต้น: 1)--more_ds : ใช้การฝึกอบรมสองชุด (ค่าเริ่มต้น: 'Josefalbers/LJ-Speech') ขอขอบคุณเป็นพิเศษสำหรับรหัสที่ยอดเยี่ยมของ Lucidrains ที่เป็นแรงบันดาลใจให้กับโครงการนี้และการใช้งาน VOCOS ของ Lucasnewman ที่ทำให้สิ่งนี้เป็นไปได้
ใบอนุญาต Apache 2.0