tts_arabic
1.0.0
แบบจำลอง TTS อาหรับ (fastpitch) จาก TTS-Arabic-Pytorch Repow ในรูปแบบ ONNX
ตัวอย่างเสียงสามารถพบได้ที่นี่
ติดตั้งด้วย:
pip install git+https://github.com/nipponjo/tts_arabic.git
ตัวอย่าง:
# %%
from tts_arabic import tts
# %%
text = "اَلسَّلامُ عَلَيكُم يَا صَدِيقِي."
wave = tts ( text , speaker = 2 , pace = 0.9 , play = True )
# %% Buckwalter transliteration
text = ">als~alAmu Ealaykum yA Sadiyqiy."
wave = tts ( text , speaker = 0 , play = True )
# %% Unvocalized input
text_unvoc = "القهوة مشروب يعد من بذور البن المحمصة"
wave = tts ( text_unvoc , play = True , vowelizer = 'shakkelha' )แบบจำลองก่อนหน้า:
| แบบอย่าง | ID รุ่น | พิมพ์ | #params | กระดาษ |
|---|---|---|---|---|
| Fastpitch | Fastpitch | ข้อความ-> เมล | 46.3m | arxiv |
| มิกซ์ | Mixer128 | ข้อความ-> เมล | 2.9m | arxiv |
| มิกซ์ | Mixer80 | ข้อความ-> เมล | 1.5m | arxiv |
| hifi-gan | ไฮเฟก้า | ผู้ร้อง | 13.9m | arxiv |
| เสียงร้อง | เสียงร้อง | ผู้ร้อง | 13.4m | arxiv |
ตัวเลือก TTS:
from tts_arabic import tts
text = "اَلسَّلامُ عَلَيكُم يَا صَدِيقِي."
wave = tts (
text , # input text
speaker = 1 , # speaker id; choose between 0,1,2,3
pace = 1 , # speaker pace
denoise = 0.005 , # vocoder denoiser strength
play = True , # play audio?
pitch_mul = 1 , # pitch multiplier
pitch_add = 0 , # pitch offset
vowelizer = None , # vowelizer model
model_id = 'fastpitch' , # Model ID for Text->Mel model
vocoder_id = 'hifigan' , # Model ID for vocoder model
cuda = None , # Optional; CUDA device index
save_to = './test.wav' , # Optionally; save audio WAV file
bits_per_sample = 32 , # when save_to is specified (8, 16 or 32 bits)
)