VoiceCloning
1.0.0
กระดาษที่เสนอโมเดล YouTTS ถูกใช้เป็นหน่วยการสร้างส่วนกลางของ API Yourtts สำหรับวิธีการพูดได้หลายภาษาสำหรับ TTs หลายลำโพงที่ไม่ได้ยิงซึ่งสามารถใช้กับข้อมูลเสียงหลายภาษาในขณะที่สร้างแนวทางที่เก่ากว่า VITS
| แบบอย่าง | url |
|---|---|
| ตัวเข้ารหัสลำโพง | การเชื่อมโยง |
| EXP 1. Yourtts-en (VCTK) | การเชื่อมโยง |
| exp 1. yourtts-en (vctk) + scl | การเชื่อมโยง |
| exp 2. Yourtts-en (VCTK) -pt | การเชื่อมโยง |
| exp 2. yourtts-en (vctk) -pt + scl | การเชื่อมโยง |
| exp 3. yourtts-en (vctk) -pt-fr | การเชื่อมโยง |
| exp 3. yourtts-en (vctk) -pt-fr scl | การเชื่อมโยง |
| exp 4. Yourtts-en (VCTK+Libritts) -pt-fr scl | การเชื่อมโยง |
เสียงสำหรับ MOS มีอยู่ที่นี่ นอกจากนี้ MOS เสียงอยู่ที่นี่
Libritts (ทดสอบสะอาด): 1188, 1995, 260, 1284, 2300, 237, 908, 1580, 121 และ 1089
VCTK: P261, P225, P294, P347, P238, P234, P248, P335, P245, P326 และ P302
MLS Portuguese: 12710, 5677, 12249, 12287, 9351, 11995, 7925, 3050, 4367 และ 1306
@ARTICLE{2021arXiv211202418C,
author = {{Casanova}, Edresson and {Weber}, Julian and {Shulby}, Christopher and {Junior}, Arnaldo Candido and {G{"o}lge}, Eren and {Antonelli Ponti}, Moacir},
title = "{YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone}",
journal = {arXiv e-prints},
keywords = {Computer Science - Sound, Computer Science - Computation and Language, Electrical Engineering and Systems Science - Audio and Speech Processing},
year = 2021,
month = dec,
eid = {arXiv:2112.02418},
pages = {arXiv:2112.02418},
archivePrefix = {arXiv},
eprint = {2112.02418},
primaryClass = {cs.SD},
adsurl = {https://ui.adsabs.harvard.edu/abs/2021arXiv211202418C},
adsnote = {Provided by the SAO/NASA Astrophysics Data System}
}