VoiceCloning
1.0.0
تم استخدام الورقة التي اقترحت نموذج YouRTTS كقاعدة بناء مركزية في واجهة برمجة التطبيقات. yourtts للحصول على نهج متعدد اللغات ل TTS متعددة الحوامل الصفر التي يمكن استخدامها على بيانات الصوت متعددة اللغات أثناء البناء على أساليب Vits الأقدم.
| نموذج | عنوان URL |
|---|---|
| تشفير المتحدث | وصلة |
| exp 1. yourtts-en (VCTK) | وصلة |
| exp 1. yourtts-en (vctk) + scl | وصلة |
| exp 2. yourtts-en (vctk) -pt | وصلة |
| exp 2. yourtts-en (vctk) -pt + scl | وصلة |
| exp 3. yourtts-en (vctk) -pt-fr | وصلة |
| exp 3. | وصلة |
| exp 4. | وصلة |
تتوفر Audios لـ MOS هنا. أيضا ، MOS Audios هنا.
Libritts (اختبار نظيف): 1188 ، 1995 ، 260 ، 1284 ، 2300 ، 237 ، 908 ، 1580 ، 121 و 1089
VCTK: p261 ، p225 ، p294 ، p347 ، p238 ، p234 ، p248 ، p335 ، p245 ، p326 و p302
MLS البرتغالية: 12710 ، 5677 ، 12249 ، 12287 ، 9351 ، 11995 ، 7925 ، 3050 ، 4367 و 1306
@ARTICLE{2021arXiv211202418C,
author = {{Casanova}, Edresson and {Weber}, Julian and {Shulby}, Christopher and {Junior}, Arnaldo Candido and {G{"o}lge}, Eren and {Antonelli Ponti}, Moacir},
title = "{YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone}",
journal = {arXiv e-prints},
keywords = {Computer Science - Sound, Computer Science - Computation and Language, Electrical Engineering and Systems Science - Audio and Speech Processing},
year = 2021,
month = dec,
eid = {arXiv:2112.02418},
pages = {arXiv:2112.02418},
archivePrefix = {arXiv},
eprint = {2112.02418},
primaryClass = {cs.SD},
adsurl = {https://ui.adsabs.harvard.edu/abs/2021arXiv211202418C},
adsnote = {Provided by the SAO/NASA Astrophysics Data System}
}