تنزيل VoiceCloning - VoiceCloning رمز المصدر

VoiceCloning

كود الذكاء الاصطناعي

1.0.0

تنزيل

نموذج الاستنساخ الصوتي مع TTS الصفر القائم على الاهتمام

AI المستخدمة في API هذا هو تطبيق YouRtts Zero-Shot Multispeaker TTS لنمذجة الصوت التوليدي.

تم استخدام الورقة التي اقترحت نموذج YouRTTS كقاعدة بناء مركزية في واجهة برمجة التطبيقات. yourtts للحصول على نهج متعدد اللغات ل TTS متعددة الحوامل الصفر التي يمكن استخدامها على بيانات الصوت متعددة اللغات أثناء البناء على أساليب Vits الأقدم.

يمكن العثور على التطبيقات المرجعية المستخدمة لدراسة مفاهيم TTS هنا

النماذج التي تم بحثها تحت المصدر المفتوح على النحو المنصوص عليه من coqui

نموذج	عنوان URL
تشفير المتحدث	وصلة
exp 1. yourtts-en (VCTK)	وصلة
exp 1. yourtts-en (vctk) + scl	وصلة
exp 2. yourtts-en (vctk) -pt	وصلة
exp 2. yourtts-en (vctk) -pt + scl	وصلة
exp 3. yourtts-en (vctk) -pt-fr	وصلة
exp 3.	وصلة
exp 4.	وصلة

TTS إعادة تدريب البيانات

تتوفر Audios لـ MOS هنا. أيضا ، MOS Audios هنا.

مصادر الصوت الافتراضية TTS:

Libritts (اختبار نظيف): 1188 ، 1995 ، 260 ، 1284 ، 2300 ، 237 ، 908 ، 1580 ، 121 و 1089

VCTK: p261 ، p225 ، p294 ، p347 ، p238 ، p234 ، p248 ، p335 ، p245 ، p326 و p302

MLS البرتغالية: 12710 ، 5677 ، 12249 ، 12287 ، 9351 ، 11995 ، 7925 ، 3050 ، 4367 و 1306

اقتباس


@ARTICLE{2021arXiv211202418C,
  author = {{Casanova}, Edresson and {Weber}, Julian and {Shulby}, Christopher and {Junior}, Arnaldo Candido and {G{"o}lge}, Eren and {Antonelli Ponti}, Moacir},
  title = "{YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone}",
  journal = {arXiv e-prints},
  keywords = {Computer Science - Sound, Computer Science - Computation and Language, Electrical Engineering and Systems Science - Audio and Speech Processing},
  year = 2021,
  month = dec,
  eid = {arXiv:2112.02418},
  pages = {arXiv:2112.02418},
  archivePrefix = {arXiv},
  eprint = {2112.02418},
  primaryClass = {cs.SD},
  adsurl = {https://ui.adsabs.harvard.edu/abs/2021arXiv211202418C},
  adsnote = {Provided by the SAO/NASA Astrophysics Data System}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-14
الحجم 14.88KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل