تنزيل mandarin tts - تنزيل رمز مصدر mandarin tts

mandarin tts

كود الذكاء الاصطناعي

1.0.0

تنزيل

نص الماندرين الصيني إلى الكلام (MTTS)

هذا هو إطار عمل معتدل من النص إلى الكلام يهدف إلى دعم البحث السريع وتطورات المنتجات. وتشمل الميزات الرئيسية

جميع الوحدات قابلة للتكوين عبر Yaml ،
يتم دعم تضمين النص / التضمين / التضمين متعدد الطوابق وتكوينه ، قابل للتكوين ،
يتم دعم العديد من الصوت (Vocgan ، HIFI-GAN ، WAVEGLOW ، MELGAN) بواسطة محول بحيث يمكن إجراء المقارنة عبر مختلف المركبات بسهولة ،
يتم دعم تنبؤات التباين/التباين في الملعب/الطاقة ، ويمكن إضافة الفروق الأخرى بسهولة ،
وأكثر على خريطة الطريق.

المساهمات موضع ترحيب.

عينات الصوت

تحقق من العرض التوضيحي هنا على سبيل المثال

عينات صوتية مثيرة للاهتمام لـ Aishell3 أضيفت هنا.
تستضيف صفحة Github أيضًا بعض العينات لمجموعات بيانات Biaobei و Aishell3.

بداية سريعة

ثَبَّتَ

 git clone https://github.com/ranchlai/mandarin-tts.git
cd mandarin-tts
git submodule update --force --recursive --init --remote
pip install -e . f

تمرين

يتم توفير مثالين هنا: Biaobei و Aishell3.

لتدريب النماذج الخاصة بك ، قم أولاً بإنشاء نسخة من الأمثلة الحالية ، ثم قم بإعداد ميزات melspectrogram باستخدام wav2mel.py

 cd examples
python wav2mel.py -c ./aishell3/config.yaml -w < aishell3_wav_folder > -m < mel_folder > -d cpu

قم بإعداد ملفات SCP اللازمة للتدريب ،

 cd examples/aishell3
python prepare.py --wav_folder < aishell3_wav_folder >  --mel_folder < mel_folder > --dst_folder ./train/

سيؤدي ذلك إلى إنشاء ملفات SCP المطلوبة بواسطة config.yaml (في قسم مجموعة البيانات/القطار). ستحتاج أيضًا إلى التحقق من أن كل شيء على ما يرام في ملف التكوين. عادة لا تحتاج إلى تغيير الرمز.

الآن يمكنك بدء التدريب الخاص بك

 cd examples/aishell3
python ../../mtts/train.py -c config.yaml -d cuda

بالنسبة لمجموعة بيانات Biaobei ، فإن سير العمل هو نفسه ، باستثناء أنه لا يوجد مكبر صوت تدمير ولكن يمكنك إضافة تضمين Prosody.

سيتم إضافة المزيد من الأمثلة. من فضلك ابق.

توليف

نقاط التفتيش MTTs قبل

يتم توفير مثالين حاليًا ، ويتم تلخيص نقاط التفتيش/التكوينات المقابلة على النحو التالي.

مجموعة البيانات	نقطة التفتيش	تكوين
Aishell3	وصلة	وصلة
بياجي	وصلة	وصلة

المتفرجات المدعومة

يلعب Vocoders دور تحويل melspectrograms إلى أشكال موجية. تتم إضافتها كفيروسات فرعية وسيتم تدريبها في هذا المشروع. وبالتالي يجب عليك تنزيل نقاط التفتيش قبل التوليف. في التدريب ، ليس من الضروري ، حيث يمكنك مراقبة عملية التدريب من melspectrograms التي تم إنشاؤها وأيضًا منحنى الخسارة. الحالي نحن ندعم الماسكين التاليين ،

Vocoder	نقطة التفتيش	جيثب
WaveGlow	وصلة	وصلة
HIFI-GAN	وصلة	وصلة
فوتغان	رابط الرابط	وصلة
ميليغان	وصلة	وصلة

ستكون جميع المفرطات جاهزة بعد تشغيل git submodule update --force --recursive --init --remote . ومع ذلك ، يجب عليك تنزيل نقطة التفتيش يدويًا وبشكل صحيح تعيين المسار في ملف config.yaml.

إعداد نص الإدخال الخاص بك

يجب أن يكون input.txt متسقًا مع إعدادك لـ emb_type1 إلى emb_type_n في ملف التكوين ، أي نفس النوع ، نفس الترتيب.

لتسهيل نسخ Hanzi إلى Pinyin ، يمكنك المحاولة:

 cd examples/aishell3/
python ../../mtts/text/gp2py.py -t "为适应新的网络传播方式和读者阅读习惯"
>> sil wei4 shi4 ying4 xin1 de5 wang3 luo4 chuan2 bo1 fang1 shi4 he2 du2 zhe3 yue4 du2 xi2 guan4 sil|sil 为 适 应 新 的 网 络 传 播 方 式 和 读 者 阅 读 习 惯 sil

لا يمكنك نسخ النص إلى input.txt ، وتذكر أن تضع الاسم المحدد ذاتيا ومعرف السماعة ، مفصولة بـ '|'.

توليف الأمواج الخاصة بك

مع نقاط التفتيش أعلاه ونص جاهزة ، يمكنك أخيرًا تشغيل عملية التوليف ،

python ../../mtts/synthesize.py  -d cuda --c config.yaml --checkpoint ./checkpoints/checkpoint_1240000.pth.tar -i input.txt

يرجى التحقق من ملف config.yaml لإعدادات Vocoder.

إذا كان محظوظًا ، يمكن العثور على أمثلة صوتية في مجلد الإخراج.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-21
الحجم 50.36MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
معلومات باللغة الإنجليزية عن تطوير الصوت (دليل مستخدم TTS إصدار دلفي)

2009-05-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل