تنزيل shanghainese tts - تنزيل رمز المصدر shanghainese tts

shanghainese tts

كود الذكاء الاصطناعي

2023.06.06

تنزيل

TTS Shanghainese

مشروع Dartmouth Ling 48 النهائي: تحسين TTS لشنغهينز
Yuanhao Chen [email protected] Spring 2023

هدف

لإنشاء نظام نص إلى كلام (TTS) لشنغهيني من الصفر ، سعيا لتحسين إنتاج النغمة Sandhi مقارنة بالنماذج الحالية من خلال إيلاء اهتمام خاص للمعالجة المسبقة للنص.

وصف

انظر الكتابة/main.pdf.

التبعيات

pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt  # for analysis of questionnaire results

الاستخدام

انظر speech_synthesis/README.md .

بناء

phonemisation/ : يحتوي على وحدة الصوتية
- انظر شرح الإخراج في phonemisation/__init__.py
- الاستخدام: python -m phonemisation "text to phonemise"
- آلية: الجملة الصينية - تجزئة الكلمات ⟶ الكلمات الصينية - الرومانيين ⟶ شنغهاني بينين - صوتية صوتية شنغهانية
  - يستخدم jieba لتجزئة الكلمات
  - يتم استخدام قاموس شنغهاني الذي قمت به سابقًا في الروماني
    - يستخدم وحدة Qieyun لإضافة رقم النغمة 1 إلى مقاطع من نغمة yinping / inbin ؛ نغمات أخرى غير محددة من الناحية الصوتية
  - وظيفة romanisation_to_ipa في romanisation.py
make_metadata.py : يستخدم وحدة phonemisation لتحويل النسخ إلى IPA وإنشاء بيانات التعريف للتدريب
- انظر أدناه في data/
data/ : يحتوي على مجموعة البيانات المستخدمة للتدريب
- يتم تكييف النسخ والملفات الصوتية من هذا الريبو
  - انخفاض إلى 16 كيلو هرتز للتدريب
  - حاليا ، فقط shh.dict.cn/ يستخدم للتدريب
- يتم إنشاء ملفات */metadata.txt بواسطة make_metadata.py
training/
- كمبيوتر محمول Juptyer لتدريب النموذج
- تهدف إلى تحميل وتشغيل في بيئة Google Colab ؛ يحتاج إلى تعديل للاستخدام المحلي
- يستخدم ريبو coqui-ai/TTS ، والذي يحتوي على تنفيذ حالات
writeup/ : الكتابة
speech_synthesis/ : يحتوي على نموذج توليف الكلام
- انظر speech_synthesis/README.md لمزيد من التفاصيل
comparison_questionnaire/ : يحتوي على ملفات الاستبيان والملفات الصوتية المستخدمة لمقارنة الكلام الذي ينتجه هذا النموذج ونموذج Apple ومكبر صوت بشري
- *-1.wav : أنتجته هذا النموذج
- *-2.wav : أنتجت Apple Voiceover (MacBook Pro 14 بوصة ، 2021 ؛ Macos Ventura 13.0.1)
- *-3.wav : تحدث بنفسي
- stats.ipynb : دفتر Jupyter لتحليل نتائج الاستبيان

يوسع

معلومات إضافية

الإصدار 2023.06.06
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-22
الحجم 581.42MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
معلومات باللغة الإنجليزية عن تطوير الصوت (دليل مستخدم TTS إصدار دلفي)

2009-05-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل