WG WaveNet Download - WG WaveNet Source Code Download

WG WaveNet

كود الذكاء الاصطناعي

1.0.0

تنزيل

WG-Wavenet: تخليق الكلام في الوقت الفعلي في الوقت الفعلي بدون GPU

Po-Chun Hsu ، Hung-Yi Lee

في ورقتنا الحديثة ، نقترح WG-Wavenet ، نموذج توليد موجة سريعة وخفيفة الوزن وعالية الجودة. يتكون WG-Wavenet من نموذج قائم على التدفق المدمج ومرشح بعد المرشح. يتم تدريب المكونين بشكل مشترك من خلال زيادة احتمالية بيانات التدريب وتحسين وظائف الخسارة على مجالات التردد. أثناء تصميم نموذج قائم على التدفق مضغوط بشدة ، يتطلب النموذج المقترح موارد حسابية أقل بكثير مقارنة بنماذج توليد الموجة الأخرى خلال كل من التدريب ووقت الاستدلال ؛ على الرغم من أن النموذج مضغوط للغاية ، إلا أن المرشح يحافظ على جودة الشكل الموجي الذي تم إنشاؤه. يمكن تدريب تطبيق Pytorch الخاص بنا باستخدام ذاكرة GPU أقل من 8 جيجابايت وينشئ عينات صوتية بمعدل أكثر من 5000 كيلو هرتز على وحدة معالجة الرسومات NVIDIA 1080TI. علاوة على ذلك ، حتى لو كانت توليفًا على وحدة المعالجة المركزية ، فإننا نوضح أن الطريقة المقترحة قادرة على توليد 44.1 كيلو هرتز موجة موجة أسرع 1.2 مرة من الوقت الفعلي. تُظهر التجارب أيضًا أن جودة الصوت المولدة قابلة للمقارنة مع تلك الخاصة بالطرق الأخرى.

قم بزيارة demopage لعينات الصوت.

تودو

الافراج عن نموذج ما قبل.
الجمع مع tacotron2.

متطلبات

بيثون> = 3.5.2
الشعلة> = 1.4.0
numpy
سكيبي
مخلل
Librosa
Tensorboardx

المعالجة المسبقة

تمرين

تحميل خطاب LJ. في هذا المثال في data/
للتدريب ، قم بتشغيل الأمر التالي.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models >

للتدريب باستخدام نموذج ما قبل الرضا ، قم بتشغيل الأمر التالي.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --ckpt_pth= < pth/to/pretrained/model >

لاستخدام Tensorboard (اختياري) ، قم بتشغيل الأمر التالي.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --log_dir= < dir/to/logs >

الاستدلال

لتوليف ملفات WAV ، قم بتشغيل الأمر التالي.

python3 inference.py --ckpt_pth= < pth/to/model > --src_pth= < pth/to/src/wavs > --res_pth= < pth/to/save/wavs >

نموذج ما قبل

العمل قيد التقدم.

TTS

سوف نجمع بين هذا المتفرج مع Tacotron2. سيتم إصدار مزيد من المعلومات وتوضيح كولاب هنا.

مراجع

WaveGlow بواسطة Nvidia
موازي Wavegan بواسطة Kan-Bayashi

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-22
الحجم 13.71KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
wgcf

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل