تنزيل LVCNet - تنزيل رمز المصدر LVCNet

LVCNet

كود الذكاء الاصطناعي

1.0.0

تنزيل

LVCNET: شبكة نمذجة فعالة تعتمد على الحالة لتوليد الموجة

باستخدام LVCNET لتصميم مولد Wavegan المتوازي ونفس الإستراتيجية لتدريبه ، فإن سرعة الاستدلال للمتفرج الجديد هي أكثر من 5x أسرع من الماسك الأصلي دون أي تدهور في جودة الصوت .

تم قبول أعمالنا الحالية [Paper] بواسطة ICASSP2021 ، وتم وصف أعمالنا السابقة في Melglow.

التدريب والاختبار

قم بإعداد البيانات ، وقم بتنزيل مجموعة بيانات LJSpeech من https://keithito.com/lj-spheade-dataset/ ، وحفظها في data/LJSpeech-1.1 . ثم ركض
```
 python - m vocoder . preprocess - - data - dir . / data / LJSpeech - 1.1 - - config configs / lvcgan . v1 . yaml
```
يتم حساب وحفظ mel-sepctrums في مجلد temp/ .

تدريب lvcnet

 python - m vocoder . train - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

اختبار lvcnet

 python - m vocoder . test - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

يتم تخزين النتائج التجريبية ، بما في ذلك سجلات التدريب ، ونقاط التفتيش النموذجية والسماعات المصنفة ، في المجلد exps/exp.lvcgan.v1/ .
التشابه ، يمكنك أيضًا استخدام ملف config configs/pwg.v1.yaml لتدريب نموذج موجة موازية.
```
 # training
python - m vocoder . train - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1
# test
python - m vocoder . test - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1 
```

نتائج

Tensorboard

استخدم Tensorboard لعرض عملية التدريب التجريبية:

 tensorboard --logdir exps

خسارة التغلب

تقييم الخسارة

عينة Aduio

يتم حفظ عينات الصوت في samples/ ، حيث

يتم إنشاء samples/*_lvc.wav بواسطة LVCNET ،
يتم إنشاء samples/*_pwg.wav بواسطة Wavegan المتوازي ،
samples/*_real.wav هي الصوت الحقيقي.

مرجع

LVCNET: شبكة النمذجة المعتمدة على الحالة لتوليد الموجة ، https://arxiv.org/abs/2102.10815
Melglow: شبكة توليد موجة فعالة استنادًا إلى الالتفاف المتغير الموقع ، https://arxiv.org/abs/2012.01684
https://github.com/kan-bayashi/Parallelwavegan
https://github.com/lmnt-com/diffwave

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-22
الحجم 8.03MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل