ดาวน์โหลด LVCNet - ดาวน์โหลดซอร์สโค้ด LVCNet

LVCNet

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

LVCNET: เครือข่ายการสร้างแบบจำลองตามเงื่อนไขที่มีประสิทธิภาพสำหรับการสร้างรูปคลื่น

การใช้ LVCNET เพื่อออกแบบเครื่องกำเนิดไฟฟ้าของ Wavegan แบบขนานและ กลยุทธ์เดียวกัน ในการฝึกอบรมความเร็วการอนุมานของนักร้องใหม่นั้น เร็วกว่า 5 เท่าเร็ว กว่า Vocoder ดั้งเดิม โดยไม่มีการย่อยสลายคุณภาพเสียงใด ๆ

ผลงานปัจจุบันของเรา [กระดาษ] ได้รับการยอมรับจาก ICASSP2021 และผลงานก่อนหน้าของเราได้รับการอธิบายใน Melglow

การฝึกอบรมและการทดสอบ

เตรียมข้อมูลดาวน์โหลดชุดข้อมูล LJSpeech จาก https://keithito.com/lj-speech-dataset/ และบันทึกใน data/LJSpeech-1.1 จากนั้นวิ่ง
```
 python - m vocoder . preprocess - - data - dir . / data / LJSpeech - 1.1 - - config configs / lvcgan . v1 . yaml
```
mel-sepctrums คำนวณและบันทึกใน temp/

การฝึกอบรม lvcnet

 python - m vocoder . train - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

ทดสอบ lvcnet

 python - m vocoder . test - - config configs / lvcgan . v1 . yaml - - exp - dir exps / exp . lvcgan . v1

ผลการทดลองรวมถึงบันทึกการฝึกอบรมจุดตรวจแบบจำลองและเสียงสังเคราะห์ถูกเก็บไว้ในโฟลเดอร์ exps/exp.lvcgan.v1/
ความคล้ายคลึงกันคุณยังสามารถใช้ไฟล์ config configs/pwg.v1.yaml เพื่อฝึกอบรมโมเดล Wavegan แบบขนาน
```
 # training
python - m vocoder . train - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1
# test
python - m vocoder . test - - config configs / pwg . v1 . yaml - - exp - dir exps / exp . pwg . v1 
```

ผลลัพธ์

บอร์ดบอร์ด

ใช้ Tensorboard เพื่อดูกระบวนการฝึกอบรมการทดลอง:

 tensorboard --logdir exps

การสูญเสีย traning

ภาพ

ประเมินการสูญเสีย

ภาพ

ตัวอย่าง aduio

ตัวอย่างเสียงจะถูกบันทึกไว้ใน samples/ โดยที่

samples/*_lvc.wav ถูกสร้างขึ้นโดย lvcnet
samples/*_pwg.wav ถูกสร้างขึ้นโดย Wavegan คู่ขนาน
samples/*_real.wav เป็นเสียงจริง

อ้างอิง

LVCNET: เครือข่ายการสร้างแบบจำลองตามเงื่อนไขที่มีประสิทธิภาพสำหรับการสร้างรูปคลื่น https://arxiv.org/abs/2102.10815
Melglow: เครือข่ายการกำเนิดคลื่นที่มีประสิทธิภาพตามการควบคุมตำแหน่ง-ตัวแปร https://arxiv.org/abs/2012.01684
https://github.com/kan-bayashi/parallelwavegan
https://github.com/lmnt-com/diffwave

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-22
ขนาด 8.03MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด