ดาวน์โหลด WG WaveNet - WG WaveNet Source Source Download

WG WaveNet

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

WG-Wavenet: การสังเคราะห์คำพูดที่มีความเที่ยงตรงสูงแบบเรียลไทม์โดยไม่มี GPU

Po-chun Hsu, Hung-yi Lee

ในบทความล่าสุดของเราเราเสนอ WG-Wavenet ซึ่งเป็นรูปแบบการสร้างรูปคลื่นที่รวดเร็วน้ำหนักเบาและคุณภาพสูง WG-Wavenet ประกอบด้วยแบบจำลองการไหลแบบกะทัดรัดและตัวกรองหลัง องค์ประกอบทั้งสองได้รับการฝึกฝนร่วมกันโดยเพิ่มโอกาสในการฝึกอบรมและเพิ่มประสิทธิภาพฟังก์ชั่นการสูญเสียในโดเมนความถี่ ในขณะที่เราออกแบบแบบจำลองการไหลที่มีการบีบอัดอย่างหนักโมเดลที่เสนอนั้นต้องการทรัพยากรการคำนวณน้อยกว่าเมื่อเทียบกับแบบจำลองการสร้างรูปคลื่นอื่น ๆ ในระหว่างการฝึกอบรมและการอนุมาน แม้ว่าโมเดลจะถูกบีบอัดอย่างมาก แต่โพสต์กรองจะรักษาคุณภาพของรูปคลื่นที่สร้างขึ้นไว้ การใช้งาน Pytorch ของเราสามารถผ่านการฝึกอบรมโดยใช้หน่วยความจำ GPU น้อยกว่า 8 GB และสร้างตัวอย่างเสียงในอัตรามากกว่า 5,000 kHz บน Nvidia 1080Ti GPU นอกจากนี้แม้ว่าการสังเคราะห์ CPU เราแสดงให้เห็นว่าวิธีการที่เสนอนั้นสามารถสร้างรูปคลื่นคำพูด 44.1 kHz ได้เร็วกว่าแบบเรียลไทม์ 1.2 เท่า การทดลองยังแสดงให้เห็นว่าคุณภาพของเสียงที่สร้างขึ้นนั้นเปรียบได้กับวิธีการอื่น

เยี่ยมชม demopage สำหรับตัวอย่างเสียง

สิ่งที่ต้องทำ

รุ่นที่วางไว้ล่วงหน้า
รวมกับ tacotron2

ความต้องการ

Python> = 3.5.2
Torch> = 1.4.0
นม
คนขี้เกียจ
ดอง
คลังแสง
tensorboardx

การประมวลผลล่วงหน้า

การฝึกอบรม

ดาวน์โหลดคำพูด LJ ในตัวอย่างนี้อยู่ใน data/
สำหรับการฝึกอบรมให้เรียกใช้คำสั่งต่อไปนี้

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models >

สำหรับการฝึกอบรมโดยใช้แบบจำลองที่ผ่านการฝึกอบรมให้เรียกใช้คำสั่งต่อไปนี้

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --ckpt_pth= < pth/to/pretrained/model >

สำหรับการใช้ Tensorboard (ไม่บังคับ) ให้เรียกใช้คำสั่งต่อไปนี้

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --log_dir= < dir/to/logs >

การอนุมาน

สำหรับการสังเคราะห์ไฟล์ WAV ให้เรียกใช้คำสั่งต่อไปนี้

python3 inference.py --ckpt_pth= < pth/to/model > --src_pth= < pth/to/src/wavs > --res_pth= < pth/to/save/wavs >

แบบจำลอง

ทำงานระหว่างดำเนินการ

TTS

เราจะรวมคำแนะนำนี้เข้ากับ Tacotron2 ข้อมูลเพิ่มเติมและการสาธิต colab จะวางจำหน่ายที่นี่

การอ้างอิง

Waveglow โดย Nvidia
Parallelwavegan โดย Kan-Bayashi

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-22
ขนาด 13.71KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
wgcf

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด