ดาวน์โหลด LightSpeech - ดาวน์โหลดซอร์สโค้ด LightSpeech

LightSpeech

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

แสง

การใช้ Pytorch อย่างไม่เป็นทางการของ LightSpeech: ข้อความที่มีน้ำหนักเบาและรวดเร็วในการพูดด้วยการค้นหาสถาปัตยกรรมประสาท repo นี้ใช้การใช้งาน Fastspeech 2 ของ ESPNET เป็นฐาน repo นี้ใช้เฉพาะรุ่นสุดท้ายของรุ่น Lightspeech ไม่ใช่การค้นหาสถาปัตยกรรมระบบประสาทตามที่กล่าวไว้ในกระดาษ

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x

ความต้องการ :

รหัสทั้งหมดที่เขียนใน Python 3.6.2

ติดตั้ง pytorch

ก่อนที่จะติดตั้ง pytorch โปรดตรวจสอบเวอร์ชัน cuda ของคุณโดยเรียกใช้คำสั่งต่อไปนี้: nvcc --version

 pip install torch torchvision

ใน repo นี้ฉันได้ใช้ pytorch 1.6.0 สำหรับคุณสมบัติ torch.bucketize ซึ่งไม่ได้อยู่ใน Pytorch เวอร์ชันก่อนหน้า

การติดตั้งข้อกำหนดอื่น ๆ :

 pip install -r requirements.txt

หากต้องการใช้ Tensorboard ติดตั้ง tensorboard version 1.14.0 Seperatly พร้อม tensorflow (1.14.0)

สำหรับการประมวลผลล่วงหน้า:

โฟลเดอร์ filelists ประกอบด้วย MFA (Motreal Force Aligner) ไฟล์ชุดข้อมูล LJSpeech ที่ประมวลผลดังนั้นคุณไม่จำเป็นต้องจัดเรียงข้อความด้วยเสียง (สำหรับการแยกระยะเวลา) สำหรับชุดข้อมูล LJSpeech สำหรับชุดข้อมูลอื่น ๆ ตามคำสั่งที่นี่ สำหรับการประมวลผลก่อนการประมวลผลอื่น ๆ คำสั่งต่อไปนี้:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

สำหรับการค้นหาขั้นต่ำและสูงสุดของ F0 และพลังงาน

 python .compute_statistics.py

อัปเดตต่อไปนี้ใน hparams.py โดย min และ max ของ F0 และพลังงาน

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

สำหรับการฝึกอบรม

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

เพื่อการอนุมาน

เช็ด

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

สำหรับการส่งออก Torchcript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

บันทึก :

สำหรับการโคลนเสียงที่สมบูรณ์และจบลงด้วยการจบเสียงหรือข้อความเป็นกล่องเครื่องมือ (TTS)? กรุณาเยี่ยมชมเทคโนโลยี Deepsync

การอ้างอิง

Lightspeech: ข้อความที่มีน้ำหนักเบาและรวดเร็วในการพูดด้วยการค้นหาสถาปัตยกรรมประสาท
FastSpeech 2: ข้อความแบบ end-to-end ที่รวดเร็วและคุณภาพสูงและคุณภาพสูง
FastSpeech: ข้อความที่รวดเร็วแข็งแกร่งและควบคุมได้เป็นคำพูด
Espnet
การใช้งาน Waveglow ของ Nvidia
Melgan
เกี่ยวกับทุเรียน
การใช้งาน FastSpeech2 TensorFlow
การใช้งาน Pytorch Fastspeech 2 อื่น ๆ
เวิร์นน์

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-14
ขนาด 3.27MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด