Unduh LightSpeech - Unduh Kode Sumber LightSpeech

LightSpeech

Kode Sumber AI

1.0.0

Unduh

Lightspeech

Implementasi Pytorch tidak resmi dari LightSpeech: Teks ringan dan cepat untuk berbicara dengan pencarian arsitektur saraf. Repo ini menggunakan implementasi FastSpeech 2 dari ESPNet sebagai basis. Repo ini hanya mengimplementasikan versi akhir model LightSpeech bukan pencarian arsitektur saraf seperti yang disebutkan dalam kertas.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

Persyaratan :

Semua kode yang ditulis dalam Python 3.6.2 .

Instal Pytorch

Sebelum menginstal pytorch, silakan periksa versi CUDA Anda dengan menjalankan perintah berikut: nvcc --version

 pip install torch torchvision

Dalam repo ini saya telah menggunakan pytorch 1.6.0 untuk fitur torch.bucketize yang tidak ada dalam versi Pytorch sebelumnya.

Memasang persyaratan lain:

 pip install -r requirements.txt

Untuk menggunakan Tensorboard Instal tensorboard version 1.14.0 Seperatly dengan tensorflow (1.14.0)

Untuk preprocessing:

Folder filelists berisi MFA (Motreal Force Aligner) yang diproses file dataset LJSPEECH sehingga Anda tidak perlu menyelaraskan teks dengan audio (untuk durasi ekstrak) untuk dataset LJSPEECH. Untuk dataset lain, ikuti instruksi di sini. Untuk perintah pengikut menjalankan pra-pemrosesan lainnya:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

Untuk menemukan min dan max f0 dan energi

 python .compute_statistics.py

Perbarui yang berikut di hparams.py oleh min dan max f0 dan energi

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

Untuk pelatihan

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

Untuk inferensi

WIP

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

Untuk ekspor Torchscript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

Catatan :

Untuk Kloning Suara yang Lebih Lengkap dan Akhir Ujung atau Kotak Kotak Teks ke Bicara (TTS)? Silakan kunjungi teknologi DeepSync.

Referensi

Lightspeech: teks ringan dan cepat untuk diucapkan dengan pencarian arsitektur saraf
FastSpeech 2: Teks ujung ke ujung berkualitas tinggi dan berkualitas tinggi
Fastspeech: teks cepat, kuat, dan terkendali untuk berbicara
Espnet
Implementasi Waveglow Nvidia
Melgan
Durian
Implementasi FastSpeech2 TensorFlow
Implementasi Pytorch Fastspeech 2 lainnya
Wavernn

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-14
ukuran 3.27MB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua