Unduh deepaudio tts - Unduh Kode Sumber deepaudio tts

deepaudio tts

Kode Sumber AI

1.0.0

Unduh

Apa itu deepaudio-tts?

DeepAudio-TTS adalah kerangka kerja untuk melatih model Text-to-Speech (TTS) berbasis jaringan saraf. Ini memasukkan atau akan mencakup arsitektur jaringan saraf yang populer untuk model TT dan Vocoder.

Untuk memudahkan menggunakan berbagai fungsi seperti presisi campuran, pelatihan multi-node, dan pelatihan TPU dll, saya memperkenalkan pencahayaan pytorch dan hydra dalam kerangka kerja ini. Itu masih dalam pengembangan.

Contoh pelatihan

Preprocess data Anda. (Script segera datang, atau Anda dapat mengikuti tutorial pidato dayung untuk langkah ini.)
Latih modelnya. Anda dapat memilih satu percobaan di DeepAudio/TTS/CLI/Configs/Experiment. Kemudian latih model dengan garis berikut:

 $ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata

Model yang didukung

Tacotron2
Fastspeech2
Transformer TTS
Paralel Wavegan
Hifigan
Vit

Rencana ke depan

kode bersih

Hapus kode yang berlebihan.
buat deepaudio.tts.models lebih bersih.

Model

Model lain.
Model pretrained.

Penyebaran

onnx
jit

Cara berkontribusi pada deepaudio-tts

Ini adalah proyek pribadi. Jadi saya tidak memiliki cukup sumber daya GPU untuk melakukan banyak percobaan. Proyek ini masih dalam pengembangan. Saya menghargai segala jenis umpan balik atau kontribusi. Silakan membuat tarikan requsest untuk beberapa masalah kecil seperti perbaikan bug, hasil percobaan. Jika Anda memiliki pertanyaan, buka masalah.