Unduh AiVoice - Unduh Kode Sumber AiVoice

AiVoice

Kode Sumber AI

1.0.0

Unduh

Suara dalam 3

Ini adalah implementasi TensorFlow dari Deep Voice 3: 2000-speaker neural text-to-speech. Untuk saat ini, kami hanya fokus pada sintesis speaker tunggal.

Persyaratan

TensorFlow> = 1.2
Python> = 3.0

Dataset

Dataset Pidato LJ

Pra-proses

Unduh dan unzip dataset LJ Speech. Berlari:

 python prepro.py

CATATAN: Pastikan kami telah membuka ritsleting dataset ke foler prepro.py yang sama.

Setelah ini, kami akan mendapatkan tiga folder baru:

 ├── dones          [New]
├── mags           [New]
├── mels           [New]
├── metadata.csv
├── README
└── wavs

Pelatihan

Data pelatihan dimuat dari ./LJSpeech-1.0/metadata.csv , ./LJSpeech-1.0/mels , ./LJSpeech-1.0/dones , ./LJSpeech-1.0/mags sebagai default. Jika kami ingin mengubah jalur pemuatan, kami dapat mengubah konfigurasi di class Hyperparams .

Untuk melatih model, kami menggunakan perintah ini:

 python train.py

Model pra-terlatih

Saat ini, kami tidak bisa mendapatkan hasil yang baik. Namun, kami masih menyediakan model pra-terlatih kami jika seseorang tertarik padanya.

Model pra-terlatih.

Angka perhatiannya adalah sebagai berikut:

Semua angka perhatian yang dihasilkan pada pelatihan termasuk dalam file zip model pra-terlatih.

Deskripsi file

Hyperparams.py: Parameter Hyper
Prepro.py: Membuat input dan target, yaitu, spektrogram Mel, besarnya, dan dones.
data_load.py
utils.py: Beberapa fungsi operasional khusus.
modules.py: blok bangunan untuk jaringan.
networks.py: encoder, decoder, dan converter
train.py: kereta api
Sintesis.py: Inferensi
test_sents.txt: Beberapa kalimat pengujian di koran.