download etos tts - download kode sumber etos tts

etos tts

Kode Sumber AI

1.0.0

Unduh

Etos TTS

ETOS TTS, bertujuan untuk membangun teks-ke-pidato saraf (TTS) yang mampu mengubah teks menjadi ucapan dalam suara-suara yang disampel di alam liar. Ini adalah implementasi Pytorch dari Tacotron: model sintesis teks-ke-end-to-end sepenuhnya.

Penggunaan

Persyaratan

Python 3.6 atau lebih
Pytorch 0.4 diuji
Untuk ubuntu, sudo apt install libsndfile1

Anda dapat menggunakan PIP untuk memasang persyaratan lain.

pip3 install -r requirements.txt

Pengujian

Anda dapat menggunakan model pretrained di bawah models/may22 dan menjalankan server web TTS:

python server.py -c server_conf.json

Kemudian buka http://127.0.0.1:8000 dan nikmati.

Data

Saat ini TTS menyediakan loader data untuk

Pidato LJ

Melatih jaringan

Untuk menjalankan pelatihan Anda sendiri, Anda perlu mendefinisikan file config.json (templat sederhana di bawah) dan hubungi dengan perintah.

train.py --config_path config.json

Jika Anda suka menggunakan set GPU tertentu.

CUDA_VISIBLE_DEVICES="0,1,4" train.py --config_path config.json

Setiap run membuat folder percobaan dengan tanggal dan waktu corresponfing, di bawah folder yang Anda atur di config.json . Dan jika belum ada pos pemeriksaan di bawah folder itu, itu akan dihapus saat Anda menekan Ctrl+C.

Anda juga dapat menikmati Tensorboard dengan beberapa log pelatihan yang bagus, jika Anda menunjuk --logdir folder percobaan.

Contoh config.json :

 {
  "num_mels": 80,
  "num_freq": 1025,
  "sample_rate": 22050,
  "frame_length_ms": 50,
  "frame_shift_ms": 12.5,
  "preemphasis": 0.97,
  "min_level_db": -100,
  "ref_level_db": 20,
  "embedding_size": 256,
  "text_cleaner": "english_cleaners",

  "epochs": 200,
  "lr": 0.002,
  "warmup_steps": 4000,
  "batch_size": 32,
  "eval_batch_size":32,
  "r": 5,
  "mk": 0.0,  // guidede attention loss weight. if 0 no use
  "priority_freq": true,  // freq range emphasis

  "griffin_lim_iters": 60,
  "power": 1.2,

  "dataset": "TWEB",
  "meta_file_train": "transcript_train.txt",
  "meta_file_val": "transcript_val.txt",
  "data_path": "/data/shared/BibleSpeech/",
  "min_seq_len": 0,
  "num_loader_workers": 8,

  "checkpoint": true,  // if save checkpoint per save_step
  "save_step": 200,
  "output_path": "/path/to/my_experiment",
}