Download etos tts - etos tts Download de código fonte

etos tts

Código-Fonte de IA

1.0.0

Baixar

Etos tts

O Etos TTS, visa construir um texto em fala (TTS) neural que é capaz de transformar o texto em fala em vozes que são amostradas na natureza. É uma implementação de tacotron pytorch: um modelo de síntese de texto para fala de ponta a ponta.

Uso

Requisitos

Python 3.6 ou mais tarde
pytorch 0.4 é testado
Para o Ubuntu, sudo apt install libsndfile1

Você pode usar o PIP para instalar outros requisitos.

pip3 install -r requirements.txt

Teste

Você pode usar o modelo pré -terenciado em models/may22 e executar o TTS Web Server:

python server.py -c server_conf.json

Em seguida, vá para http://127.0.0.1:8000 e aproveite.

Dados

Atualmente, o TTS fornece carregadores de dados para

LJ DISCURSO

Treinando a rede

Para executar seu próprio treinamento, você precisa definir um arquivo config.json (modelo simples abaixo) e ligar com o comando.

train.py --config_path config.json

Se você gosta de usar um conjunto específico de GPUs.

CUDA_VISIBLE_DEVICES="0,1,4" train.py --config_path config.json

Cada execução cria uma pasta de experimentos com a data e hora do CorreStonefing, na pasta que você define em config.json . E se ainda não houver ponto de verificação nessa pasta, ele será removido quando você pressionar Ctrl+C.

Você também pode desfrutar do Tensorboard com alguns bons registros de treinamento, se você apontar --logdir a pasta do experimento.

Exemplo config.json :

 {
  "num_mels": 80,
  "num_freq": 1025,
  "sample_rate": 22050,
  "frame_length_ms": 50,
  "frame_shift_ms": 12.5,
  "preemphasis": 0.97,
  "min_level_db": -100,
  "ref_level_db": 20,
  "embedding_size": 256,
  "text_cleaner": "english_cleaners",

  "epochs": 200,
  "lr": 0.002,
  "warmup_steps": 4000,
  "batch_size": 32,
  "eval_batch_size":32,
  "r": 5,
  "mk": 0.0,  // guidede attention loss weight. if 0 no use
  "priority_freq": true,  // freq range emphasis

  "griffin_lim_iters": 60,
  "power": 1.2,

  "dataset": "TWEB",
  "meta_file_train": "transcript_train.txt",
  "meta_file_val": "transcript_val.txt",
  "data_path": "/data/shared/BibleSpeech/",
  "min_seq_len": 0,
  "num_loader_workers": 8,

  "checkpoint": true,  // if save checkpoint per save_step
  "save_step": 200,
  "output_path": "/path/to/my_experiment",
}