Download do dctts2 - Download do código fonte do dctts2

dctts2

Código-Fonte de IA

1.0.0

Baixar

Texto profundo da convolução para a fala

Esta é uma implementação do artigo "Sistema de texto em fala com eficientemente treinável com base em redes convolucionais profundas com atenção guiada" https://arxiv.org/abs/1710.08969

O código é baseado nas seguintes implementações

https://github.com/keithito/tacotron.git
https://github.com/joisino/chainer-ettts.git
https://github.com/kyubyong/tacotron.git

O modelo treina "text2mel" e "ssrn" separadamente através de trensmel.py & TrainMag.py, respectivamente, você precisa baixar o conjunto de dados do LJSpeech disponível em https://keithito.com/lj-seech-dataset/

Amostras de áudio

Você pode ouvir amostras de áudio

Modelos pré-treinados podem ser baixados aqui

Prepare o conjunto de dados

Primeiro, você deve preparar o conjunto de dados. Se você deseja usar o conjunto de dados LJSpeech, pode usar os seguintes comandos.

 $ wget http://data.keithito.com/data/speech/LJSpeech-1.0.tar.bz2
$ tar xvf LJSpeech-1.0.tar.bz2
$ python prepro.py

Treine a rede Text2mel

 $ python trainmel.py

Durante o treinamento, você pode revisar a saída (por padrão a cada 200 minibatches), ele despeja os dois primeiros exemplos no lote em Mel0.png & Mel1.png também veja a atenção aprendida através de A0.png & a1.png

Mel

Atenção

Treine a rede SSRN

 $ python trainmag.py

Durante o treinamento, você pode visualizar a saída através do Mag0.png & Mag1.png, que compara o espectrograma aprendido com a verdade groung.

Mag

Sintetize

Para sintetizar um novo uso de sentença:

 $ python synth.py --text "sentance to synthesize" --file output.wav

Demo Web Server

Você pode executar um servidor da Demo Web para fazer TTS executando

 $ python server.py

Isso usa a estrutura do Flask para executar a demonstração

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-19
tamanho 2.11MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos