Download de AiVoice - Download do código -fonte AiVoice

Português

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Página Inicial>Relacionado com a programação>Código-Fonte de IA

AiVoice

Código-Fonte de IA

1.0.0

Baixar

Voz profunda 3

Esta é uma implementação do TensorFlow da Deep Voice 3: 2000-alto-falante texto em fala. Por enquanto, estamos apenas focando na síntese de alto -falante único.

Exigência

Tensorflow> = 1.2
Python> = 3.0

Conjunto de dados

O conjunto de dados de fala do LJ

Pré-processo

Download e descompacte o conjunto de dados de discurso LJ. Correr:

 python prepro.py

NOTA: Verifique se as abrigamos o conjunto de dados no mesmo foler de prepro.py .

Depois disso, teríamos três novas pastas:

 ├── dones          [New]
├── mags           [New]
├── mels           [New]
├── metadata.csv
├── README
└── wavs

Treinamento

Os dados de treinamento são carregados em ./LJSpeech-1.0/metadata.csv , ./LJSpeech-1.0/mels , ./LJSpeech-1.0/dones , ./LJSpeech-1.0/mags como padrão. Se quisermos alterar o caminho de carregamento, poderíamos alterar a configuração nos class Hyperparams .

Para treinar o modelo, usamos este comando:

 python train.py

Modelo pré-treinado

Atualmente, não podemos obter um bom resultado. No entanto, ainda fornecemos nosso modelo pré-treinado, caso alguém esteja interessado nele.

Modelo pré-treinado.

Sua figura de atenção é a seguinte:

Todos os números de atenção gerados no treinamento estão incluídos no arquivo zíper do modelo pré-treinado.

Descrição do arquivo

hyperparams.py: parâmetros hiper
Prepro.py: cria entradas e alvos, ou seja, espectrograma, magnitude e dones.
data_load.py
Utils.py: várias funções operacionais personalizadas.
Modules.py: Construindo blocos para as redes.
Networks.py: codificador, decodificador e conversor
TRIN.PY: Trem
synthesize.py: inferência
test_sents.txt: algumas frases de teste no papel.

Referência

A maior parte do código é emprestada de Kyubyong/DeepVoice3.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-20
tamanho 19.32KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos