Download KoreanTTS - Download do código fonte KoreanTTS

Português

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Página Inicial>Relacionado com a programação>Código-Fonte de IA

KoreanTTS

Código-Fonte de IA

1.0.0

Baixar

Cor da Corentts

É um projeto que combina o modelo Tacotron2 e o modelo de vocoder (Griffinlim, Wavenet, Melgan) para implementar o TTS coreano.

Baseado em

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

Conjunto de dados

Discurso de alto -falante do Alcorão
- Feminina de dublador profissional (12 horas, WAV, 44100KHz, 12853, 3 GB)
Voz do ator Yoo Inna
- Aumente o volume da KBS Radio Yu Inna (3 horas, WAV, 16000KHz, 3327, 480,6MB)
- API do Discurso para Texto do Google
- API de fala de Kakao
Pet Pet Trainer Kang Hyung -wok Voice
- API de avaliação coreana ETRI

Os dados de áudio realizados sobre aprendizado não são compartilhados com problemas de direitos autorais. Verifique cada fonte de dados.

KSS: https://www.kaggle.com/bryanpark/korean-le-speaker-peath-dataset
Rádio KBS: http://program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

Pré -processamento

Converta o arquivo WAV em um arquivo Numpy
'Audio', 'Mel', 'Linear', 'Text', etc.
Data/KSS/＂Nome do arquivo de voz.npz criação
MEL-Spectrograma, Conjunto de respostas corretas de espectrograma linear

Progresso do projeto

Há um total de quatro aprendizado.

Tacotron2 + griffinlim + singlespeaker
Tacotron2 + Griffinlim + MultisSpeaker (Voz Deep 2)
Tacotron2 + melgan + alto -falante
Tacotron2 + Melgan + Multisispaker (Learning de Transferência)

resultado

Tacotron2 + Griffinlim + MultisSpeaker (KSS + Yoo Inna) Dados KSS
- AlignMnet (50000)
Tacotron2 + Griffinlim + MultisSpeaker (KSS + Yoo em -na)
- Alinhamento (90000)
Tacotron2 + Melgan + Singlespeaker (KSS)
- Alinhamento (90000)

MELGAN_90000

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-22
tamanho 50.54MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos