Descargar KoreanTTS - Descargar el código fuente KoreanTTS

Español

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Inicio>Relacionado con la programación>Código Fuente de IA

KoreanTTS

Código Fuente de IA

1.0.0

Descargar

Coreanstts

Es un proyecto que combina el modelo Tacotron2 y el modelo Vocoder (Griffinlim, Wavenet, Melgan) para implementar TTS coreanos.

Residencia en

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

Conjunto de datos

Discurso de orador único de Corán
- Actor de voz femenina profesional (12 horas, WAV, 44100kHz, 12853, 3GB)
Voz del actor Yoo Inna
- Aumente el volumen de KBS Radio Yu Inna (3 horas, WAV, 16000KHz, 3327, 480.6MB)
- Discurso de Google a la API de texto
- Kakao Speech API
Entrenador de mascotas Kang Hyung -wook Voice
- API de evaluación coreana de ETRI

Los datos de audio realizados en el aprendizaje no se comparten con problemas de derechos de autor. Verifique cada fuente de datos.

KSS: https://www.kaggle.com/bryanpark/korean-le-peaker-sepeech-dataset
Radio KBS: http://program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

Preprocesamiento

Convertir el archivo wav en un archivo numpy
'Audio', 'mel', 'lineal', 'texto', etc.
Data/kss/＂nombre de archivo de voz.npz creación
Espectrograma MEL, espectrograma lineal Conjunto de respuestas correctas

Progreso del proyecto

Hay un total de cuatro aprendizaje.

Tacotron2 + griffinlim + sencillo
Tacotron2 + griffinlim + multiespeaker (voz profunda 2)
Tacotron2 + Melgan + altavoz único
Tacotron2 + Melgan + Multispeaker (Transfer Learning)

resultado

Tacotron2 + griffinlim + multiespeaker (kss + yoo inna) datos KSS
- AlignMnet (50000)
Tacotron2 + griffinlim + multiespeaker (kss + yoo en -na)
- Alineación (90000)
Tacotron2 + Melgan + SingleSpeaker (KSS)
- Alineación (90000)

Melgan_90000

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-22
tamaño 50.54MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo