Téléchargement KoreanTTS - Téléchargement du code source KoreanTTS

Français

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Page d'accueil>Lié à la programmation>Code Source AI

KoreanTTS

Code Source AI

1.0.0

Télécharger

Coréantts

Il s'agit d'un projet qui combine le modèle Tacotron2 et le modèle Vocoder (Griffinlim, Wavenet, Melgan) pour mettre en œuvre des TT coréens.

Basé sur

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

Ensemble de données

Discours de conférencier unique Koran
- Actor de la voix professionnelle (12 heures, Wav, 44100khz, 12853, 3 Go)
La voix de l'acteur Yoo Inna
- Augmentez le volume de KBS Radio Yu Inna (3 heures, Wav, 16000 kHz, 3327, 480,6 Mo)
- API Google Speech to SMS
- API de discours Kakao
Pet Pet Trainer Kang Hyung - VOIRE
- API d'évaluation coréenne etri

Les données audio menées sur l'apprentissage ne sont pas partagées avec les problèmes de droit d'auteur. Veuillez vérifier chaque source de données.

KSS: https://www.kaggle.com/bryanpark/korean-le-speaker-disech-dataset
KBS Radio: http://program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

Prétraitement

Convertir le fichier WAV en un fichier Numpy
«Audio», «Mel», «linéaire», «texte», etc.
Data / kSS / ＂nom de fichier vocal.NPZ Création
Spectrogramme de Mel, ensemble de réponses correct-spectrogramme linéaire

Projet de progrès

Il y a un total de quatre apprentissage.

Tacotron2 + Griffinlim + singleSpeaker
Tacotron2 + Griffinlim + Multippeaker (voix profonde 2)
Tacotron2 + Melgan + Président unique
Tacotron2 + Melgan + Multippeaker (apprentissage transfert)

résultat

Tacotron2 + Griffinlim + Multippeaker (KSS + YOO INNA) KSS DATA
- Alignmnet (50000)
Tacotron2 + Griffinlim + Multippeaker (KSS + Yoo in -na)
- Alignement (90000)
Tacotron2 + Melgan + singleSpeaker (KSS)
- Alignement (90000)

MELGAN_90000

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-22
taille 50.54MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout