KoreanTTS 다운로드 - KoreanTTS 소스 코드 다운로드

한국어

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

홈페이지>프로그래밍 관련>AI 소스 코드

KoreanTTS

AI 소스 코드

1.0.0

다운로드

KoreanTTS

Tacotron2 모델과 Vocoder모델(Griffinlim, Wavenet, MelGan)을 결합하여 한국어 TTS를 구현하는 프로젝트입니다.

Based on

https://github.com/TensorSpeech/TensorFlowTTS
https://github.com/hccho2/Tacotron2-Wavenet-Korean-TTS
https://carpedm20.github.io/tacotron/

Dataset

Koran Single Speaker Speech
- 전문여자성우(12시간, wav, 44100khz, 12853개, 3GB)
배우 유인나 목소리
- KBS 라디오 유인나의 볼륨을 높여요(3시간, wav, 16000khz, 3327개, 480.6MB)
- Google Speech to Text API
- Kakao Speech API
반려동물 훈련사 강형욱 목소리
- ETRI 한국어 인식 API

학습에 진행한 오디오 데이터는 저작권 문제로 공유하지 않습니다. 각 데이터 출처에서 확인해주세요.

KSS: https://www.kaggle.com/bryanpark/korean-single-speaker-speech-dataset
KBS 라디오: http://program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

Preprocessing

wav 파일을 numpy 파일로 변환
‘audio’, ‘mel’, ‘linear’, ‘text’ 등의 메타데이터를 묶어 저장
Data/kss/＂음성파일이름.npz＂ 생성
Mel-spectrogram, Linear-spectrogram 정답셋을 생성

Project 진행

총 4가지의 학습을 진행하였습니다.

Tacotron2 + GriffinLim + Singlespeaker
Tacotron2 + GriffinLim + Multispeaker(Deep Voice 2)
Tacotron2 + Melgan + Single Speaker
Tacotron2 + Melgan + Multispeaker (Transfer learning)

결과

Tacotron2 + GriffinLim + Multispeaker(KSS + 유인나) 중 KSS 데이터
- Alignmnet (50000)
Tacotron2 + GriffinLim + Multispeaker(KSS + 유인나) 중 유인나 데이터
- Alignment(90000)
Tacotron2 + MelGan + Singlespeaker(KSS)
- Alignment(90000)

melgan_90000

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-22
크기 50.54MB
출처 Github

관련 애플리케이션

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

추천

chat.petals.dev

기타 소스코드

1.0.0
GPT Prompt Templates

기타 소스코드

1.0.0
GPTyped

기타 소스코드

GPTyped 1.0.5
ML stack

AI 소스 코드

1.0.0
awesome free chatgpt

AI 소스 코드

1.0.0
pywin_contextmenu

AI 소스 코드

Version update
Google Dorks

기타 소스코드

1.0
shepherd

기타 소스코드

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

기타 소스코드

v1.1.0-rc-3

관련 정보 전체