KoreanTTS下載 - KoreanTTS代碼下載

中文(繁体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首頁>編程相關>Ai源碼

KoreanTTS

Ai源碼

1.0.0

下載

韓國人

這是一個結合了Tacotron2模型和Vocoder模型（Griffinlim，Wavenet，Melgan）來實施韓國TTS的項目。

基於

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

數據集

《古蘭經單揚聲器》演講
- 專業的女配音演員（12小時，WAV，44100KHz，12853，3GB）
演員Yoo Inna的聲音
- 增加KBS無線電YU INNA的體積（3小時，WAV，16000KHz，3327，480.6MB）
- Google對文字API的演講
- Kakao演講API
寵物寵物教練康亨-Wook聲音
- ETRI韓國評估API

對學習進行的音頻數據沒有與版權問題共享。請檢查每個數據源。

KSS：https：//www.kaggle.com/bryanpark/korean-le-speaker-spech-dataset
KBS廣播：http：//program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

預處理

將WAV文件轉換為numpy文件
“音頻”，“梅爾”，“線性”，“文本”，等。
data/kss/＂語音文件名.npz創建
MEL光譜圖，線性光譜圖正確答案集

項目進度

共有四個學習。

TACOTRON2 + Griffinlim +單身揚聲器
tacotron2 + griffinlim + MultiSpeaker（Deep Voice 2）
tacotron2 +梅爾根 +單揚聲器
TACOTRON2 + Melgan + MultiSpeaker（轉移學習）

結果

TACOTRON2 + Griffinlim + MultiSpeaker（KSS + Yoo Inna）KSS數據
- Alignmnet（50000）
TACOTRON2 + GRIFFINLIM + MULTISPEAKER（-na中的KSS + YOO）
- 對齊（90000）
TACOTRON2 + Melgan +單身座談會（KSS）
- 對齊（90000）

Melgan_90000

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-08-22
大小 50.54MB
來自於 Github

相關應用

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部