KoreanTTSダウンロードKoreanTTSソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

KoreanTTS

AI ソースコード

1.0.0

ダウンロード

韓国語

これは、Tacotron2モデルとボコーダーモデル（Griffinlim、Wavenet、Melgan）を組み合わせて韓国のTTを実装するプロジェクトです。

に基づく

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

データセット

コーラン単一スピーカースピーチ
- プロの女性声優（12時間、WAV、44100KHz、12853、3GB）
俳優のユ・インナの声
- KBS RadioYu Innaの量を増やす（3時間、WAV、16000kHz、3327、480.6MB）
- テキストAPIへのGoogleスピーチ
- Kakao Speech API
ペットのペットトレーナーKang Hyung -Wook Voice
- Etri Korean Appraisal API

学習で実施されたオーディオデータは、著作権の問題と共有されていません。各データソースを確認してください。

KSS：https：//www.kaggle.com/bryanpark/korean-le-speaker-speech-dataset
KBSラジオ：http：//program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

前処理

WAVファイルをnumpyファイルに変換します
「オーディオ」、「メル」、「線形」、「テキスト」など
data/kss/＂音声ファイルname.npz作成
メルスペクトルグラム、線形スペクトルグラムの正解セット

プロジェクトの進捗

合計4つの学習があります。

Tacotron2 + Griffinlim + Singlespeaker
Tacotron2 + Griffinlim + Multispeaker（Deep Voice 2）
Tacotron2 + Melgan +シングルスピーカー
Tacotron2 + Melgan + Multispeaker（転送学習）

結果

tacotron2 + griffinlim + multispeaker（kss + yoo inna）KSSデータ
- alignmnet（50000）
tacotron2 + griffinlim + multispeaker（kss + yoo in -na）
- アライメント（90000）
Tacotron2 + Melgan + Singlespeaker（KSS）
- アライメント（90000）

melgan_90000

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-22
サイズ 50.54MB
から Github

関連アプリ

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ML stack

AI ソースコード

1.0.0
awesome free chatgpt

AI ソースコード

1.0.0
pywin_contextmenu

AI ソースコード

Version update
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて