KoreanTTS下载 - KoreanTTS代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

KoreanTTS

Ai源码

1.0.0

下载

韩国人

这是一个结合了Tacotron2模型和Vocoder模型（Griffinlim，Wavenet，Melgan）来实施韩国TTS的项目。

基于

https://github.com/tensorspeech/tensorflowtts
https://github.com/hccho2/tacotron2-korean-tts
https://carpedm20.github.io/tacotron/

数据集

《古兰经单扬声器》演讲
- 专业的女配音演员（12小时，WAV，44100KHz，12853，3GB）
演员Yoo Inna的声音
- 增加KBS无线电YU INNA的体积（3小时，WAV，16000KHz，3327，480.6MB）
- Google对文字API的演讲
- Kakao演讲API
宠物宠物教练康亨-Wook声音
- ETRI韩国评估API

对学习进行的音频数据没有与版权问题共享。请检查每个数据源。

KSS：https：//www.kaggle.com/bryanpark/korean-le-speaker-spech-dataset
KBS广播：http：//program.kbs.co.kr/2fm/radio/uvolum/pc/index.html

预处理

将WAV文件转换为numpy文件
“音频”，“梅尔”，“线性”，“文本”，等。
data/kss/＂语音文件名.npz创建
MEL光谱图，线性光谱图正确答案集

项目进度

共有四个学习。

TACOTRON2 + Griffinlim +单身扬声器
tacotron2 + griffinlim + MultiSpeaker（Deep Voice 2）
tacotron2 +梅尔根 +单扬声器
TACOTRON2 + Melgan + MultiSpeaker（转移学习）

结果

TACOTRON2 + Griffinlim + MultiSpeaker（KSS + Yoo Inna）KSS数据
- Alignmnet（50000）
TACOTRON2 + GRIFFINLIM + MULTISPEAKER（-na中的KSS + YOO）
- 对齐（90000）
TACOTRON2 + Melgan +单身座谈会（KSS）
- 对齐（90000）

Melgan_90000

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-22
大小 50.54MB
来自于 Github

相关应用

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部