Chinese FastSpeech2下载 - Chinese FastSpeech2源代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

Chinese FastSpeech2

Ai源码

1.0.0

下载

Chinese-FastSpeech2

基于标贝中文标准女声数据继续训练，同时对原论文的FastSpeech2模型做了改进，引入了韵律表征以及韵律预测模块，使中文发音更生动且富有节奏

20230402 更新

1、加入韵律模型训练代码，在BertProsody目录下
2、加入韵律模型训练的数据预处理代码（针对标贝数据，代码未整理，先放出来），在preprocessor/biaobei.py里

样例

参考samples中生成的音频

模型文件

本项目主体架构为FastSpeech2+HifiGAN结构，另外在输入阶段引入了中文文本的韵律向量，因此共有三个模型：fastspeech_model、hifigan_model、prosody_model（网盘链接，提取码：qgpi），下载后将模型文件放入指定的目录下：

8000.pth.tar ---> output/ckpt/biaobei/
generator_universal.pth.tar ---> hifigan/
best_model.pt ---> transformer/prosody_model/

预测

提供了两种预测方式：1）python synthesize_all.py；2）http接口调用

第一种方式是交互式，命令行运行python synthesize_all.py后，输入需要转换的文本，运行后会在代码会在当前工作目录下生成tmp.wav文件；
第二种方式是api调用，运行tts_server.py，会启动语音转文本的接口，调用该接口可参考TestServer.py，同样生成的音频文件(tmp.wav)会保存在当前工作目录下

训练

由于本项目参考FastSpeech2项目，如果想自定义训练，该项目提供了较为详细的训练方法可供参考；
本项目对原方法作了一些优化，优化部分可参考博客: 基于FastSpeech2优化的中文语音合成

本项目是出于个人兴趣在语音合成方面做的一些尝试，欢迎大家批评指正，多多交流！

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-24
大小 5.43MB
来自于 Github

相关应用

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
中文DOS游戏(Chinese DOS games in browser)项目源码正式版

2022-11-01

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部