mandarin tts下载 - mandarin tts源代码下载

mandarin tts

Ai源码

1.0.0

下载

中国普通话文本（MTTS）

这是一个模块化的文本到语音框架，旨在支持快速的研究和产品发展。主要功能包括

所有模块均可通过yaml配置
支持和配置扬声器嵌入 /韵律嵌入 /多流文本嵌入，
适配器支持各种声码器（VOCGAN，HIFI-GAN，WAVEGLOW，MELGAN）
支持持续时间/音高/能量方差预测器，并且可以轻松添加其他方差，
还有更多关于路线图。

欢迎捐款。

音频样本

在这里查看演示

此处添加了有趣的Aishell3的有趣音频样本。
GitHub页面还托管了Biaobei和Aishell3数据集的一些示例。

快速开始

安装

 git clone https://github.com/ranchlai/mandarin-tts.git
cd mandarin-tts
git submodule update --force --recursive --init --remote
pip install -e . f

训练

这里提供了两个例子：Biaobei和Aishell3。

要训练自己的型号，请首先从现有示例中制作副本，然后使用wav2mel.py准备MelspectRogragron功能

 cd examples
python wav2mel.py -c ./aishell3/config.yaml -w < aishell3_wav_folder > -m < mel_folder > -d cpu

准备培训所需的SCP文件，

 cd examples/aishell3
python prepare.py --wav_folder < aishell3_wav_folder >  --mel_folder < mel_folder > --dst_folder ./train/

这将生成config.yaml所需的SCP文件（在数据集/火车部分中）。您还需要检查配置文件中的所有内容是否正常。通常，您不需要更改代码。

现在您可以开始培训

 cd examples/aishell3
python ../../mtts/train.py -c config.yaml -d cuda

对于Biaobei数据集，工作流程相同，除了没有扬声器嵌入，但您可以添加韵律嵌入。

将添加更多示例。请留下。

合成

预估计的MTT检查点

当前提供了两个示例，并总结了相应的检查点/配置，如下所示。

数据集	检查点	config
aishell3	关联	关联
Biaobei	关联	关联

支持的声码器

Vocoder的作用是将Melspectrograms转换为波形。它们被添加为子模型，并将接受该项目的培训。因此，您应该在合成之前下载检查站。在培训中，不是必需的，因为您可以从生成的Melspectrogram和损失曲线中监视训练过程。当前我们支持以下声音编码器，

Vocoder	检查点	github
浪潮	关联	关联
hifi-gan	关联	关联
vocgan	链接链接	关联
梅尔根	关联	关联

运行git submodule update --force --recursive --init --remote 。但是，您必须手动下载检查点并正确设置config.yaml文件中的路径。

准备输入文本

input.txt应与您在配置文件中的eng_type_n的设置设置为emb_type1，即，同一类型，相同的订单。

为了促进Hanzi到Pinyin的转录，您可以尝试：

 cd examples/aishell3/
python ../../mtts/text/gp2py.py -t "为适应新的网络传播方式和读者阅读习惯"
>> sil wei4 shi4 ying4 xin1 de5 wang3 luo4 chuan2 bo1 fang1 shi4 he2 du2 zhe3 yue4 du2 xi2 guan4 sil|sil 为 适 应 新 的 网 络 传 播 方 式 和 读 者 阅 读 习 惯 sil

不是您可以将文本复制到input.txt，并记住放下由'|'隔开的自定义名称和扬声器ID。

综合您的海浪

有了上述检查点和文本准备就绪，您最终可以运行综合过程，

python ../../mtts/synthesize.py  -d cuda --c config.yaml --checkpoint ./checkpoints/checkpoint_1240000.pth.tar -i input.txt

请检查Vocoder设置的Config.yaml文件。

如果幸运的话，可以在输出文件夹中找到音频示例。

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-21
大小 50.36MB
来自于 Github

mandarin tts

中国普通话文本（MTTS）

音频样本

快速开始

安装

训练

合成

预估计的MTT检查点

支持的声码器

准备输入文本

综合您的海浪

GitHub sgrebnov/cordova plugin background download

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

F5 TTS ComfyUI

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

语音开发英文资料(TTS使用指南Delphi版)

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express