AiVoice下载 - AiVoice源代码下载

AiVoice

Ai源码

1.0.0

下载

深层声音3

这是深度语音3：2000扬声器神经文本到语音的张量实现。目前，我们只是专注于单扬声器的综合。

要求

TensorFlow> = 1.2
python> = 3.0

数据集

LJ语音数据集

预处理

下载并解开LJ语音数据集。跑步：

 python prepro.py

注意：请确保我们将数据集解压缩到prepro.py的同一foler中。

之后，我们将获得三个新文件夹：

 ├── dones          [New]
├── mags           [New]
├── mels           [New]
├── metadata.csv
├── README
└── wavs

训练

./LJSpeech-1.0/mags数据从./LJSpeech-1.0/metadata.csv ./LJSpeech-1.0/mels ./LJSpeech-1.0/dones 。如果我们想更改加载路径，我们可以更改class Hyperparams中的配置。

要训练模型，我们使用此命令：

 python train.py

预训练模型

目前，我们无法取得好成绩。但是，我们仍然提供我们的预培训模型，以防有人对此感兴趣。

预训练模型。

它的注意数如下：

在训练中产生的所有注意数字都包含在预训练的模型zpiped文件中。

文件说明

hyperparams.py：超级参数
prepro.py：创建输入和目标，即，MEL频谱图，幅度和Dones。
data_load.py
utils.py：几个自定义操作功能。
模块：网络的构建块。
Networks.py：编码器，解码器和转换器
train.py：火车
Synthesize.py：推理
test_sents.txt：论文中的一些测试句子。

参考

大部分代码都是从Kyubyong/DeepVoice3借来的。

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-20
大小 19.32KB
来自于 Github

AiVoice

深层声音3

要求

数据集

预处理

训练

预训练模型

文件说明

参考

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express