TensorVox下载TensorVox源代码下载

TensorVox

Ai源码

TensorVox V1.0.0.0

下载

Tensorvox

Tensorvox是一种旨在在桌面中启用用户友好和轻巧的神经语音综合的应用程序，旨在提高对此类技术的可访问性。

它主要由TensorflowTTS供电，也由Coqui-TTS和Vits提供动力，它使用纯C ++/QT编写，使用TensorFlow C API与TensorFlow模型（前两个）进行交互，而libtorch则用于Pytorch。这样，我们就可以执行推断，而无需安装价值的Python库，只有几个DLL。

尝试一下

Google文档中的详细指南

从发行版中获取副本，提取.zip并检查Google Drive文件夹中的型号和安装说明

如果您有兴趣使用自己的型号，首先需要训练，然后导出它。

支持的体系结构

Tensorvox支持来自三个存储库的模型：

TensorFlowTTS ：FastSpeech2，Tacotron2，Char和Phoneme和Multi Band Melgan。这是一本COLAB笔记本，演示了如何导出识别的，基于Char的Tacotron2模型：
Coqui-TTS： Tacotron2（基于音素的IPA）和多波段梅尔根（Melgan），从Pytorch转换为张量。这是一个笔记本，显示如何导出LJSpeech DDC模型：
jaywalnut310/vits： Vits，这是一个完全E2E模型。（强调IPA作为音素）导出笔记本：

这两个例子应该为您提供足够的指导来了解所需的内容。如果您想专门为此目的培训模型，那么我建议使用TensorFlowTTS，因为它是具有最好的支持的型号，并且VITS，因为它是最接近语言的东西，因此为英语（Coqui and Tftts，vits，vits）提供了开箱即用的支持，德国和西班牙（只有Tensorflowtts）；也就是说，您无需做任何事情。您可以在不修改代码的情况下添加语言，只要音素集为IPA（压力或无施加），ARPA或全局电话（打开问题，我会向您解释）

建立说明

当前，仅支持Windows 10 X64（尽管我听说过它在8.1上运行的报道）。

要求：

QT创建者
MSVC 2017（V141）编译器

启动构建（所有提供的库）：

下载预编译的二进制依赖项，包括
解压缩它，以便deps文件夹与.pro和主源文件位于同一位置。
使用QT创建者打开项目，添加您的编译器并编译

请注意，要尝试使用闪亮的新可执行文件，您需要下载如上所述的程序发行版，并用新版本中的新版本替换新版本，因此您将所有DLL都置于适当的位置。

TODO：添加从头开始编译的说明。

外部（谢谢）

libtorch ：https：//pytorch.org/cppdocs/installing.html
Tensorflow C API ：https：//www.tensorflow.org/install/lang_c
cppflow （tf c api-> c ++包装器）：https：//github.com/serizba/cppflow
Audiofile （用于WAV导出）：https：//github.com/adamstark/audiofile
无框黑暗样式窗口：https：//github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
现代C ++的JSON ：https：//github.com/nlohmann/json
R8Brain-Free-SRC （重采样）：https：//github.com/avaneev/r8brain-free-src
rnnoise （cmake版本，降低输出）：https：//github.com/almogh52/rnnoise-cmake
Logitech LED照明SDK （鼠标RGB集成）：https：//www.logitechg.com/en-us/innovation/developer-lab.html
qcustomplot ：https：//www.qcustompoltot.com/index.php/introduction
libnumbertext ：https：//github.com/numbertext/libnumbertext