TTS dataset tools下载TTS dataset tools源代码下载

TTS dataset tools

Ai源码

1.0.0

下载

tts-dataset-tools

通过Google语音转录音频，并通过扬声器分离（诊断）转录文本API。使用音频和关联的文本自动生成TTS数据集。使用Google API来转录已按最大沉默中断（建议）分开的切割。或使用EENEAS强制将文本对齐音频。快速校对和编辑切割。

对于Google对文本API的演讲，您将需要一个Google Cloud Platform帐户。您的$ Google_application_credentials env变量必须指向您的凭据JSON文件路径。 Google在新帐户上免费提供300美元的服务和3个月的免费服务。

运行Tools.py用于GUI工具。

当前的限制是您需要调整校对部分的列宽度，并且在导航条目时，必须将焦点从当前和下一个输入文本框中取下，或者文本框将无法更新。 Dearpy Gui的下一个版本将解决这些问题。

使用VPN会干扰长长的Google语音来文本API请求。

GUI数据集

在妈妈们使用旧版本的Dearpygui，我最终将迁移。

Windows设置

pip安装numpy-用户

PIP安装pydub - 用户

pip安装dearpygui == 0.6.415-用户

PIP安装Google-Cloud语音 - 用户

PIP安装Google-Cloud-Storagory - 用户

PIP安装SimpleAudio-用户

*如果您无法构建SimpereAudio，请确保安装了GCC：Sudo Apt-GET更新，Sudo Apt-get install build-esentersentss

PIP安装Sox-用户

Linux设置

建议使用Linux环境，以适用于AENEAS选项，在Windows aeneas中，由于内存问题，将无法进行更长的削减。

WGET https://raw.githubusercontent.com/readbeyond/aeneas/master/install_depperencies.sh

bash install_dependencies.sh

pip安装numpy-用户

PIP安装埃涅阿斯 - 用户

测试安装：python -m aeneas.diarostics

PIP安装pydub - 用户

pip安装dearpygui == 0.6.415-用户

PIP安装Google-Cloud语音 - 用户

PIP安装Google-Cloud-Storagory - 用户

PIP安装SimpleAudio-用户

PIP安装Sox-用户

如果您遇到Libpython错误：

sudo apt install libasound2-dev

通过键入：sudo nano〜/.bashrc编辑bashrc文件

然后，根据您的包装的安装在何处，并在结尾处添加该行：

导出ld_library_path =“/[yourhomepath]/anaconda3/envs/[yourenv]/lib/“”

或者

导出ld_library_path =“/[yourhomepath]/。conda/envs/[yourenv]/lib/'

或者如果基本环境

导出ld_library_path =“/[yourhomepath]/anaconda3/lib/'

按CTRL+O导出更新的文件。然后ctrl+x退出。

键入源〜/.bashrc启用新路径。

用法

视频教程：https：//www.youtube.com/watch?v=te7pui2xeje

建议

尽管您应该始终在培训前校对它们，但有几件事将提高您的削减质量。对于英语以外的其他语言，您可以轻松地编辑AENEAS命令行和字符替换为您的需求，并用您的语言代码（https://cloud.google.com/speech-toece-toxt-text/docs/languages）替换Google en-us语言代码。检查是否包括章节标题之类的内容。发言缓慢甚至节奏的扬声器将使最干净的剪辑削减，而快节奏的扬声器倾向于一起运行单词，并可能导致一些单词，单词，将其转移到下一个必须进行编辑的切割中。如果可以的话，请删除所有音乐。

展开

附加信息