通过Google语音转录音频,并通过扬声器分离(诊断)转录文本API。使用音频和关联的文本自动生成TTS数据集。使用Google API来转录已按最大沉默中断(建议)分开的切割。或使用EENEAS强制将文本对齐音频。快速校对和编辑切割。
对于Google对文本API的演讲,您将需要一个Google Cloud Platform帐户。您的$ Google_application_credentials env变量必须指向您的凭据JSON文件路径。 Google在新帐户上免费提供300美元的服务和3个月的免费服务。
运行Tools.py用于GUI工具。
当前的限制是您需要调整校对部分的列宽度,并且在导航条目时,必须将焦点从当前和下一个输入文本框中取下,或者文本框将无法更新。 Dearpy Gui的下一个版本将解决这些问题。
使用VPN会干扰长长的Google语音来文本API请求。


在妈妈们使用旧版本的Dearpygui,我最终将迁移。
pip安装numpy-用户
PIP安装pydub - 用户
pip安装dearpygui == 0.6.415-用户
PIP安装Google-Cloud语音 - 用户
PIP安装Google-Cloud-Storagory - 用户
PIP安装SimpleAudio-用户
*如果您无法构建SimpereAudio,请确保安装了GCC:Sudo Apt-GET更新,Sudo Apt-get install build-esentersentss
PIP安装Sox-用户
建议使用Linux环境,以适用于AENEAS选项,在Windows aeneas中,由于内存问题,将无法进行更长的削减。
WGET https://raw.githubusercontent.com/readbeyond/aeneas/master/install_depperencies.sh
bash install_dependencies.sh
pip安装numpy-用户
PIP安装埃涅阿斯 - 用户
测试安装:python -m aeneas.diarostics
PIP安装pydub - 用户
pip安装dearpygui == 0.6.415-用户
PIP安装Google-Cloud语音 - 用户
PIP安装Google-Cloud-Storagory - 用户
PIP安装SimpleAudio-用户
PIP安装Sox-用户
如果您遇到Libpython错误:
sudo apt install libasound2-dev
通过键入:sudo nano〜/.bashrc编辑bashrc文件
然后,根据您的包装的安装在何处,并在结尾处添加该行:
导出ld_library_path =“/[yourhomepath]/anaconda3/envs/[yourenv]/lib/“”
或者
导出ld_library_path =“/[yourhomepath]/。conda/envs/[yourenv]/lib/'
或者如果基本环境
导出ld_library_path =“/[yourhomepath]/anaconda3/lib/'
按CTRL+O导出更新的文件。然后ctrl+x退出。
键入源〜/.bashrc启用新路径。
视频教程:https://www.youtube.com/watch?v=te7pui2xeje
尽管您应该始终在培训前校对它们,但有几件事将提高您的削减质量。对于英语以外的其他语言,您可以轻松地编辑AENEAS命令行和字符替换为您的需求,并用您的语言代码(https://cloud.google.com/speech-toece-toxt-text/docs/languages)替换Google en-us语言代码。检查是否包括章节标题之类的内容。发言缓慢甚至节奏的扬声器将使最干净的剪辑削减,而快节奏的扬声器倾向于一起运行单词,并可能导致一些单词,单词,将其转移到下一个必须进行编辑的切割中。如果可以的话,请删除所有音乐。