TTSDatasetRecorder
1.0.0
这是一个简单的应用程序,用于录制使用Kivy在Python实现的自制TTS数据集。设计的用例是根据显示的文本长度显示默认麦克风的固定音频持续时间。阅读速度是可以调节的,并且可以通过简单控件导航文本,以防句子由于噪声,扬声器错误等,需要重新录制句子。
我仅在Mac OS和Ubuntu上对此进行了测试,我认为它可以在Windows上进行小型修改。我也没有很好地测试GUI,并且对小部件的尺寸和桨板进行了硬编码,因此该应用程序可能会在不同的窗口尺寸和桌面分辨率上看起来很时髦。
需要Python 3。
pip install -r requirements.txt
python prompter.py
该应用程序将在同一文件夹中的text.txt中读取文本,并按行显示IT。按Record按钮并在Recording...显示文本。一段时间后,记录将自动停止。如果分配的时间太少或太多,则可以使用滑块对阅读速度进行调整。录制将被保存为.wav文件,位于~/Desktop/TTS_dataset_recordings中的48000 kHz,其文件名与text.txt中的行号相对应