TTSDatasetRecorder
1.0.0
這是一個簡單的應用程序,用於錄製使用Kivy在Python實現的自製TTS數據集。設計的用例是根據顯示的文本長度顯示默認麥克風的固定音頻持續時間。閱讀速度是可以調節的,並且可以通過簡單控件導航文本,以防句子由於噪聲,揚聲器錯誤等,需要重新錄製句子。
我僅在Mac OS和Ubuntu上對此進行了測試,我認為它可以在Windows上進行小型修改。我也沒有很好地測試GUI,並且對小部件的尺寸和槳板進行了硬編碼,因此該應用程序可能會在不同的窗口尺寸和桌面分辨率上看起來很時髦。
需要Python 3。
pip install -r requirements.txt
python prompter.py
該應用程序將在同一文件夾中的text.txt中讀取文本,並按行顯示IT。按Record按鈕並在Recording...顯示文本。一段時間後,記錄將自動停止。如果分配的時間太少或太多,則可以使用滑塊對閱讀速度進行調整。錄製將被保存為.wav文件,位於~/Desktop/TTS_dataset_recordings中的48000 kHz,其文件名與text.txt中的行號相對應