Dies ist eine einfache App für die Aufzeichnung von Homebrew -TTS -Datensätzen, die mit Kivy in Python implementiert sind. Mit dem entworfenen Anwendungsfall wird die Textzeile nach Zeile angezeigt und eine feste Audiodauer aus dem Standardmikrofon basierend auf der angezeigten Textlänge aufgezeichnet. Die Lesegeschwindigkeit ist einstellbar und der Text kann durch einfache Steuerelemente navigiert werden, falls ein Satz aufgrund von Rauschen, Lautsprecherfehler usw. erneut aufgezeichnet werden muss.
Ich habe dies nur unter Mac OS und Ubuntu getestet. Ich denke, es kann unter Windows mit kleinen Änderungen ausgeführt werden. Ich habe die GUI auch nicht gut getestet und die Widget-Größen und -Paddings fest codiert, sodass die App in verschiedenen Fenstergrößen und Desktop-Auflösungen möglicherweise funky aussieht.
Benötigt Python 3.
pip install -r requirements.txt
python prompter.py
In der App wird der text in text.txt im selben Ordner gelesen und die Zeile für Zeile angezeigt. Drücken Sie die Record und sagen Sie den Satz, während die Recording... Text angezeigt wird. Die Aufzeichnung wird nach einiger Zeit automatisch angehalten. Wenn die zugewiesene Zeit zu wenig oder zu viel ist, können Sie sie mit dem Schieberegler für Ihre Lesegeschwindigkeit einstellen. Die Aufzeichnungen werden als .wav -Dateien bei 48000 kHz in ~/Desktop/TTS_dataset_recordings gespeichert, wobei die Dateinamen den Zeilennummern in text.txt entsprechen.