Il s'agit d'une application simple pour enregistrer des ensembles de données HomeBrew TTS, implémentés dans Python à l'aide de Kivy. Le cas d'utilisation conçu est d'afficher le texte ligne par ligne et d'enregistrer une durée fixe de l'audio à partir du microphone par défaut en fonction de la longueur de texte affichée. La vitesse de lecture est réglable et le texte peut être navigué par des contrôles simples au cas où une phrase doit être réenregistrée en raison du bruit, de l'erreur du haut-parleur, etc.
Je n'ai testé cela que sur Mac OS et Ubuntu, je pense qu'il peut fonctionner sur Windows avec de petites modifications. Je n'ai pas non plus testé l'interface graphique et codé en dur et les tailles de widgets et les pagnières, de sorte que l'application peut sembler funky à différentes tailles de fenêtre et résolutions de bureau.
Nécessite Python 3.
pip install -r requirements.txt
python prompter.py
L'application lira le texte dans text.txt dans le même dossier et l'affichera ligne par ligne. Appuyez sur le bouton Record et dites la phrase pendant que l' Recording... le texte s'affiche. L'enregistrement s'arrêtera automatiquement après un certain temps. Si le temps alloué est trop peu ou trop, vous pouvez l'ajuster pour votre vitesse de lecture à l'aide du curseur. Les enregistrements seront enregistrés sous forme de fichiers .wav à 48000 kHz dans ~/Desktop/TTS_dataset_recordings , avec les noms de fichiers correspondant aux numéros de ligne dans text.txt