นี่คือแอพง่ายๆสำหรับการบันทึกชุดข้อมูล Homebrew TTS ที่ใช้ใน Python โดยใช้ Kivy กรณีการใช้งานที่ออกแบบมาคือการแสดงข้อความทีละบรรทัดและบันทึกระยะเวลาที่คงที่ของเสียงจากไมโครโฟนเริ่มต้นตามความยาวข้อความที่แสดง ความเร็วในการอ่านสามารถปรับได้และข้อความสามารถนำทางด้วยการควบคุมอย่างง่ายในกรณีที่ประโยคจะต้องบันทึกอีกครั้งเนื่องจากเสียงรบกวนข้อผิดพลาดของลำโพง ฯลฯ
ฉันทดสอบสิ่งนี้บน Mac OS และ Ubuntu เท่านั้นฉันคิดว่ามันสามารถทำงานบน Windows ด้วยการปรับเปลี่ยนขนาดเล็ก ฉันยังไม่ได้ทดสอบ GUI ที่ดีและเข้ารหัสขนาดวิดเจ็ตและพายดังนั้นแอปอาจดูขี้ขลาดในขนาดหน้าต่างและความละเอียดของเดสก์ท็อปที่แตกต่างกัน
ต้องใช้ Python 3.
pip install -r requirements.txt
python prompter.py
แอพจะอ่านข้อความใน text.txt ในโฟลเดอร์เดียวกันและแสดงทีละบรรทัด กดปุ่ม Record และพูดประโยคในขณะที่ Recording... ข้อความจะปรากฏขึ้น การบันทึกจะหยุดโดยอัตโนมัติหลังจากเวลาผ่านไป หากเวลาที่กำหนดน้อยเกินไปหรือมากเกินไปคุณสามารถปรับได้สำหรับความเร็วในการอ่านของคุณโดยใช้ตัวเลื่อน การบันทึกจะถูกบันทึกเป็นไฟล์ .wav ที่ 48000 kHz ใน ~/Desktop/TTS_dataset_recordings พร้อมชื่อไฟล์ที่สอดคล้องกับหมายเลขบรรทัดใน text.txt