openai whisper realtime
1.0.0
นี่คือการทดลองอย่างรวดเร็วเพื่อให้ได้การถอดความเกือบเรียลไทม์โดยใช้ Whisper
ติดตั้งข้อกำหนด:
pip install -r requirements.txt
เรียกใช้สคริปต์:
python openai-whisper-realtime.py
การพึ่งพา:
แนะนำให้ใช้ CPU หรือ GPU ที่รวดเร็วมาก
อินพุตเสียงเริ่มต้นของระบบจะถูกจับด้วย Python แบ่งออกเป็นชิ้นเล็ก ๆ และถูกป้อนเข้ากับฟังก์ชั่นการถอดความดั้งเดิมของ OpenAI มันพยายาม (ปัจจุบันค่อนข้างไม่ดี) เพื่อตรวจจับการหยุดคำและไม่แบ่งบัฟเฟอร์เสียงในกรณีเหล่านั้น ด้วยวิธีการออกแบบโมเดลมันไม่สมเหตุสมผลที่สุดที่จะทำสิ่งนี้ แต่ฉันพบว่ามันน่าจะคุ้มค่าที่จะลอง มันทำงานได้ดี