การโต้ตอบด้วยเสียงที่ไร้รอยต่อและเรียลไทม์กับ AI
คำแนะนำ: ใครก็ตามที่สนใจในการแก้ปัญหาเสียงที่ล้ำสมัยโปรด ดูที่ Linguflex ด้วย มันช่วยให้คุณควบคุมสภาพแวดล้อมของคุณโดยการพูดและเป็นหนึ่งในผู้ช่วยโอเพนซอร์ซที่มีความสามารถและมีความซับซ้อนมากที่สุดในปัจจุบัน
ใช้การสตรีมอินพุต Faster_whisper และ Elevenlabs สำหรับการตอบสนองต่อเวลาแฝงต่ำสำหรับอินพุตที่พูด
- ดูวิดีโอสาธิต
หมายเหตุ : การสาธิตดำเนินการในการเชื่อมต่อ 10Mbit/s ดังนั้นประสิทธิภาพที่แท้จริงอาจน่าประทับใจมากขึ้นในการเชื่อมต่อที่เร็วขึ้น
voice_talk_vad.py - ตรวจจับคำพูดโดยอัตโนมัติ
voice_talk.py - สลับการบันทึกเปิด/ปิดด้วยสเปซบาร์
แทนที่ your_openai_key และ your_elevenlabs_key ด้วยค่าคีย์ OpenAI และ ElevenLabs API ของคุณในรหัส
ติดตั้งไลบรารี Python ที่ต้องการ:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch ดำเนินการสคริปต์หลักตามการตั้งค่าโหมดของคุณ:
python voice_talk_vad.pyหรือ
python voice_talk.pyvoice_talk_vad.py : พูดคุยกับไมโครโฟนของคุณ
ฟังคำตอบ
voice_talk.py :อย่าลังเลที่จะแยกปรับปรุงและส่งคำขอดึง หากคุณกำลังพิจารณาการเปลี่ยนแปลงหรือเพิ่มเติมที่สำคัญโปรดเริ่มต้นด้วยการเปิดปัญหา
ตะโกนออกไปอย่างมากถึง: