livewhisper.py เอาท์พุท psuedo-live ประโยคตามประโยคไปยังเทอร์มินัล ใช้โมเดล Whisper ของ OpenAI และ Library SoundDevice เพื่อฟังไมโครโฟน เสียงจาก MIC จะถูกเก็บไว้หากมีการตรวจพบระดับเสียงและความถี่จากนั้นเมื่อตรวจพบความเงียบจะช่วยประหยัดเสียงไปยังไฟล์อุณหภูมิและส่งไปยังกระซิบ
การพึ่งพา: Whisper, Numpy, Scipy, SoundDevice
LiveWhisper สามารถใช้งานได้เป็นทางเลือกในการพูด แม้ว่าตอนนี้จะได้รับการสนับสนุนกระซิบของตัวเองดังนั้นมันก็ขึ้นอยู่กับคุณ -
ฉันยังได้รวม assistant.py ซึ่งใช้ LiveWhisper เป็นฐานเป็นความพยายามของฉันในการสร้างผู้ช่วยผู้ควบคุมเสียงง่าย ๆ เช่น Siri, Alexa หรือ Jarvis
การพึ่งพาเช่นเดียวกับ LiveWhisper เช่นเดียวกับการร้องขอ, PYTTSX3, Wikipedia, BS4 ยังต้องการ: Espeak และ Python3-espeak
ผู้ช่วยเสียงสามารถเปิดใช้งานได้โดยบอกว่าเป็นชื่อค่าเริ่มต้น "คอมพิวเตอร์", "เฮ้คอมพิวเตอร์" หรือ "คอมพิวเตอร์โอเค" ก็ใช้ได้เช่นกัน คุณสามารถรอให้คอมพิวเตอร์ตอบกลับหรือขอการกระทำ/คำถามทันทีโดยไม่หยุดชั่วคราว
คุณสมบัติที่มีอยู่: สภาพอากาศวันที่และเวลาเล่าเรื่องตลกและทำการค้นหา Wikipedia นอกจากนี้ยังสามารถจัดการคำขออื่น ๆ เช่นคณิตศาสตร์พื้นฐานหรือเรื่องไม่สำคัญอย่างแท้จริง ที่ขึ้นอยู่กับตัวอย่างคำตอบทันทีของ Google และบางครั้งก็ไม่ทำงาน
ผู้เล่นสื่อควบคุมโดยใช้: เล่น, หยุดชั่วคราว, ถัดไป, ก่อนหน้า, หยุด, เล่นอะไร? การควบคุมสื่อต้องการรูปแบบของการยกเลิกเสียงรบกวน/เสียงก้องเปิดใช้งานการทำงานที่ถูกต้อง ดูหน้านี้สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีเปิดใช้งานใน Linux Pulseaudio
คุณสามารถปิดผู้ช่วยผ่าน ctrl+c หรือโดยบอกว่ามันเป็นชื่อ & "ยุติ"
หากคุณชอบโครงการของฉันและต้องการช่วยฉันทำมากขึ้นโปรดพิจารณาบริจาคในหน้า Ko-Fi ของฉัน! ขอบคุณ!