ดาวน์โหลด MMM WhisperGPT - MMM WhisperGPT Source Source Download

MMM WhisperGPT

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

MMM-Whispergpt

นี่คือโมดูลสำหรับMagicMirror²

มันทำงานอย่างไร https://nikro.me/articles/professional/crafting-our-ai-assistant/

เป้าหมายของโมดูลคือการสร้างวิดเจ็ตแบบโต้ตอบที่กำหนดเองที่ใช้เครื่องมือ Open AI:

Whisper-โมเดลโฮสต์ตัวเองสำหรับการถอดความด้วยเสียงเป็นข้อความ
Langchain - ตั้งใจที่จะใช้กับ CHATGPT API เพื่อประมวลผลคำขอ
picovoice -> morcupine -ใช้สำหรับทริกเกอร์คำ (โฮสต์ตัวเอง) แบบออฟไลน์ (เน้นความเป็นส่วนตัว)
ยัง ... Mimic3 :)

ความคิดคือสิ่งต่อไปนี้:

Wake Word (เม่น)
... บันทึกการค้นหา (แสดงแอนิเมชั่นเซ็กซี่จะทำในภายหลัง)
... ส่งต่อไปยังกระซิบที่โฮสต์ตัวเอง
... ถอดความเสียงเป็นข้อความ
แสดงคำถามเป็นข้อความแสดงผลที่ถอดความ (ในการแสดงผลโมดูล)
... ผ่าน Langchain ไปยัง Chatgpt
... ส่งข้อความตอบกลับกลับไปยังโมดูลและแสดงผลบนหน้าจอ
... ใช้ TTS (MIMIC3) - โฮสต์ตัวเองบนเครือข่ายเพื่อโยนไฟล์ WAV กลับมาเล่น

ใช้โมดูล

ในการใช้โมดูลนี้เพิ่มบล็อกการกำหนดค่าต่อไปนี้ลงในอาร์เรย์โมดูลในไฟล์ config/config.js :

 var config = {
    modules : [
        {
            module : 'MMM-WhisperGPT' ,
            config : {
                // See below for configurable options
                picovoiceKey : 'xxx' ,
                picovoiceWord : 'JARVIS' ,
                picovoiceSilenceTime : 3 ,
                picovoiceSilenceThreshold : 600 ,
                audioDeviceIndex : 3 ,
                openAiKey : 'xxx' ,
                openAiSystemMsg : 'xxx' ,
                whisperUrl : '192.168.1.5:9000/asr' ,
                whisperMethod : 'openai-whisper' ,
                mimic3Url : '192.168.1.6:59125'
            }
        }
    ]
}

ตัวเลือกการกำหนดค่า

ตัวเลือก	ที่จำเป็น?	คำอธิบาย
`picovoiceKey`	ที่จำเป็น	Picovoice Access Key - คุณต้องลงทะเบียนเพื่อรับ - ใช้สำหรับ Trigger Word
`picovoiceWord`	ไม่จำเป็น	Picovoice Trigger Word เช่น Bumblebee, Jarvis ฯลฯ ค่าเริ่มต้นเป็น Jarvis
`picovoiceSilenceTime`	ไม่จำเป็น	ระยะเวลาเงียบ - ค่าเริ่มต้นถึง 3 (3 วินาที)
`picovoiceSilenceThreshold`	ไม่จำเป็น	นี่คือเสียงรบกวนพื้นหลัง * หมายเลขนี้ ค่าเริ่มต้นคือ 1.1 (aka 10%)
`audioDeviceIndex`	ไม่จำเป็น	อุปกรณ์เสียง - IE 3 - สิ่งเหล่านั้นจะถูกพิมพ์ออกมาเมื่อคุณใช้โหมดดีบั๊ก ค่าเริ่มต้นถึง 0
`whisperUrl`	ที่จำเป็น	URL (หรือ IP?) เป็นอินสแตนซ์ที่โฮสต์ตัวเองของเสียงกระซิบ
`whisperMethod`	ไม่จำเป็น	วิธีการกระซิบ: openai-whisper หรือ whisper เร็วขึ้น ค่าเริ่มต้นเป็น: เร็วขึ้น
`whisperLanguage`	ไม่จำเป็น	ค่าเริ่มต้นเป็น: en.
`openAiKey`	ที่จำเป็น	คีย์ API ของ Openai
`openAiSystemMsg`	ไม่จำเป็น	ระบบผงชูรส - AI ควรประพฤติตนอย่างไร
`mimic3Url`	ที่จำเป็น	MIMIC3 URL (เซิร์ฟเวอร์) พร้อมโปรโตคอลพอร์ตโดยไม่ต้อง /API /TTS
`mimic3Voice`	ไม่จำเป็น	Mimic3 Voice - ค่าเริ่มต้น: en_us/cmu -arctic_low%23gka
`debug`	ไม่จำเป็น	หากคุณต้องการดีบักค่าเริ่มต้นคือ: เท็จ

picovoice / morcupine คืออะไร

Picovoice / morcupine ใช้สำหรับคำว่า "ทริกเกอร์" มันเป็นเครือข่าย AI / Neural ขนาดเล็กที่โฮสต์ตัวเอง (NN) Picovoice เสนอบริการที่หลากหลายรวมถึงใบอนุญาตสำหรับ AI ออฟไลน์นี้ มันส่งเฉพาะสถิติการใช้งานไม่ใช่การสนทนาเสียงจริง

กระซิบคืออะไร

Whisper เป็นผลิตภัณฑ์โอเพนซอร์ซจาก OpenAI มันเป็นรูปแบบภาษาขนาดใหญ่ (LLM) AI ที่จัดการกับคำพูดเป็นข้อความ (การถอดความ) ในกรณีส่วนตัวของฉันฉันมีโฮสต์ตัวเองในเครือข่ายท้องถิ่นของฉัน

ฉันใช้สิ่งนี้: https://github.com/ahmetoner/whisper-asr-webservice

CHATGPT คืออะไร

CHATGPT เป็นผลิตภัณฑ์อื่นจาก OpenAI มันเป็นรูปแบบภาษาขนาดใหญ่ (LLM) AI คุณจะต้องลงทะเบียนและรับคีย์ API เพื่อใช้งาน

Langchain คืออะไร

Langchain เป็นห้องสมุดที่สร้างขึ้นรอบ ๆ LLM ที่ช่วยให้สามารถใช้งานได้พิเศษเช่นหน่วยความจำระยะยาว

MIMIC3 (MyCroft) คืออะไร

MIMIC3 ของ MyCroft เป็นระบบแบบ text-to-speech (TTS) ที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) มันมี TTS ที่เป็นจริงที่สามารถทำงานบนระบบที่ จำกัด ทรัพยากรได้บ้าง ตอนแรกฉันพยายามที่จะตั้งค่าบน OrangePi ของฉัน แต่ฉันติดตั้งไว้ในเครื่องเดียวกันด้วย Whisper และใช้งานผ่านเครือข่าย

ฉันใช้ Docker-compose.yml นี้

 version : ' 3.7 '

services :
  mimic3 :
    image : mycroftai/mimic3
    ports :
      - 59125:59125
    volumes :
      - .:/home/mimic3/.local/share/mycroft/mimic3
    stdin_open : true
    tty : true

การแก้ไขปัญหา

หากเสียงของคุณไม่ทำงาน - ตรวจสอบว่าคุณใช้ ALSA หรือ Pulseaudio หรือไม่ คุณอาจต้องติดตั้ง mpg123 คุณสามารถติดตั้งได้โดยใช้คำสั่ง sudo apt-get install mpg123
คุณอาจต้องติดตั้ง lame สำหรับการเข้ารหัสเสียง คุณสามารถติดตั้งได้โดยใช้คำสั่ง sudo apt-get install lame

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-19
ขนาด 129.37KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
หนังโอเวอร์เลย์สนุกๆ และโทรทัศน์ อืม.

2024-01-05

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด