MMM WhisperGPT Download - MMM WhisperGPT Source Code Download

MMM WhisperGPT

كود الذكاء الاصطناعي

1.0.0

تنزيل

ط ط ط

هذه وحدة النمط لـ MagicMirror².

كيف تعمل

الهدف من الوحدة النمطية هو إنشاء عنصر واجهة مستخدم تفاعلية مخصصة تستخدم أدوات AI المفتوحة:

Whisper-نموذج مستضيف لنسخ الصوت إلى النص.
Langchain - المقصود لاستخدامه في API chatgpt ، لمعالجة الطلبات.
يتم استخدام Picovoice -> النيص -لتشغيل الكلمات غير المتصلة بالإنترنت (ذاتيا) (لهجة على الخصوصية).
أيضا ... تقليد 3 :)

الفكرة هي ما يلي:

كلمة الاستيقاظ (النيص).
... سجل استعلام (عرض رسوم متحركة مثيرة ، سيتم القيام به لاحقًا)
... تمر إلى الهمس المستضاف ذاتيا
... نسخ صوت إلى نص
أظهر السؤال على أنه نص تم عرضه (في عرض الوحدة النمطية)
... تمر عبر langchain إلى chatgpt
... تمرير الرد النصية مرة أخرى إلى الوحدة النمطية وقم بإعدادها على الشاشة
... استخدم TTS (MIMIC3) - مستضيف ذاتيًا على الشبكة ، لإراقة ملف WAV للعب.

باستخدام الوحدة النمطية

لاستخدام هذه الوحدة ، أضف كتلة التكوين التالية إلى مجموعة الوحدات النمطية في ملف config/config.js :

 var config = {
    modules : [
        {
            module : 'MMM-WhisperGPT' ,
            config : {
                // See below for configurable options
                picovoiceKey : 'xxx' ,
                picovoiceWord : 'JARVIS' ,
                picovoiceSilenceTime : 3 ,
                picovoiceSilenceThreshold : 600 ,
                audioDeviceIndex : 3 ,
                openAiKey : 'xxx' ,
                openAiSystemMsg : 'xxx' ,
                whisperUrl : '192.168.1.5:9000/asr' ,
                whisperMethod : 'openai-whisper' ,
                mimic3Url : '192.168.1.6:59125'
            }
        }
    ]
}

خيارات التكوين

خيار	مطلوب؟	وصف
`picovoiceKey`	مطلوب	مفتاح الوصول إلى PicoVoice - يجب عليك التسجيل للحصول عليه - يتم استخدام هذا لكلمة الزناد.
`picovoiceWord`	خياري	Picovoice Trigger Word ، أي Bumblebee ، Jarvis ، إلخ. الافتراضيات إلى Jarvis.
`picovoiceSilenceTime`	خياري	فترة الصمت - الافتراضيات إلى 3 (3 ثوان).
`picovoiceSilenceThreshold`	خياري	هذا هو عادة ضوضاء الخلفية * هذا الرقم. القيمة الافتراضية هي 1.1 (ويعرف أيضًا باسم 10 ٪).
`audioDeviceIndex`	خياري	جهاز الصوت - أي 3 - سيتم طباعة تلك عند استخدام وضع التصحيح. الافتراضات إلى 0.
`whisperUrl`	مطلوب	عنوان URL (أو IP؟) إلى مثيل مستضيف ذاتي الهمس.
`whisperMethod`	خياري	طريقة الهمس: Openai-Whisper أو أسرع. الإعدادات الافتراضية إلى: أسرع.
`whisperLanguage`	خياري	الإعدادات الافتراضية إلى: en.
`openAiKey`	مطلوب	مفتاح API من Openai.
`openAiSystemMsg`	خياري	System MSG - كيف يجب أن تتصرف الذكاء الاصطناعي.
`mimic3Url`	مطلوب	MIMIC3 url (خادم) ، مع بروتوكول ، منفذ ، بدون /API /TTS
`mimic3Voice`	خياري	MIMIC3 الصوت - الافتراضي: EN_US/CMU -ARCTIC_LOW ٪ 23GKA
`debug`	خياري	إذا كنت ترغب في تصحيح ، فإن الافتراضي هو: خطأ.

ما هو picovoice / porcupine

يتم استخدام picovoice / porcupine للكلمة "الزناد". إنها شبكة صغيرة من الذكاء الاصطناعي / العصبية (NN). يقدم Picovoice مجموعة من الخدمات ، بما في ذلك ترخيص لهذا الذكاء الاصطناعي في وضع عدم الاتصال. إنه يرسل فقط إحصائيات الاستخدام ، وليس محادثات الصوت الفعلية.

ما هو الهمس

Whisper هو منتج مفتوح المصدر من Openai. إنه نموذج لغة كبير (LLM) AI الذي يتعامل مع الكلام إلى النص (النسخ). في حالتي الشخصية ، استضافتها ذاتيًا على شبكتي المحلية.

لقد استخدمت هذا: https://github.com/ahmetoner/whisper-asr-webservice

ما هو chatgpt

ChatGPT هو منتج آخر من Openai. إنه نموذج لغة كبير (LLM) AI. ستحتاج إلى التسجيل والحصول على مفتاح API لاستخدامه.

ما هو لانجشين

Langchain هي مكتبة مبنية على LLMs تتيح وظائف إضافية ، مثل الذاكرة طويلة الأجل.

ما هو mimic3 (mycroft)

MIMIC3 من MyCroft هو نظام نص إلى كلام (TTS) يعتمد على نموذج لغة كبير (LLM). إنه يوفر TTS واقعية يمكن أن تعمل على أنظمة مقيدة إلى حد ما. حاولت في البداية إعداده على OrangePI الخاص بي ، لكن بدلاً من ذلك ، قمت بتثبيته على نفس الجهاز مع الهمس واستخدامه عبر الشبكة.

لقد استخدمت هذا docker-corm.yml

 version : ' 3.7 '

services :
  mimic3 :
    image : mycroftai/mimic3
    ports :
      - 59125:59125
    volumes :
      - .:/home/mimic3/.local/share/mycroft/mimic3
    stdin_open : true
    tty : true

استكشاف الأخطاء وإصلاحها

إذا كان الصوت الخاص بك لا يعمل - تحقق مما إذا كنت تستخدم ALSA أو Pulseaudio. قد تحتاج إلى تثبيت mpg123 . يمكنك تثبيته باستخدام الأمر sudo apt-get install mpg123 .
قد تحتاج أيضًا إلى تثبيت lame لتشفير الصوت. يمكنك تثبيته باستخدام الأمر sudo apt-get install lame .

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-19
الحجم 129.37KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
متعة تراكب الفيلم والتلفزيون ط ط ط

2024-01-05

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل