WeChat AI Assistant
تفاعل متعدد الوسائط مع مساعد ChatGpt AI في WeChat ، ومعالجة الأسئلة والأجوبة ، والتشغيل الأدوار ، والرد على الصوت ، والصور ، ورسائل الفيديو ، وتلخيص المقالات وصفحات الويب ، والبحث في الإنترنت ، والمزيد. تحويل WeChat الشخصية إلى مساعد الذكاء الاصطناعى الخاص بك.
مقدمة
يستخدم هذا المشروع مكتبة WeChatferry للتحكم في عميل Windows PC Desktop WeChat ويتصل بأجهزة API Assistant Assistant لمعالجة الرسائل المتعددة الوسائط الذكية.
- تحدث إلى chatgpt AI (نص أو صوت) في WeChat للتفاعل متعدد الوسائط.
- باستخدام WeChatferry للاتصال بإصدار Windows Desktop من WeChat ، والتوافق العالي مع WeChat (لا يلزم مصادقة اسم حقيقي) ، ومخاطر منخفضة.
- استخدم واجهة برمجة تطبيقات Assistant Assistant لإدارة مجموعة محادثة الدردشة الجماعية تلقائيًا.
- استخدم نماذج الدعم المرئي مثل GPT-4O لتنفيذ قراءة وتحليل محتوى الصور/الفيديو.
- تحميل المستند ، والبحث في محتوى المستند ، والإجابة على الأسئلة بناءً على محتوى المستند (باستخدام أداة OpenAI المدمجة في ملف file_search).
- يمكن لـ AI استخدام حكمه الخاص للاتصال بمترجم الكود والأدوات الخارجية لإكمال المهمة. الأدوات الحالية: Bing_Search (Bing Search) ، Browser_Link (رابط الويب للتصفح) ، text_to_image (وصف نص للصور) ، text_to_speech (نص إلى صوت) ، mahjong_agari (حساب mahjong العمودي والبطاقة: عدد الأرقام ، الرموز ، عدد الأرقام ، النقاط ، إلخ.
- تطوير خطة المتابعة: واجهات برمجة التطبيقات الأخرى وأدوات المكالمات/ المؤسسة WeChat و WeChat تسجيل الدخول الرسمي
- QQ Group: 812016253 انقر للانضمام
- دعم إصدار عميل سطح المكتب WeChat: 3.9.10.27
استخدام الحالات
- "ارسم صورة للقط وتزلج Capybara معًا"
- "(صور مقتبسة) اكتب قصيدة تستند إلى محتوى الصورة وقراءتها لي."
- "(استشهد بمقالات الحساب العام أو روابط صفحة الويب) تلخص النقاط الرئيسية للمقالة"
- "ابحث عن أخبار عن Openai وقراءة النتائج لي"
- "قف مستقيم Mahjong Hand 111234567899M Touch 0M ، أي نوع من نوع الخدمة ونقاط؟"






تعليمات النشر
الشروط المطلوبة للنشر:
- Openai API ملاحظة: يعتمد هذا المشروع على API المساعد.
- جهاز الكمبيوتر أو الخادم Windows.
- (اختياري ، صيني محلي) Access Openai's Proxy Server (مثل Openai-Proxy) ، أو استخدم وكيل API.
- (اختياري ، مطلوب للنشر اليدوي) تثبيت بيئة Python و git
- صفحة تنزيل Python (يوصى ببيثون 3.11 ، يعتمد هذا المشروع على Python 3.12 أو أعلى ولا يمكن تثبيته تلقائيًا)
- صفحة تنزيل GIT
- (اختياري ، للاستخدام مع المكون الإضافي للبحث عن الإنترنت) Bing Search API
الطريقة 1: تنزيل من الإصدار (يستخدم مباشرة)
- قم بتنزيل الملف القابل للتنفيذ المعبأة وملف تثبيت WeChat في الإصدارات
- قم بتثبيت الإصدار المحدد من سطح مكتب WeChat Windows (يتم توفير حزمة التثبيت).
- فك ضغط الحزمة المضغوطة محليًا.
- قم بتحرير ملف config.yaml (العنصر المطلوب هو openai api_key ، ويتم عرض وصف عنصر التكوين في الوثائق.)
- Run "Main.exe" ، سيقوم البرنامج بالاتصال بعميل WeChat ، وسيبدأ البرنامج في التشغيل بعد تسجيل الدخول.
الطريقة 2: النشر اليدوي لرمز المصدر (التطوير)
- قم بتثبيت الإصدار المحدد من Wechat Windows. يرجى تنزيله في الإصدار.
- استنساخ رمز المشروع للمحلية
git clone https://github.com/latorc/Wechat-AI-Assistant.git
- (اختياري) قم بإنشاء بيئة افتراضية Python وتفعيلها
python -m venv .venv
call .venv S cripts a ctivate.bat
- قم بتثبيت المكتبة التابعة هنا
cd Wechat-AI-Assistant
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- تحرير ملف التكوين: أعد تسمية ملف التكوين config_template.yaml إلى config.yaml ، وتعديل عنصر التكوين. راجع الوثائق الخاصة بوصف عنصر التكوين.
- تشغيل main.py
سيقوم البرنامج تلقائيًا بالاتصال بعميل WeChat ، ثم مسح الكود لتسجيل الدخول إلى عميل سطح المكتب WeChat للبدء في استخدامه.
عناصر التكوين الرئيسية
| عناصر التكوين | يوضح | إعطاء مثال |
|---|
| api_key | مفتاح API Openai | SK-ABCDEFG12345678 .... |
| base_url | عنوان URL الخاص بـ API ، لا حاجة لتغيير واجهة برمجة التطبيقات الافتراضية ، املأ عند استخدام الوكيل أو واجهة برمجة تطبيقات الطرف الثالث | https://api.openai.com/v1 |
| الوكيل | عنوان خادم الوكيل المستخدم للوصول إلى Openai ، في التنسيق "http: // العنوان: رقم المنفذ" | http://10.0.0.10:8002 |
| chat_model | نموذج الدردشة المستخدمة افتراضيًا | GPT-4O |
| مسؤولون | قائمة المسؤول WeChat ID ، يمكن للمسؤولين فقط استخدام أوامر المسؤول | [WX1234 ، WX2345] |
للاطلاع على خيارات التكوين الأخرى ، راجع التعليقات في config.yaml.
نصائح الاستخدام
- أضف أصدقاء WeChat Aflement Assistant ، أو أضفه إلى الدردشة الجماعية و @ وتحدث معها.
- ستقوم المحادثة المباشرة معها باستدعاء ChatGpt للإجابة. بعد إرسال الصور والملفات والصور المرجعية والملفات ومساعد @AAI ، قم بتوجيهها لمعالجتها.
- سيقوم مساعد WeChat AI بتحديد الأداة بشكل مستقل واتصل بها لإكمال المهمة بناءً على نص المستخدم. في الوقت الحاضر ، تشمل الأدوات الرسم (Openai Dall-E-3) ، مترجم رمز ، صوت صناعي (Openai API) ، الوصول إلى صفحات الويب ، البحث ، إلخ.
- يتم التحكم مؤقتًا عن جودة الرسم من قبل الذكاء الاصطناعي
- يتم دعم الإصدار المحدد من WeChat فقط. يرجى إغلاق عميل سطح المكتب المفتوح WeChat قبل التشغيل.
أوامر المسؤول
بعد تعريف المسؤول (مشروع Admins في ملف config.yaml) ، يمكن للمسؤول استخدام أمر المسؤول. الأمر الافتراضي هو كما يلي:
| طلب | يوضح |
|---|
| مساعدة $ | عرض معلومات المساعدة |
| تكوين تحديث $ | إعادة تحميل تكوين البرنامج |
| $ واضح | مسح ذاكرة المحادثة الحالية |
| $ load <الاسم المسبق> | تحميل الإعدادات المسبقة للمحادثة الحالية |
| $ إعادة تعيين الإعدادات المسبقة | إعادة تعيين الإعداد المسبق للإعداد المسبق للمحادثة الحالية |
| قائمة الإعداد المسبق $ | عرض الإعدادات المسبقة المتاحة |
| $ id | إظهار معرف المحادثة الحالية |
يمكن تعديل هذه الأوامر في config.yaml
حوار وظيفة مسبق
- الإعدادات المسبقة للحوار هي كلمات موجهة النظام وأساليب تغليف الرسائل التي تسري على المحادثة الحالية (الدردشة الجماعية أو الدردشة المفردة).
- استخدم الأمر الافتراضي "$ load <preset name>" لمساعد الذكاء الاصطناعي لتحميل الإعدادات المسبقة للمحادثة الحالية. يعرض أمر "قائمة الإعداد المسبق $" الإعدادات المسبقة المتوفرة حاليًا وأوصافها.
- <الاسم المسبق> هو ملف تكوين YAML مع نفس الاسم المحدد في دليل الإعداد المسبق.
- Default.yaml هو الإعداد المسبق الافتراضي ويتم استخدامه افتراضيًا للحوار.
- يمكنك استخدام حقل Group_presets في ملف التكوين لتعيين الإعدادات المسبقة للمحادثة ، والتي سيتم تحميلها تلقائيًا عند بدء تشغيل البرنامج.
- لإنشاء الإعدادات المسبقة الخاصة بك ، راجع Default.yaml في دليل الإعداد المسبق ، أي الإعداد المسبق الافتراضي. انسخ الملف ، وتغيير الاسم إلى اسم الإعداد المسبق الخاص بك ، وتعديل المعلومات الموجودة فيه.
- DESC: وصف بسيط للإعدادات المسبقة
- sys_prompt: الكلمات المسبقة مسبقًا الكلمات
- msg_format: سلسلة التنسيق التي تلتف رسالة المستخدم ، والمتغيرات {message} = الرسالة الأصلية ، {wxcode} = Sender WeChat ID ، {nobeam} = Sender WeChat Namname. إذا لم يتم تعيينه ، فأرسل رسالة المصدر مباشرة.
الأدوات (المكون الإضافي)
- تمثل الأدوات وظائف خارجية وواجهة برمجة التطبيقات ، والتي يمكن تحديدها واستدعاءها بواسطة نموذج الذكاء الاصطناعى لإكمال المهام الإضافية ، مثل الرسومات وعمليات البحث في الشبكة والوظائف الأخرى.
- استخدم الأمر "$ help" لعرض المكونات الإضافية للأداة الممكّنة.
- تكوين الأداة: في حقل الأدوات في config.yaml ، يحدد ما إذا كانت الأداة ممكّنة وخيارات التكوين للأداة. لتعطيل الأداة ، ما عليك سوى حذف اسم المكون الإضافي أو التعليق عليه. تتطلب بعض المكونات الإضافية خيارات تكوين إضافية للعمل ، مثل Bing_Search (Bing Search) التي تتطلب العمل API_Key.
- تتوافق كل أداة مع أداة دالة في المساعد ، والتي يمكن عرضها على ملعب Openai.
- يقع رمز الأدوات في دليل الأدوات ، ويرث فئة قاعدة الأدوات ويقوم بتنفيذ الواجهة.
مقدمة الأداة:
- Bing_search: استخدم واجهة برمجة تطبيقات Microsoft Bing Search للبحث عن المحتوى على الإنترنت.
- سجل للحصول على واجهة برمجة تطبيقات Search Bing See: https://www.microsoft.com/bing/apis/bing-web-search-api
- Browser_Link: تصفح روابط الويب. استخدم السيلينيوم للحصول على محتوى نص ويب لاستخدامه من قبل الذكاء الاصطناعي.
- text_to_image: رسم نص. استخدم نموذج DALL-E لإنشاء الصور من النص.
- text_to_speech: نص إلى الكلام. إنشاء صوت الصوت من النص باستخدام API Openai.
- Audio_transscript: صوت إلى نص. نسخ الكلام إلى نص باستخدام Openai Whipser.
- Mahjong_agari: حساب عدد علامات الترقيم ونقاط البطاقة. احسب المعلومات مثل أنواع الخدمة ، وعدد الأرقام ، والنقاط ، إلخ. استخدم المكتبة: https://github.com/mahjongrepository/mahjong
نصائح ونصائح أخرى
- عندما لا تتمكن من الاتصال بواجهة برمجة التطبيقات الرسمية في البلد ، يمكنك محاولة استخدام وكيل API أو استخدام وكيل إنترنت علمي. وكيل API مجاني هو Openai-Proxy.com ، لتحل محل base_url بـ https://api.openai-proxy.com/v1
- يمكنك استخدام محاكي الهاتف المحمول (مثل محاكي Xiaoyao) لتسجيل الدخول إلى WeChat وتسجيل الدخول إلى عميل Windows WeChat للحفاظ على WeChat عبر الإنترنت. لا تقاطع عملية مسح رمز المحاكي ، حيث قد يتم تشغيل اكتشاف WeChat والحظر.
- يدعو البرنامج API API الخاص بـ Openai. يمكنك اختبار هذا المساعد في ملعب Openai.
- سيقوم البرنامج بتحميل الصور والملفات إلى Openai للمعالجة. يمكنك عرض ملفاتك وحذفها في خلفية إدارة Openai. لا يتقاضى Openai الملف نفسه ، لكن لديه قيود على إجمالي المساحة التي يشغلها الملف.
- يرسل البرنامج وصف تعريف جميع الأدوات ونتائج البحث والنص الكامل لصفحة الويب إلى Openai. يلزم حفظ الرموز المميزة ويمكن إغلاق بعض الأدوات (المكونات الإضافية).
الموارد
- QQ Group: 812016253 انقر للانضمام
- شكر وتقدير: يعتمد هذا المشروع على WeChatferry.
- موصى به: نشر موقع ChatGpt الخاص بك chatgpt-next web بنقرة واحدة
- المرجع: مشروع WeChat Robot Chatgpt-On-Wechat الذي يسجل الدخول باستخدام إصدار الويب من WeChat
- المرجع: Openai Cookbook Blog Blog Assistant API نظرة عامة
- المرجع: مرجع API Openai