Wechat AI Assistent
Multimodale Interaktion mit Chatgpt AI -Assistent in WeChat, Verarbeitung Q & A, spielen Sie Rollen, reagieren Sie auf Sprach-, Bilder und Videomeldungen, fassen Sie Artikel und Webseiten zusammen, suchen Sie im Internet und vieles mehr. Verwandeln Sie den persönlichen Wechat in Ihren KI -Assistenten.
Einführung
Dieses Projekt verwendet die WeChatferry -Bibliothek, um den Windows -PC -Desktop -WeChat -Client zu steuern und die OpenAI -Assistent -API für intelligente multimodale Nachrichtenverarbeitung aufzurufen.
- Sprechen Sie mit Chatgpt AI (Text oder Stimme) in WeChat für multimodale Interaktion.
- Verwenden von WeChatterry zur Verbindung zur Windows-Desktop-Version von WeChat, einer hohen Kompatibilität mit WeChat (keine echte Authentifizierung ist erforderlich) und ein geringes Risiko.
- Verwalten Sie die OpenAI -Assistent -API, um den Konversationskontext der Gruppen -Chat automatisch zu verwalten.
- Verwenden Sie visuelle Support-Modelle wie GPT-4O, um das Lesen und Analyse von Bild-/Videoinhalten durchzuführen.
- Dokument-Upload, Dokumentinhaltssuche und Beantwortung von Fragen basierend auf Dokumentinhalten (mithilfe von OpenAI integriertes Datei-In-Tool).
- Die KI kann ein eigenes Urteilsvermögen verwenden, um den Code -Dolmetscher und die externen Tools aufzurufen, um die Aufgabe zu erledigen. Bestehende Tools: Bing_search (Bing -Suche), browser_link (durchsuchen Sie Web -Link), text_to_image (Textbeschreibung zum Bild), text_to_speech (Text zu Voice), Mahjong_agari (Berechnung von vertikalem Mahjong und Karte: Anzahl der Zahlen, Symbolen, Zahlen der Zahlen, Punkte, Punkte usw.)).
- Entwicklung des Follow-up-Plans: Andere APIs und Tools/ Enterprise WeChat und WeChat Official Account Login
- QQ -Gruppe: 812016253 Klicken Sie auf, um sich anzuschließen
- Unterstützung von WeChat Desktop -Client -Version: 3.9.10.27
Anwendungsfälle
- "Zeichnen Sie ein Foto einer Katze und eines Capybara -Skifahrens zusammen"
- "(Zitierte Bilder) Schreiben Sie ein Gedicht, das auf dem Inhalt des Bildes basiert, und lesen Sie es mir vor."
- "(Links für öffentliche Konto Artikel oder Webseiten -Links zitieren) Fassen Sie die wichtigsten Punkte des Artikels zusammen."
- "Suchen Sie nach Neuigkeiten über Openai und lesen Sie mir die Ergebnisse vor"
- "Stehen Sie aufrecht Mahjong Hand 1112345678999m Touch 0m, welche Art von Servicetyp und Punkten?"






Bereitstellungsanweisungen
Für den Einsatz erforderliche Bedingungen:
- OpenAI -API -Key -Hinweis: Dieses Projekt basiert auf der Assistant API.
- Windows -Computer oder Server.
- (Optional, inländisches Chinesisch) Zugriff auf den Proxyserver von OpenAI (wie OpenAI-Proxy) oder verwenden Sie den API-Proxy.
- (Optional, für die manuelle Bereitstellung erforderlich) Installieren Sie die Python -Umgebung und die Git
- Python Download -Seite (Python 3.11 wird empfohlen. Dieses Projekt hängt von Python 3.12 oder darüber ab und kann nicht automatisch installiert werden)
- Git -Download -Seite
- (Optional, zur Verwendung mit dem Internet-Such-Plug-In) Bing-Such-API-Schlüssel
Methode 1: Download von der Veröffentlichung (direkt verwendet)
- Laden Sie die verpackte ausführbare Datei- und WeChat -Installationsdatei in Veröffentlichungen herunter
- Installieren Sie die angegebene Version von WeChat Windows Desktop (das Installationspaket wird bereitgestellt).
- Dekomprimieren Sie das komprimierte Paket lokal.
- Bearbeiten Sie die Datei config.yaml (das erforderliche Element ist openai api_key und die Beschreibung der Konfigurationselement ist in der Dokumentation angezeigt.)
- Führen Sie "main.exe" aus, das Programm wird auf dem WeChat -Client aufgerufen, und das Programm wird nach dem Anmelden ausgeführt.
Methode 2: Manuelle Bereitstellung von Quellcode (Entwicklung)
- Installieren Sie die angegebene Version von Wechat Windows. Bitte laden Sie es in Veröffentlichung herunter.
- Klonen des Projektcodes nach lokal
git clone https://github.com/latorc/Wechat-AI-Assistant.git
- (Optional) Erstellen Sie eine virtuelle Python -Umgebung und aktivieren Sie sie
python -m venv .venv
call .venv S cripts a ctivate.bat
- Installieren Sie die abhängige Bibliothek;
cd Wechat-AI-Assistant
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- Konfigurationsdatei bearbeiten: Benennen Sie die Konfigurationsdatei config_template.yaml in config.yaml um und bearbeiten Sie das Konfigurationselement. Siehe Dokumentation für die Beschreibung der Konfigurationselement.
- Run main.py
Das Programm ruft automatisch den WeChat -Client auf und scann dann den Code, um sich beim WeChat -Desktop -Client anzumelden, um ihn zu verwenden.
Hauptkonfigurationselemente
| Konfigurationselemente | veranschaulichen | Geben Sie ein Beispiel an |
|---|
| api_key | Ihr OpenAI -API -Schlüssel | SK-ABCDEFG12345678 .... |
| Base_url | Die URL der API, die nicht erforderlich ist, die Standard-API zu ändern | https://api.openai.com/v1 |
| Proxy | Die Proxy -Serveradresse zum Zugriff auf OpenAI im Format "http: // Adresse: Portnummer" | http://10.0.0.10:8002 |
| CHAT_MODEL | Das standardmäßig verwendete Chat -Modell | gpt-4o |
| Administratoren | Liste der Administrator -Wechat -ID, nur Administratoren können Administratorbefehle verwenden | [WX1234, WX2345] |
Weitere Konfigurationsoptionen finden Sie in den Kommentaren in config.yaml.
Nutzungstipps
- Fügen Sie WeChat AI -Assistenten von Wechat -Freunden hinzu oder fügen Sie es dem Gruppenchat hinzu und unterhalten Sie sich damit.
- Ein direktes Gespräch damit wird Chatgpt anrufen, um zu antworten. Nach dem Senden von Bildern und Dateien, Referenzbildern und -dateien und @AI -Assistenten unterweisen sie, sie zu verarbeiten.
- Der WeChat AI -Assistent wählt das Tool unabhängig aus und ruft auf, um die Aufgabe basierend auf dem Text des Benutzers zu vervollständigen. Zu den Tools gehören zu den Tools (OpenAI Dall-E-3), Code-Interpreter, synthetische Sprache (OpenAI-API), Zugriff auf Webseiten, Suche usw.
- Zeichnenqualität wird vorübergehend von KI kontrolliert
- Nur die angegebene Version von WeChat wird unterstützt. Bitte schließen Sie den offenen Wechat -Desktop -Client vor dem Ausführen.
Administratorbefehle
Nachdem der Administrator definiert wurde (das Admins -Projekt in der Datei config.yaml) kann der Administrator den Befehl Administrator verwenden. Der Standardbefehl lautet wie folgt:
| Befehl | veranschaulichen |
|---|
| $ Hilfe | Hilfsinformationen anzeigen |
| $ Aktualisieren Konfiguration | Laden Sie die Programmkonfiguration neu |
| $ Clear | Löschen Sie den aktuellen Gesprächsgedächtnis |
| $ Load <voreingestellter Name> | Laden Sie Voreinstellungen für das aktuelle Gespräch |
| $ Reset Presets | Voreinstellung auf die Standardvoreinstellung für die aktuelle Konversation zurücksetzen |
| $ Voreingestellte Liste | Verfügbare Voreinstellungen anzeigen |
| $ id | Zeigen Sie die ID des aktuellen Gesprächs |
Diese Befehle können in config.yaml geändert werden
Dialog -Preset -Funktion
- Dialogvoreinstellungen sind System -Eingabeaufforderung und Nachrichtenverpackungsmethoden, die sich auf die aktuelle Konversation auswirken (Gruppenchat oder einzelner Chat).
- Verwenden Sie den Standardbefehl "$ load <voreingestellter Name>", damit der AI -Assistent Voreinstellungen für die aktuelle Konversation lädt. Der Befehl "$ preet list" zeigt die aktuell verfügbaren Voreinstellungen und deren Beschreibungen an.
- <voreinstellung Name> ist eine YAML -Konfigurationsdatei mit dem gleichen Namen im Verzeichnis voreinstunden.
- Standard.yaml ist die Standardvoreinstellung und wird standardmäßig für den Dialog verwendet.
- Sie können das Feld Group_Presets in der Konfigurationsdatei verwenden, um Voreinstellungen für die Konversation festzulegen, die beim Starten des Programms automatisch geladen werden.
- Um Ihre eigenen Voreinstellungen zu erstellen, lesen Sie die Standard -Voreinstellung auf Standard.yaml im Verzeichnis der Voreinstellung. Kopieren Sie die Datei, ändern Sie den Namen in Ihren voreingestellten Namen und ändern Sie die darin enthaltenen Informationen.
- Desc: Eine einfache Beschreibung der Voreinstellungen
- sys_prompt: voreingestellte System -Eingabeaufforderungswörter
- MSG_FORMAT: Die Format -Zeichenfolge, die die Benutzernachricht umhüllt, und die Variablen {Message} = Originalnachricht, {wxCode} = Sender WeChat ID, {Spitzname} = Sender Wechat -Spitzname. Wenn nicht festgelegt, senden Sie die Quellnachricht direkt.
Werkzeuge (Plug-In)
- Tools repräsentieren externe Funktionen und APIs, die vom KI -Modell ausgewählt und aufgerufen werden können, um zusätzliche Aufgaben wie Zeichnungen, Netzwerksuche und andere Funktionen zu erledigen.
- Verwenden Sie den Befehl "$ hilf", um die aktivierten Tool-Plug-Ins anzuzeigen.
- Toolkonfiguration: Im Feld Tools in config.yaml definiert sie, ob das Tool aktiviert ist und die Konfigurationsoptionen für das Tool. Um das Tool zu deaktivieren, löschen oder kommentieren Sie einfach den Plugin -Namen. Einige Plugins erfordern zusätzliche Konfigurationsoptionen, um zu funktionieren, z. B. Bing_search (Bing -Suche), bei denen API_Key funktioniert.
- Jedes Tool entspricht einem Funktionstool im Assistenten, das auf dem OpenAI -Spielplatz angezeigt werden kann.
- Der Toolcode befindet sich im Tools -Verzeichnis, erbt die Toolbase -Klasse und implementiert die Schnittstelle.
Werkzeugeinführung:
- Bing_search: Verwenden Sie die Microsoft Bing -Such -API, um im Internet nach Inhalten zu suchen.
- Registrieren Sie sich, um die Bing-Search-API zu erhalten: https://www.microsoft.com/bing/apis/bing-web-search-api
- Browser_Link: Web -Links durchsuchen. Verwenden Sie Selenium, um Webtextinhalte für die Verwendung durch AI zu erhalten.
- text_to_image: Textzeichnung. Verwenden Sie das Dall-E-Modell, um Bilder aus dem Text zu generieren.
- text_to_speech: text to rede. Generieren Sie mit der OpenAI -API Voice -Audio aus dem Text.
- Audio_Transscript: Voice to Text. Transkribieren Sie die Sprache in Text mit OpenAI -Peitschen.
- MAHJONG_AGARI: Berechnung der Anzahl der Punkten und Kartenpunkte. Berechnen Sie Informationen wie Servicetypen, Anzahl der Zahlen, Punkte usw. Verwenden Sie Bibliothek: https://github.com/mahjongrpository/mahjong
Andere Tipps und Tipps
- Wenn Sie keine Verbindung zu offiziellen APIs im Land herstellen können, können Sie versuchen, API -Proxy oder einen wissenschaftlichen Internet -Proxy zu verwenden. Ein kostenloser API-Proxy ist openai-proxy.com, der Base_url durch https://api.openai-proxy.com/v1 ersetzt
- Sie können einen mobilen Emulator (z. B. Xiaoyao -Emulator) verwenden, um sich bei WeChat anzumelden und sich beim Windows WeChat -Client anzumelden, um WeChat online zu halten. Unterbrechen Sie den Code -Scanprozess des Emulators nicht, da die WeChat -Erkennung und -verbot ausgelöst werden können.
- Das Programm ruft OpenAIs Assistant API an. Sie können diesen Assistenten auf dem OpenAI -Spielplatz testen.
- Das Programm lädt Fotos und Dateien zum Öffnen zur Verarbeitung hoch. Sie können Ihre Dateien im OpenAI -Verwaltungshintergrund anzeigen und löschen. OpenAI berechnet die Datei selbst nicht, sondern hat Einschränkungen für den Gesamtraum der Datei.
- Das Programm sendet die Definitionsbeschreibung aller Tools, Suchergebnisse und Volltext der Webseite an Öffnen. Tokens müssen gespeichert werden und einige Werkzeuge (Plug-Ins) können geschlossen werden.
Ressource
- QQ -Gruppe: 812016253 Klicken Sie auf, um sich anzuschließen
- Bestätigung: Dieses Projekt basiert auf WeChattferry.
- Empfohlen: Bereitstellen Sie Ihr eigenes Chatgpt-Website Chatgpt-Next-Web-Projekt mit einem Klick ein
- Referenz: Das WeChat-Roboter-Chatgpt-on-Wechat
- Referenz: OpenAI -Kochbuch -Blog -Tutorial Assistant API -Übersicht
- Referenz: OpenAI -API -Referenz