ผู้ช่วย Wechat AI
การโต้ตอบหลายรูปแบบกับผู้ช่วย CHATGPT AI ใน WeChat, กระบวนการถาม - ตอบ, เล่นบทบาท, ตอบสนองต่อเสียง, รูปภาพและข้อความวิดีโอ, สรุปบทความและหน้าเว็บ, ค้นหาอินเทอร์เน็ตและอื่น ๆ เปลี่ยน WeChat ส่วนตัวให้กลายเป็นผู้ช่วย AI ของคุณ
การแนะนำ
โครงการนี้ใช้ไลบรารี WeChatferry เพื่อควบคุมไคลเอ็นต์ Windows PC Desktop WeChat และเรียกผู้ช่วย OpenAI API สำหรับการประมวลผลข้อความหลายรูปแบบอัจฉริยะ
- พูดคุยกับ CHATGPT AI (ข้อความหรือเสียง) ใน WeChat สำหรับการโต้ตอบแบบหลายรูปแบบ
- การใช้ WeChatferry เพื่อเชื่อมต่อกับ Windows Desktop เวอร์ชัน WeChat ความเข้ากันได้สูงกับ WeChat (ไม่จำเป็นต้องมีการตรวจสอบชื่อจริง) และความเสี่ยงต่ำ
- ใช้ OpenAI Assistant API เพื่อจัดการบริบทการสนทนาของกลุ่มโดยอัตโนมัติ
- ใช้โมเดลสนับสนุนภาพเช่น GPT-4O เพื่อดำเนินการอ่านและวิเคราะห์เนื้อหาภาพ/วิดีโอ
- การอัปโหลดเอกสารการค้นหาเนื้อหาเอกสารและตอบคำถามตามเนื้อหาเอกสาร (ใช้เครื่องมือ File_Search ในตัว OpenAI)
- AI สามารถใช้การตัดสินของตัวเองเพื่อเรียกรหัสล่ามและเครื่องมือภายนอกเพื่อทำงานให้เสร็จสมบูรณ์ เครื่องมือที่มีอยู่: bing_search (การค้นหา bing), browser_link (เรียกดูเว็บลิงค์), text_to_image (คำอธิบายข้อความถึงรูปภาพ), text_to_speech (ข้อความถึงเสียง), mahjong_agari (การคำนวณ mahjong แนวตั้งและการ์ด: จำนวนจำนวนสัญลักษณ์จำนวนจำนวน
- การพัฒนาแผนติดตาม: API อื่น ๆ และเครื่องมือโทร/ Enterprise WeChat และ WeChat อย่างเป็นทางการเข้าสู่ระบบบัญชี
- กลุ่ม QQ: 812016253 คลิกเพื่อเข้าร่วม
- สนับสนุน WeChat Desktop Client เวอร์ชัน: 3.9.10.27
ใช้เคส
- "วาดรูปแมวและเล่นสกี Capybara ด้วยกัน"
- "(รูปภาพที่ยกมา) เขียนบทกวีตามเนื้อหาของรูปภาพและอ่านให้ฉัน"
- "(อ้างถึงบทความบัญชีสาธารณะหรือลิงก์หน้าเว็บ) สรุปประเด็นสำคัญของบทความ"
- "ค้นหาข่าวเกี่ยวกับ Openai และอ่านผลลัพธ์ให้ฉัน"
- "ยืนตัวตรง Mahjong Hand 1112345678999m Touch 0m ประเภทบริการและคะแนนแบบไหน?"






คำแนะนำการปรับใช้
เงื่อนไขที่จำเป็นสำหรับการปรับใช้:
- คีย์ OpenAI API หมายเหตุ: โครงการนี้ขึ้นอยู่กับผู้ช่วย API
- คอมพิวเตอร์หรือเซิร์ฟเวอร์ Windows
- (เป็นทางเลือก, จีนในประเทศ) การเข้าถึงพร็อกซีเซิร์ฟเวอร์ของ OpenAI (เช่น Openai-Proxy) หรือใช้ API Proxy
- (จำเป็นต้องใช้สำหรับการปรับใช้ด้วยตนเอง) ติดตั้งสภาพแวดล้อม Python และ Git
- แนะนำหน้าดาวน์โหลด Python (Python 3.11 โครงการนี้ขึ้นอยู่กับ Python 3.12 หรือสูงกว่าและไม่สามารถติดตั้งได้โดยอัตโนมัติ)
- หน้าดาวน์โหลด git
- (เป็นทางเลือกสำหรับใช้กับปลั๊กอินการค้นหาทางอินเทอร์เน็ต) คีย์ Bing Search API
วิธีที่ 1: ดาวน์โหลดจากรีลีส (ใช้โดยตรง)
- ดาวน์โหลดไฟล์ที่เรียกใช้งานได้และไฟล์การติดตั้ง WeChat ในรุ่นเผยแพร่
- ติดตั้งเวอร์ชันที่ระบุของ WeChat Windows Desktop (มีแพ็คเกจการติดตั้ง)
- บีบอัดแพ็คเกจบีบอัดในเครื่อง
- แก้ไขไฟล์ config.yaml (รายการที่ต้องการคือ OpenAI API_KEY และคำอธิบายรายการการกำหนดค่าจะแสดงในเอกสารประกอบ)
- เรียกใช้ "Main.exe" โปรแกรมจะเรียกใช้ไคลเอนต์ WeChat และโปรแกรมจะเริ่มทำงานหลังจากเข้าสู่ระบบ
วิธีที่ 2: การปรับใช้ซอร์สโค้ดด้วยตนเอง (การพัฒนา)
- ติดตั้ง WeChat Windows เวอร์ชันที่ระบุ กรุณาดาวน์โหลดในรุ่น
- การโคลนนิ่งรหัสโครงการเป็นท้องถิ่น
git clone https://github.com/latorc/Wechat-AI-Assistant.git
- (ไม่บังคับ) สร้างสภาพแวดล้อมเสมือนจริงของ Python และเปิดใช้งาน
python -m venv .venv
call .venv S cripts a ctivate.bat
- ติดตั้งไลบรารีที่ขึ้นอยู่กับที่นี่
cd Wechat-AI-Assistant
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- แก้ไขไฟล์การกำหนดค่า: เปลี่ยนชื่อไฟล์กำหนดค่า config_template.yaml เป็น config.yaml และแก้ไขรายการการกำหนดค่า ดูเอกสารสำหรับคำอธิบายรายการการกำหนดค่า
- เรียกใช้ main.py
โปรแกรมจะเรียกไคลเอนต์ WeChat โดยอัตโนมัติจากนั้นสแกนรหัสเพื่อเข้าสู่ระบบไปยังไคลเอนต์ WeChat Desktop เพื่อเริ่มใช้งาน
รายการการกำหนดค่าหลัก
| รายการกำหนดค่า | อธิบาย | ยกตัวอย่าง |
|---|
| api_key | คีย์ OpenAI API ของคุณ | SK-ABCDEFG12345678 .... |
| base_url | URL ของ API ไม่จำเป็นต้องเปลี่ยน API เริ่มต้นกรอกข้อมูลเมื่อใช้พร็อกซีหรือ API ของบุคคลที่สาม | https://api.openai.com/v1 |
| พร็อกซี | ที่อยู่พร็อกซีเซิร์ฟเวอร์ที่ใช้ในการเข้าถึง OpenAI ในรูปแบบ "http: // ที่อยู่: หมายเลขพอร์ต" | http://10.0.0.10:8002 |
| chat_model | รูปแบบการแชทที่ใช้โดยค่าเริ่มต้น | GPT-4O |
| ผู้ดูแลระบบ | รายชื่อผู้ดูแลระบบ WeChat ID มีเพียงผู้ดูแลระบบเท่านั้นที่สามารถใช้คำสั่งผู้ดูแลระบบ | [WX1234, WX2345] |
สำหรับตัวเลือกการกำหนดค่าอื่น ๆ ดูความคิดเห็นใน config.yaml
เคล็ดลับการใช้งาน
- เพิ่มเพื่อน WeChat ของ WeChat AI หรือเพิ่มลงในการแชทเป็นกลุ่มและ @ มันและมีการสนทนากับมัน
- การสนทนาโดยตรงกับมันจะโทรหา CHATGPT เพื่อตอบ หลังจากส่งรูปภาพและไฟล์รูปภาพอ้างอิงและไฟล์และ @AI Assistant สั่งให้พวกเขาประมวลผล
- ผู้ช่วย WeChat AI จะเลือกและเรียกเครื่องมือเพื่อให้งานเสร็จสมบูรณ์ตามข้อความของผู้ใช้ ในปัจจุบันเครื่องมือรวมถึงการวาด (OpenAI Dall-E-3), Code Interpreter, Synthetic Voice (OpenAI API), การเข้าถึงหน้าเว็บ, การค้นหา ฯลฯ
- คุณภาพการวาดถูกควบคุมโดย AI ชั่วคราว
- รองรับ WeChat รุ่นที่ระบุเท่านั้น โปรดปิดไคลเอนต์เดสก์ท็อป WeChat ที่เปิดก่อนที่จะทำงาน
คำสั่งผู้ดูแลระบบ
หลังจากที่ผู้ดูแลระบบถูกกำหนด (โครงการ Admins ในไฟล์ config.yaml) ผู้ดูแลระบบสามารถใช้คำสั่งผู้ดูแลระบบได้ คำสั่งเริ่มต้นมีดังนี้:
| คำสั่ง | อธิบาย |
|---|
| $ ช่วย | แสดงข้อมูลความช่วยเหลือ |
| $ Refresh Configuration | โหลดการกำหนดค่าโปรแกรมใหม่ |
| $ ชัดเจน | ล้างหน่วยความจำการสนทนาปัจจุบัน |
| $ load <ชื่อที่ตั้งไว้ล่วงหน้า> | โหลดที่ตั้งไว้ล่วงหน้าสำหรับการสนทนาปัจจุบัน |
| $ รีเซ็ตล่วงหน้า | รีเซ็ตล่วงหน้าเป็นค่าเริ่มต้นที่ตั้งไว้ล่วงหน้าสำหรับการสนทนาปัจจุบัน |
| $ รายการที่ตั้งไว้ล่วงหน้า | แสดงที่ตั้งไว้ล่วงหน้า |
| $ id | แสดง ID ของการสนทนาปัจจุบัน |
คำสั่งเหล่านี้สามารถแก้ไขได้ใน config.yaml
ฟังก์ชั่นบทสนทนาที่ตั้งไว้ล่วงหน้า
- บทสนทนาที่ตั้งไว้ล่วงหน้าเป็นคำที่พร้อมใช้งานของระบบและวิธีการบรรจุภัณฑ์ข้อความที่มีผลกับการสนทนาปัจจุบัน (การแชทกลุ่มหรือแชทเดี่ยว)
- ใช้คำสั่งเริ่มต้น "$ load <ชื่อที่ตั้งไว้ล่วงหน้า>" สำหรับผู้ช่วย AI ในการโหลดที่ตั้งไว้ล่วงหน้าสำหรับการสนทนาปัจจุบัน คำสั่ง "$ preset list" แสดงค่าที่ตั้งไว้ล่วงหน้าและคำอธิบายของพวกเขาในปัจจุบัน
- <ชื่อที่ตั้งไว้ล่วงหน้า> เป็นไฟล์กำหนดค่า YAML ที่มีชื่อเดียวกันที่กำหนดไว้ในไดเรกทอรีที่ตั้งไว้ล่วงหน้า
- default.yaml เป็นค่าเริ่มต้นที่ตั้งไว้ล่วงหน้าและใช้โดยค่าเริ่มต้นสำหรับการสนทนา
- คุณสามารถใช้ฟิลด์ Group_Presets ในไฟล์กำหนดค่าเพื่อตั้งค่าที่ตั้งไว้ล่วงหน้าสำหรับการสนทนาซึ่งจะโหลดโดยอัตโนมัติเมื่อโปรแกรมเริ่มต้น
- ในการสร้างที่ตั้งไว้ล่วงหน้าของคุณเองโปรดดูที่ default.yaml ในไดเรกทอรีที่ตั้งไว้ล่วงหน้านั่นคือค่าที่ตั้งไว้ล่วงหน้าเริ่มต้น คัดลอกไฟล์เปลี่ยนชื่อเป็นชื่อที่ตั้งไว้ล่วงหน้าของคุณและแก้ไขข้อมูลในนั้น
- DESC: คำอธิบายง่าย ๆ ของการตั้งค่าล่วงหน้า
- SYS_PROMPT: คำที่แจ้งล่วงหน้าของระบบที่ตั้งไว้ล่วงหน้า
- msg_format: สตริงรูปแบบที่ห่อข้อความผู้ใช้และตัวแปร {ข้อความ} = ข้อความต้นฉบับ {wxCode} = ผู้ส่ง weChat id, {ชื่อเล่น} = ผู้ส่งชื่อเล่น WeChat หากไม่ได้ตั้งค่าให้ส่งข้อความต้นฉบับโดยตรง
เครื่องมือ (ปลั๊กอิน)
- เครื่องมือแสดงถึงฟังก์ชั่นภายนอกและ API ซึ่งสามารถเลือกและเรียกโดยโมเดล AI เพื่อทำงานเพิ่มเติมให้เสร็จสมบูรณ์เช่นภาพวาดการค้นหาเครือข่ายและฟังก์ชั่นอื่น ๆ
- ใช้คำสั่ง "$ help" เพื่อแสดงปลั๊กอินเครื่องมือที่เปิดใช้งาน
- การกำหนดค่าเครื่องมือ: ในฟิลด์เครื่องมือใน config.yaml จะกำหนดว่าเครื่องมือถูกเปิดใช้งานและตัวเลือกการกำหนดค่าสำหรับเครื่องมือ หากต้องการปิดใช้งานเครื่องมือเพียงลบหรือแสดงความคิดเห็นชื่อปลั๊กอิน ปลั๊กอินบางตัวต้องการตัวเลือกการกำหนดค่าเพิ่มเติมในการทำงานเช่น Bing_Search (การค้นหา Bing) ที่ต้องการให้ API_KEY ทำงานได้
- เครื่องมือแต่ละตัวสอดคล้องกับเครื่องมือฟังก์ชั่นในผู้ช่วยซึ่งสามารถดูได้บนสนามเด็กเล่น OpenAI
- รหัสเครื่องมืออยู่ในไดเรกทอรีเครื่องมือสืบทอดคลาสฐานข้อมูลและใช้อินเทอร์เฟซ
เครื่องมือแนะนำ:
- Bing_Search: ใช้ Microsoft Bing Search API เพื่อค้นหาเนื้อหาบนอินเทอร์เน็ต
- ลงทะเบียนเพื่อรับ Bing Search API ดู: https://www.microsoft.com/bing/apis/bing-web-search-api
- Browser_link: เรียกดูเว็บลิงก์ ใช้ซีลีเนียมเพื่อรับเนื้อหาข้อความเว็บสำหรับใช้โดย AI
- text_to_image: การวาดข้อความ ใช้โมเดล Dall-E เพื่อสร้างภาพจากข้อความ
- text_to_speech: ข้อความถึงคำพูด สร้างเสียงเสียงจากข้อความโดยใช้ OpenAI API
- AUDIO_TRANSScript: Voice to Text การถอดเสียงคำพูดลงในข้อความโดยใช้ Openai Whipser
- Mahjong_agari: การคำนวณจำนวนเครื่องหมายวรรคตอนและคะแนนบัตร คำนวณข้อมูลเช่นประเภทบริการจำนวนตัวเลขคะแนน ฯลฯ ใช้ห้องสมุด: https://github.com/mahjongrepository/mahjong
เคล็ดลับและเคล็ดลับอื่น ๆ
- เมื่อคุณไม่สามารถเชื่อมต่อกับ API อย่างเป็นทางการในประเทศคุณสามารถลองใช้ API Proxy หรือใช้พร็อกซีอินเทอร์เน็ตทางวิทยาศาสตร์ พร็อกซี API ฟรีคือ openai-proxy.com แทนที่ base_url ด้วย https://api.openai-proxy.com/v1
- คุณสามารถใช้เครื่องจำลองมือถือ (เช่น Xiaoyao Emulator) เพื่อเข้าสู่ระบบ WeChat และเข้าสู่ระบบ Windows WeChat เพื่อให้ WeChat ออนไลน์ อย่าขัดจังหวะกระบวนการสแกนรหัสของอีมูเลเตอร์เนื่องจากการตรวจจับ WeChat และการห้ามอาจถูกเรียกใช้
- โปรแกรมเรียกผู้ช่วย API ของ OpenAI คุณสามารถทดสอบผู้ช่วยนี้ได้ที่ OpenAI Playground
- โปรแกรมจะอัปโหลดรูปภาพและไฟล์ไปยัง OpenAI สำหรับการประมวลผล คุณสามารถดูและลบไฟล์ของคุณในพื้นหลังการจัดการ OpenAI OpenAI ไม่ได้เรียกเก็บไฟล์เอง แต่มีข้อ จำกัด เกี่ยวกับพื้นที่ทั้งหมดที่ถูกครอบครองโดยไฟล์
- โปรแกรมส่งคำอธิบายคำจำกัดความของเครื่องมือทั้งหมดผลการค้นหาและข้อความเต็มของหน้าเว็บไปยัง OpenAI โทเค็นจะต้องบันทึกและเครื่องมือบางอย่าง (ปลั๊กอิน) สามารถปิดได้
ทรัพยากร
- กลุ่ม QQ: 812016253 คลิกเพื่อเข้าร่วม
- รับทราบ: โครงการนี้ใช้ WeChatferry
- แนะนำ: ปรับใช้เว็บไซต์ chatgpt ของคุณเองโครงการ chatgpt-next-web ด้วยคลิกเดียว
- การอ้างอิง: โครงการ WeChat Robot Chatgpt-on-Wechat ที่เข้าสู่ระบบการใช้ Web
- การอ้างอิง: Openai Cookbook บล็อกการสอนผู้ช่วย API ภาพรวม API
- การอ้างอิง: การอ้างอิง OpenAI API