Wechat AI 조수
WeChat, Process Q & A, 역할 재생, 음성, 사진 및 비디오 메시지에 응답, 기사 및 웹 페이지를 요약하고 인터넷 검색 등과의 ChatGpt AI Assistant와의 멀티 모드 상호 작용. 개인 wechat을 AI 조수로 바꾸십시오.
소개
이 프로젝트는 Wechatferry 라이브러리를 사용하여 Windows PC 데스크탑 Wechat 클라이언트를 제어하고 지능형 멀티 모달 메시지 처리를 위해 OpenAI Assistant API를 호출합니다.
- 멀티 모달 상호 작용을 위해 WeChat의 Chatgpt AI (텍스트 또는 음성)와 대화하십시오.
- WeChatferry를 사용하여 Wechat의 Windows 데스크탑 버전, WeChat과의 호환성이 높고 (실제 인증이 필요하지 않음) 위험이 낮습니다.
- OpenAI Assistant API를 사용하여 그룹 채팅 대화 컨텍스트를 자동으로 관리하십시오.
- GPT-4O와 같은 시각적 지원 모델을 사용하여 사진/비디오 컨텐츠 읽기 및 분석을 수행하십시오.
- 문서 업로드, 컨텐츠 검색을 문서화 및 문서 컨텐츠를 기반으로 한 질문에 답하십시오 (OpenAI 내장 File_Search 도구 사용).
- AI는 자체 판단을 사용하여 코드 통역사 및 외부 도구를 호출하여 작업을 완료 할 수 있습니다. 기존 도구 : bing_search (bing search), browser_link (웹 링크 찾아보기), text_to_image (텍스트 설명), text_to_speech (텍스트 to 음성), mahjong_agari (수직 mahjong 및 카드 수, 숫자, 기호, 숫자 수, 포인트 등))
- 후속 계획 개발 : 기타 API 및 도구 통화/ 엔터프라이즈 WeChat 및 WeChat 공식 계정 로그인
- QQ 그룹 : 812016253 클릭하려면 가입
- WeChat 데스크탑 클라이언트 버전 지원 : 3.9.10.27
사용 사례
- "고양이의 사진과 카피 바라가 함께 스키를 타십시오."
- "(인용 된 그림) 그림의 내용을 바탕으로시를 쓰고 읽으십시오."
- "(공개 계정 기사 또는 웹 페이지 링크를 인용) 기사의 핵심 사항을 요약합니다."
- "OpenAi에 대한 뉴스를 검색하고 나에게 결과를 읽으십시오"
- "직립 똑바로 마하






배포 지침
배포에 필요한 조건 :
- OpenAI API 키 참고 :이 프로젝트는 비공식 API 포털의 조수 API에 의존합니다.
- Windows 컴퓨터 또는 서버.
- (선택 사항, 국내 중국어) Access OpenAi의 프록시 서버 (예 : OpenAI-Proxy) 또는 API 프록시를 사용하십시오.
- (선택 사항, 수동 배포에 필요한 선택 사항) Python 환경을 설치하고 GIT
- 파이썬 다운로드 페이지 (Python 3.11은 권장되며,이 프로젝트는 Python 3.12 이상에 따라 다르며 자동으로 설치할 수 없습니다)
- git 다운로드 페이지
- (인터넷 검색 플러그인과 함께 사용하기 위해) Bing Search API 키
방법 1 : 릴리스에서 다운로드 (직접 사용)
- 포장 된 실행 파일 및 wechat 설치 파일을 릴리스로 다운로드하십시오.
- 지정된 버전의 WeChat Windows 데스크탑을 설치하십시오 (설치 패키지가 제공됨).
- 압축 패키지를 로컬로 압축 해제하십시오.
- config.yaml 파일 편집 (필요한 항목은 OpenAI API_Key이며 구성 항목 설명이 문서에 표시됩니다.)
- "main.exe"를 실행하면 프로그램이 WeChat 클라이언트를 호출하고 로그인 후 프로그램이 시작됩니다.
방법 2 : 소스 코드의 수동 배포 (개발)
- 지정된 WeChat Windows 버전을 설치하십시오. 릴리스에서 다운로드하십시오.
- 프로젝트 코드를 로컬로 복제합니다
git clone https://github.com/latorc/Wechat-AI-Assistant.git
- (선택 사항) 파이썬 가상 환경을 생성하고 활성화하십시오
python -m venv .venv
call .venv S cripts a ctivate.bat
- 종속 라이브러리 설치; 여기에서 Tsinghua의 소스를 사용합니다.이 소스는 중국 국내 사용자가 신속하게 다운로드하는 데 편리합니다.
cd Wechat-AI-Assistant
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 구성 파일 편집 : configure.yaml로 구성 파일 이름을 config.yaml로 바꾸고 구성 항목을 편집하십시오. 구성 항목 설명에 대한 설명서를 참조하십시오.
- main.py를 실행하십시오
이 프로그램은 자동으로 WeChat 클라이언트를 호출 한 다음 코드를 스캔하여 WeChat 데스크탑 클라이언트에 로그인하여 사용을 시작합니다.
주요 구성 항목
| 구성 항목 | 설명 | 예를 들어보세요 |
|---|
| API_KEY | OpenAI API 키 | SK-ABCDEFG12345678 .... |
| base_url | API의 URL, 기본 API를 변경할 필요가없고 프록시 또는 타사 API를 사용할 때 채우십시오. | https://api.openai.com/v1 |
| 대리 | "http : // 주소 : 포트 번호"형식으로 OpenAI에 액세스하는 데 사용되는 프록시 서버 주소 | http://10.0.0.10:8002 |
| chat_model | 기본적으로 사용되는 채팅 모델 | GPT-4O |
| 관리자 | 관리자 wechat id 목록, 관리자 만 관리자 명령을 사용할 수 있습니다. | [WX1234, WX2345] |
다른 구성 옵션은 config.yaml의 주석을 참조하십시오.
사용 팁
- Wechat AI Assistant의 Wechat 친구를 추가하거나 그룹 채팅 및 @에 추가하여 대화를 나누십시오.
- 직접 대화하면 Chatgpt에 전화하여 답변합니다. 사진과 파일, 그림 및 파일 및 @AI 조수를 보내는 후 처리하도록 지시합니다.
- WeChat AI 어시스턴트는 독립적으로 도구를 선택하고 호출하여 사용자의 텍스트를 기반으로 작업을 완료합니다. 현재 도구는 그리기 (OpenAi Dall-E-3), 코드 통역사, 합성 음성 (OpenAI API), 웹 페이지 액세스, 검색 등이 포함됩니다.
- 드로잉 품질은 AI에 의해 일시적으로 제어됩니다
- 지정된 WeChat 버전 만 지원됩니다. 실행하기 전에 Open WeChat 데스크탑 클라이언트를 닫으십시오.
관리자 명령
관리자가 정의 된 후 (config.yaml 파일의 관리자 프로젝트) 관리자는 관리자 명령을 사용할 수 있습니다. 기본 명령은 다음과 같습니다.
| 주문하다 | 설명 |
|---|
| $ 도움말 | 도움말 정보를 보여줍니다 |
| $ 구성 구성 | 프로그램 구성을 다시로드하십시오 |
| $ clear | 명확한 현재 대화 메모리 |
| $ load <preset name> | 현재 대화를 위해 사전 설정을로드하십시오 |
| $ presets를 재설정하십시오 | 현재 대화의 기본 사전 설정으로 사전 설정을 재설정하십시오 |
| $ preset 목록 | 사용 가능한 사전 설정을 보여줍니다 |
| $ ID | 현재 대화의 ID를 보여줍니다 |
이 명령은 config.yaml에서 수정할 수 있습니다
대화 사전 설정 기능
- 대화 사전 설정은 현재 대화 (그룹 채팅 또는 단일 채팅)에 적용되는 시스템 프롬프트 단어 및 메시지 포장 방법입니다.
- AI 어시스턴트가 현재 대화의 사전 설정을로드하려면 기본 명령 "$ load <preset name>"을 사용하십시오. "$ preset list"명령은 현재 사용 가능한 사전 설정 및 해당 설명을 표시합니다.
- <preset name>은 사전 설정 디렉토리에 정의 된 동일한 이름의 Yaml 구성 파일입니다.
- default.yaml은 기본 사전 설정이며 대화에 기본적으로 사용됩니다.
- 구성 파일의 Group_Presets 필드를 사용하여 대화를 위해 사전 설정을 설정할 수 있으며 프로그램이 시작될 때 자동으로로드됩니다.
- 자신의 사전 설정을 만들려면 사전 설정 디렉토리의 Default.yaml, 즉 Default Preset을 참조하십시오. 파일을 복사하고 이름을 사전 설정 이름으로 변경하고 정보를 수정하십시오.
- DESC : 사전 설정에 대한 간단한 설명
- sys_prompt : 사전 설정 시스템 프롬프트 단어
- msg_format : 사용자 메시지를 랩핑하는 형식 문자열 및 변수 {message} = 원본 메시지, {wxcode} = wechat id, {nickname} = 발신자 닉네임. 설정되지 않은 경우 소스 메시지를 직접 보내십시오.
도구 (플러그인)
- 도구는 외부 기능 및 API를 나타내며 AI 모델에서 선택하고 호출하여 도면, 네트워크 검색 및 기타 기능과 같은 추가 작업을 완료 할 수 있습니다.
- "$ help"명령을 사용하여 활성화 된 도구 플러그인을 표시하십시오.
- 도구 구성 : config.yaml의 도구 필드에서 도구가 활성화되어 있는지 여부와 도구의 구성 옵션을 정의합니다. 도구를 비활성화하려면 플러그인 이름을 간단히 삭제하거나 댓글을 달아주십시오. 일부 플러그인에는 API_KEY가 작동 해야하는 Bing_Search (Bing Search)와 같은 추가 구성 옵션이 필요합니다.
- 각 도구는 Openai Playground에서 볼 수있는 어시스턴트의 기능 도구에 해당합니다.
- 도구 코드는 도구 디렉토리에 있으며 도구베이스 클래스를 상속하고 인터페이스를 구현합니다.
도구 소개 :
- bing_search : Microsoft Bing Search API를 사용하여 인터넷에서 콘텐츠를 검색하십시오.
- Bing Search API를 받으려면 등록하십시오
- Browser_Link : 웹 링크를 찾아보십시오. 셀레늄을 사용하여 AI에서 사용할 웹 텍스트 콘텐츠를 얻으십시오.
- text_to_image : 텍스트 도면. Dall-E 모델을 사용하여 텍스트에서 이미지를 생성하십시오.
- text_to_speech : 텍스트로 연설. OpenAI API를 사용하여 텍스트에서 음성 오디오를 생성하십시오.
- Audio_transscript : 음성 to 텍스트. OpenAi Whipser를 사용하여 음성을 텍스트로 전사합니다.
- Mahjong_agari : 구두점 및 카드 지점의 계산. 서비스 유형, 숫자 수, 포인트 등과 같은 정보를 계산합니다. 도서관을 사용하십시오 : https://github.com/mahjongrepository/mahjong
다른 팁과 팁
- 국가의 공식 API에 연결할 수없는 경우 API 프록시를 사용하거나 과학 인터넷 프록시를 사용할 수 있습니다. 무료 API 프록시는 Openai-Proxy.com이며 Base_url을 https://api.openai-proxy.com/v1로 대체합니다.
- 모바일 에뮬레이터 (예 : Xiaoyao 에뮬레이터)를 사용하여 WeChat에 로그인하고 Windows Wechat 클라이언트에 로그인하여 WeChat을 온라인으로 유지할 수 있습니다. WeChat 감지 및 금지가 트리거 될 수 있으므로 에뮬레이터의 코드 스캔 프로세스를 방해하지 마십시오.
- 이 프로그램은 OpenAi의 Assistant API를 운영 할 때 대화를 위해 "wechat_ai_assistant"라는 비서를 생성하고 수정합니다. Openai Playground 에서이 어시스턴트를 테스트 할 수 있습니다.
- 이 프로그램은 처리를 위해 사진과 파일을 OpenAI에 업로드합니다. OpenAI 관리 배경에서 파일을보고 삭제할 수 있습니다. OpenAI는 파일 자체를 충전하지 않지만 파일이 차지하는 총 공간에 제한이 있습니다.
- 이 프로그램은 모든 도구, 검색 결과 및 웹 페이지의 전체 텍스트에 대한 정의 설명을 OpenAI로 보냅니다. 토큰을 저장해야하며 일부 도구 (플러그인)를 닫을 수 있습니다.
의지
- QQ 그룹 : 812016253 클릭하려면 가입
- 승인 :이 프로젝트는 Wechatferry 프로젝트의 Lich0821 보스에게 감사합니다
- 권장 : 한 번의 클릭으로 나만의 chatgpt 웹 사이트 Chatgpt-Next-Web 프로젝트 배포
- 참조 : Wechat의 웹 버전을 사용하여 로그인하는 Wechat Robot Chatgpt-on-Wechat 프로젝트
- 참조 : OpenAi CookBook 블로그 자습서 API 개요
- 참조 : OpenAI API 참조