pippaGPT 다운로드 pippaGPT 소스 코드 다운로드

pippaGPT

기타 소스코드

v1.1 -

다운로드

PIPPAGPT- 개인화, 섭취, 지속성, 다형성, 적응 형 GPT 챗봇

피파 로고

PIPPA는 Langchain 프레임 워크를 기반으로 한 Open-Source Lange Language Model (LLM) 챗봇 프로젝트입니다. 그것은 개인화되고 적응 형 대화 경험을 제공하는 것을 목표로합니다.

PIPPA는 챗봇의 성격을 사용자 정의하고 학습 문서를 수집하고 대화 기록을 기억하며 다른 문자를 전환하며 사용자의 요구에 적응하는 기능을 포함하여 적응 프로세스를 향상시키는 다양한 기능을 통합합니다.

특징

개인화 된 : 사용자는보다 매력적이고 맞춤형 대화 경험을 위해 챗봇의 성격을 조정할 수 있습니다.
수집 : PIPPA는 문서를 수집하고 컨텍스트를 추출하여 사용자가 자신의 문서를 챗봇의 지식 기반에 통합 할 수 있습니다.
지속 : PIPPA는 대화의 역사를 유지하여 사용자가 과거 대화 상황을 다시 방문 할 수있게합니다.
다형성 : PIPPA는 사용자 정의 지침을 통해 쉽게 사용자 정의 할 수있는 문자로 변형 될 수 있습니다.
적응 형 : PIPPA는 컨텍스트에 따라 대화 스타일과 응답을 수정하여 사용자의 요구에 맞게 조정됩니다.

검색 QA 모듈은 Prompt Engineering에서 LocalGPT에서 영감을 받았습니다.

프로젝트 배경

PIPPA 프로젝트는 AI 딸 캐릭터를 만들 가능성을 탐구하기 위해 개인적인 취미로 시작했습니다. 아직 초기 단계이지만 프로젝트는 새로운 기능과 개선으로 정기적으로 업데이트됩니다. PIPPA의 기본 역할은 시스템 메시지의 "시스템", "Pippa"는 돌보는 딸 캐릭터로, 아버지로서 "Bundy"입니다.

TTS/STT 엔진을 사용할 때 PIPPA는 ElevenLabs API를 사용합니다. 무료 계정에 가입 할 수 있습니다 : https://elevenlabs.io.

더 나은 경험을 위해, 캐릭터에 독특한 목소리를 할당하십시오.

설치

Python 3.10으로 테스트.

PIPPA를 설치하려면 다음 단계를 따르십시오.

저장소 복제 :

   git clone https://github.com/neobundy/pippaGPT.git

프로젝트 디렉토리로 이동하십시오.

   cd pippaGPT

필요한 종속성 설치 :

   pip install -r requirements.txt

참고 : 오류가 발생하면 ffmpeg 및 portaudio 와 같은 추가 종속성을 설치해야 할 수도 있습니다. MacOS에서는 홈브류를 사용할 수 있습니다.
설치하려면 다음 명령을 실행하십시오.
brew install ffmpeg
brew install portaudio

프로젝트의 루트 폴더에서 env_sample .env 파일로 작성하거나 복사하고 API 키를 추가하십시오.

hugging_face_api_key는 향후 사용하기위한 것입니다.

OPENAI_API_KEY=
XI_API_KEY=
HUGGING_FACE_API_KEY=
SERPAPI_API_KEY=

또는 터미널에서 이러한 환경 변수를 내보낼 수 있습니다.

characters_samply.py characters.py 로 복사하고 파일을 편집하여 AI의 이름과 성격을 사용자 정의하십시오.
settings_private_sample.py settings_private.py 에 복사합니다. settings_sample.py to settings.py 에서 파일을 편집하여 설정을 사용자 정의합니다.
settings.py 파일에서 llms 모델을 선택하십시오.

 DEFAULT_GPT_MODEL = "gpt-3.5-turbo"
DEFAULT_GPT_HELPER_MODEL = "gpt-3.5-turbo-16k"
DEFAULT_GPT_QA_HELPER_MODEL = "gpt-3.5-turbo-16k"

default_gpt_model- 대화를위한 메인 모델.
default_gpt_helper_model- 요약 버퍼 메모리를위한 모델.
default_gpt_qa_helper_model- 검색 QA 모델.

큰 맥락에는 더 많은 토큰이 필요합니다. 16K 토큰으로는 대부분의 경우 충분합니다.

Default_GPT_MODEL 용 GPT-4 모델은 더 나은 경험을 위해 적극 권장하지만 10 배 비싸며 사전 지불 된 OpenAI 계정에만 사용할 수 있습니다.

Zep Vector Store Server 또는 Audio Server URL과 같은 settings_private.py 에있는 일부 민감하거나 사용자 별 설정.

 ZEP_API_URL = "http://localhost:8000"
DEFAULT_MEMORY_TYPE = "Summary Buffer"
AUDIO_SERVER_URL = "http://localhost:5000"

추억

기본적으로 Langchain의 "Summary Buffer"메모리는 대화 컨텍스트를 유지하는 데 사용됩니다.

Pippa는 6 가지 유형의 추억을 지원합니다.

슬라이딩 윈도우 : ConversationBufferWindowMemory- 지정된 수의 메시지를 유지합니다.
토큰 버퍼 : ConversationTokenBuffermemory- 주어진 수의 토큰을 기반으로 메시지를 유지합니다.
요약 버퍼 : MonstationSumMaryBuffermemory- 모든 메시지를 저장하면서 요약 된 기록을 유지합니다.
요약 : MonstationSummaryMemory- 요약 만 유지합니다.
버퍼 : ConversationBuffermemory- 메시지의 전체 이력을 그대로 저장하는 가장 기본적인 메모리 유형입니다.
Zep : 벡터 스토어

ZEP는 큰 상황에 적극 권장됩니다. Docker 컨테이너로 로컬로 실행할 수 있습니다. settings_private.py 를 편집하십시오.

요약 유형 메모리가 Zep을 포함하여 선택 될 때 요약이 나타납니다. 요약은 요약 GTP 도우미 모델에 의해 생성됩니다.

ZEP가 인덱스 및 요약을 생성하는 데 시간이 걸립니다. 준비가되지 않았을 때 "요약 ... 인내심을 갖으십시오." 메시지가 나타납니다.

 ZEP_API_URL = "http://localhost:8000"

ZEP 서버는 모든 호스트 또는 포트에서 실행할 수 있습니다. 다른 호스트에서 실행되면 settings_private.py 에서 ZEP_API_URL 변수를 업데이트하십시오.

Zep을 실행하는 방법을 배우려면 https://www.getzep.com/을 방문하십시오.

앱 실행

PIPPA 앱을 실행하려면 다음 명령을 사용하십시오.

streamlit run main.py

앱은 포트 5000에서 청취하는 오디오 서버를 자동으로 시작합니다. 필요한 경우 audio_server.py 실행하여 오디오 서버를 수동으로 실행할 수 있습니다.

문서 수집

PIPPA가 배울 수있는 자신의 문서를 얻으려면 다음을 수행하십시오.

docs 폴더에 문서 (예 : PDF, DOCX, XLSX, TXT, MD, PY)를 배치하십시오.
vectordb.py 스크립트를 실행하여 벡터 데이터베이스를 만듭니다.

   python vectordb.py

TTS/STT 엔진 - elevenlabs

ElevenLabs API 키가있는 경우 PIPPA와 함께 TTS (텍스트 음성) 엔진을 사용할 수 있습니다.

stt (speech-to-text)는 OpenAi의 Whisper-1 모델에 의해 처리됩니다.

다음 단계를 따르십시오.

tts.py 스크립트를 실행하여 ElevenLabs 계정에서 사용 가능한 음성 이름 및 ID를 얻으십시오.

   python tts.py

적절한 음성 ID로 settings_private.py 에서 다음 변수를 업데이트하십시오.

 VOICE_ID_AI = ""
VOICE_ID_SYSTEM = ""
VOICE_ID_HUMAN = ""

TTS/STT 기능은 플라스크 오디오 서버로 지원됩니다. 앱이 시작되면 서버가 포트 5000에서 자동으로 실행되고 청취됩니다. audio_server.py 실행하여 수동으로 서버를 실행할 수도 있습니다.
오디오 확인란을 사용하면 앱이 오디오 서버를 사용하여 텍스트를 음성으로 변환하고 음성으로 텍스트로 변환합니다. Mac에서는 앱이 시스템 환경 설정에서 마이크를 사용할 수 있어야합니다. 먼저 사용하면 앱이 마이크를 사용할 수 있습니다.
녹음 버튼이 녹음을 시작하고 완료되면 중지를 클릭합니다. 앱은 녹음 된 오디오를 텍스트로 자동 변환하여 챗봇으로 보냅니다.
TTS 기능을 보려면 메시지에 할당 된 Speek 버튼을 클릭하십시오. 앱은 텍스트를 자동으로 음성으로 변환하고 오디오를 재생합니다.
타이핑 모드로 돌아가려면 오디오 확인란을 선택 취소하십시오.

프롬프트 키워드

settings.py 파일을 편집하여 PIPPA에 사용 된 프롬프트 키워드 접두사를 사용자 정의 할 수 있습니다.

PROMPT_KEYWORD_PREFIX_SYSTEM : 임시 시스템 메시지에 사용됩니다 (기본값 : "시스템 :")
PROMPT_KEYWORD_PREFIX_CI : 사용자 정의 지침을 대체하는 데 사용됩니다 (기본값 : "ci :")
PROMPT_KEYWORD_PREFIX_QA : docs 폴더의 문서를 기반으로 QA를 검색하는 데 사용됩니다 (기본값 : "QA :")
PROMPT_KEYWORD_PREFIX_GOOGLE : 주어진 정보를 위해 웹을 검색하는 데 사용됩니다 (기본값 : "Google :")
PROMPT_KEYWORD_PREFIX_WIKI : Wikipedia 검색에 사용됩니다 (기본값 : "Wiki :")
PROMPT_KEYWORD_PREFIX_MATH : 수학 쿼리에 사용 (기본값 : "math :")
PROMPT_KEYWORD_PREFIX_MIDJOURNEY : Midjourney 프롬프트 생성에 사용됩니다 (기본값 : "Midjourney :")

대화와 컨텍스트 Windows가 관리되고 저장되는 방법

스냅 샷 가져 오기 : PIPPA가 응답 할 때마다 스냅 샷이 캡처됩니다. 이 스냅 샷에는 컨텍스트 창뿐만 아니라 전체 대화가 포함되어 있습니다.
대화 저장 : 대화는 사용자가 "대화 내보내기"버튼을 클릭 할 때 대화 폴더에서 JSON 파일로 저장됩니다.
마지막 사용자 입력 : 가장 최근의 사용자 입력은 Temp 폴더 내의 last_user_input.md 파일에 저장됩니다. 이는 입력을 재설정하는 임계 앱 오류가 발생한 경우 마지막 입력을 복원하는 데 사용됩니다.
새로운 대화 시작 : 새로운 대화를 시작할 때 컨텍스트 창과 대화가 재설정됩니다. "대화로드"드롭 다운 메뉴에서 이전 대화를 선택하면 JSON 파일이로드되고 컨텍스트 창이 복원됩니다. 그러나 전체 대화를 복원하려면 앱을 다시 실행해야합니다. ZEP는 다른 랭케인 메모리 유형과 호환되지 않습니다. 진행중인 대화 중에 ZEP로 전환하는 경우 최신 스냅 샷을로드하여 컨텍스트와 전체 대화를 ZEP의 벡터 저장소로 복원하십시오.

스트리밍 및 비용 정보

스트리밍은 기본적으로 활성화됩니다. 비활성화하려면 settings.py 파일을 다음과 같이 수정하십시오.

 STREAMING_ENABLED = True

스트리밍이 활성화되면 비용은 OpenAI의 문서를 기반으로 근사치입니다. 정확한 비용을 얻으려면 스트리밍을 비활성화해야합니다.

비용 계산에는 요약 및 QA와 같은 보조 GPT 모델에서 발생한 다른 비용은 포함되지 않습니다.

자치령 대표

settings.py 에서 다음 상수를 설정하십시오.

 DEFAULT_GPT_AGENT_HELPER_MODEL = "gpt-4"

‼ 닐 경고 :이 작업은 OpenAI 토큰 측면에서 매우 비쌉니다.

 MAX_AGENTS_ITERATIONS = 8

반복 횟수는 에이전트가 실행할 수 있는지를 결정합니다. 많은 수의 반복은 일반적으로 더 정확한 답변으로 이어 지지만 더 많은 토큰을 소비합니다.

Google 검색 에이전트는 최상의 답변을 얻으려면 여러 쿼리를 수행해야 할 수도 있습니다.

예를 들어, "한국, 미국 및 일본 주 대표 중 가장 오래된 사람은 누구입니까?"라고 물으면 최종 답변을 얻으려면 에이전트가 최소 3-4 번 쿼리해야 할 것입니다.

동일한 모델이 동일한 쿼리에 다르게 응답 할 수 있습니다. 'GPT-4'조차도 항상 최고를 수행하는 것은 아니지만 강력히 권장됩니다. 다른 모델로 실험하십시오.

랑 체인 수준에서도 실험적이라는 점에 유의하십시오. 예상대로 작동하지 않을 수 있습니다.

검색 웹

프롬프트 기술에 따라 히트 또는 미스 상황입니다. Google 검색 기능을 사용하려면 Serpapi API 키가 필요합니다 : https://serpapi.com. 제공된 최종 답변은 기본 모델의 중간 프롬프트 역할을합니다.

Wikipedia를 검색하십시오

에이전트는 먼저 주어진 쿼리의 관련 Wikipedia 페이지를 찾으려고 시도합니다. 발견되면 페이지 요약을 반환하고 요약 내의 특정 용어를 검색합니다.

수학

LLM은 수학 능력으로 알려져 있지 않습니다. 수학 에이전트는 매우 복잡한 수학 문제에 대한 정확한 답변을 제공합니다.

벡터 DB 관리

벡터 데이터베이스를 관리하려면 vectordb.py 스크립트를 실행하십시오.

   python vectordb.py

다음 옵션이 있습니다.

(c) REATE DB : settings.CHROMA_DB_FOLDER 폴더에서 새 벡터 데이터베이스를 만듭니다 settings.VECTORDB_COLLECTION
(e) MBED 대화 : settings.CONVERSATION_SAVE_FOLDER 폴더에서 대화를 포함시켜 장기 메모리 역할을합니다.
(d) Elete Collection : 벡터 데이터베이스 컬렉션을 삭제합니다. 이 작업은 벡터 데이터베이스 자체를 삭제하지 않습니다.
(Q) Uery DB : 루프에서 벡터 데이터베이스를 쿼리하십시오. 루프를 종료하려면 '종료'또는 '종료'를 입력하십시오.

(e) MBED 대화 옵션을 선택할 때 기존 내보내기 대화 *.json 만 snapshot.json 제외한 벡터 데이터베이스에 포함됩니다.

문제 해결

앱을 실행할 때 오류가 발생하면 다음 단계를 시도하십시오.

pip install --upgrade charset_normalizer
pip install --upgrade openai
pip install --upgrade langchain

특허

PIPPA는 Apache 2.0 라이센스에 따라 릴리스됩니다. 개인 또는 상업적 목적으로 코드를 사용, 수정 및 배포하십시오.

확장하다

추가 정보

버전 v1.1 -
유형 기타 소스코드
업데이트 시간 2025-03-07
크기 7.08MB
출처 Github

pippaGPT

PIPPAGPT- 개인화, 섭취, 지속성, 다형성, 적응 형 GPT 챗봇

특징

프로젝트 배경

설치

추억

앱 실행

문서 수집

TTS/STT 엔진 - elevenlabs

프롬프트 키워드

대화와 컨텍스트 Windows가 관리되고 저장되는 방법

스트리밍 및 비용 정보

자치령 대표

검색 웹

Wikipedia를 검색하십시오

수학

벡터 DB 관리

문제 해결

특허

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express