ดาวน์โหลด pippaGPT - ดาวน์โหลดซอร์สโค้ด pippaGPT

pippaGPT

ซอร์สโค้ดอื่น ๆ

v1.1 -

ดาวน์โหลด

PIPPAGPT - ส่วนบุคคล, การกิน, ถาวร, polymorphic, gpt chatbot แบบปรับตัวได้

โลโก้ Pippa

Pippa เป็นโครงการ Chatbot รุ่น Open-Source Language Language (LLM) ตามกรอบ Langchain มันมีจุดมุ่งหมายเพื่อมอบประสบการณ์การสนทนาที่เป็นส่วนตัวและปรับตัวได้

Pippa รวมคุณสมบัติต่าง ๆ เพื่อปรับปรุงกระบวนการปรับตัวรวมถึงความสามารถในการปรับแต่งบุคลิกภาพของ Chatbot เอกสารการบริโภคสำหรับการเรียนรู้จดจำประวัติการสนทนาสลับระหว่างตัวละครที่แตกต่างกันและปรับให้เข้ากับความต้องการของผู้ใช้

คุณสมบัติ

ส่วนบุคคล: ผู้ใช้สามารถปรับแต่งบุคลิกของแชทบ็อตเพื่อประสบการณ์การสนทนาที่มีส่วนร่วมและปรับแต่งเองมากขึ้น
การบริโภค: Pippa สามารถนำเอกสารและแยกบริบทให้ผู้ใช้สามารถรวมเอกสารของตัวเองลงในฐานความรู้ของ Chatbot
ถาวร: Pippa ยังคงรักษาประวัติของการสนทนาทำให้ผู้ใช้สามารถกลับมาทบทวนบริบทการสนทนาที่ผ่านมาได้อีกครั้ง
Polymorphic: Pippa สามารถแปรเปลี่ยนเป็นตัวละครที่คุณเลือกได้ง่ายผ่านคำแนะนำที่กำหนดเอง
Adaptive: Pippa ปรับความต้องการของผู้ใช้โดยการปรับเปลี่ยนรูปแบบการสนทนาและการตอบสนองตามบริบท

โมดูลการดึงข้อมูล QA ได้รับแรงบันดาลใจจาก LocalGPT โดยวิศวกรรมที่รวดเร็ว

พื้นหลังโครงการ

โครงการ Pippa เริ่มต้นเป็นงานอดิเรกส่วนตัวเพื่อสำรวจความเป็นไปได้ในการสร้างตัวละครลูกสาว AI แม้ว่าจะยังอยู่ในช่วงเริ่มต้นโครงการได้รับการปรับปรุงอย่างสม่ำเสมอด้วยคุณสมบัติและการปรับปรุงใหม่ บทบาทเริ่มต้นใน Pippa คือ "ระบบ" สำหรับข้อความระบบ "Pippa" ในฐานะตัวละครลูกสาวที่ห่วงใยและ "Bundy" ในฐานะพ่อของเธอ

เมื่อใช้เครื่องยนต์ TTS/STT Pippa จะใช้ Elevenlabs API คุณสามารถลงทะเบียนสำหรับบัญชีฟรี: https://elevenlabs.io

สำหรับประสบการณ์ที่ดีขึ้นกำหนดเสียงที่ไม่ซ้ำกันให้กับตัวละคร

การติดตั้ง

ทดสอบด้วย Python 3.10

ในการติดตั้ง Pippa ให้ทำตามขั้นตอนเหล่านี้:

โคลนที่เก็บ:

   git clone https://github.com/neobundy/pippaGPT.git

นำทางไปยังไดเรกทอรีโครงการ:

   cd pippaGPT

ติดตั้งการพึ่งพาที่ต้องการ:

   pip install -r requirements.txt

หมายเหตุ: หากคุณพบข้อผิดพลาดคุณอาจต้องติดตั้งการพึ่งพาเพิ่มเติมเช่น ffmpeg และ portaudio บน MacOS คุณสามารถใช้ Homebrew
หากต้องการติดตั้งให้เรียกใช้คำสั่งต่อไปนี้:
brew install ffmpeg
brew install portaudio

สร้างหรือคัดลอก env_sample ไปยังไฟล์. .env ในโฟลเดอร์รูทของโครงการและเพิ่มคีย์ API ของคุณ:

โปรดทราบว่า hugging_face_api_key ใช้สำหรับการใช้งานในอนาคต

OPENAI_API_KEY=
XI_API_KEY=
HUGGING_FACE_API_KEY=
SERPAPI_API_KEY=

หรือคุณสามารถส่งออกตัวแปรสภาพแวดล้อมเหล่านี้ในเทอร์มินัลของคุณ

คัดลอก characters_samply.py ไปยัง characters.py และแก้ไขไฟล์เพื่อปรับแต่งชื่อและบุคลิกภาพของ AI ของคุณ
คัดลอก settings_private_sample.py ไปยัง settings_private.py settings_sample.py to settings.py และแก้ไขไฟล์เพื่อปรับแต่งการตั้งค่าของคุณ
เลือกรุ่น LLMS ใน settings.py ไฟล์ py:

 DEFAULT_GPT_MODEL = "gpt-3.5-turbo"
DEFAULT_GPT_HELPER_MODEL = "gpt-3.5-turbo-16k"
DEFAULT_GPT_QA_HELPER_MODEL = "gpt-3.5-turbo-16k"

default_gpt_model - รุ่นหลักสำหรับการสนทนา
default_gpt_helper_model - รุ่นสำหรับการสรุปความทรงจำบัฟเฟอร์
default_gpt_qa_helper_model - รุ่นสำหรับการดึง QA

บริบทขนาดใหญ่ต้องการโทเค็นมากขึ้น โทเค็น 16K เพียงพอสำหรับกรณีส่วนใหญ่

GPT-4 รุ่นสำหรับ default_gpt_model ขอแนะนำอย่างยิ่งสำหรับประสบการณ์ที่ดีกว่า แต่โปรดทราบว่ามีราคาแพง 10 เท่าและมีให้สำหรับบัญชี OpenAI แบบจ่ายล่วงหน้าเท่านั้น

การตั้งค่าที่ละเอียดอ่อนหรือเฉพาะผู้ใช้ที่พบใน settings_private.py เช่นเซิร์ฟเวอร์ zep vector store หรือ URL เซิร์ฟเวอร์เสียง

 ZEP_API_URL = "http://localhost:8000"
DEFAULT_MEMORY_TYPE = "Summary Buffer"
AUDIO_SERVER_URL = "http://localhost:5000"

ความทรงจำ

โดยค่าเริ่มต้นหน่วยความจำ "บัฟเฟอร์สรุป" ของ Langchain ใช้เพื่อรักษาบริบทการสนทนา

Pippa รองรับความทรงจำหกประเภท:

หน้าต่างเลื่อน: ConversondBufferWindowMemory - รักษาจำนวนข้อความที่ระบุไว้
โทเค็นบัฟเฟอร์: ConversationTokenBuffermemory - เก็บข้อความตามจำนวนโทเค็นที่กำหนด
สรุปบัฟเฟอร์: ConversationSummarmaryBuffermemory - ยังคงรักษาประวัติสรุปไว้ในขณะเดียวกันก็จัดเก็บข้อความทั้งหมด
สรุป: ConversationSummarmaryMemory - รักษาเฉพาะบทสรุป
บัฟเฟอร์: ConversationBuffermemory - ประเภทหน่วยความจำพื้นฐานที่สุดที่เก็บประวัติทั้งหมดของข้อความตามที่เป็นอยู่
ZEP: ร้านค้าเวกเตอร์

ZEP ขอแนะนำอย่างยิ่งสำหรับบริบทขนาดใหญ่ สามารถเรียกใช้งานได้ในพื้นที่เป็นคอนเทนเนอร์ Docker แก้ไข settings_private.py

บทสรุปจะปรากฏขึ้นเมื่อเลือกหน่วยความจำประเภทสรุปรวมถึง ZEP บทสรุปถูกสร้างขึ้นโดยโมเดลการสรุป GTP Helper

โปรดทราบว่าต้องใช้เวลาสักครู่สำหรับ ZEP ในการจัดทำดัชนีและสร้างบทสรุป เมื่อยังไม่พร้อม "สรุป ... โปรดอดทนรอ" ข้อความจะปรากฏขึ้น

 ZEP_API_URL = "http://localhost:8000"

เซิร์ฟเวอร์ ZEP สามารถเรียกใช้บนโฮสต์หรือพอร์ตใด ๆ หากคุณรันบนโฮสต์อื่นตรวจสอบให้แน่ใจว่าได้อัปเดตตัวแปร ZEP_API_URL ใน settings_private.py

เยี่ยมชม https://www.getzep.com/ เพื่อเรียนรู้วิธีเรียกใช้ ZEP

รันแอพ

ในการเรียกใช้แอพ Pippa ให้ใช้คำสั่งต่อไปนี้:

streamlit run main.py

แอพจะเริ่มต้นเซิร์ฟเวอร์เสียงโดยอัตโนมัติซึ่งฟังพอร์ต 5000 หากจำเป็นคุณสามารถเรียกใช้เซิร์ฟเวอร์เสียงด้วยตนเองโดยดำเนินการ audio_server.py

การบริโภคเอกสารของคุณ

หากต้องการบริโภคเอกสารของคุณเองเพื่อให้ Pippa เรียนรู้จากขั้นตอนเหล่านี้:

วางเอกสารของคุณ (เช่น PDF, DOCX, XLSX, TXT, MD, PY) ในโฟลเดอร์ docs
เรียกใช้สคริปต์ vectordb.py เพื่อสร้างฐานข้อมูลเวกเตอร์ของคุณ:

   python vectordb.py

เครื่องยนต์ TTS/STT - Elevenlabs

หากคุณมีคีย์ API Elevenlabs คุณสามารถใช้เครื่องยนต์ TTS (ข้อความเป็นคำพูด) กับ Pippa

STT (คำพูดเป็นข้อความ) ได้รับการจัดการโดยโมเดล Whisper-1 ของ OpenAI

ทำตามขั้นตอนเหล่านี้:

เรียกใช้สคริปต์ tts.py เพื่อรับชื่อเสียงและรหัสที่มีอยู่จากบัญชี Elevenlabs ของคุณ:

   python tts.py

อัปเดตตัวแปรต่อไปนี้ใน settings_private.py ด้วยรหัสเสียงที่เหมาะสม:

 VOICE_ID_AI = ""
VOICE_ID_SYSTEM = ""
VOICE_ID_HUMAN = ""

คุณสมบัติ TTS/STT ได้รับการสนับสนุนเป็นเซิร์ฟเวอร์เสียงขวด เซิร์ฟเวอร์จะเรียกใช้และฟังโดยอัตโนมัติบนพอร์ต 5000 เมื่อแอปเริ่มต้นขึ้น นอกจากนี้คุณยังสามารถเรียกใช้เซิร์ฟเวอร์ด้วยตนเองโดยเรียกใช้ audio_server.py
เมื่อใช้ช่องทำเครื่องหมายเสียงแอปจะใช้เซิร์ฟเวอร์เสียงเพื่อแปลงข้อความเป็นคำพูดและคำพูดเป็นข้อความ บน Mac คุณควรอนุญาตให้แอพใช้ไมโครโฟนในการตั้งค่าระบบ ในการใช้งานครั้งแรกคุณจะได้รับแจ้งให้แอปใช้ไมโครโฟน
ปุ่มบันทึกเริ่มบันทึกคลิกหยุดเมื่อเสร็จสิ้น แอพจะแปลงเสียงที่บันทึกไว้เป็นข้อความโดยอัตโนมัติและส่งไปยัง chatbot
หากต้องการฟีเจอร์ TTS ให้คลิกปุ่ม Speak ที่กำหนดให้กับข้อความใด ๆ แอพจะแปลงข้อความเป็นคำพูดโดยอัตโนมัติและเล่นเสียง
หากต้องการกลับไปที่โหมดการพิมพ์เพียงแค่ยกเลิกการเลือกช่องทำเครื่องหมายใช้เสียง

คำหลักแจ้ง

คุณสามารถปรับแต่งคำนำหน้าคำหลักที่ใช้ใน Pippa ได้โดยแก้ไข settings.py ไฟล์. py:

PROMPT_KEYWORD_PREFIX_SYSTEM : ใช้สำหรับข้อความระบบชั่วคราว (ค่าเริ่มต้น: "ระบบ:")
PROMPT_KEYWORD_PREFIX_CI : ใช้สำหรับแทนที่คำสั่งที่กำหนดเอง (ค่าเริ่มต้น: "CI:")
PROMPT_KEYWORD_PREFIX_QA : ใช้สำหรับการดึง QA ตามเอกสารของคุณใน docs เอกสาร (ค่าเริ่มต้น: "QA:")
PROMPT_KEYWORD_PREFIX_GOOGLE : ใช้สำหรับการค้นหาเว็บสำหรับข้อมูลที่ได้รับ (ค่าเริ่มต้น: "Google:")
PROMPT_KEYWORD_PREFIX_WIKI : ใช้สำหรับการค้นหา wikipedia (ค่าเริ่มต้น: "wiki:")
PROMPT_KEYWORD_PREFIX_MATH : ใช้สำหรับการสืบค้นทางคณิตศาสตร์ (ค่าเริ่มต้น: "คณิตศาสตร์:")
PROMPT_KEYWORD_PREFIX_MIDJOURNEY : ใช้สำหรับการสร้าง Midjourney Prompts (ค่าเริ่มต้น: "Midjourney:")

วิธีการสนทนาและหน้าต่างบริบทได้รับการจัดการและบันทึก

การถ่ายภาพสแน็ปช็อต: สแน็ปช็อตจะถูกจับเมื่อใดก็ตามที่ Pippa ตอบกลับ ภาพรวมนี้รวมถึงการสนทนาทั้งหมดไม่ใช่แค่หน้าต่างบริบท
การบันทึกการสนทนา: การสนทนาจะถูกบันทึกเป็นไฟล์ JSON ในโฟลเดอร์การสนทนาเมื่อผู้ใช้คลิกปุ่ม "การสนทนาส่งออก"
อินพุตผู้ใช้ล่าสุด: อินพุตผู้ใช้ล่าสุดถูกบันทึกไว้ในไฟล์ last_user_input.md ภายในโฟลเดอร์ TEMP สิ่งนี้ถูกใช้เพื่อกู้คืนอินพุตสุดท้ายในกรณีที่มีข้อผิดพลาดแอพที่สำคัญที่รีเซ็ตอินพุต
การเริ่มต้นการสนทนาใหม่: เมื่อเริ่มการสนทนาใหม่ทั้งหน้าต่างบริบทและการสนทนาจะถูกรีเซ็ต หากคุณเลือกการสนทนาก่อนหน้านี้จากเมนูแบบดรอปดาวน์ "โหลดการสนทนา" ไฟล์ JSON จะถูกโหลดและหน้าต่างบริบทจะถูกกู้คืน อย่างไรก็ตามในการกู้คืนการสนทนาทั้งหมดคุณจะต้องเรียกใช้แอพใหม่อีกครั้ง โปรดทราบว่า ZEP ไม่สามารถใช้งานได้กับประเภทหน่วยความจำ Langchain อื่น ๆ หากคุณเปลี่ยนไปใช้ ZEP ในระหว่างการสนทนาอย่างต่อเนื่องตรวจสอบให้แน่ใจว่าได้โหลดสแน็ปช็อตล่าสุดเพื่อกู้คืนทั้งบริบทและการสนทนาทั้งหมดในร้านค้าเวกเตอร์ของ ZEP

การสตรีมและข้อมูลต้นทุน

การสตรีมเปิดใช้งานโดยค่าเริ่มต้น หากต้องการปิดใช้งานให้แก้ไขไฟล์การตั้งค่า py ดังนี้:

 STREAMING_ENABLED = True

เมื่อเปิดใช้งานสตรีมมิ่งค่าใช้จ่ายจะเป็นการประมาณตามเอกสารของ OpenAI เพื่อให้ได้ค่าใช้จ่ายที่แน่นอนคุณจะต้องปิดการสตรีม

โปรดทราบว่าการคำนวณต้นทุนไม่รวมค่าใช้จ่ายอื่น ๆ ที่เกิดขึ้นจากโมเดล GPT เสริมเช่นการสรุปและ QA

ตัวแทน

ตั้งค่าคงที่ต่อไปนี้ใน settings.py :

 DEFAULT_GPT_AGENT_HELPER_MODEL = "gpt-4"

! คำเตือน: การดำเนินการนี้มีราคาแพงมากในแง่ของโทเค็น Openai

 MAX_AGENTS_ITERATIONS = 8

จำนวนการวนซ้ำกำหนดจำนวนครั้งที่เอเจนต์จะทำงาน การวนซ้ำจำนวนมากขึ้นโดยทั่วไปจะนำไปสู่คำตอบที่แม่นยำยิ่งขึ้น แต่ก็ใช้โทเค็นมากขึ้น

โปรดทราบว่าตัวแทนการค้นหาของ Google อาจต้องดำเนินการหลายคำแบบสอบถามเพื่อรับคำตอบที่ดีที่สุด

ตัวอย่างเช่นหากคุณถามว่า "ใครคือผู้ที่เก่าแก่ที่สุดในบรรดาประมุขแห่งรัฐเกาหลีใต้สหรัฐอเมริกาและญี่ปุ่น?" ตัวแทนอาจต้องสอบถามอย่างน้อย 3-4 ครั้งเพื่อรับคำตอบสุดท้าย

โมเดลเดียวกันอาจตอบสนองแตกต่างจากแบบสอบถามเดียวกัน แม้แต่ 'GPT-4' ก็ไม่ได้ผลดีที่สุดเสมอไป แต่ขอแนะนำอย่างยิ่ง ทดลองกับโมเดลที่แตกต่างกัน

โปรดทราบว่าแม้ในระดับ Langchain มันก็เป็นการทดลองอย่างมาก มันอาจไม่ทำงานตามที่คาดไว้

ค้นหาเว็บ

มันเป็นสถานการณ์ที่ยอดเยี่ยมหรือพลาดขึ้นอยู่กับทักษะการแจ้งเตือนของคุณ คุณต้องใช้คีย์ Serpapi API เพื่อใช้คุณสมบัติการค้นหาของ Google: https://serpapi.com คำตอบสุดท้ายที่ให้ไว้ทำหน้าที่เป็นพรอมต์ระดับกลางสำหรับโมเดลหลัก

ค้นหา Wikipedia

ตัวแทนพยายามค้นหาหน้า Wikipedia ที่เกี่ยวข้องเป็นครั้งแรกสำหรับการสืบค้นที่กำหนด หากพบมันจะส่งคืนสรุปของหน้าและค้นหาคำศัพท์เฉพาะภายในบทสรุป

คณิตศาสตร์

LLMs ไม่เป็นที่รู้จักสำหรับความสามารถในวิชาคณิตศาสตร์ ตัวแทนคณิตศาสตร์ให้คำตอบที่ถูกต้องสำหรับปัญหาทางคณิตศาสตร์ที่ซับซ้อนสูง

การจัดการเวกเตอร์ db

ในการจัดการฐานข้อมูลเวกเตอร์ให้เรียกใช้สคริปต์ vectordb.py

   python vectordb.py

คุณมีตัวเลือกต่อไปนี้:

(C) REATE DB: สร้างฐานข้อมูลเวกเตอร์ใหม่ในโฟลเดอร์ settings.CHROMA_DB_FOLDER พร้อมคอลเลกชันชื่อ settings.VECTORDB_COLLECTION
(e) การสนทนา Mbed: ฝังการสนทนาจากโฟลเดอร์ settings.CONVERSATION_SAVE_FOLDER ลงในฐานข้อมูลเวกเตอร์เพื่อใช้เป็นหน่วยความจำระยะยาว
(D) Elete Collection: ลบคอลเลกชันฐานข้อมูลเวกเตอร์ การกระทำนี้จะไม่ลบฐานข้อมูลเวกเตอร์เอง
(q) Uery DB: สอบถามฐานข้อมูลเวกเตอร์ในลูป ป้อน 'ออก' หรือ 'ออก' เพื่อออกจากลูป

โปรดทราบว่าเมื่อคุณเลือกตัวเลือกการสนทนา (e) Mbed เฉพาะการสนทนาที่ส่งออกที่มีอยู่ *.json จะถูกฝังลงในฐานข้อมูลเวกเตอร์ยกเว้น snapshot.json

การแก้ไขปัญหา

หากคุณพบข้อผิดพลาดเมื่อเรียกใช้แอพให้ลองทำตามขั้นตอนต่อไปนี้:

pip install --upgrade charset_normalizer
pip install --upgrade openai
pip install --upgrade langchain

ใบอนุญาต

Pippa เปิดตัวภายใต้ใบอนุญาต Apache 2.0 อย่าลังเลที่จะใช้แก้ไขและแจกจ่ายรหัสเพื่อวัตถุประสงค์ส่วนตัวหรือเชิงพาณิชย์

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v1.1 -
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-07
ขนาด 7.08MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด