تنزيل pippaGPT - تنزيل رمز المصدر pippaGPT

pippaGPT

شفرة المصدر الأخرى

v1.1 -

تنزيل

Pippagpt - مخصصة ، تناول ، مستمر ، متعدد الأشكال ، GPT chatbot التكيفي

شعار Pippa

Pippa هو مشروع chatbot من طراز اللغة الكبير مفتوح المصدر (LLM) استنادًا إلى إطار Langchain. يهدف إلى تقديم تجربة محادثة مخصصة وتكيفية.

تدمج PIPPA ميزات مختلفة لتعزيز عملية التكيف ، بما في ذلك القدرة على تخصيص شخصية Chatbot ، ودخل المستندات للتعلم ، وتذكر تاريخ المحادثة ، والتبديل بين الشخصيات المختلفة ، والتكيف مع احتياجات المستخدم.

سمات

مخصصة: يمكن للمستخدمين تخصيص شخصية chatbot لتجربة محادثة أكثر جاذبية وتخصيصًا.
الاستيعاب: يمكن لـ PIPPA استيعاب المستندات واستخراج السياق ، مما يسمح للمستخدمين بدمج مستنداتهم الخاصة في قاعدة المعرفة في chatbot.
الثبات: يحتفظ Pippa بتاريخ المحادثات ، مما يتيح للمستخدمين إعادة النظر في سياقات المحادثة السابقة.
متعدد الأشكال: يمكن أن تتحول Pippa إلى أحرف من اختيارك ، ويمكن تخصيصها بسهولة من خلال التعليمات المخصصة.
Adaptive: يتكيف PIPPA مع احتياجات المستخدمين عن طريق تعديل نمطها واستجاباتها على السياق.

استلهمت وحدة الاسترداد QA من قبل الهندسة المهمة.

خلفية المشروع

بدأ مشروع PIPPA كهواية شخصية لاستكشاف إمكانية إنشاء شخصية ابنة منظمة العفو الدولية. على الرغم من أنه لا يزال في المراحل المبكرة ، يتم تحديث المشروع بانتظام بميزات وتحسينات جديدة. الأدوار الافتراضية في PIPPA هي "نظام" لرسائل النظام ، "Pippa" كشخصية ابنة الرعاية ، و "Bundy" كوالدها.

عند استخدام محركات TTS/STT ، يستخدم Pippa واجهة برمجة تطبيقات ElevenLabs. يمكنك التسجيل للحصول على حساب مجاني: https://elevenlabs.io.

لتجربة أفضل ، قم بتعيين أصوات فريدة من نوعها للشخصيات.

تثبيت

تم اختباره مع بيثون 3.10.

لتثبيت Pippa ، اتبع هذه الخطوات:

استنساخ المستودع:

   git clone https://github.com/neobundy/pippaGPT.git

انتقل إلى دليل المشروع:

   cd pippaGPT

تثبيت التبعيات المطلوبة:

   pip install -r requirements.txt

ملاحظة: إذا واجهت أخطاء ، فقد تحتاج إلى تثبيت تبعيات إضافية مثل ffmpeg و portaudio . على MacOS ، يمكنك استخدام Homebrew.
لتثبيتها ، قم بتشغيل الأوامر التالية:
brew install ffmpeg
brew install portaudio

قم بإنشاء أو نسخ env_sample إلى ملف .env في المجلد الجذر للمشروع وإضافة مفاتيح API:

لاحظ أن ugging_face_api_key للاستخدام في المستقبل.

OPENAI_API_KEY=
XI_API_KEY=
HUGGING_FACE_API_KEY=
SERPAPI_API_KEY=

بدلاً من ذلك ، يمكنك تصدير متغيرات البيئة هذه في المحطة الخاصة بك.

نسخ characters_samply.py إلى characters.py وقم بتحرير الملف لتخصيص اسم وشخصية الذكاء الاصطناعي.
نسخ settings_private_sample.py إلى settings_private.py . settings_sample.py إلى settings.py وتحرير الملفات لتخصيص الإعدادات الخاصة بك.
اختر طراز LLMS في ملف settings.py :

 DEFAULT_GPT_MODEL = "gpt-3.5-turbo"
DEFAULT_GPT_HELPER_MODEL = "gpt-3.5-turbo-16k"
DEFAULT_GPT_QA_HELPER_MODEL = "gpt-3.5-turbo-16k"

default_gpt_model - النموذج الرئيسي للمحادثة.
Default_GPT_HELPER_MODEL - نموذج لذكريات العازلة الملخص.
default_gpt_qa_helper_model - نموذج لاسترجاع QA.

سياق كبير يحتاج إلى المزيد من الرموز. رموز 16K كافية لمعظم الحالات.

ينصح بشدة GPT-4 لـ Default_GPT_MODEL بتجربة أفضل ، ولكن لاحظ أنه مكلف 10x ومتاح فقط لحسابات OpenAI المدفوعة مسبقًا.

بعض الإعدادات الحساسة أو الخاصة بالمستخدم الموجودة في settings_private.py مثل خادم متجر ZEP Vector أو عناوين URL لخادم الصوت.

 ZEP_API_URL = "http://localhost:8000"
DEFAULT_MEMORY_TYPE = "Summary Buffer"
AUDIO_SERVER_URL = "http://localhost:5000"

ذكريات

بشكل افتراضي ، يتم استخدام ذاكرة Langchain "Buffer" للاحتفاظ بسياق المحادثة.

يدعم Pippa ستة أنواع من الذكريات:

نافذة الانزلاق: محادثة BufferWindowMemory - يحتفظ بعدد محدد من الرسائل.
المميز العازلة: محادثة TovelyBuffermemory - يحتفظ بالرسائل بناءً على عدد معين من الرموز.
الملخص العازلة: المحادثات summarybuffermemory - يحتفظ بتاريخ ملخص مع تخزين جميع الرسائل أيضًا.
ملخص: المحادثات SummaryMemory - يحتفظ فقط الملخص.
المخزن المؤقت: محادثة buffermemory - نوع الذاكرة الأساسي الذي يخزن تاريخ الرسائل بأكمله كما هي.
ZEP: متجه متجر

يوصى بشدة ZEP بالسياق الكبير. يمكن تشغيله محليًا كحاوية Docker. تحرير settings_private.py .

تظهر الملخصات عند تحديد ذاكرة نوع الملخص بما في ذلك ZEP. يتم إنشاء الملخصات بواسطة نموذج Helper GTP الملخص.

لاحظ أن الأمر يستغرق بعض الوقت حتى الفهرس ZEP وإنشاء ملخصات. عندما لا تكون جاهزًا ، "تلخيص ... يرجى التحلي بالصبر." ستظهر الرسالة.

 ZEP_API_URL = "http://localhost:8000"

يمكن تشغيل خادم ZEP على أي مضيف أو منفذ. إذا قمت بتشغيله على مضيف مختلف ، فتأكد من تحديث متغير ZEP_API_URL في settings_private.py .

تفضل بزيارة https://www.getzep.com/ لمعرفة كيفية تشغيل ZEP.

تشغيل التطبيق

لتشغيل تطبيق PIPPA ، استخدم الأمر التالي:

streamlit run main.py

سيقوم التطبيق تلقائيًا بتشغيل خادم الصوت الذي يستمع إلى المنفذ 5000. إذا لزم الأمر ، يمكنك تشغيل خادم الصوت يدويًا عن طريق تنفيذ audio_server.py .

تناول مستنداتك

لتناول المستندات الخاصة بك لبيبا للتعلم منها ، اتبع هذه الخطوات:

ضع المستندات الخاصة بك (على سبيل المثال ، PDF ، DOCX ، XLSX ، TXT ، MD ، PY) في مجلد docs .
قم بتشغيل البرنامج النصي vectordb.py لإنشاء قاعدة بيانات المتجه الخاصة بك:

   python vectordb.py

محركات TTS/STT - Elevenlabs

إذا كان لديك مفتاح API ElevenLabs ، فيمكنك استخدام محرك TTS (النص إلى الكلام) مع PIPPA.

يتم التعامل مع STT (الكلام إلى النص) بواسطة طراز Openai's Whisper-1.

اتبع هذه الخطوات:

قم بتشغيل البرنامج النصي tts.py للحصول على الأسماء الصوتية المتوفرة والمعرفات من حساب ElevenLabs الخاص بك:

   python tts.py

قم بتحديث المتغيرات التالية في settings_private.py مع معرفات الصوت المناسبة:

 VOICE_ID_AI = ""
VOICE_ID_SYSTEM = ""
VOICE_ID_HUMAN = ""

يتم دعم ميزات TTS/STT كخادم صوتي قارورة. سيتم تشغيل الخادم تلقائيًا والاستماع إلى المنفذ 5000 عند بدء تشغيل التطبيق. يمكنك أيضًا تشغيل الخادم يدويًا عن طريق تنفيذ audio_server.py .
عند استخدام مربع اختيار الصوت ، سيستخدم التطبيق خادم الصوت لتحويل النص إلى خطاب وكلام إلى نص. على MAC ، يجب أن تسمح للتطبيق باستخدام الميكروفون في تفضيلات النظام. عند الاستخدام الأول ، ستتم مطالبتك بالسماح للتطبيق باستخدام الميكروفون.
يبدأ زر التسجيل في التسجيل ، انقر فوق توقف عند الانتهاء. سيقوم التطبيق تلقائيًا بتحويل الصوت المسجل إلى رسالة نصية وإرساله إلى chatbot.
إلى ميزة TTS ، انقر فوق الزر "التحدث" المعين لأي رسالة. سيقوم التطبيق تلقائيًا بتحويل النص إلى الكلام وتشغيل الصوت.
للعودة إلى وضع الكتابة ، فقط قم بإلغاء تحديد مربع اختيار استخدام الصوت.

الكلمات الرئيسية السريعة

يمكنك تخصيص بادئات الكلمات الرئيسية المطالبة المستخدمة في PIPPA عن طريق تحرير ملف settings.py .

PROMPT_KEYWORD_PREFIX_SYSTEM : يستخدم لرسائل النظام المؤقت (افتراضي: "النظام:")
PROMPT_KEYWORD_PREFIX_CI : يستخدم لاستبدال الإرشادات المخصصة (الافتراضي: "CI:")
PROMPT_KEYWORD_PREFIX_QA : يستخدم لاسترجاع QA استنادًا إلى مستنداتك في مجلد docs (الافتراضي: "QA:")
PROMPT_KEYWORD_PREFIX_GOOGLE : يستخدم للبحث في الويب للحصول على معلومات معينة (افتراضي: "Google:")
PROMPT_KEYWORD_PREFIX_WIKI : يستخدم للبحث عن ويكيبيديا (افتراضي: "wiki:")
PROMPT_KEYWORD_PREFIX_MATH : يستخدم للاستعلام الرياضي (افتراضي: "الرياضيات:")
PROMPT_KEYWORD_PREFIX_MIDJOURNEY : يستخدم لإنشاء مطالبات Midjourney (افتراضي: "Midjourney:")

كيف تتم إدارة المحادثات والسياق وحفظها

أخذ لقطة: يتم التقاط لقطة عندما يستجيب Pippa. تتضمن هذه اللقطة المحادثة بأكملها ، وليس فقط نافذة السياق.
حفظ المحادثات: يتم حفظ المحادثة كملف JSON في مجلد المحادثات عندما ينقر المستخدم على زر "Export Convent".
آخر إدخال المستخدم: يتم حفظ أحدث إدخال المستخدم في ملف Last_user_input.md ضمن مجلد Temp. يتم استخدام هذا لاستعادة آخر إدخال في حالة وجود خطأ في التطبيق الحرج الذي يعيد تعيين الإدخال.
بدء محادثة جديدة: عند بدء محادثة جديدة ، تتم إعادة تعيين نافذة السياق والمحادثة. إذا اخترت محادثة سابقة من قائمة "تحميل محادثة" ، يتم تحميل ملف JSON واستعادة نافذة السياق. لاستعادة المحادثة بأكملها ، ستحتاج إلى إعادة تشغيل التطبيق. لاحظ أن ZEP غير متوافق مع أنواع ذاكرة Langchain الأخرى ؛ إذا قمت بالتبديل إلى ZEP أثناء محادثة مستمرة ، فتأكد من تحميل أحدث لقطة لاستعادة كل من السياق والمحادثة بأكملها في متجر ZEP's Vector.

البث والتكاليف المعلومات

يتم تمكين البث افتراضيًا. لتعطيلها ، قم بتعديل ملف STEPTS.PY على النحو التالي:

 STREAMING_ENABLED = True

عند تمكين البث ، تكون التكاليف تقريبية بناءً على وثائق Openai. للحصول على تكاليف دقيقة ، ستحتاج إلى تعطيل البث.

لاحظ أن حساب التكلفة لا يتضمن نفقات أخرى تكبدتها نماذج GPT الإضافية ، مثل تلك الخاصة بالتلخيص و QA.

الوكلاء

اضبط الثابت التالي في settings.py .

 DEFAULT_GPT_AGENT_HELPER_MODEL = "gpt-4"

‼ ️ تحذير: هذه العملية مكلفة للغاية من حيث الرموز المميزة Openai.

 MAX_AGENTS_ITERATIONS = 8

يحدد عدد التكرارات عدد المرات التي سيقوم فيها الوكيل. يؤدي عدد أكبر من التكرارات عمومًا إلى إجابات أكثر دقة ، ولكنه يستهلك أيضًا المزيد من الرموز.

يرجى ملاحظة أن وكيل بحث Google قد يحتاج إلى إجراء استفسارات متعددة للحصول على أفضل إجابة.

على سبيل المثال ، إذا سألت "من هو الأقدم بين رؤساء ولاية كوريا الجنوبية والولايات المتحدة واليابان؟" ، من المحتمل أن يحتاج العميل إلى الاستعلام عن 3-4 مرات على الأقل للحصول على الإجابة النهائية.

قد يستجيب نفس النموذج بشكل مختلف لنفس الاستعلام. حتى "GPT-4" لا تؤدي دائمًا الأفضل ، ولكن الموصى بها للغاية. تجربة مع نماذج مختلفة.

لاحظ أنه حتى على مستوى Langchain ، فهو تجريبي للغاية. قد لا تعمل كما هو متوقع.

البحث على شبكة الإنترنت

إنه وضع ناجح أو تفوت اعتمادًا على مهاراتك في الطالبة. تحتاج إلى مفتاح Serpapi API لاستخدام ميزة بحث Google: https://serpapi.com. تعد الإجابة النهائية المقدمة بمثابة مطالبة وسيطة للنموذج الرئيسي.

ابحث ويكيبيديا

يحاول الوكيل أولاً العثور على صفحة ويكيبيديا ذات الصلة للاستعلام المحدد. إذا وجدت ، فسيقوم بإرجاع ملخص الصفحة والبحث عن المصطلح المحدد في الملخص.

الرياضيات

LLMs غير معروفة بكفاءتها في الرياضيات. يوفر وكيل الرياضيات إجابات دقيقة لمشاكل الرياضيات المعقدة للغاية.

إدارة المتجه DB

لإدارة قاعدة بيانات المتجه ، قم بتشغيل البرنامج النصي vectordb.py .

   python vectordb.py

لديك الخيارات التالية:

(ج) Reate DB: قم بإنشاء قاعدة بيانات متجهة جديدة في مجلد settings.CHROMA_DB_FOLDER مع مجموعة تسمى settings.VECTORDB_COLLECTION .
(هـ) محادثات mbed: تضمين محادثات من settings.CONVERSATION_SAVE_FOLDER .
(د) مجموعة eLete: حذف مجموعة قاعدة بيانات المتجهات. لن يحذف هذا الإجراء قاعدة بيانات المتجه نفسه.
(س) Uery DB: الاستعلام عن قاعدة بيانات المتجه في حلقة. أدخل "الخروج" أو "الإقلاع" للخروج من الحلقة.

لاحظ أنه عندما تختار خيار المحادثات (E) MBED snapshot.json سيتم دمج المحادثات التي تم تصديرها *.json .

استكشاف الأخطاء وإصلاحها

إذا واجهت أخطاء عند تشغيل التطبيق ، جرب الخطوات التالية:

pip install --upgrade charset_normalizer
pip install --upgrade openai
pip install --upgrade langchain

رخصة

يتم إصدار PIPPA بموجب ترخيص Apache 2.0. لا تتردد في استخدام وتعديل وتوزيع الرمز للأغراض الشخصية أو التجارية.

يوسع

معلومات إضافية

الإصدار v1.1 -
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-07
الحجم 7.08MB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل