تنزيل canopy - تنزيل رمز المصدر canopy

canopy

شفرة المصدر الأخرى

0.9.0

تنزيل

المظلة

ملحوظة

لم يعد فريق المظلة يحافظ على هذا المستودع. شكرا لدعمكم وحماسك للمشروع! إذا كنت تبحث عن حل خرقة مُدارة عالي الجودة مع التحديثات والتحسينات المستمرة ، فيرجى مراجعة مساعد Pinecone.

Canopy هو إطار عمل معزز للاسترجاع مفتوح المصدر (RAG) ومحرك السياق المبني على أعلى قاعدة بيانات ناقل Pinecone. تمكنك Canopy من تجربة التطبيقات وإنشاءها بسرعة وسهولة باستخدام RAG. ابدأ في الدردشة مع المستندات أو البيانات النصية مع عدد قليل من الأوامر البسيطة.

يأخذ Canopy الرفع الثقيل لبناء تطبيقات خرقة: من تقطيع وتضمين بيانات النص الخاصة بك إلى إدارة سجل الدردشة ، وتحسين الاستعلام ، واسترجاع السياق (بما في ذلك الهندسة السريعة) ، والتوليد المعزز.

يوفر Canopy خادمًا مدمجًا قابلاً للتكوين حتى تتمكن من نشر تطبيق دردشة يعمل بالطاقة على واجهة المستخدم الخاصة بك أو الواجهة. أو يمكنك إنشاء تطبيق خرقة مخصص خاص بك باستخدام مكتبة Canopy.

يتيح لك Canopy تقييم سير عمل RAG الخاص بك باستخدام أداة دردشة تعتمد على CLI. من خلال أمر بسيط في cli Canopy ، يمكنك الدردشة بشكل تفاعلي مع بيانات النص الخاصة بك ومقارنة Rag مقابل سير العمل غير المقيد جنبًا إلى جنب.

تحقق من منشور المدونة لمعرفة المزيد ، أو رؤية برنامج تعليمي سريع هنا.

خرقة مع المظلة

تقوم Canopy بتنفيذ سير عمل RAG الكامل لمنع الهلوسة وزيادة LLM مع بيانات النص الخاصة بك.

المظلة لها تدفقان: إنشاء قاعدة المعرفة والدردشة. في تدفق إنشاء قاعدة المعرفة ، يقوم المستخدمون بتحميل مستنداتهم وتحويلها إلى تمثيلات ذات معنى مخزنة في قاعدة بيانات ناقلات Pinecone. في تدفق الدردشة ، يتم تحسين الاستعلامات الواردة وتاريخ الدردشة لاسترداد المستندات الأكثر صلة ، ويتم الاستعلام عن قاعدة المعرفة ، ويتم إنشاء سياق ذي معنى للرد على LLM.

ماذا يوجد داخل الصندوق؟

مكتبة Canopy Core - تحتوي المكتبة على 3 فصول رئيسية مسؤولة عن أجزاء مختلفة من سير عمل Rag:
- Chatengine - يعرض واجهة الدردشة للتفاعل مع بياناتك. بالنظر إلى تاريخ رسائل الدردشة ، يقوم ChatEngine بصياغة الاستعلامات ذات الصلة إلى ContextEngine ، ثم يستخدم LLM لإنشاء استجابة على دراية.
- Contextengine - يؤدي الجزء "الاسترجاع" من القطع. يستخدم ContextEngine قاعدة KnowledgeBase الأساسية لاسترداد المستندات الأكثر صلة ، ثم يقوم بصياغة سياق نصي متماسك لاستخدامه كموجه لمجلة LLM.
- المعرفة - يدير بياناتك لسير سير عمل RAG. يقوم تلقائيًا بقطع بيانات النص وتحويلها إلى تضمينات نصية ، وتخزينها في قاعدة بيانات المتجه pinecone (افتراضي)/QDrant. بالنظر إلى استعلام نصي - ستسترجع قاعدة المعرفة أجزاء المستندات الأكثر صلة من قاعدة البيانات.

يمكن العثور على مزيد من المعلومات حول استخدام المكتبة الأساسية في وثائق المكتبة

Canopy Server - هذا هو خدمة ويب يلفت مكتبة Canopy Core وتكشفها كأو قبل API REST. تم تصميم الخادم فوق Fastapi و Uvicorn و Gunicorn ويمكن نشره بسهولة في الإنتاج. يأتي الخادم أيضًا مع واجهة مستخدم Swagger مدمجة لسهولة الاختبار والتوثيق. بعد بدء تشغيل الخادم ، يمكنك الوصول إلى واجهة المستخدم Swagger على http://host:port/docs (افتراضي: http://localhost:8000/docs )
Canopy CLI - أداة تطوير مدمجة تتيح للمستخدمين إعداد خادم المظلة الخاص بهم واختبار تكوينه.
مع ثلاثة أوامر CLI فقط ، يمكنك إنشاء خادم مظلة جديد ، وتحميل المستندات الخاصة بك ، ثم التفاعل مع chatbot باستخدام تطبيق الدردشة المدمج مباشرة من المحطة. يتيح chatbot المدمج أيضًا مقارنة الاستجابات المملوءة بالخرق مقابل chatbot الأصلي LLM.

يثبت

إعداد بيئة افتراضية (اختياري)

python3 -m venv canopy-env
source canopy-env/bin/activate

يمكن العثور على مزيد من المعلومات حول البيئات الافتراضية هنا

تثبيت الحزمة

pip install canopy-sdk

يمكنك أيضًا تثبيت Canopy-SDK مع إضافات. انقر هنا لمشاهدة الإضافات المتاحة

إضافات

اسم	وصف
`grpc`	لإلغاء تأمين بعض تحسينات الأداء من خلال العمل مع إصدار GRPC من عميل Pinecone
`torch`	لتمكين التضمينات التي توفرها محولات الجملة
`transformers`	إذا كنت تستخدم anyscale LLMS ، فمن المستحسن استخدام رمز `LLamaTokenizer` الذي يتطلب المحولات كاعتماد
`cohere`	لاستخدام Cohere Reranker أو/و Cohere LLM
`qdrant`	لاستخدام qdrant كقاعدة معرفة بديلة

قم بإعداد متغيرات البيئة

 export PINECONE_API_KEY= " <PINECONE_API_KEY> "
export OPENAI_API_KEY= " <OPENAI_API_KEY> "
export INDEX_NAME= " <INDEX_NAME> "

انقر هنا لمزيد من المعلومات حول متغيرات البيئة

متغيرات البيئة الإلزامية

اسم	وصف	كيف تحصل عليه؟
`PINECONE_API_KEY`	مفتاح API لـ Pinecone. تستخدم للمصادقة على خدمات pinecone لإنشاء فهارس وإدراج بيانات وحذفها والبحث عنها	سجل أو تسجيل الدخول إلى حساب Pinecone الخاص بك في وحدة التحكم. يمكنك الوصول إلى مفتاح API الخاص بك من قسم "مفاتيح API" في الشريط الجانبي من لوحة القيادة الخاصة بك
`OPENAI_API_KEY`	مفتاح API لـ Openai. تستخدم للمصادقة على خدمات Openai للتضمين والدردشة API	يمكنك العثور على مفتاح API Openai هنا. قد تحتاج إلى تسجيل الدخول أو التسجيل في خدمات Openai
`INDEX_NAME`	اسم مظلة فهرس Pinecone سوف يعمل مع	يمكنك اختيار أي اسم طالما أنه يتبع قيود Pinecone
`CANOPY_CONFIG_FILE`	مسار ملف yaml التكوين ليتم استخدامه بواسطة خادم Canopy.	اختياري - إذا لم يتم توفيره ، سيتم استخدام التكوين الافتراضي

متغيرات البيئة الاختيارية

يتم استخدام متغيرات البيئة الاختيارية هذه للمصادقة على الخدمات المدعومة الأخرى للتضمينات و LLMS. إذا قمت بتكوين المظلة لاستخدام أي من هؤلاء مقدمي الخدمات - ستحتاج إلى تعيين متغيرات البيئة ذات الصلة.

اسم	وصف	كيف تحصل عليه؟
`ANYSCALE_API_KEY`	مفتاح API لأي anyscale. تستخدم للمصادقة على نقاط نهاية anyscale لـ Open Source LLMS	يمكنك تسجيل أي نقاط نهاية أي شيء والعثور على مفتاح API الخاص بك هنا
`CO_API_KEY`	مفتاح API ل coere. تستخدم للمصادقة للتعامل مع الخدمات للتضمين	يمكنك العثور على مزيد من المعلومات حول التسجيل في COMERE هنا
`JINA_API_KEY`	مفتاح API لجينا AI. تستخدم للمصادقة على خدمات Jinaai للتضمين والدردشة API	يمكنك العثور على مفتاح API Openai هنا. قد تحتاج إلى تسجيل الدخول أو التسجيل في خدمات Openai
`AZURE_OPENAI_ENDOINT`	عنوان URL لنقطة نهاية Azure Openai التي نشرتها.	يمكنك العثور على هذا في بوابة Azure Openai تحت _keys ونقاط النهاية
`AZURE_OPENAI_API_KEY`	مفتاح API لاستخدامه في نماذج Azure Openai.	يمكنك العثور على هذا في بوابة Azure Openai تحت _keys ونقاط النهاية
`OCTOAI_API_KEY`	مفتاح API لـ OCTOAI. تستخدم للمصادقة على LLMs مفتوحة المصدر المقدمة في Octoai	يمكنك الاشتراك في Octoai والعثور على مفتاح API الخاص بك هنا

تحقق من أن التثبيت ناجح وأن البيئة تم تشغيلها ، وتشغيلها:

canopy

يجب أن يكون الإخراج مشابهًا لهذا:

Canopy: Ready

Usage: canopy [OPTIONS] COMMAND [ARGS]...
# rest of the help message

Quickstart

في هذه البداية السريعة ، سوف نوضح لك كيفية استخدام المظلة لإنشاء نظام إجابة أسئلة بسيط باستخدام RAG (الجيل المعزز للاسترجاع).

1. إنشاء فهرس مظلة جديد

كإعداد لمرة واحدة ، تحتاج Canopy إلى إنشاء فهرس Pinecone جديد تم تكوينه للعمل مع Canopy ، فقط تشغيل:

canopy new

واتبع تعليمات CLI. سيكون للفهرس الذي سيتم إنشاؤه بادئة canopy--<INDEX_NAME> .
عليك فقط القيام بهذه العملية مرة واحدة لكل فهرس المظلة الذي تريد إنشاؤه.

لمعرفة المزيد حول فهارس Pinecone وكيفية إدارتها ، يرجى الرجوع إلى الدليل التالي: فهم الفهارس

2. تحميل البيانات

يمكنك تحميل البيانات في فهرس المظلة باستخدام الأمر:

canopy upsert /path/to/data_directory
# or
canopy upsert /path/to/data_directory/file.parquet
# or
canopy upsert /path/to/data_directory/file.jsonl
# or
canopy upsert /path/to/directory_of_txt_files/
# ...

تدعم Canopy الملفات بتنسيقات jsonl و parquet و csv . بالإضافة إلى ذلك ، يمكنك تحميل ملفات بيانات النص العادي بتنسيق .txt . في هذه الحالة ، سيتم التعامل مع كل ملف كوثيقة واحدة. سيكون معرف المستند هو اسم الملف ، وسيكون المصدر هو المسار الكامل للملف.

ملاحظة : يتم استخدام حقول المستندات في تدفق الخرقة ويجب أن تمتثل للمخطط التالي:

+----------+--------------+--------------+---------------+
| id(str)  | text(str)    | source       | metadata      |
|          |              | Optional[str] | Optional[dict] |
| ----------+--------------+--------------+--------------- |
| " id1 "    | " some text "  | " some source " | { " key " : " val " } |
+----------+--------------+--------------+---------------+

# id       - unique identifier for the document
#
# text     - the text of the document, in utf-8 encoding.
#
# source   - the source of the document, can be any string, or null.
#            ** this will be used as a reference in the generated context. **
#
# metadata - optional metadata for the document, for filtering or additional context.
#            Dict[str, Union[str, int, float, List[str]]]

يعرض دفتر الملاحظات هذا كيفية إنشاء مجموعة بيانات في هذا التنسيق ، اتبع الإرشادات الواردة في CLI عند تحميل بياناتك.

نصيحة

إذا كنت ترغب في فصل بياناتك إلى مساحات الأسماء ، فيمكنك استخدام خيار --namespace أو متغير بيئة INDEX_NAMESPACE .

3. ابدأ خادم المظلة

يعرض خادم Canopy وظائف Canopy عبر واجهة برمجة تطبيقات REST. وهي ، يتيح لك تحميل المستندات واسترداد المستندات ذات الصلة لاستعلام معين والدردشة مع بياناتك. يعرض الخادم نقطة نهاية A /chat.completion التي يمكن دمجها بسهولة مع أي تطبيق دردشة. لبدء الخادم ، قم بتشغيل:

canopy start

الآن ، يجب مطالبتك برسالة Uvicorn القياسية التالية:

 ...

INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

هذا كل شيء! يمكنك الآن البدء في استخدام خادم Canopy مع أي تطبيق دردشة يدعم A /chat.completion نقطة نهاية.

سيحتفظ أمر بدء المظلة بالمحطة (الاستخدام الموصى به). إذا كنت ترغب في تشغيل الخادم في الخلفية ، فيمكنك استخدام الأمر التالي - nohup canopy start &

إيقاف الخادم

لإيقاف الخادم ، ما عليك سوى الضغط على CTRL+C في المحطة التي بدأت فيها.

أداة دردشة التقييم

يأتي CLI's CLI مع تطبيق دردشة مدمج يتيح لك الدردشة بشكل تفاعلي مع بياناتك النصية ومقارنة RAG مقابل سير العمل غير المقيد جنبًا إلى جنب لتقييم النتائج

في نافذة طرفية جديدة ، قم بتعيين متغيرات البيئة المطلوبة ثم قم بتشغيلها:

canopy chat

هذا سوف يفتح واجهة الدردشة في المحطة الخاصة بك. يمكنك طرح الأسئلة وسيحاول chatbot المملوءة بالخروج الإجابة عليها باستخدام البيانات التي قمت بتحميلها.

لمقارنة استجابة الدردشة مع وبدون خرقة ، استخدم العلم --no-rag

ملاحظة : يتم دعم هذه الطريقة فقط مع Openai في الوقت الحالي.

canopy chat --no-rag

سيؤدي ذلك إلى فتح نافذة واجهة دردشة مماثلة ، ولكن سيظهر كل من ردود القشرة وغير المتجانسة جنبًا إلى جنب.

اعتبارات

تنطبق حدود الأسعار والتسعير الذي يحدده مقدمو النماذج على استخدام المظلة. تعمل Canopy حاليًا مع نماذج Openai و Azure Openai و AnyScale و Cohere.
سيتم دعم المزيد من التكامل في المستقبل القريب.

المساهمة

شكرا لك على النظر في المساهمة في المظلة! يرجى الاطلاع على إرشاداتنا المساهمة لمزيد من المعلومات.

استخدام متقدم

ترحيل تطبيق Openai الحالي إلى المظلة

إذا كان لديك بالفعل تطبيق يستخدم API Openai ، فيمكنك ترحيله إلى المظلة ببساطة عن طريق تغيير نقطة نهاية API إلى http://host:port/v1 ، على سبيل المثال مع التكوين الافتراضي:

 from openai import OpenAI

client = OpenAI ( base_url = "http://localhost:8000/v1" )

إذا كنت ترغب في استخدام مساحة اسم فهرس محددة للدردشة ، فيمكنك فقط إلحاق مساحة الاسم إلى نقطة نهاية API:

 from openai import OpenAI

client = OpenAI ( base_url = "http://localhost:8000/v1/my-namespace" )

تشغيل خادم المظلة في الإنتاج

تستخدم Canopy fastapi كإطار الويب و Uvicorn كخادم ASGI.
لاستخدام المظلة في الإنتاج ، يوصى باستخدام صورة Docker's Canopy ، المتوفرة على حزم GitHub ، لتلبية احتياجات الإنتاج.
للحصول على إرشادات حول نشر المظلة على منصة Google Cloud (GCP) ، راجع المثال المقدم في نشر وثائق GCP.

بدلاً من ذلك ، يمكنك استخدام Gunicorn كـ WSGI من فئة الإنتاج ، والمزيد من التفاصيل هنا.
قم بتعيين متغيرات PORT المطلوب و WORKER_COUNT Envrionment ، وابدأ الخادم بـ:

gunicorn canopy_server.app:app --worker-class uvicorn.workers.UvicornWorker --bind 0.0.0.0: $PORT --workers $WORKER_COUNT

مهم

يتفاعل الخادم مع خدمات مثل Pinecone و Openai باستخدام بيانات اعتماد المصادقة الخاصة بك. عند نشر الخادم على مزود استضافة المواقع العامة ، يوصى بتمكين آلية المصادقة ، بحيث لا يأخذ الخادم سوى طلبات من المستخدمين المصادقين.

يوسع

معلومات إضافية

الإصدار 0.9.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-08
الحجم 3.62MB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل