يهدف هذا المشروع إلى استكشاف البحث عن قاعدة بيانات Weaviate ، باستخدام Cohere لإنشاء ناقلات مخصصة. هناك العديد من عمليات البحث التي نقوم بها باستخدام الخطوات المذكورة أدناه:
- خرقة واحدة موجه
- البحث المتجه
ستحتاج إلى ما يلي:
- مفتاح واجهة برمجة تطبيقات Weaviate وعنوان URL
- مفتاح Cohere API
- تثبيت Virtual Env ، ثم:
pip install -r requirements.txt - قم بإنشاء ملف .env وتخزين رصيدك
- اختبر اتصال DB عن طريق التشغيل:
python database/open_db_connection - إنشاء تضمينات لمجموعة البيانات:
python database/create_embeddings
- سيؤدي ذلك إلى إنشاء دليل جديد داخل دليل الجذر الخاص بك يسمى "Scratch".
- سيقوم بعد ذلك بإنشاء ملف .csv يحتوي على جميع المتجهات التي تم إنشاؤها بواسطة Cohere
- قم بإنشاء مجموعة جديدة في مثيل Weaviate الخاص بك:
python database/create_collection
- سيؤدي هذا إلى إنشاء مجموعة جديدة تسمى "MovieCustomVector"
- استيراد البيانات:
python database/import_data - استعلام البيانات:
python -m queries.{the_file_you_wish_to_query} - لإنهاء اتصال DB لأي سبب من الأسباب:
python database/close_db_connection
مزيد من المعلومات حول طرق البحث
يتكون البحث الخارق ، المعروف أيضًا باسم "التوليد" ، من خطوتين:
- (Weaviate) قم بتشغيل استعلام بحث في Weaviate للعثور على الكائنات ذات الصلة.
- (Cohere) استخدم نموذج لغة كبير لإنشاء استجابة بناءً على النتائج (من الخطوة السابقة) والمطالبة المقدمة أو المهمة.
اختبار نقاط نهاية الراحة
- الصق عنوان URL لنقطة نهاية WCD الخاصة بك في المتصفح ، وإلحاقه باستخدام
/v1 - سيظهر لك هذا قائمة بنقاط النهاية المريحة التي يمكنك الوصول إليها من خلال تكوين ساعي البريد.
- يستخدم Weaviate رمز حامل ، ويجب أن تم لصقه في WCD_API_KEY للترخيص