dataBase المتجه مع مكتبة QDrant والتضمين مع Tansformers الجملة
محاكاة قاعدة بيانات متجه على مجموعة بيانات كونالا.
مجموعة البيانات
- Conala: مجموعة بيانات Code/Natural Language Language لاسترداد مقتطفات البرنامج ذات الصلة باستعلامات المستخدم.
الأطر
- قاعدة بيانات المتجهات: قاعدة بيانات المتجهات في الذاكرة باستخدام مكتبة QDrant.
- التضمين: محول الجملة (All-Minilm-L6-V2).
الملفات
- Bread_data.ipynb: دفتر لعرض البيانات والتحليل البسيط لمجموعة البيانات.
- inmbeddings.ipynb: احتوى على الكود الكامل لإنشاء التضمين باستخدام محولات الجملة ، و database المتجهات باستخدام QDrant ثم الاسترجاع بناءً على تشابه جيب التمام.
إذا وجدت ريبو مفيدًا ، فيرجى إسقاط أ