الحفاظ على الإنسان في الحلقة. أنا لست مطورًا في QDrant ، ولا يرتبط مباشرة بهم ، لكنني أعتقد أنهم قاموا ببناء شيء ممتاز ، وحتى الآن لا يحظى بالتقدير. هذا الريبو هنا ليكون بمثابة عرض تجريبي أكثر من أي شيء آخر.
https://github.com/qdrant/qdrant
سأسميها بمجرد أن تكون مرتبة ومتاحة على DockerHub. يكفي أن تتمكن من استخدامه لتشغيل POC الخاص بك دون أي رمز إضافي.
يمكنك تحقيق ما يقرب من نصف هذه الأداة فقط عبر واجهة مستخدم Swagger الخاصة بهم ، ولكن من الواضح أن هذا مصمم لضرب واجهات برمجة تطبيقات بسيطة ، وليس سير عمل منظمة العفو الدولية المتمحورة حول البيانات ، لذلك فهي تفتقد بعض المكونات المفيدة. هذا العمل مكتوب بعمق أكثر هنا https://medium.com/@george.pearse (قواعد بيانات Vector Part 2).

يقع شعار الألعاب في مكان ما بين كوب مكبدي لكيفية تمكينك للأدوات من التركيز حقًا على مجموعة فرعية بيانات محددة ، ورسم بياني بايزي كلاسيكي إذا كنت قد تم نقله بدرجة كافية لمحاولة إضافة التعلم النشط.
العثور على وثائق من أجل التحويلات الجملة التي تعانق من خلال Google Search دفعني إلى الجنون ، فهو يعيش هنا https://www.sbert.net/docs/hugging_face.html
وضع العلامات السريعة مع الوجه المعانقة ، التدفق والكدرانت. أولاً ، سأدعم NLP ، ثم سأفكر في إضافة دعم الصور (وهو المكان الذي جاءت منه هذه الفكرة).

انظر Kern.ai للحصول على حل كامل في مهب يستخدم Qdrant وراء الكواليس. من المفترض أن تكون هذه الأداة بسيطة بما يكفي لتكون بمثابة مقدمة لقواعد بيانات المتجهات. يمكنك الكتابة ورؤية الطلبات ، تمامًا كما تفعل عبر API Python.
وبالمثل ، فإن Koaning/Bulk ممتاز ، ولكن ماذا لو تفقد UMAP (إدراج تقنية الحد من الأبعاد البديلة هنا) كل الفوارق الفاسقة ، وتفشل التصورات عالية المستوى في توفير قيمة لمجموعة البيانات الخاصة بك؟
أردت أيضًا أن أعطي Fastapi إجراء اختبار صغير ، لذا لكل استعلام (طلب نشر) الذي يمكنك حفظه ، يمكنك تلقي نتائجه عن طريق ضرب نقطة نهاية Fastapi باسم الاستعلام.
لتطبيق هذه الأدوات على مجموعة بيانات متعددة الوسائط ، ستحتاج فقط إلى تسلسل التضمينات لكل مكون وبعيدًا أن تذهب مع كل التقنيات نفسها.
NB: أسماء أخرى
قد يكون من المنطقي تطبيق تشابه مقطوع بدلاً من أقرب K.
للبدء ، فقط الجري
docker-compose up