valentinus
valentinus-v0.6.0

ناقلات الجيل التالي DB مصنوع من روابط LMDB
git clone https://github.com/kn0sys/valentinus && cd valentinus| var | الاستخدام | تقصير |
|---|---|---|
LMDB_USER | دليل العمل للمستخدم لقاعدة البيانات | مستخدم $ |
LMDB_MAP_SIZE | يحدد حجم البيئة القصوى ، أي حجم في الذاكرة/القرص لجميع البيانات | 20 ٪ من الذاكرة المتاحة |
ONNX_PARALLEL_THREADS | وضع التنفيذ الموازي لهذه الجلسة | 1 |
VALENTINUS_CUSTOM_DIM | أبعاد التضمينات للنماذج المخصصة | All-Mini-LM-6-> 384 |
VALENTINUS_LMDB_ENV | بيئة قاعدة البيانات (أي اختبار ، prod) | امتحان |
all-MiniLM-L6-v2_onnxmkdir all-MiniLM-L6-v2_onnx
cd all-MiniLM-L6-v2_onnx && wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/model.onnx
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/special_tokens_map.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer_config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/vocab.txt RUST_TEST_THREADS=1 cargo test
انظر الأمثلة
مستوحاة من هذا البرنامج التعليمي Chromadb Python