valentinus
valentinus-v0.6.0

Vektor der nächsten Generation DB mit LMDB -Bindungen gebaut
git clone https://github.com/kn0sys/valentinus && cd valentinus| var | Verwendung | Standard |
|---|---|---|
LMDB_USER | Arbeitsverzeichnis des Benutzers für Datenbank | $ Benutzer |
LMDB_MAP_SIZE | Legt die Größe der maximalen Umgebungsgröße fest, dh Größe in Speicher/Festplatte aller Daten | 20% des verfügbaren Speichers |
ONNX_PARALLEL_THREADS | Parallel Ausführungsmodus für diese Sitzung | 1 |
VALENTINUS_CUSTOM_DIM | Einbettungsabmessungen für benutzerdefinierte Modelle | All-Mini-LM-6-> 384 |
VALENTINUS_LMDB_ENV | Umgebung für die Datenbank (dh Test, prod) | prüfen |
all-MiniLM-L6-v2_onnx Verzeichnis erforderlichmkdir all-MiniLM-L6-v2_onnx
cd all-MiniLM-L6-v2_onnx && wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/model.onnx
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/special_tokens_map.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer_config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/vocab.txt RUST_TEST_THREADS=1 cargo test
Siehe Beispiele
Inspiriert von diesem Chromadb -Python -Tutorial