valentinus
valentinus-v0.6.0

Вектор DB следующего поколения, построенный из привязки LMDB
git clone https://github.com/kn0sys/valentinus && cd valentinus| вар | Использование | по умолчанию |
|---|---|---|
LMDB_USER | Рабочий каталог пользователя для базы данных | $ Пользователь |
LMDB_MAP_SIZE | Устанавливает максимальный размер среды, то есть размер в памяти/диск всех данных | 20% доступной памяти |
ONNX_PARALLEL_THREADS | Параллельный режим выполнения для этого сеанса | 1 |
VALENTINUS_CUSTOM_DIM | Встроенные размеры для пользовательских моделей | All-Mini-LM-6-> 384 |
VALENTINUS_LMDB_ENV | среда для базы данных (т.е. тест, Prod) | тест |
all-MiniLM-L6-v2_onnxmkdir all-MiniLM-L6-v2_onnx
cd all-MiniLM-L6-v2_onnx && wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/model.onnx
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/special_tokens_map.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer_config.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/tokenizer.json
wget https://huggingface.co/nigel-christian/all-MiniLM-L6-v2_onnx/resolve/main/vocab.txt RUST_TEST_THREADS=1 cargo test
Смотрите примеры
Вдохновлен этим учебником Python Chromadb