Descarga de VQLite - Descarga del código fuente VQLite

VQLite

Otro código fuente

1.0.0

Descargar

VQLite: motor de búsqueda vectorial simple y liviano basado en Google Scann

中文点这里

VQLite es un motor de búsqueda de similitud vectorial ligero y simple basado en Google Scann. VQLITE proporciona una API relajante simple para la creación de servicios de búsqueda de similitud vectorial.

La razón por la que estamos creando este proyecto es que actualmente no hay una solución que satisfaga nuestras necesidades (como se describe en el siguiente párrafo), y creemos que los motores de búsqueda vectoriales disponibles en el mercado son demasiado pesados, a menudo requieren un clúster de Kubernetes con múltiples réplicas. Esto puede ser un desperdicio de recursos y una carga para muchos proyectos.

Los motores de búsqueda de similitud vectorial comúnmente utilizados (como Milvus, Qdrant, Vearch) se administran por dimensiones vectoriales y operan en vectores. En contraste, VQLite procesa datos basados en documentos como dimensiones. Descubrimos que en muchos casos, no existe una relación individual entre documentos y vectores, sino más bien una relación de uno a muchos donde un documento puede tener múltiples vectores. Administrar datos basados únicamente en vectores puede ser engorroso y dar como resultado recursos desperdiciados al almacenar múltiples copias de metadatos. Por lo tanto, el diseño de VQLite permite múltiples vectores por documento al tiempo que permite el almacenamiento de metadatos sin depender de soluciones de almacenamiento adicionales como MySQL o Redis.

Si realmente desea utilizar este proyecto, comprenda la estructura y el diseño de VQLite, o si desea hacer algunas modificaciones a VQLite para adaptarlo a sus propias necesidades, se recomienda encarecidamente que lea Design.md.

Por supuesto, el aspecto más importante es la velocidad de recuperación; Por lo tanto, utilizamos el escaneo de Google en el núcleo de nuestro sistema, ya que actualmente puede ser el método de búsqueda de similitud de vectores públicos más rápidos disponibles. ~~De hecho, simplemente encapsulamos escaneo~~

La siguiente imagen proviene de Scann.

banco

Características

API de reposo
Simple y liviano
Rápido

Punto de referencia

Utilizamos 13 millones de vectores para construir la base de datos en las máquinas AWS. A continuación se presentan los resultados de la prueba.

Máquina	QPS	Params (nprobe, reordener, topk)
c5.9xLarge	7600	256,256,30
c7g.8xLarge	2900	256,256,30
R5.8XLARGE	6900	256,256,30

Requisitos

Linux o macOS.
Golang

Empezar

Proporcionamos dos formas de usarlo, compilando el código fuente y el uso de Docker. Recomendamos usar el Docker.

Compilar desde el código fuente

git clone --recurse-submodules https://github.com/VQLite/VQLite.git
# git submodule update --remote --merge
cd vqindex
bash build.sh vqindex_api
cp bazel-bin/scann/scann_ops/cc/libvqlite_api.so /usr/local/lib/
cp bazel-bin//external/local_config_tf/libtensorflow_framework. * /usr/local/lib/
cd ..
go build cmd/vqlite.go

Estibador

Primero, copie el vqlite.yaml a su máquina y haga modificaciones apropiadas.

docker pull ghcr.io/vqlite/vqlite:latest

docker run --restart=always -d --name vqlite -p 8880:8880  
    -v $( pwd ) /vqlite.yaml:/app/vqlite.yaml 
    -v $( pwd ) /vqlite_data:/app/vqlite_data 
    vqlite

Ejemplo de uso

Puede verificar el directorio Python_SDK para el código de muestra.

Consejos

Intente hacer que cada segmento sea lo más grande posible, configúrelo al límite de memoria y minimice el número de segmentos. Esto puede mejorar la velocidad de búsqueda. Cuantos más segmentos hay, más lenta será la velocidad.
Según nuestras pruebas, la configuración de Nprobe y Topk tiene poco impacto en la velocidad de recuperación. Reorden tiene un impacto significativo tanto en la velocidad como en la tasa de retiro. En términos simples, cuanto mayor sea el valor de reorden, más lenta es la velocidad de recuperación pero con una tasa de recuperación más alta.
Si ya ha creado el índice, incluso puede eliminar todos los archivos de conjuntos de datos.vql para guardar espacio en disco.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-25
tamaño 73.39KB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo