Impresionante motor de búsqueda de vectores
Una lista curada de impresionante marco de búsqueda vectorial/motor, biblioteca, servicio en la nube y trabajos de investigación para la búsqueda de similitud vectorial
Servicio independiente
- Apache Cassandra 5.0-Búsqueda de vectores (CEP-30), ácido serializable estricto (CEP-15), base de datos de escala horizontal
- QDRANT - Motor de búsqueda de similitud vectorial con soporte de filtrado extendido
- VALD: un motor de búsqueda de vectores distribuidos altamente escalable
- MILVUS: una base de datos vectorial nativa de nube con alto rendimiento y alta escalabilidad.
- Weaviate: un motor de búsqueda de vectores en tiempo real nativo de nube en la nube
- OpEddistro Elasticsearch KNN: un complemento de aprendizaje automático que admite un algoritmo de búsqueda K -NN aproximado para la distribución abierta para ElasticSearch
- Elastiknn - complemento Elasticsearch para la búsqueda de vecinos más cercanos
- Epsilla: un sistema de gestión de bases de datos de vectores de alto rendimiento, Hippocampus para IA
- Vearch: un sistema distribuido escalable para una búsqueda de similitud eficiente de vectores de aprendizaje profundo
- PGANN - RESPECTIVO RÁPIDO APROXIMADO VERCE (ANN) Búsquedas con una base de datos PostgreSQL
- JINA-Jina te permite construir una búsqueda de aprendizaje profundo como servicio.
- Infinity: la base de datos nativa de AI creada para aplicaciones LLM, que proporciona una búsqueda de vector y texto completo increíblemente rápidos
- Aquila DB - Algoritmo de búsqueda K -NN enfocado en distribución
- Redis HNSW - Un módulo Redis para la búsqueda de similitud basada en HNSW
- Solr - Apache Solr - tiene una función de búsqueda vectorial densa a partir de Solr 9.0
- Marqo: un motor de búsqueda semántico que admite la búsqueda de tensor (secuencia de vectores)
- TXTAI - Crear aplicaciones de búsqueda semántica y flujos de trabajo
- Semantra: una herramienta multipropósito para buscar documentos semánticamente.
- SuperduperdB - Traiga IA a su base de datos favorita
- TensordB - Base de datos vectorial de alto rendimiento que admite computación heterogénea
- JVECTOR: un motor de búsqueda vectorial puro Java, dependencia cero, integrado, utilizado por DataStax Astra DB y Apache Cassandra.
- VQLITE: motor de búsqueda vectorial simple y liviano
- VEXVAULT - 100% Basado en el navegador, código abierto, escalable, simple, búsqueda vectorial de costo cero
- Vespa.ai - Motor de búsqueda de texto y ... Búsqueda de vector aproximado rápido (ANN)
- La búsqueda ANN a gran escala de Vespa utilizando HNSW-IF índices se describe aquí
Biblioteca
- LANGSTREAM-Langstream es un proyecto de código abierto que combina lo mejor de las arquitecturas basadas en eventos con las últimas tecnologías Gen AI.
- Cassio - Cassio es la solución definitiva para integrar a la perfección Apache Cassandra® con inteligencia artificial generativa y otras cargas de trabajo de aprendizaje automático
- JVECTOR: un motor de búsqueda vectorial de Java puro, dependencia cero, utilizado por algunas de las bases de datos distribuidas avanzadas, como Datatax Astra DB y Apache Cassandra ™
- FAISS: una biblioteca para una búsqueda y agrupación de similitud eficientes de vectores densos
- FAISS distribuido: trabaje con índices FAISS que no encajan en una sola memoria del servidor
- Autofaiss: crea automáticamente los índices Faiss KNN
- Scann: una búsqueda de similitud vectorial eficiente en la biblioteca a escala.
- NMSLIB-Biblioteca espacial no métrica, una biblioteca de búsqueda de similitud eficiente para espacios genéricos no métricos
- Molestar - biblioteca C ++ con enlaces de pitón para buscar puntos
- Flann - Biblioteca escrita en C ++ y contiene enlaces para los siguientes idiomas: C, Matlab, Python y Ruby
- Aplicación LLM-Biblioteca de Python de código abierto para una indexación de datos de datos en tiempo real (K-Nearsest Kears)
- MRPT - Búsqueda rápida de vecino más cercano con proyección aleatoria
- RPFOREST - Biblioteca de Python para la búsqueda aproximada de vecinos más cercanos
- PGVector - Extensión de búsqueda de similitud vectorial de código abierto para Postgres
- PASE-Extensión de búsqueda de vecino más cercano aproximado ultra alta dimensión más cercana para Postgres
- Pyserini - Kit de herramientas para la investigación de recuperación de información reproducible con representaciones escasas y densas
- NGT: proporciona comandos y una biblioteca para realizar una alta velocidad aproximada al vecino más cercano
- NearPy: búsqueda aproximada utilizando diferentes métodos de hashes sensibles a la localidad
- Toros N2 - Ligero aproximado de la biblioteca vecina más cercana
- Puffinn - Hallazgo rápido sin parámetros y universal de los vecinos más cercanos
- SPTAG: una biblioteca de búsqueda de vecindario más cercana aproximada (ANN) distribuida
- Pynndescent - Un descenso vecino más cercano de Python para los vecinos más cercanos
- Tarsoslsh: una biblioteca Java que implementa el algoritmo práctico de búsqueda de vecinos más cercanos para vectores multidimensionales
- TORCHPQ: implementaciones eficientes de la cuantización del producto y sus variantes utilizando Pytorch y CUDA
- Granne - Recuperación basada en gráficos de los vecinos más cercanos más cercanos a los vecinos Witten in Rust
- Ingreddinghub: una base de datos creada para incrustaciones de aprendizaje automático
- Hora - Biblioteca de colecciones de algoritmo de búsqueda de vecinos más cercanos de Hora - Aproximadamente
- VOY - Un motor de búsqueda de similitud vectorial WASM escrito en óxido
- Chroma: la base de datos de incrustación de código abierto para construir aplicaciones LLM en Python o JavaScript con memoria
- USARECH: motor de búsqueda vectorial más pequeño y más rápido para C ++, Python, JavaScript, Rust, Java, Golang, Wolfram
- Recolección de tiendas de vectores de Golang - Chroma, interfaces PGVector
- Búsqueda vectorial escalable (SVS): una biblioteca de rendimiento para la búsqueda de similitud vectorial
Servicio en la nube
- Epsilla Cloud: la base de datos vectorial sin servidor totalmente administrada con 10 veces más rápida, más barata y mejor.
- DataStax Astra Vector - DBAA Vector Vector Multi -Cloud, Servidor sin servidor
- Relevancia AI - Plataforma vectorial desde la experimentación hasta la implementación
- Pinecone: búsqueda vectorial administrada con filtrado, actualizaciones de índice en vivo, escala horizontal y mucho más
- MyScale: una base de datos vectorial administrada basada en Clickhouse
- Redis Cloud - Base de datos de vectores administrados en Redis
- Zilliz Cloud - Servicio nativo de nube para Milvus
Trabajos de investigación
Lista de métodos sobre cómo se puede implementar el algoritmo de búsqueda vectorial aproximado de manera más eficiente.
- Spann: Billimes de mil millones de escala altamente eficiente. Búsqueda del vecindario más cercano-Neurips 2021
- Revisando los índices invertidos para mil millones de vecinos más cercanos a escala más cercano - ECCV 2018
- Acelerar la inferencia a gran escala con la cuantización del vector anisotrópico
- Billion de similitudes de similitud con GPU
- Búsqueda eficiente y robusta de vecinos más cercanos utilizando gráficos jerárquicos navegables pequeños mundiales
- Optimización de la indexación basada en el gráfico de vecinos de K-Nears para la búsqueda de proximidad en datos de alta dimensión
- En la búsqueda de aproximadamente incrustaciones de palabras similares - ACL 2016