Moteur de recherche vectoriel génial
Une liste organisée du cadre / moteur de recherche vectoriel impressionnant, de la bibliothèque, du service cloud et des articles de recherche sur la recherche de similitude vectorielle
Service autonome
- Apache Cassandra 5.0 - Recherche de vecteur (CEP-30), acide sérialisable strict (CEP-15), base de données à l'échelle horizontale
- QDRANT - Moteur de recherche de similarité vectorielle avec support de filtrage prolongé
- Vald - un moteur de recherche de vecteur distribué hautement évolutif
- Milvus - une base de données vectorielle-native du nuage avec une performance élevée et une évolutivité élevée.
- Weavate - un moteur de recherche de vecteur natif et en temps réel
- OpenSistro Elasticsearch KNN - Un plugin d'apprentissage automatique qui prend en charge un algorithme de recherche K-NN approximatif pour une distribution ouverte pour Elasticsearch
- Elastiknn - Plugin Elasticsearch pour la recherche du voisin le plus proche
- Epsilla - Un système de gestion de la base de données vectorielle haute performance, Hippocampus pour l'IA
- VEARCH - Un système distribué évolutif pour une recherche efficace de similitude des vecteurs d'apprentissage en profondeur
- PGANN - Fast approximation le plus proche voisin (Ann) recherche avec une base de données PostgreSQL
- Jina - Jina vous permet de construire une recherche en profondeur en tant que service.
- Infinity - La base de données AI-Native construite pour les applications LLM, fournissant une recherche de vecteur et de texte intégral incroyablement rapide
- Aquila DB - Algorithme de recherche K-NN axé sur la distribution
- Redis HNSW - Un module Redis pour la recherche de similitude basé sur HNSW
- Solr - Apache Solr - a une fonction de recherche de vecteur dense à partir de Solr 9.0
- MARQO - Un moteur de recherche sémantique qui prend en charge la recherche de tenseur (séquence de vecteurs)
- txtai - Créer des applications de recherche sémantique et des workflows
- SEMANTRA - Un outil polyvalent pour rechercher sémantiquement des documents.
- SuperDuperDB - Apportez l'IA à votre base de données préférée
- TENSORDB - Base de données vectorielle haute performance prenant en charge l'informatique hétérogène
- JVector - Un moteur de recherche vectoriel intégré Java, zéro, intégré, utilisé par DataSax Astra DB et Apache Cassandra.
- VQLite - moteur de recherche vectoriel simple et léger
- Vexvault - 100% de navigateur, open source, évolutif, simple, recherche de vecteur à coût zéro
- Vespa.ai - Moteur de recherche de texte et ... recherche de vecteur approximative rapide (ANN)
- La recherche ANN à grande échelle de Vespa à l'aide des index HNSW-IF est décrite ici
Bibliothèque
- Langstream - Langstream est un projet open-source qui combine les meilleures architectures basées sur des événements avec les dernières technologies de Gen AI.
- Cassio - Cassio est la solution ultime pour intégrer la Cassandra® Apache Cassandra avec une intelligence artificielle générative et d'autres charges de travail d'apprentissage automatique
- JVector - Un moteur de recherche de vecteur java pur, zéro dépendance, utilisé par certaines des bases de données distribuées avancées telles que DataStax Astra DB & Apache Cassandra ™
- FAISS - Une bibliothèque pour une recherche et un regroupement de similitudes efficaces de vecteurs denses
- FAISS distribué - Travaillez avec les index FAISS qui ne s'intègrent pas dans une seule mémoire de serveur
- Autofaiss - Créez automatiquement les indices Faish KNN
- Scan - une bibliothèque de recherche de similitude vectorielle efficace à l'échelle.
- NMSLIB - Bibliothèque d'espace non métrique, une bibliothèque de recherche de similitudes efficace pour les espaces génériques non métriques
- Bibliothèque C ++ C ++ avec des liaisons Python pour rechercher des points
- Flann - Bibliothèque écrite en C ++ et contient des liaisons pour les langues suivantes: C, Matlab, Python et Ruby
- Application LLM - Bibliothèque Python open-source pour une indexation de données en temps réel (K-Dearest Neighbors)
- Mrpt - Recherche de voisine la plus proche rapide avec projection aléatoire
- RPForest - Bibliothèque Python pour la recherche approximative des voisins les plus proches
- PGVector - Extension de recherche de similitude vectorielle open source pour Postgres
- PASE - Extension de recherche de voisin le plus proche de la dimension ultra-dimensionnelle pour Postgres
- Pyserini - Toolkit pour la recherche de récupération d'informations reproductibles avec des représentations clairsemées et denses
- NGT - fournit des commandes et une bibliothèque pour effectuer un voisin approximatif à grande vitesse le plus proche
- Nearpy - Recherche approximative en utilisant différentes méthodes de hachage sensibles à la localité
- TOROS N2 - Bibliothèque de voisine la plus proche du poids léger
- Puffinn - découverte rapide sans paramètres et universelle de voisins les plus proches
- SPTAG - Une bibliothèque de recherche de quartier la plus proche répartie distribuée (ANN)
- Pynndescent - une descente de voisin le plus proche Python pour les K voisins les plus proches
- TARSOSLSH - Une bibliothèque Java implémentant l'algorithme pratique de recherche de voisin le plus proche pour les vecteurs multidimensionnels
- TORCHPQ - Implémentations efficaces de la quantification du produit et de ses variantes à l'aide de Pytorch et Cuda
- Granne - Récupération basée sur le graphique des voisins les plus proches approximatifs Witten à Rust
- EmbeddingHub - une base de données conçue pour les intégres d'apprentissage automatique
- HORA - Efficace Approxime le plus proche voisin Recherche Algorithme Collections Bibliothèque écrite en rouille
- VOY - un moteur de recherche de similitude Vector WasM écrit en rouille
- Chroma - La base de données d'intégration open source pour la création d'applications LLM en Python ou JavaScript avec mémoire
- Usearch - Moteur de recherche de vecteur plus petit et plus rapide pour C ++, Python, JavaScript, Rust, Java, Golang, Wolfram
- Collection des magasins de vecteurs de Golang - Chrome, interfaces PGVector
- Recherche de vecteur évolutif (SVS) - Une bibliothèque de performances pour la recherche de similitude vectorielle
Service cloud
- Epsilla Cloud - la base de données vectorielle sans serveur entièrement gérée avec 10x plus rapide, moins cher et mieux.
- DataSax Astra Vector - Multi-cloud, vecteur sans serveur DBAAS
- Pertinence Ai - plate-forme vectorielle de l'expérimentation au déploiement
- Pinecone - Recherche de vecteur géré avec filtrage, mises à jour d'index en direct, échelle horizontale et bien plus encore
- MyScale - une base de données vectorielle gérée basée sur Clickhouse
- Redis Cloud - Base de données vectorielle gérée dans Redis
- Zilliz Cloud - Service natif du cloud pour Milvus
Documents de recherche
Liste des méthodes sur la façon dont l'algorithme de recherche vectorielle approximatif peut être implémenté plus efficacement.
- Spann: Recherche de quartier la plus proche de milliards de dollars très efficaces - Neirips 2021
- Revisiter les indices inversés pour des voisins les plus proches à l'échelle des milliards - ECCV 2018
- Accélération de l'inférence à grande échelle avec la quantification des vecteurs anisotropes
- Recherche de similitudes à l'échelle des milliards avec GPUS
- Recherche de voisin le plus proche efficace et robuste en utilisant des graphiques hiérarchiques à petit monde navigable
- Optimisation de l'indexation basée sur le graphique du voisin K-Dearest pour la recherche de proximité dans des données de grande dimension
- Sur la recherche approximativement des incorporations de mots similaires - ACL 2016