Tolle Vektor -Suchmaschine
Eine kuratierte Liste der fantastischen Vektor -Suchframework/-motor-, Bibliotheks-, Cloud -Service- und Forschungsarbeiten zur Vektor -Ähnlichkeitssuche
Eigenständiger Service
- Apache Cassandra 5.0-Vektorsuche (CEP-30), strenge serielle Säure (CEP-15), Horizontal Skalierungsdatenbank
- QDRANT - Suchmaschine der Vektorähnlichkeit mit erweiterter Filterunterstützung
- VALD - eine hochskalierbare verteilte Vektorsuchmaschine
- MILVUS-Eine Cloud-native-Vektor-Datenbank mit hoher Leistung und hoher Skalierbarkeit.
- WEAVIATE-Eine Cloud-native Echtzeit-Vektor-Suchmaschine
- Opendistro Elasticsearch KNN - Ein Plugin für maschinelles Lernen, das einen ungefähren K -NN -Suchalgorithmus für die offene Distribution für Elasticsearch unterstützt
- Elastiknn - Elasticsearch -Plugin für die nächste Suche nach Nachbarn
- EPSILA - Ein Hochleistungs -Vektor -Datenbankmanagementsystem, Hippocampus für AI
- VEARCH - Ein skalierbares verteiltes System zur effizienten Ähnlichkeits Suche nach Deep -Lern -Vektoren
- PGNN - Fast ungefähre Nachbarn (Ann Neighbor) durchsucht mit einer PostgreSQL -Datenbank
- Jina-Jina ermöglicht es Ihnen, tiefe Lernbetrieben auf Suchanfänger zu bauen.
- Infinity-Die für LLM-Anwendungen erstellte AI-native Datenbank, die eine unglaublich schnelle Vektor- und Volltext-Suche bietet
- Aquila DB - Vertriebsorientierter K -NN -Suchalgorithmus
- Redis HNSW - Ein Redis -Modul für Ähnlichkeitssuche basierend auf HNSW
- Solr - Apache Solr - verfügt über eine dichte Vektor -Suchfunktion zum Solr 9.0
- Marqo - Eine semantische Suchmaschine, die die Tensorsuche unterstützt (Abfolge von Vektoren)
- txtai - Erstellen Sie semantische Suchanwendungen und Workflows
- Semantra - Ein Mehrzweck -Tool zum semantischen Suchdokumenten.
- SuperduperDB - Bringen Sie KI in Ihre Lieblingsdatenbank.
- TensSudb - Hochleistungsvektor -Datenbank, das heterogenes Computing unterstützt
- JVector - Eine reine Java, keine Abhängigkeit, eingebettete Vektor -Suchmaschine, die von DataStax Astra db und Apache Cassandra verwendet wird.
- VQLite - Einfache und leichte Suchmaschine Vektor -Suchmaschine
- VEXVAULT - 100% Browserbasiert, Open Source, Skalierbar, einfach, Null -Kosten -Vektor -Suche
- Vespa.ai - Textsuchmaschine und ... schnelle ungefähre Vektorsuche (Ann)
- Vespas große Ann-Suche mit HNSW-IF-Indizes wird hier beschrieben
Bibliothek
- Langstream-Langstream ist ein Open-Source-Projekt, das die besten eventbasierten Architekturen mit den neuesten Gen-AI-Technologien kombiniert.
- Cassio - Cassio ist die ultimative Lösung für die nahtlose Integration von Apache Cassandra® in generative künstliche Intelligenz und andere Workloads für maschinelles Lernen
- JVector - Eine reine Java, keine Abhängigkeit, eine eingebettete Vektor -Suchmaschine, die von einigen der erweiterten verteilten Datenbanken verwendet wird, z. B. DataStax Astra DB & Apache Cassandra ™
- FAISS - Eine Bibliothek zur effizienten Ähnlichkeitssuche und Clusterbildung dichter Vektoren
- Distributed Faiss - Arbeiten Sie mit Faiss -Indizes, die nicht in einen einzelnen Serverspeicher passen
- Autofaiss - Erstellen Sie automatisch FAISS -KNN -Indizes
- SCANN - Eine Bibliothek Effiziente Vektor -Ähnlichkeitssuche im Maßstab.
- NMSLIB-Nicht-metrische Raumbibliothek, eine effiziente Suchbibliothek der Ähnlichkeit für generische nichtmetrische Räume
- Ärgern - C ++ Bibliothek mit Python -Bindungen zur Suche nach Punkten
- Flann - Bibliothek in C ++ geschrieben und enthält Bindungen für die folgenden Sprachen: C, Matlab, Python und Ruby
- LLM App-Open-Source-Python-Bibliothek für eine Echtzeitdaten-KNN (K-Nearest-Nachbarn) Indexierung
- MRPT - Schnellste Nachbarsuchung mit zufälliger Projektion
- RPforest - Python Library für ungefähre Nachbarn -Suche
- PGVector - Open -Source Vector -Ähnlichkeitssuche für Postgres
- PASE-Ultrahochdimensionale ungefähre Erweiterung der nächsten Nachbar-Suchseckung für Postgres
- Pyserini - Toolkit für reproduzierbare Informationsabrufforschung mit spärlichen und dichten Darstellungen
- NGT - Bietet Befehle und eine Bibliothek zur Durchführung von Hochgeschwindigkeits -ungefähren Nachbarn
- Nearpy - ungefähre Suche mit unterschiedlichen ortsensitiven Hashing -Methoden
- Toros N2 - Leichte ungefähre Nachbarbibliothek
- Puffinn - parameterlose und universelle schnelle Erkenntnis der nächsten Nachbarn
- SPTAG - eine verteilte ungefähre Bibliothek für die Search (Neighborhood Search)
- Pynndescent - Ein Python nächster Nachbarabstich für ungefähre K -Nachbarn
- Tarsoslsh - Eine Java -Bibliothek, die den praktischen Algorithmus für die Suche nach Nachbarn für mehrdimensionale Vektoren implementiert
- Torchpq - Effiziente Implementierungen der Produktquantisierung und ihrer Varianten mit Pytorch und CUDA
- Granne - Graph -basierte Abruf der ungefähren nächsten Nachbarn Witten in Rost
- EinbettungShub - Eine Datenbank für maschinelles Lernen Einbettungen erstellt
- HORA - Effiziente ungefähre Nachbar -Such -Algorithmus -Sammlungsbibliothek in Rost
- Voy - Eine WASM -Vektor -Ähnlichkeitssuchmaschine in Rost geschrieben
- CHROMA - Die Open -Source -Einbettungsdatenbank zum Erstellen von LLM -Apps in Python oder JavaScript mit Speicher
- Usearch - kleinere und schnellere Vektor -Suchmaschine für C ++, Python, JavaScript, Rost, Java, Golang, Wolfram
- Golang Vector Stores Collection - Chroma, PGVector -Schnittstellen
- Skalierbare Vektorsuche (SVS) - Eine Leistungsbibliothek für die Vektor -Ähnlichkeitssuche
Cloud -Service
- EPSILA Cloud - Die voll verwaltete serverlose Vektor -Datenbank mit 10x schneller, billiger und besser.
- DataStax Astra Vector - Multi -Cloud, serverloser Vektor -DBAAs
- Relevanz -AI -Vektorplattform vom Experimentieren bis zur Bereitstellung
- Pinecone - Verwaltete Vektorsuche mit Filterung, Live -Index -Updates, horizontaler Skalierung und viel mehr
- MyScale - Eine verwaltete Vektor -Datenbank basierend auf Clickhouse
- Redis Cloud - verwaltete Vektordatenbank in Redis
- Zilliz Cloud - Cloud -natives Dienst für Milvus
Forschungsarbeiten
Liste der Methoden darüber, wie der ungefähre Vektorsuchalgorithmus effizienter implementiert werden kann.
- SPANN: Hocheffizientes Milliardenkala ungefähr nächstes Nachbarschaftssuche-Neurips 2021
- Überprüfung der umgekehrten Indizes für Milliardenkala ungefähr nächste Nachbarn - ECCV 2018
- Beschleunigung der groß angelegten Inferenz mit anisotropen Vektorquantisierung
- Billion im GPUs ähnliche Ähnlichkeitssuche
- Effiziente und robuste ungefähre Suche nach der nächsten Nachbarn mit hierarchischen schiffbaren kleinen Weltgrafiken
- Optimierung der Indexierung basierend auf K-nearest Nachbardiagramm für die Proximity-Suche in hochdimensionalen Daten
- Bei der Suche nach ähnlichen Wort -Einbettungen - ACL 2016