Mecanismo de busca de vetor incrível
Uma lista com curadoria de impressionantes estrutura/mecanismo de pesquisa vetorial, biblioteca, serviço em nuvem e documentos de pesquisa para pesquisa de similaridade vetorial
Serviço independente
- Apache Cassandra 5.0-Pesquisa de vetor (CEP-30), ácido serialisable rigoroso (CEP-15), Banco de Dados de Escala Horizontalmente
- QDRANT - mecanismo de busca de similaridade vetorial com suporte de filtragem estendido
- Vald - um mecanismo de pesquisa vetorial distribuído altamente escalável
- MILVUS-Um banco de dados vetorial nativo em nuvem com alto desempenho e alta escalabilidade.
- WEAVIATE-Um mecanismo de busca vetorial nativo da nuvem em tempo real
- Opendistro Elasticsearch KNN - Um plug -in de aprendizado de máquina que suporta um algoritmo aproximado de pesquisa K -NN para distro aberto para o Elasticsearch
- Elastiknn - Elasticsearch Plugin para pesquisa de vizinha mais próxima
- EPSILLY - Um sistema de gerenciamento de banco de dados de vetor de alto desempenho, hipocampo para AI
- VECH - Um sistema distribuído escalável para busca eficiente de similaridade de vetores de aprendizado profundo
- PGGNN - Pesquisas de vizinho mais próximo mais próximo (RAI) com um banco de dados PostGresql
- Jina-Jina permite que você construa uma busca profunda de aprendizado como serviço.
- Infinito-o banco de dados nativo da IA criado para aplicativos LLM, fornecendo um vetor incrivelmente rápido e pesquisa de texto completo
- Aquila DB - Algoritmo de Pesquisa K -NN com foco na distribuição
- Redis HNSW - um módulo Redis para pesquisa de similaridade baseada em HNSW
- Solr - Apache Solr - possui um recurso dense de pesquisa de vetores a partir de Solr 9.0
- Marqo - um mecanismo de pesquisa semântico que suporta pesquisa de tensor (sequência de vetores)
- TXTAI - Construa aplicativos de pesquisa semânticos e fluxos de trabalho
- Semantra - Uma ferramenta multiuso para pesquisar semanticamente documentos.
- Superduperdb - Traga a IA para o seu banco de dados favorito
- TensordB - Banco de dados de vetores de alto desempenho que suporta computação heterogênea
- JVector - um java puro, dependência zero, mecanismo de pesquisa de vetores incorporado, usado por DataStax Astra DB e Apache Cassandra.
- Vqlite - mecanismo de busca de vetores simples e leve
- Vexvault - 100% baseado em navegador, código aberto, escalável, simples, pesquisa vetorial de custo zero
- Vespa.ai - mecanismo de pesquisa de texto e ... Pesquisa de vetor aproximada rápida (Ann)
- A pesquisa de Ann em larga escala da Vespa usando índices HNSW-IF é descrita aqui
Biblioteca
- LangStream-Langstream é um projeto de código aberto que combina o melhor das arquiteturas baseadas em eventos com as mais recentes tecnologias da Gen AI.
- Cassio - Cassio é a solução final para integrar perfeitamente o Apache Cassandra® com inteligência artificial generativa e outras cargas de trabalho de aprendizado de máquina
- JVector - um Java puro, dependência zero, mecanismo de pesquisa vetorial incorporado usado por alguns dos bancos de dados distribuídos avançados, como DataStax Astra DB & Apache Cassandra ™
- FAISS - Uma biblioteca para busca eficiente de similaridade e agrupamento de vetores densos
- FAISS distribuído - Trabalhe com índices FAISS que não se encaixam em uma única memória do servidor
- Autofaiiss - Crie automaticamente índices FAISS KNN
- Scannn - Uma pesquisa de similaridade vetorial eficiente da biblioteca em escala.
- NMSLIB-Biblioteca Espacial Não Métrica, uma biblioteca de busca de similaridade eficiente para espaços genéricos não-meétricos
- Biblioteca C ++ com ligações Python para procurar pontos
- Flann - Biblioteca escrita em C ++ e contém ligações para os seguintes idiomas: C, Matlab, Python e Ruby
- App LLM-Biblioteca Python de código aberto para uma indexação de dados em tempo real KNN (K-Nearest Neighbours)
- MRPT - Pesquisa vizinha mais próxima rápida com projeção aleatória
- RPForest - Python Library para busca aproximada dos vizinhos mais próximos
- PGVECTOR - Extensão de pesquisa de similaridade vetorial de código aberto para Postges
- Pase-Ultra-High-Dimensional aproximadamente a extensão de busca vizinha mais próxima do PostGres
- Pyserini - Kit de ferramentas para pesquisa de recuperação de informações reproduzíveis com representações esparsas e densas
- NGT - Fornece comandos e uma biblioteca para realizar o vizinho aproximado aproximado de alta velocidade
- Nearpy - Pesquisa aproximada usando diferentes métodos de hash sensíveis à localidade
- Toros N2 - Biblioteca vizinha aproximada mais leve e aproximada
- Puffinn - Localização rápida sem parâmetros e universais de vizinhos mais próximos
- SPTAG - Uma Biblioteca Distribuída Aproximada de Pesquisa de Bairro mais próxima (Ann)
- PYNNDESCE - Uma descida de vizinho mais próxima de Python para aproxima K vizinhos mais próximos
- Tarsoslsh - Uma biblioteca Java implementando o algoritmo prático de busca vizinha mais próxima para vetores multidimensionais
- Torchpq - implementações eficientes da quantização do produto e suas variantes usando Pytorch e Cuda
- GRANNE - Recuperação baseada em gráficos de vizinhos aproximados mais próximos witten em ferrugem
- INCEDDINGHUB - Um banco de dados construído para incorporação de aprendizado de máquina
- HORA - Biblioteca de Coleções de Algoritmo de Pesquisa Vizinha Aproximada eficiente, escrita em Rust
- Voy - um mecanismo de busca de similaridade vetorial do WASM escrito em ferrugem
- Chroma - O banco de dados de incorporação de código aberto para a construção de aplicativos LLM em Python ou JavaScript com memória
- Usesearch - mecanismo de busca de vetores menores e mais rápidos para C ++, Python, JavaScript, Rust, Java, Golang, Wolfram
- Coleção de lojas de vetores de Golang - Chroma, interfaces pgvector
- Pesquisa de vetor escalável (SVS) - Uma biblioteca de desempenho para pesquisa de similaridade vetorial
Serviço em nuvem
- Epsilla Cloud - O banco de dados vetorial sem servidor totalmente gerenciado com 10x mais rápido, mais barato e melhor.
- DataStax Astra Vector - DBAAs de vetor sem servidor de várias nuvens
- Relevância AI - plataforma vetorial de experimentação à implantação
- Pinecone - Pesquisa de vetor gerenciada com filtragem, atualizações de índices ao vivo, escala horizontal e muito mais
- MyScale - Um banco de dados vetorial gerenciado baseado em clickhouse
- Redis Cloud - Banco de Dados Vetores Gerenciados em Redis
- Zilliz Cloud - Serviço nativo em nuvem para Milvus
Trabalhos de pesquisa
Lista de métodos sobre como o algoritmo de pesquisa de vetores aproximado pode ser implementado de maneira mais eficaz.
- Spann: Pesquisa aproximada de vizinhança aproximada mais eficiente em escala de bilhão-Neurips 2021
- Revisitando os índices invertidos para bilhões de vizinhos aproximados mais próximos - ECCV 2018
- Acelerar a inferência em larga escala na quantização de vetores anisotrópicos
- Pesquisa de similaridade em escala de bilhão com GPUs
- Pesquisa aproximada mais próxima e eficiente e robusta, usando gráficos mundiais pequenos de navegação hierárquica
- Otimização da indexação com base no gráfico vizinho mais parecido com a pesquisa de proximidade em dados de alta dimensão
- Ao procurar aproximadamente por incorporações de palavras semelhantes - ACL 2016