很棒的矢量搜索引擎
精选的矢量搜索框架/引擎,图书馆,云服务和研究论文的精选清单与矢量相似性搜索
独立服务
- Apache Cassandra 5.0 - 矢量搜索(CEP-30),严格的串行酸(CEP-15),水平缩放数据库
- QDRANT-矢量相似性搜索引擎具有扩展的过滤支持
- Vald-高度可扩展的分布式矢量搜索引擎
- MILVUS-具有高性能和高扩展性的云本地矢量数据库。
- 编织 - 云原生的实时矢量搜索引擎
- OpenDistro弹性搜索KNN-机器学习插件,该插件支持近似K -NN搜索算法的eLasticsearch开放发行算法
- Elastiknn -Elasticsearch插件最近的邻居搜索
- Epsilla-高性能矢量数据库管理系统,AI的海马
- Vearch-可扩展的分布式系统,用于有效地相似性搜索深度学习向量
- Pgann-使用PostgreSQL数据库快速近似最近的邻居(ANN)搜索
- Jina-Jina允许您构建深度学习驱动的搜索服务。
- Infinity-为LLM应用程序构建的AI本地数据库,提供令人难以置信的快速向量和全文搜索
- Aquila DB-分销集中的K -NN搜索算法
- REDIS HNSW-基于HNSW的相似性搜索的REDIS模块
- SOLR -APACHE SOLR-具有密集的向量搜索功能,如Solr 9.0
- Marqo-一个支持张量搜索的语义搜索引擎(向量的顺序)
- TXTAI-构建语义搜索应用程序和工作流程
- Semantra-用于语义搜索文档的多功能工具。
- SuperDuperdB-将AI带到您喜欢的数据库
- TENSORDB-高性能矢量数据库支持异质计算
- JVECTOR-纯Java,零依赖性,嵌入式向量搜索引擎,由DataStax Astra DB和Apache Cassandra使用。
- vqlite-简单且轻巧的矢量搜索引擎
- VexVault- 100%基于浏览器,开源,可扩展,简单,零成本向量搜索
- vespa.ai-文本搜索引擎和...快速近似矢量搜索(ANN)
- VESPA的大规模ANN搜索使用HNSW-IF IF INDEXES在此处介绍
图书馆
- Langstream-Langstream是一个开源项目,将基于事件的最佳体系结构与最新的AI Gen Technologies结合在一起。
- Cassio -Cassio是无缝将ApacheCassandra®与生成人工智能和其他机器学习工作负载无缝集成的最终解决方案
- JVECTOR-纯Java,零依赖性,嵌入式向量搜索引擎,由某些高级分布式数据库(例如dataStax astra astra db&apache cassandra™)使用
- faiss-库,用于有效相似性搜索和密集向量的聚类
- 分布式faiss-使用不适合单个服务器内存的faiss索引
- Autofaiss-自动创建Faiss Knn指数
- 扫描 - 库有效的矢量相似性搜索。
- NMSLIB-非中间空间库,一个有效的相似性搜索库,用于通用非现有空间
- 烦恼 - 带有Python绑定的C ++库以搜索点
- Flann-库用C ++编写并包含以下语言的绑定:C,Matlab,Python和Ruby
- LLM应用程序 - 实时数据KNN(K-Nearest邻居)索引的开源Python库
- MRPT-随机投影的快速最近邻居搜索
- rpforest- python库,用于大约最近的邻居搜索
- PGVECTOR- POSTGRES的开源矢量相似性搜索扩展
- PASE-超高维的近似近似邻居搜索扩展
- Pyserini-可再现信息检索研究的工具包,稀疏而密集的表示
- NGT-提供命令和库,用于执行高速大约最近的邻居
- 近乎近似搜索使用不同的地方敏感的哈希方法
- Toros N2-轻质大约最近的邻居库
- puffinn-无参数和普遍的快速发现最近的邻居
- SPTAG-分布式大约最近的邻里搜索(ANN)库
- pynndescent- python最近的邻居下降,大约k最近的邻居
- TARSOSLSH-一个Java库,实现了实用的最近邻居搜索算法的多维向量
- TORCHPQ-使用Pytorch和CUDA的产品量化及其变体的有效实现
- Granne-基于图的基于图的检索
- EmbeddingHub-用于机器学习嵌入的数据库
- HORA-有效的近似近似最近的邻居搜索算法收集库用Rust编写
- Voy -WASM矢量相似性搜索引擎用Rust编写
- 色度 - 用于在Python或JavaScript中构建LLM应用程序的开源嵌入数据库
- USEARCH- C ++,Python,JavaScript,Rust,Java,Golang,Wolfram的较小和更快的矢量搜索引擎
- Golang Vector商店收集 - 色度,PGVECTOR界面
- 可扩展矢量搜索(SVS) - 矢量相似性搜索的性能库
云服务
- Epsilla Cloud-完全管理的无服务器矢量数据库,其更快,更便宜,更好。
- dataStax astra矢量 - 多云的无服务器矢量dbaas
- 相关性AI-矢量平台从实验到部署
- Pinecone-通过过滤,实时索引更新,水平缩放等托管矢量搜索等等
- MyScale-基于Clickhouse的托管矢量数据库
- redis云 - redis中的托管矢量数据库
- Zilliz Cloud-米尔维斯的云原生服务
研究论文
有关如何更有效地实现近似向量搜索算法的方法列表。
- SPANN:高效的十亿个尺度近似最近的邻里搜索-Neurips 2021
- 重新访问数十亿个尺寸最近的邻居的倒置指数-ECCV 2018
- 通过各向异性矢量量化加速大规模推断
- 与GPU的十亿个尺度相似性搜索
- 使用层次可导航的小世界图表有效且健壮的近似近似邻居搜索
- 基于k-nearest邻居图的索引优化在高维数据中以近距离搜索的优化
- 大约搜索类似的单词嵌入-ACL 2016