很棒的矢量搜索引擎
精選的矢量搜索框架/引擎,圖書館,雲服務和研究論文的精選清單與矢量相似性搜索
獨立服務
- Apache Cassandra 5.0 - 矢量搜索(CEP-30),嚴格的串行酸(CEP-15),水平縮放數據庫
- QDRANT-矢量相似性搜索引擎具有擴展的過濾支持
- Vald-高度可擴展的分佈式矢量搜索引擎
- MILVUS-具有高性能和高擴展性的雲本地矢量數據庫。
- 編織 - 雲原生的實時矢量搜索引擎
- OpenDistro彈性搜索KNN-機器學習插件,該插件支持近似K -NN搜索算法的eLasticsearch開放發行算法
- Elastiknn -Elasticsearch插件最近的鄰居搜索
- Epsilla-高性能矢量數據庫管理系統,AI的海馬
- Vearch-可擴展的分佈式系統,用於有效地相似性搜索深度學習向量
- Pgann-使用PostgreSQL數據庫快速近似最近的鄰居(ANN)搜索
- Jina-Jina允許您構建深度學習驅動的搜索服務。
- Infinity-為LLM應用程序構建的AI本地數據庫,提供令人難以置信的快速向量和全文搜索
- Aquila DB-分銷集中的K -NN搜索算法
- REDIS HNSW-基於HNSW的相似性搜索的REDIS模塊
- SOLR -APACHE SOLR-具有密集的向量搜索功能,如Solr 9.0
- Marqo-一個支持張量搜索的語義搜索引擎(向量的順序)
- TXTAI-構建語義搜索應用程序和工作流程
- Semantra-用於語義搜索文檔的多功能工具。
- SuperDuperdB-將AI帶到您喜歡的數據庫
- TENSORDB-高性能矢量數據庫支持異質計算
- JVECTOR-純Java,零依賴性,嵌入式向量搜索引擎,由DataStax Astra DB和Apache Cassandra使用。
- vqlite-簡單且輕巧的矢量搜索引擎
- VexVault- 100%基於瀏覽器,開源,可擴展,簡單,零成本向量搜索
- vespa.ai-文本搜索引擎和...快速近似矢量搜索(ANN)
- VESPA的大規模ANN搜索使用HNSW-IF IF INDEXES在此處介紹
圖書館
- Langstream-Langstream是一個開源項目,將基於事件的最佳體系結構與最新的AI Gen Technologies結合在一起。
- Cassio -Cassio是無縫將ApacheCassandra®與生成人工智能和其他機器學習工作負載無縫集成的最終解決方案
- JVECTOR-純Java,零依賴性,嵌入式向量搜索引擎,由某些高級分佈式數據庫(例如dataStax astra astra db&apache cassandra™)使用
- faiss-庫,用於有效相似性搜索和密集向量的聚類
- 分佈式faiss-使用不適合單個服務器內存的faiss索引
- Autofaiss-自動創建Faiss Knn指數
- 掃描 - 庫有效的矢量相似性搜索。
- NMSLIB-非中間空間庫,一個有效的相似性搜索庫,用於通用非現有空間
- 煩惱 - 帶有Python綁定的C ++庫以搜索點
- Flann-庫用C ++編寫並包含以下語言的綁定:C,Matlab,Python和Ruby
- LLM應用程序 - 實時數據KNN(K-Nearest鄰居)索引的開源Python庫
- MRPT-隨機投影的快速最近鄰居搜索
- rpforest- python庫,用於大約最近的鄰居搜索
- PGVECTOR- POSTGRES的開源矢量相似性搜索擴展
- PASE-超高維的近似近似鄰居搜索擴展
- Pyserini-可再現信息檢索研究的工具包,稀疏而密集的表示
- NGT-提供命令和庫,用於執行高速大約最近的鄰居
- 近乎近似搜索使用不同的地方敏感的哈希方法
- Toros N2-輕質大約最近的鄰居庫
- puffinn-無參數和普遍的快速發現最近的鄰居
- SPTAG-分佈式大約最近的鄰里搜索(ANN)庫
- pynndescent- python最近的鄰居下降,大約k最近的鄰居
- TARSOSLSH-一個Java庫,實現了實用的最近鄰居搜索算法的多維向量
- TORCHPQ-使用Pytorch和CUDA的產品量化及其變體的有效實現
- Granne-基於圖的基於圖的檢索
- EmbeddingHub-用於機器學習嵌入的數據庫
- HORA-有效的近似近似最近的鄰居搜索算法收集庫用Rust編寫
- Voy -WASM矢量相似性搜索引擎用Rust編寫
- 色度 - 用於在Python或JavaScript中構建LLM應用程序的開源嵌入數據庫
- USEARCH- C ++,Python,JavaScript,Rust,Java,Golang,Wolfram的較小和更快的矢量搜索引擎
- Golang Vector商店收集 - 色度,PGVECTOR界面
- 可擴展矢量搜索(SVS) - 矢量相似性搜索的性能庫
雲服務
- Epsilla Cloud-完全管理的無服務器矢量數據庫,其更快,更便宜,更好。
- dataStax astra矢量 - 多雲的無服務器矢量dbaas
- 相關性AI-矢量平台從實驗到部署
- Pinecone-通過過濾,實時索引更新,水平縮放等託管矢量搜索等等
- MyScale-基於Clickhouse的託管矢量數據庫
- redis雲 - redis中的託管矢量數據庫
- Zilliz Cloud-米爾維斯的雲原生服務
研究論文
有關如何更有效地實現近似向量搜索算法的方法列表。
- SPANN:高效的十億個尺度近似最近的鄰里搜索-Neurips 2021
- 重新訪問數十億個尺寸最近的鄰居的倒置指數-ECCV 2018
- 通過各向異性矢量量化加速大規模推斷
- 與GPU的十億個尺度相似性搜索
- 使用層次可導航的小世界圖表有效且健壯的近似近似鄰居搜索
- 基於k-nearest鄰居圖的索引優化在高維數據中以近距離搜索的優化
- 大約搜索類似的單詞嵌入-ACL 2016