Mesin pencari vektor yang mengagumkan
Daftar kerangka kerja/mesin pencari vektor yang mengagumkan, perpustakaan, layanan cloud, dan makalah penelitian dengan pencarian kesamaan vektor
Layanan mandiri
- Apache Cassandra 5.0-Pencarian Vektor (CEP-30), Asam Serialisable yang ketat (CEP-15), database penskalaan horizontal
- Qdrant - Mesin pencari kesamaan vektor dengan dukungan penyaringan yang diperluas
- Vald - mesin pencari vektor terdistribusi yang sangat terukur
- MILVUS-Database vektor cloud-asli dengan kinerja tinggi dan skalabilitas tinggi.
- Weaviate-Mesin pencari vektor-real-time cloud
- Opendistro Elasticsearch KNN - Plugin Pembelajaran Mesin yang mendukung perkiraan algoritma pencarian K -NN untuk distro terbuka untuk Elasticsearch
- ELASTIKNN - Plugin Elasticsearch untuk pencarian tetangga terdekat
- EpSilla - Sistem Manajemen Database Vektor Kinerja Tinggi, Hippocampus untuk AI
- Vearch - Sistem terdistribusi yang dapat diskalakan untuk pencarian kesamaan yang efisien dari vektor pembelajaran mendalam
- PGANN - Perkiraan FAST NEGREATICE DETERMAN (JST) Pencarian dengan database PostgreSQL
- Jina-Jina memungkinkan Anda untuk membangun pencarian yang didukung oleh pembelajaran yang mendalam.
- Infinity-Database asli AI yang dibangun untuk aplikasi LLM, menyediakan vektor yang sangat cepat dan pencarian teks lengkap
- Aquila DB - Algoritma pencarian K -NN yang berfokus pada
- Redis HNSW - Modul Redis untuk Pencarian Kesamaan Berdasarkan HNSW
- Solr - Apache Solr - Memiliki fitur pencarian vektor padat pada Solr 9.0
- Marqo - mesin pencari semantik yang mendukung pencarian tensor (urutan vektor)
- txtai - membangun aplikasi dan alur kerja semantik
- Semantra - Alat multiguna untuk dokumen pencarian semantik.
- SuperDuperDB - Bawa AI ke database favorit Anda
- TensordB - Database Vektor Kinerja Tinggi Mendukung Komputasi Heterogen
- JVector - Java murni, ketergantungan nol, mesin pencari vektor tertanam, digunakan oleh DataStax Astra DB dan Apache Cassandra.
- VQLite - Mesin pencari vektor sederhana dan ringan
- VEXVAULT - 100% Browser Berbasis, Sumber Terbuka, Dapat Diukur, Sederhana, Pencarian Vektor Zero -Biaya
- Vespa.ai - mesin pencari teks dan ... pencarian vektor perkiraan cepat (ann)
- Pencarian ANN skala besar Vespa menggunakan indeks HNSW-IF dijelaskan di sini
Perpustakaan
- LANGSTREAM-Langstream adalah proyek open-source yang menggabungkan arsitektur terbaik berbasis acara dengan teknologi AI Gen terbaru.
- Cassio - Cassio adalah solusi utama untuk mengintegrasikan Apache Cassandra® dengan mulus dengan kecerdasan buatan generatif dan beban kerja pembelajaran mesin lainnya
- JVector - Java murni, ketergantungan nol, mesin pencari vektor tertanam yang digunakan oleh beberapa database terdistribusi tingkat lanjut seperti DataStax Astra DB & Apache Cassandra ™
- FAISS - Perpustakaan untuk Pencarian Kesamaan yang Efisien dan pengelompokan vektor padat
- FAISS Terdistribusi - Bekerja dengan Indeks FAISS yang tidak cocok dengan memori server tunggal
- Autofaiss - secara otomatis membuat indeks faiss knn
- Scann - Pencarian kesamaan vektor yang efisien pustaka pada skala.
- NMSLIB-Perpustakaan Ruang Non-Metrik, Perpustakaan Pencarian Kesamaan Efisien untuk Ruang Non-Metrik Generik
- PERPUSTAKAAN C ++ dengan binding Python untuk mencari poin
- Flann - Perpustakaan Ditulis dalam C ++ dan berisi binding untuk bahasa berikut: C, Matlab, Python, dan Ruby
- LLM App-Perpustakaan Python open-source untuk pengindeksan data real-time KNN (K-Nearest)
- MRPT - Pencarian tetangga terdekat cepat dengan proyeksi acak
- RPForest - Perpustakaan Python untuk Perkiraan Pencarian Tetangga terdekat
- PGVECTOR - Ekstensi Pencarian Kesamaan Vektor Sumber Terbuka untuk Postgres
- Pase-Perkiraan Ultra-High-Dimensional Perpanjangan Pencarian Tetangga terdekat untuk Postgres
- Pyserini - Toolkit untuk penelitian pengambilan informasi yang dapat direproduksi dengan representasi yang jarang dan padat
- NGT - Menyediakan perintah dan perpustakaan untuk melakukan perkiraan berkecepatan tinggi tetangga terdekat
- Nearpy - Perkiraan Pencarian Menggunakan berbagai metode hashing yang peka terhadap lokalitas
- Toros N2 - Perkiraan Ringan Perpustakaan Tetangga terdekat
- Puffinn - temuan cepat tanpa parameter dan universal dari tetangga terdekat
- SPTAG - Perkiraan Terdistribusi Perpustakaan Pencarian Lingkungan Terdekat (JST)
- Pynndescent - keturunan tetangga terdekat Python untuk perkiraan k tetangga terdekat
- Tarsoslsh - Perpustakaan Java yang menerapkan algoritma pencarian tetangga terdekat untuk vektor multidimensi
- Torchpq - Implementasi kuantisasi produk yang efisien dan variannya menggunakan Pytorch dan CUDA
- Granne - Pengambilan berbasis grafik dari perkiraan tetangga terdekat dengan karat
- Embeddinghub - database yang dibangun untuk embeddings pembelajaran mesin
- Hora - Perkiraan Efisien Perpustakaan Algoritma Algoritma Pencarian Tetangga Terdekat Ditulis dalam karat
- VOY - mesin pencari kesamaan vektor wasm yang ditulis dengan karat
- Chroma - Database embedding sumber terbuka untuk membangun aplikasi LLM di Python atau JavaScript dengan memori
- USEARCH - mesin pencari vektor yang lebih kecil & lebih cepat untuk C ++, Python, Javascript, Rust, Java, Golang, Wolfram
- Golang Vector Stores Collection - Chroma, antarmuka pgvektor
- Pencarian Vektor yang Dapat Diukur (SVS) - Perpustakaan Kinerja untuk Pencarian Kesamaan Vektor
Layanan Cloud
- Epsilla Cloud - Database vektor tanpa server yang dikelola sepenuhnya dengan 10x lebih cepat, lebih murah dan lebih baik.
- DataStax Astra Vector - DBAAS vektor multi -cloud, server tanpa server
- Platform AI - Vektor Relevansi dari Eksperimen ke Penyebaran
- Pinecone - Pencarian vektor yang dikelola dengan penyaringan, pembaruan indeks langsung, penskalaan horizontal, dan banyak lagi
- MyScale - database vektor yang dikelola berdasarkan clickhouse
- Redis Cloud - Database Vektor Terkelola di Redis
- Zilliz Cloud - Layanan asli cloud untuk Milvus
Makalah Penelitian
Daftar metode tentang bagaimana perkiraan algoritma pencarian vektor dapat diimplementasikan lebih efektif.
- Spann: Perkiraan Billion-Skala yang sangat efisien Pencarian Lingkungan terdekat-Neurips 2021
- Meninjau kembali indeks terbalik untuk perkiraan skala miliaran tetangga terdekat - ECCV 2018
- Mempercepat inferensi skala besar dengan kuantisasi vektor anisotropik
- Pencarian kesamaan skala miliaran dengan GPU
- Efisien dan kuat Perkiraan pencarian tetangga terdekat menggunakan grafik dunia kecil yang dapat dilayari hierarkis
- Optimalisasi pengindeksan berdasarkan grafik tetangga k-nearest untuk pencarian kedekatan dalam data dimensi tinggi
- Pada kira -kira mencari kata embeddings yang serupa - ACL 2016