? Database Vektor Luar Biasa
Daftar Karya Luar Biasa yang Dikuratori Terkait dengan Struktur/Basis Data Struktur/Vektor Tinggi
Layanan
- Google Vector Search (Vertex AI)
- Pinecone
- Weaviate [Panduan Pemula]
- Vespa
- txtai
- Marqo
- Vectara
- Epsilla
- Algolia
- Meilisearch
- nucliadb
- OpenSearch
- Myscale
- Qdrantcloud
- Zilliz
- OpenSearch's Alibabacloud
- Cloud TypeSense
- Pencarian vektor mongodb atlas
- Superduperdb
- KBD.AI
Perbandingan
- Dari Vespa
- Perbandingan DB Vektor oleh VectorHub
- Benchmark Database Vektor MyScale
Perpustakaan & Mesin
Data / vektor multidimensi
- ? Matriks fitur vektor db
- Kertas Faiss
- Typesense
- Qdrant
- mengganggu
- Ngt
- pgvektor
- Chroma
- Llamaindex
- Epsilla
- jvector
- RAKIT
- Vald
- Voyager
- vektor tiny
- Usearch
- Vearch
- Mrpt
- Milvus
- ketakterbatasan
- Havenask
- Chromem-Go
- Oasysdb [notebook]
- Meilisearch - API mesin pencari untuk semantik (vektor), pencarian teks lengkap & hybrid
- Arroy - Perkiraan Perpustakaan Rust Neighbors terdekat
- BLEVE
- CUV
- VSAG
- sqlite-vec
- Myscaledb
- Hora
- Arroy
- Kgraph
- DETORMALNEIGHBORS.JL
- Muopdb
Teks
Yang lain
- Simsimd: Alternatif yang efisien untuk
scipy.spatial.distance dan numpy.inner
Tolok ukur & database
Tolok ukur Ann [kertas].
Tolok ukur JST skala miliaran
- Hasil 2021
- Simhadri, Harsha Vardhan, dkk. "Hasil Big Ann: Kompetisi Neurips'23." ARXIV Preprint ARXIV: 2409.17424 (2024).
Beir
Vectorbbench - Alat Benchmark Database Vektor, [GitHub]
Tolok ukur basis data vektor qdrant
Benchmark Database Vektor MyScale
Li, Wen, et al. "Perkiraan pencarian tetangga terdekat pada data dimensi tinggi - eksperimen, analisis, dan peningkatan." Transaksi IEEE tentang Pengetahuan dan Rekayasa Data 32.8 (2019): 1475-1488.
Zeng, Xianzhi, dkk. "Candy: Benchmark untuk perkiraan berkelanjutan pencarian tetangga terdekat dengan konsumsi data dinamis." ARXIV Preprint ARXIV: 2406.19651 (2024).
Dataset Pencarian Vektor Intellabs
Buku
- Yayasan Struktur Data Multidimensi dan Metrik
- Pengantar Pengambilan Informasi
- Pembelajaran mendalam untuk pencarian
- Yayasan Pengambilan Vektor
Konferensi & Lokakarya
- Vldb
- Tutorial:
- Tren baru dalam pencarian kesamaan vektor tinggi [slide, video, kertas]
- Pengambilan gambar di alam liar (CVPR20) [Video]
- Tumpukan jerami
- Pencarian saraf sedang beraksi
- ACM MM 2020: Efektif dan Efisien: Menuju Instance Open-World Instance Re Identification
- Miliaran skala perkiraan pencarian tetangga terdekat: [slide, video]
- Apakah contoh mencari masalah yang terpecahkan? [Slide, video]
- Pengambilan Augmented Generation dan Vespa [Slide]
- Tantangan Pengindeksan SISAP
- Kompetisi 2023
- Kompetisi 2024
Kursus
- Memori jangka panjang dalam pencarian dan database vektor (cos 495 - princeton) [catatan kelas]
- Freiburg Information Retrieval WS 2022-2023 [Situs web, kuliah video]
- Pencarian Kesamaan Vektor dan Kursus FAISS [Daftar Putar YouTube]
Yang lain
- VectorHub: Situs web pembelajaran open-source gratis untuk orang-orang (pengembang perangkat lunak ke arsitek senior ML) yang tertarik untuk menambahkan pengambilan vektor ke tumpukan ML mereka.
Publikasi
Survei
- Pan, James Jie, Jianguo Wang, dan Guoliang Li. "Survei Sistem Manajemen Database Vektor." ARXIV Preprint ARXIV: 2310.14021 (2023). [Kertas]
- Aumüller, Martin, dan Matteo Ceccarello. "Pendekatan dan tren terbaru dalam perkiraan pencarian tetangga terdekat." {IEEE} Data Engineering Bulletin (2023).
- Pencarian tetangga terdekat: yang lama, yang baru, dan mustahil. Andoni, Alexandr. [Kertas]
- Ganbarov, Ali, dkk. "Perbandingan Eksperimental Perkiraan Berbasis Grafik Algoritma Pencarian Tetangga Terdekat di Perangkat Edge." ARXIV Preprint ARXIV: 2411.14006 (2024).
Kuantisasi
Sumber: Survei kuantisasi produk.
- PQ: Kuantisasi produk untuk pencarian tetangga terdekat. Jegou, Heve, Matthijs Douze, dan Cordelia Schmid. [Kertas, Kode, Kode Julia, Nanopq]
- Pemilihan K pada GPU: Pencarian kesamaan skala miliaran dengan GPU. Johnson, Jeff, Matthijs Douze, dan Hervé Jégou [kertas, kode]
- Survei kuantisasi produk. Matsui, Yusuke, Yusuke Uchida, Hervé Jégou, dan Shin'ichi Satoh [kertas]
- OPQ: Kuantisasi produk yang dioptimalkan. GE, Tiezheng, Kaiming He, Qifa Ke, dan Jian Sun [beranda, kertas, kode, nanopq]
- ADC Lebih Cepat: Membuka kunci potensi tersembunyi kuantisasi produk dengan SIMD. André, Fabien, Anne-Marie Kermarrec, dan Nicolas Le Scouanec [kertas, kode]
- Pencarian tetangga terdekat yang dipercepat dengan ADC cepat. André, Fabien, Anne-Marie Kermarrec, dan Nicolas Le Scouanec [kertas].
- Lokalitas cache tidak cukup: pencarian tetangga terdekat berkinerja tinggi dengan pemindaian cepat kuantisasi produk. Fabien André, Anne-Marie Kermarrec, Nicolas Le Scouanec [kertas]
- Scann: Mempercepat inferensi skala besar dengan kuantisasi vektor anisotropik. Guo, Ruiqi, Philip Sun, Erik Lindgren, Quan Geng, David Simcha, Felix Chern, dan Sanjiv Kumar [kertas, inferensi Python/C ++, pelatihan/inferensi Julia]
- Multi-indeks terbalik. Babenko, Artem, dan Victor Lempitsky [kertas, kode]
- Apakah kita sudah sampai? Kuantisasi produk dan percepatan perangkat kerasnya. Fernandez-Marques, Javier, Ahmed F. Abouelhamayed, Nicholas D. Lane, dan Mohamed S. Abdelfattah. [Kertas]
- Libvq: Perangkat untuk mengoptimalkan kuantisasi vektor dan pengambilan saraf yang efisien. Li, Chaofan, Zheng Liu, Shitao Xiao, Yingxia Shao, Defu Lian, dan Zhao Cao. [Kertas, kode]
- Matsui, Yusuke, Ryota Hinami, dan Shin'ichi Satoh. "Indeks terbalik yang dapat dikonfigurasi ulang." Prosiding Konferensi Internasional ACM ke -26 tentang Multimedia. 2018. [Kertas, proyek, kode]
- Aguerrebere, Cecilia, et al. "Pencarian kesamaan dalam sekejap mata dengan indeks terkompresi." ARXIV Preprint ARXIV: 2304.04759 (2023).
- Huijben, Iris, dkk. "Kuantisasi residual dengan buku kode saraf implisit." ARXIV Preprint ARXIV: 2401.14732 (2024). [Kode]
- Rege, Aniket, dkk. "Adanns: Kerangka kerja untuk pencarian semantik adaptif." Kemajuan dalam Sistem Pemrosesan Informasi Saraf 36 (2024).
- Amara, Kenza, dkk. "Pencarian tetangga terdekat dengan kode ringkas: perspektif decoder." Prosiding Konferensi Internasional 2022 tentang Pengambilan Multimedia. 2022.
- Krishnan, Aditya, dan Edo Liberty. "Kuantisasi Produk Clustering Proyektif." ARXIV Preprint ARXIV: 2112.02179 (2021).
- Noh, Haechan, Taeho Kim, dan Jae-Pil Heo. "Indeks Terbalik Kuantizer Produk untuk Pencarian Tetangga terdekat yang dapat diskalakan." Prosiding Konferensi Internasional IEEE/CVF tentang Visi Komputer. 2021.
- Zhan, Jingtao, dkk. "Bersama mengoptimalkan encoder kueri dan kuantisasi produk untuk meningkatkan kinerja pengambilan." Prosiding Konferensi Internasional ACM ke -30 tentang Informasi & Manajemen Pengetahuan. 2021.
- Wang, Runhui, dan Dong Deng. "Deltapq: Kompresi Kode Kuantisasi Produk Lossless untuk Pencarian Kesamaan Dimensi Tinggi." Prosiding Endowment VLDB 13.13 (2020): 3603-3616.
- Jang, Young Kyun, dan Nam Ik Cho. "Jaringan kuantisasi produk umum untuk pengambilan gambar semi-diawasi." Prosiding Konferensi IEEE/CVF tentang Visi Komputer dan Pengenalan Pola. 2020.
- Chen, Ting, Lala Li, dan Yizhou Sun. "Kuantisasi Produk yang Dapat Diferensial untuk Kompresi Embedding End-to-End." Konferensi Internasional tentang Pembelajaran Mesin. PMLR, 2020.
- Huang, Rong, dkk. "Belajar representasi dokumen diskrit dalam pencarian web." Prosiding Konferensi ACM SIGKDD ke -29 tentang Penemuan Pengetahuan dan Penambangan Data. 2023.
- Nardini, Franco Maria, Cosimo Rulli, dan Rossano Venturini. "Pengambilan padat multi-vektor yang efisien dengan vektor bit." Konferensi Eropa tentang Pengambilan Informasi. Cham: Springer Nature Swiss, 2024. [Kode]
- Gao, Jianyang, dan Cheng Long. "Rabitq: Mengukur vektor dimensi tinggi dengan kesalahan teoretis terikat untuk mendekati pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2405.12497 (2024). [(Kode) [https://github.com/gaoj0017/rabitq]]
- Gao, Jianyang, dkk. "Kuantisasi praktis dan asimtotik optimal dari vektor dimensi tinggi di ruang Euclidean untuk perkiraan pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2409.09913 (2024).
- Mohoney, Jason, dkk. "Pemeliharaan Indeks IVF tambahan untuk pencarian vektor streaming." ARXIV Preprint ARXIV: 2411.00970 (2024).
- Yang, Mingyu, Woao Li, dan Wei Wang. "Perkiraan dimensi tinggi cepat pencarian tetangga terdekat dengan waktu dan ruang indeks yang efisien." ARXIV Preprint ARXIV: 2411.06158 (2024).
Metode berbasis grafik
- Wang, Zeyu, dkk. "Indeks berbasis grafik dan pohon untuk pencarian kesamaan vektor dimensi tinggi: analisis, perbandingan, dan arah masa depan." Rekayasa Data (2023): 3-21.
- Survei komprehensif dan perbandingan eksperimental dari perkiraan berbasis grafik pencarian tetangga terdekat. Wang, Mengzhao, Xiaoliang Xu, Qiang Yue, dan Yuxiang Wang. [Kertas, kode]
- Lin, Peng-Cheng, dan Wan-Lee Zhao. "Pencarian Tetangga Terdekat Berbasis Grafik: Janji dan Kegagalan." Arxiv Preprint ARXIV: 1904.02077 (2019).
- HNSW: Perkiraan yang efisien dan kuat Pencarian tetangga terdekat menggunakan grafik dunia kecil yang dapat dilayari hierarkis. Malkov, Yu A., dan Dmitry A. Yashunin. [Kertas, kode, versi karat, versi GO]
- Algoritma JST berbasis grafik untuk dataset ukuran miliaran: analisis komparatif. Dobson, Magdalen, Zheqi Shen, Guy E. Blelloch, Laxman Dhulipala, Yan Gu, Harsha Vardhan Simhadri, dan Yihan Sun. [Kertas]
- Jari: Inferensi Cepat untuk Perkiraan Berbasis Grafik Pencarian tetangga terdekat. Chen, Patrick, Wei-Cheng Chang, Jyun-Yu Jiang, Hsiang-Fu Yu, Inderjit Dhillon, dan Cho-Jui Hsieh [kertas, video]
- NSG: Menavigasi grafik spread-out untuk perkiraan pencarian tetangga terdekat. Fu, Cong, Chao Xiang, Changxu Wang, dan Deng Cai. [Kertas, kode]
- Efanna: Perkiraan sangat cepat algoritma pencarian tetangga terdekat berdasarkan grafik KNN. Cong fu, Deng Cai. [Kertas, kode]
- Khan, Saim, dkk. "Bang: Perkiraan skala miliaran pencarian tetangga terdekat menggunakan GPU tunggal." ARXIV Preprint ARXIV: 2401.11324 (2024).
- Ootomo, Hiroyuki, dkk. "Cagra: Konstruksi grafik yang sangat paralel dan perkiraan tetangga terdekat mencari GPU." ARXIV Preprint ARXIV: 2308.15136 (2023).
- Oguri, Yutaro, dan Yusuke Matsui. "Analisis teoritis dan empiris pemilihan titik masuk adaptif untuk perkiraan pencarian tetangga terdekat berbasis grafik." ARXIV Preprint ARXIV: 2402.04713 (2024).
- Oguri, Yutaro, dan Yusuke Matsui. "Metode tuning umum dan praktis untuk indeks berbasis grafik di luar rak: laporan tantangan pengindeksan SISAP oleh Tim Utokyo." Konferensi Internasional tentang Pencarian dan Aplikasi Kesamaan. Cham: Springer Nature Swiss, 2023.
- Wang, Mengzhao, dkk. "Starling: Kerangka Kerja Indeks Grafik Disk-Resident yang efisien I/O untuk pencarian kesamaan vektor dimensi tinggi pada segmen data." ARXIV Preprint ARXIV: 2401.02116 (2024). [Kode]
- Manohar, Magdalen Dobson, dkk. "Parlayann: Perkiraan Paralel Berbasis Paralel Berbasis Grafik Deterministik Algoritma Pencarian Tetangga Terdekat." Prosiding Simposium Tahunan ACM SigPlan ke -29 tentang Prinsip dan Praktik Pemrograman Paralel. 2024. [Kode]
- Wang, Mengzhao, dkk. "Kerangka kerja yang efisien dan kuat untuk perkiraan pencarian tetangga terdekat dengan kendala atribut." Kemajuan dalam Sistem Pemrosesan Informasi Saraf 36 (2024).
- Yu, Shangdi, dkk. "Pecann: pengelompokan efisien paralel dengan perkiraan pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2312.03940 (2023).
- Azizi, Ilias, Karima Echihabi, dan Themis Palpanas. "ELPIS: Pencarian kesamaan berbasis grafik untuk ilmu data yang dapat diskalakan." Prosiding Endowment VLDB 16.6 (2023): 1548-1559.
- Indyk, Piotr, dan Haike Xu. "Kinerja terburuk dari perkiraan populer implementasi pencarian tetangga terdekat: jaminan dan batasan." Kemajuan dalam Sistem Pemrosesan Informasi Saraf 36 (2024).
- Liu, Jun, dkk. "Mengoptimalkan perkiraan berbasis grafik pencarian tetangga terdekat: lebih kuat dan lebih pintar." 2022 Konferensi Internasional IEEE ke -23 tentang Manajemen Data Seluler (MDM). IEEE, 2022.
- Wang, Hui, Yong Wang, dan Wan-Lei Zhao. "Pencarian NN Berbasis Grafik: A Revisit." ARXIV Preprint ARXIV: 2204.00824 (2022).
- Peng, Zhen, dkk. "Speed-Ann: Latensi Rendah dan Akurasi Tinggi Pencarian tetangga terdekat melalui paralelisme intra-kuery." ARXIV Preprint ARXIV: 2201.13007 (2022).
- Lu, Kejing, dkk. "HVS: Struktur Grafik Hierarkis berdasarkan diagram Voronoi untuk menyelesaikan perkiraan pencarian tetangga terdekat." Prosiding Endowment VLDB 15.2 (2021): 246-258. [Kode]
- Yingfan, Liu, Cheng Hong, dan Cui Jiangtao. "Revisiting $ K $ -setor Konstruksi Grafik Tetangga Terpadu pada Data Dimensi Tinggi: Eksperimen dan Analisis." ARXIV Preprint ARXIV: 2112.02234 (2021).
- Zhu, Dantong, dan Minjia Zhang. "Memahami dan menggeneralisasi grafik kedekatan monotonik untuk perkiraan pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2107.13052 (2021).
- Gottesbüren, Lars, et al. "Melepaskan Partisi Grafik untuk Pencarian Tetangga Terdekat Skala Besar." ARXIV Preprint ARXIV: 2403.01797 (2024).
- Singh, Aditi, dkk. "FreshDiskann: Indeks JST berbasis grafik yang cepat dan akurat untuk pencarian kesamaan streaming." ARXIV Preprint ARXIV: 2105.09613 (2021).
- Wang, Hui, Wan-Lei Zhao, dan Xiangxiang Zeng. "Konstruksi grafik K-NN berskala besar pada GPU." ARXIV Preprint ARXIV: 2103.15386 (2021).
- Patel, Liana, dkk. "Acorn: pencarian performant dan predikat-agnostik di atas embeddings vektor dan data terstruktur." ARXIV Preprint ARXIV: 2403.04871 (2024).
- Zuo, Chaoji, dkk. "Serf: Grafik Segmen untuk Range-Filtering Perkiraan Pencarian Tetangga terdekat." Prosiding ACM tentang Manajemen Data 2.1 (2024): 1-26.
- Hezel, Nico, dkk. "Grafik eksplorasi dengan penyempurnaan berkelanjutan untuk pengambilan multimedia yang efisien." Prosiding Konferensi Internasional 2024 tentang Pengambilan Multimedia. 2024.
- Xiao, Goao, dkk. "Meningkatkan Indeks HNSW untuk Pembaruan Waktu Nyata: Mengatasi poin yang tidak terjangkau dan degradasi kinerja." ARXIV Preprint ARXIV: 2407.07871 (2024).
- Yang, Shuo, dkk. "Meninjau kembali konstruksi indeks perkiraan berbasis grafik kedekatan. Pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2410.01231 (2024).
- Gou, Yutong, dkk. "SymphonyQG: Menuju integrasi simfoni dari kuantisasi dan grafik untuk perkiraan pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2411.12229 (2024).
- Yang, Ming, Yuzheng Cai, dan Weiguo Zheng. "CSPG: Menyeberangi grafik kedekatan yang jarang untuk perkiraan pencarian tetangga terdekat." Konferensi Tahunan Tiga Puluh Delapan tentang Sistem Pemrosesan Informasi Saraf.
? Metode berbasis pohon
- Jayaram Subramanya, Suhas, dkk. "Diskann: pencarian tetangga terdekat miliaran poin yang akurat dengan cepat pada satu node." Kemajuan dalam Sistem Pemrosesan Informasi Saraf 32 (2019). [Kode]
- Li, Haitao, dkk. "Membangun indeks berbasis pohon untuk pengambilan padat yang efisien dan efektif." ARXIV Preprint ARXIV: 2304.11943 (2023).
- Engels, Joshua, dkk. "Perkiraan Pencarian Tetangga terdekat dengan Filter Jendela." ARXIV Preprint ARXIV: 2402.00943 (2024).
- Song, Yang, dkk. "ProMips: pencarian produk dalam maksimum C-Appreximate yang efisien dengan indeks ringan." 2021 IEEE Konferensi Internasional ke -37 tentang Rekayasa Data (ICDE). IEEE, 2021.
- Zhu, Yifan, dkk. "GTS: Indeks Pohon Berbasis GPU untuk Pencarian Kesamaan Cepat." ARXIV Preprint ARXIV: 2404.00966 (2024).
- Tatsuno, Kento, dkk. "AISAQ: All-in-Storage JST dengan kuantisasi produk untuk pengambilan informasi bebas DRAM." ARXIV Preprint ARXIV: 2404.06004 (2024).
Hashing
- Makalah luar biasa tentang belajar hash
- Survei belajar hash. Wang, Jingdong, Ting Zhang, Nicu Sebe, dan Heng Tao Shen [kertas]
- Survei tentang metode hashing yang dalam. Luo, Xiao, Haixin Wang, Daqing Wu, Chong Chen, Minghua Deng, Jianqiang Huang, dan Xian-Sheng Hua. [Kertas]
- Kuantisasi Iteratif: Pendekatan Procrustean untuk Belajar Kode Biner untuk Pengambilan Gambar Skala Besar. Gong, Yunchao, Svetlana Lazebnik, Albert Gordo, dan Florent Perronnin [Kertas, Kode Python, Kode Matlab]
- Gan, Yukang, dkk. "Pengambilan Binary Embedding di Tencent." ARXIV Preprint ARXIV: 2302.08714 (2023).
- Yan, Bencheng, dkk. "Embedding hash berbasis kode biner untuk aplikasi skala web." Prosiding Konferensi Internasional ACM ke -30 tentang Informasi & Manajemen Pengetahuan. 2021.
- Weng, Zhenyu, dan Yuesheng Zhu. "Hashing online tanpa pengawasan dengan kuantisasi multi-bit." Prosiding Konferensi Asia tentang Visi Komputer. 2022.
- Huang, Qiang, Yifan Lei, dan Anthony Kh Tung. "Pencarian tetangga terdekat point-to-hyperplane di luar unit hypersphere." Prosiding Konferensi Internasional 2021 tentang Manajemen Data. 2021.
- Weng, Zhenyu, Yuesheng Zhu, dan Ruixin Liu. "Pencarian cepat pada kode biner dengan jarak hamming tertimbang." ARXIV Preprint ARXIV: 2009.08591 (2020).
- Jian, Xiaozheng, dkk. "Pencarian Kesamaan Kosinus Top-K Cepat Melalui Kuantisasi Binary Friendly XOR pada GPU." ARXIV Preprint ARXIV: 2008.02002 (2020).
- Zheng, Bolong, dkk. "PM-LSH: Kerangka kerja LSH yang cepat dan akurat untuk pencarian NN dimensi-dimensi." Prosiding Endowment VLDB 13.5 (2020): 643-655.
- Eghbali, Sepehr. "Pencarian tetangga terdekat yang dapat diskalakan dengan kode kompak." (2019).
- Lei, Yifan, dkk. "Skema hashing yang peka terhadap lokalitas berdasarkan co-substring melingkar terpanjang." Prosiding Konferensi Internasional ACM Sigmod 2020 tentang Manajemen Data. 2020.
- Wei, Jiuqi, dkk. "DET-LSH: Skema hashing yang peka terhadap lokalitas dengan pohon pengkodean dinamis untuk perkiraan pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2406.10938 (2024).
Pendekatan lain
- Chen, Qi, et al. "Spann: perkiraan miliaran skala yang sangat efisien pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2111.08566 (2021). [Kode]
- Li, Yuliang, dkk. "Berbasis Indeks, Dimensi Tinggi, Cosine Threshold Querying dengan jaminan optimalitas." Teori Sistem Komputasi 65 (2021): 42-83.
- Chen, Yewang, dkk. "Pohon Hull Semi-Cembung: Kueri tetangga terdekat cepat untuk data skala besar di GPU." Konferensi Internasional IEEE 2018 tentang Data Mining (ICDM). IEEE, 2018.
- Engels, Joshua, Benjamin Coleman, dan Anshumali Shrivastava. "Praktis di dekat Neighbor Search melalui pengujian kelompok." Kemajuan dalam Sistem Pemrosesan Informasi Saraf 34 (2021): 9950-9962. [Suplemen]
- Gong, Long, et al. "IDEC: Kode Estimasi jarak yang dapat diindeks untuk perkiraan pencarian tetangga terdekat." Prosiding Endowment VLDB 13.9 (2020).
- Lu, Kejing, dkk. "VHP: Perkiraan Pencarian Tetangga terdekat melalui Partisi Hypersphere Virtual." Prosiding Endowment VLDB 13.9 (2020): 1443-1455.
- Bing Tian ,, Haikun Liu, Yuhang Tang, Shihai Xiao, Zhuohui Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang. "FusionAnns: Arsitektur pemrosesan koperasi CPU/GPU yang efisien untuk perkiraan skala miliaran pencarian tetangga terdekat." (2024).
- Chen, Zhonghan, dkk. "Menjelajahi kebermaknaan pencarian tetangga terdekat di ruang dimensi tinggi." ARXIV Preprint ARXIV: 2410.05752 (2024).
- Tepper, Mariano, dkk. "Gleanvec: Pencarian vektor yang mempercepat dengan pengurangan dimensi nonlinier minimalis." ARXIV Preprint ARXIV: 2410.22347 (2024).
- Li, Jingyu, dkk. "Panther: Perkiraan Pribadi Pencarian tetangga terdekat dalam pengaturan server tunggal." Cryptology Eprint Archive (2024).
- Wei, Jiuqi, dkk. "Tabrakan Subruang: Kerangka kerja yang efisien dan akurat untuk pencarian tetangga terdekat dengan dimensi tinggi." ARXIV Preprint ARXIV: 2411.14754 (2024).
Sistem
- Qin, An, et al. "Maze: Sistem deduplikasi video yang hemat biaya di skala web." Prosiding Konferensi Internasional ACM ke -30 tentang Multimedia. 2022.
- Doshi, Ishita, dkk. "Lanns: Perkiraan skala web Sistem pencarian tetangga terdekat." ARXIV Preprint ARXIV: 2010.09426 (2020).
- Chen, Yaoqi, dkk. "OnesParse: Sistem terpadu untuk pencarian vektor multi-indeks." Prosiding pendamping ACM pada Konferensi Web 2024. 2024.
Yang lain
- Optimalisasi Pencarian dengan Peningkatan Kemungkinan Kueri dan Perkiraan Dua Tingkat Pencarian untuk Perangkat Edge
- Gao, Jianyang, dan Cheng Long. "Perkiraan dimensi tinggi Pencarian tetangga terdekat: dengan operasi perbandingan jarak yang andal dan efisien." Prosiding ACM tentang Manajemen Data 1.2 (2023): 1-27.
- Perkiraan pencarian tetangga terdekat dalam sistem rekomendasi. Yury Malkov.
- Accelerating Vector Search pada GPU dengan Rapids Rakit. Corey Nolet
- Gupta, Gaurav, dkk. "Caps: Indeks partisi praktis untuk pencarian kesamaan yang difilter." ARXIV Preprint ARXIV: 2308.15014 (2023).
- Zhu, Yuhao. "RTNN: Accelerating Neighbor Search Menggunakan Tracing Ray Perangkat Keras." Prosiding Simposium ACM SigPlan ke -27 tentang Prinsip dan Praktek Pemrograman Paralel. 2022. [Kode]
- Levi, Asaf, dkk. "Pengindeksan fisik vs. logis dengan {Idea}: indeks {dedupplication-aware} terbalik." Konferensi Usenix ke -22 tentang File dan Teknologi Penyimpanan (FAST 24). 2024. [Kode]
- Carra, Damiano, dan Giovanni Daerah. "Mengambil dua burung dengan satu cache K-NN." 2021 IEEE Global Communications Conference (Globecom). IEEE, 2021.
- Salem, Tareq SI, Giovanni Daerah, dan Damiano Carra. "Caching Kesamaan Pendakian dengan Perkiraan Indeks." Transaksi IEEE/ACM pada jaringan (2022).
- Li, Conglong, dkk. "Meningkatkan perkiraan pencarian tetangga terdekat melalui penghentian awal adaptif yang dipelajari." Prosiding Konferensi Internasional ACM Sigmod 2020 tentang Manajemen Data. 2020.
- Karppa, Matti, Martin Aumüller, dan Rasmus Pagh. "Deann: Mempercepat estimasi kepadatan kernel menggunakan perkiraan pencarian tetangga terdekat." Konferensi Internasional tentang Kecerdasan dan Statistik Buatan. PMLR, 2022.
- Wang, Zeyu, dkk. "Operator Perbandingan Jarak untuk Perkiraan Pencarian Tetangga terdekat: Eksplorasi dan Benchmark." ARXIV Preprint ARXIV: 2403.13491 (2024).
- Szilvasy, Gergely, Pierre-Emmanuel Mazaré, dan Matthijs Douze. "Pencarian vektor dengan radius kecil." ARXIV Preprint ARXIV: 2403.10746 (2024).
- Han, Changhun, Suji Kim, dan Ha-Myung Park. "Pencarian kedekatan yang efisien dalam data dimensi tinggi-akumulasi waktu menggunakan pengindeksan blok multi-level." (2024).
- Tepper, Mariano, dkk. "Leanvec: Cari vektor Anda lebih cepat dengan membuatnya bugar." ARXIV Preprint ARXIV: 2312.16335 (2023).
- Harwood, Ben, dkk. "Perkiraan pencarian tetangga terdekat pada dataset dinamis: Investigasi." ARXIV Preprint ARXIV: 2404.19284 (2024).
- Mengkarakterisasi dilema kinerja dan ukuran indeks dalam pencarian vektor skala miliaran dan mematahkannya dengan memori tingkat kedua
- Xu, haue. Kinerja terburuk dari perkiraan populer implementasi pencarian tetangga terdekat: jaminan dan batasan. Diss. Institut Teknologi Massachusetts, 2024.
- Lin, Jimmy. "Nasihat Operasional untuk Retriever Jarang dan Jarang: HNSW, Flat, atau Indeks Terbalik?." ARXIV Preprint ARXIV: 2409.06464 (2024).
- Zhou, Mingxun, Elaine Shi, dan Giulia Fanti. "Pacmann: Perkiraan Pribadi Efisien Pencarian Tetangga terdekat." Cryptology Eprint Archive (2024).
? Evaluasi & Metrik
- BM25 mana yang Anda maksud? Studi reproduksibilitas skala besar dari varian penilaian. Kamphuis, Chris, Arjen P. de Vries, Leonid Boytsov, dan Jimmy Lin [kertas]
? Artikel & Pembicaraan
- Apa itu database vektor?
- Database Vektor (Bagian 1): Apa yang membuat masing -masing berbeda?
- Mesin kesamaan vektor miliaran miliaran yang sangat cepat eBay
- Meetup Visi Komputer: Aplikasi visi komputer pada skala dengan database vektor
- Bagaimana cara memilih database vektor Anda pada tahun 2023?
- Apakah kita benar -benar membutuhkan database vektor khusus?
- Database vektor bukan kategori basis data yang terpisah
- Database Vektor: Pendekatan prinsip pertama
- Tutorial RAG Pencarian Vektor - Gabungkan data Anda dengan LLM dengan pencarian lanjutan
- Pencarian kesamaan vektor yang efisien dalam alur kerja rekomendasi menggunakan milvus dengan nvidia merlin
- Database Vektor: Panduan Pemula!
- Database Vektor dan Spring IA
- Cara menangani sejuta embeddings vektor dalam aplikasi RAG
- Bagaimana Meilisearch Memperbarui Jutaan Vektor Emector Embeddings Database Dalam waktu kurang dari satu menit
- Jebakan umum yang harus dihindari saat menggunakan database vektor
- Memulai dengan database vektor
- Memilih model terbaik untuk pencarian semantik
Daftar terkait
- Mesin pencari vektor yang mengagumkan