? Base de données vectorielle impressionnante
Une liste organisée d'œuvres impressionnantes liées à une structure de grande dimension / recherche et base de données de vecteur
Services
- Google Vector Search (Vertex AI)
- Pignon
- Terminer [Guide des débutants]
- Vespa
- txtai
- marqo
- vectara
- Epsilla
- algolie
- Meilisearch
- nuclé
- Opeensearch
- Myscale
- Qdrantcloud
- Zilliz
- Alibabacloud d'Opensearch
- Cloud de Typesense
- Recherche de vecteur MongoDB Atlas
- Superduperdb
- Kbd.ai
Comparaisons
- De Vespa
- Comparaison Vector DB par VectorHub
- Benchmark de base de données Vector MyScale
Bibliothèques et moteurs
Données / vecteurs multidimensionnels
- ? Matrice de fonctions Vector DB
- Papier Faish
- Coqueluche
- Qdrant
- ennuyer
- NGT
- pgvecteur
- Chrome
- Llamaindex
- Epsilla
- jvecteur
- RADEAU
- Vallon
- Voyageur
- minuscule
- Usearch
- Vearch
- MRPT
- milvus
- infini
- faire de Havende
- chromem-go
- Oasysdb [cahier]
- Meilisearch - API de moteur de recherche pour sémantique (vecteurs), text complet et recherche hybride
- Arroy - Bibliothèque de rouille approximative des voisins les plus proches
- bleve
- cuvs
- vsag
- sqlite-vec
- Myscaledb
- Hora
- arroy
- Kgraph
- La plus la plus la plus
- Muopdb
Textes
Autres
- Simsimd: alternative efficace à
scipy.spatial.distance et numpy.inner
Benchmarks et bases de données
Benchmarks Ann [papier].
Benchmarks des ann à l'échelle des milliards
- Résultat 2021
- Simhadri, Harsha Vardhan, et al. "Résultats de la compétition Big Ann: Neirips'23." ARXIV PRÉALLAGE ARXIV: 2409.17424 (2024).
Beir
VECTORDBBANCH - Un outil de référence de base de données vectoriel, [GitHub]
Benchmarks de base de données vectorielle de QDRANT
Benchmark de base de données vectorielle de MyScale's
Li, Wen et al. "La recherche approximative des voisins les plus proches sur des données de grande dimension - expériences, analyses et amélioration." IEEE Transactions on Knowledge and Data Engineering 32.8 (2019): 1475-1488.
Zeng, Xianzhi, et al. "Candy: une référence pour la recherche continue de voisine approximative continue avec une ingestion de données dynamiques." ARXIV PRÉALLAGE ARXIV: 2406.19651 (2024).
Ensembles de données de recherche vectorielle d'Intelleabs
Livres
- Fondations de structures de données multidimensionnelles et métriques
- Introduction à la récupération de l'information
- Apprentissage en profondeur pour la recherche
- Fondements de la récupération vectorielle
Conférences et ateliers
- Vldb
- Tutoriel:
- Nouvelles tendances de la recherche de similitudes vectorielles élevées [diapositives, vidéo, papier]
- Retrievale d'image dans la nature (CVPR20) [vidéo]
- Meule de foin
- Recherche neuronale en action
- ACM MM 2020: efficace et efficiente: vers la réidentification des instances du monde ouvert
- Recherche de voisin le plus proche de milliards de dollars: [Diapositives, vidéo]
- La recherche d'instance est-elle un problème résolu? [Diapositives, vidéo]
- Génération augmentée et vespa de récupération [diapositives]
- Défi d'indexation SISAP
- Compétition 2023
- Compétition 2024
Cours
- Mémoire à long terme dans les bases de recherche et de données de vecteur (COS 495 - Princeton) [Notes de classe]
- Freiburg Information Retrieval WS 2022-2023 [site Web, conférences vidéo]
- Vector Simility Search and FAISS Faits Cours [YouTube Playlist]
Autres
- VectorHub: un site Web d'apprentissage gratuit et open source pour les personnes (développeurs de logiciels aux architectes ML seniors) intéressés à ajouter une récupération vectorielle à leur pile ML.
Publications
Enquête
- Pan, James Jie, Jianguo Wang et Guoliang Li. "Enquête sur les systèmes de gestion des bases de données vectorielles." ARXIV Préprint Arxiv: 2310.14021 (2023). [Papier]
- Aumüller, Martin et Matteo Ceccarello. "Approches et tendances récentes dans la recherche approximative du voisin le plus proche." {IEEE} Data Engineering Bulletin (2023).
- Recherche du voisin le plus proche: l'ancien, le nouveau et l'impossible. Andoni, Alexandr. [Papier]
- Ganbarov, Ali, et al. "Comparaison expérimentale des algorithmes de recherche de voisin approximatifs basés sur des graphiques sur les appareils Edge." ARXIV PRÉALLAGE ARXIV: 2411.14006 (2024).
Quantification
Source: Une étude de la quantification du produit.
- PQ: Quantification du produit pour la recherche de voisin le plus proche. Jegou, Herve, Matthijs Douze et Cordelia Schmid. [Paper, code, Julia Code, Nanopq]
- Sélection K sur GPU: Recherche de similitude à l'échelle des milliards avec GPU. Johnson, Jeff, Matthijs Douze et Hervé Jégou [papier, code]
- Une enquête sur la quantification du produit. Matsui, Yusuke, Yusuke Uchida, Hervé Jégou et Shin'ichi Satoh [papier]
- OPQ: quantification optimisée du produit. Ge, Tiezheng, Kaiming He, Qifa Ke et Jian Sun [page d'accueil, papier, code, nanopq]
- ADC plus rapide: déverrouiller le potentiel caché de la quantification du produit avec SIMD. André, Fabien, Anne-Marie Kermarrec et Nicolas le Scouarnec [papier, code]
- Accélération de la recherche voisine la plus proche avec ADC rapide. André, Fabien, Anne-Marie Kermarrec et Nicolas le Scouarnec [papier].
- La localité du cache ne suffit pas: recherche de voisin le plus proche de haute performance avec numérisation de quantification du produit. Fabien André, Anne-Marie Kermarrec, Nicolas Le Scouarnec [Paper]
- Scan: Accélération de l'inférence à grande échelle avec la quantification des vecteurs anisotropes. Guo, Ruiqi, Philip Sun, Erik Lindgren, Quan Geng, David Simcha, Felix Chern et Sanjiv Kumar [Paper, Python / C ++ Inférence, Julia Training / Inference]
- Le multi-index inversé. Babenko, Artem et Victor Lempitsky [papier, code]
- Sommes-nous encore là? La quantification du produit et son accélération matérielle. Fernandez-Marques, Javier, Ahmed F. Abouelhamayed, Nicholas D. Lane et Mohamed S. Abdelfattah. [Papier]
- Libvq: une boîte à outils pour optimiser la quantification des vecteurs et une récupération neuronale efficace. Li, Chaofan, Zheng Liu, Shitao Xiao, Yingxia Shao, Defu Lian et Zhao Cao. [Papier, code]
- Matsui, Yusuke, Ryota Hinami et Shin'ichi Satoh. "Index inversé reconfigurable." Actes de la 26e Conférence internationale de l'ACM sur le multimédia. 2018. [Paper, Project, Code]
- Aguerrebere, Cecilia, et al. "Recherche de similitude en un clin d'œil avec des indices compressés." ARXIV PRÉALLAGE ARXIV: 2304.04759 (2023).
- Huijben, Iris et al. "Quantification résiduelle avec des livres de codes neuronaux implicites." ARXIV Préprint Arxiv: 2401.14732 (2024). [Code]
- Rege, Aniket et al. "Adanns: un cadre de recherche sémantique adaptative." Avances dans les systèmes de traitement des informations neuronales 36 (2024).
- Amara, Kenza, et al. "Recherche de voisin le plus proche avec des codes compacts: une perspective de décodeur." Actes de la Conférence internationale de 2022 sur la récupération multimédia. 2022.
- Krishnan, Aditya et Edo Liberty. "La quantification des produits de clustering projective." ARXIV Préprint Arxiv: 2112.02179 (2021).
- Noh, Haechan, Taeho Kim et Jae-Pil Heo. "Index inversé de quantification du produit pour la recherche de voisine la plus proche évolutive." Actes de la conférence internationale de l'IEEE / CVF sur la vision par ordinateur. 2021.
- Zhan, Jingtao, et al. "Optimisation conjointe de l'encodeur de requête et de la quantification du produit pour améliorer les performances de récupération." Actes de la 30e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances. 2021.
- Wang, Runhui et Dong Deng. "Deltapq: compression de code de quantification du produit sans perte pour une recherche de similitude dimensionnelle élevée." Actes de la dotation VLDB 13.13 (2020): 3603-3616.
- Jang, Young Kyun et Nam Ik Cho. "Réseau de quantification des produits généralisés pour la récupération d'images semi-supervisée." Actes de la conférence IEEE / CVF sur la vision par ordinateur et la reconnaissance des modèles. 2020.
- Chen, Ting, Lala Li et Yizhou Sun. "Quantification de produit différenciable pour la compression d'intégration de bout en bout." Conférence internationale sur l'apprentissage automatique. PMLR, 2020.
- Huang, Rong, et al. "Apprendre des représentations de documents discrètes dans la recherche Web." Actes de la 29e conférence ACM SIGKDD sur la découverte des connaissances et l'exploration de données. 2023.
- Nardini, Franco Maria, Cosimo Rulli et Rossano Venturini. "Récupération de dense multi-vecteurs efficace avec des vecteurs bits." Conférence européenne sur la récupération de l'information. Cham: Springer Nature Suisse, 2024. [Code]
- Gao, Jianyang et Cheng Long. "Rabitq: quantification des vecteurs de grande dimension avec une erreur théorique à destination de la recherche approximative la plus proche du voisin." ARXIV PRÉALLAGE ARXIV: 2405.12497 (2024). [(Code) [https://github.com/gaoj0017/rabitq]]
- Gao, Jianyang, et al. "Quantification pratique et asymptotiquement optimale des vecteurs de haute dimension dans l'espace euclidien pour une recherche approximative la plus proche du voisin." ARXIV Préprint Arxiv: 2409.09913 (2024).
- Mohoney, Jason et al. "Maintenance incrémentielle de l'index de FIV pour la recherche de vecteurs en streaming." ARXIV PRÉALLAGE ARXIV: 2411.00970 (2024).
- Yang, Mingyu, Wentao Li et Wei Wang. "Recherche rapide de la recherche la plus proche du voisin avec un temps et un espace efficaces." ARXIV PRÉALLAGE ARXIV: 2411.06158 (2024).
Méthodes basées sur des graphiques
- Wang, Zeyu, et al. "Index basés sur les graphiques et les arbres pour la recherche de similitude vectorielle à haute dimension: analyses, comparaisons et orientations futures." Ingénierie des données (2023): 3-21.
- Une enquête complète et une comparaison expérimentale de la recherche approximative approximative du voisin approximative. Wang, Mengzhao, Xiaoliang Xu, Qiang Yue et Yuxiang Wang. [Papier, code]
- Lin, Peng-Cheng et Wan-Lei Zhao. "Recherche de voisine la plus proche basée sur le graphique: promesses et échecs." ARXIV Préprint Arxiv: 1904.02077 (2019).
- HNSW: recherche de voisin le plus proche efficace et robuste en utilisant des graphiques hiérarchiques de petit monde navigable. Malkov, Yu A. et Dmitry A. Yashunin. [Papier, code, version de rouille, version Go]
- Échelle des algorithmes AnNS basés sur des graphiques à des ensembles de données de taille milliard: une analyse comparative. Dobson, Magdalen, Zheqi Shen, Guy E. Belloch, Laxman Dhulipala, Yan Gu, Harsha Vardhan Simhadri et Yihan Sun. [Papier]
- Doigt: inférence rapide pour la recherche de voisin approximative basée sur des graphiques. Chen, Patrick, Wei-Cheng Chang, Jyun-yu Jiang, Hsiang-Fu Yu, Inderjit Dhillon et Cho-Jui Hsieh [Paper, vidéo]
- NSG: Navigation de graphique étalé pour une recherche approximative la plus proche du voisin. Fu, Cong, Chao Xiang, Changxu Wang et Deng Cai. [Papier, code]
- Efanna: Algorithme de recherche de voisin le plus proche approximatif extrêmement rapide basé sur le graphique KNN. Cong Fu, Deng Cai. [Papier, code]
- Khan, Saim et al. "Bang: Billion-échelle approximative la recherche de voisin le plus proche à l'aide d'un seul GPU." ARXIV Préprint Arxiv: 2401.11324 (2024).
- Ootomo, Hiroyuki, et al. "CAGRA: construction de graphiques hautement parallèles et approximation de la recherche de voisin les plus proches de GPU." ARXIV PRÉALLAGE ARXIV: 2308.15136 (2023).
- Oguri, Yutaro et Yusuke Matsui. "Analyse théorique et empirique de la sélection des points de saisie adaptative pour la recherche approximative de la plus proche des voisins basée sur des graphiques." ARXIV PRÉMENTATION ARXIV: 2402.04713 (2024).
- Oguri, Yutaro et Yusuke Matsui. "Méthode de réglage général et pratique pour l'index basé sur les graphiques standard: SISAP Indexing Challenge Rapport par Team Utokyo." Conférence internationale sur la recherche et les applications de similitude. Cham: Springer Nature Suisse, 2023.
- Wang, Mengzhao, et al. "Starling: un cadre d'index de graphes de disque économe en E / O ARXIV PRÉALLAGE ARXIV: 2401.02116 (2024). [Code]
- Manohar, Magdalen Dobson, et al. "Parlayann: algorithmes de recherche de voisin les plus proches de la recherche les plus proches de la plus proche des graphiques évolutifs et déterministes." Actes du 29e Symposium annuel ACM Sigplan sur les principes et la pratique de la programmation parallèle. 2024. [Code]
- Wang, Mengzhao, et al. "Un cadre efficace et robuste pour une recherche approximative la plus proche du voisin avec contrainte d'attribut." Avances dans les systèmes de traitement des informations neuronales 36 (2024).
- Yu, Shangdi, et al. "Pecann: clustering parallèle efficace avec une recherche approximative approximative la plus proche du voisin." ARXIV Préprint Arxiv: 2312.03940 (2023).
- Azizi, Ilias, Karima Echihabi et Themis Palpanas. "ELPIS: recherche de similitude basée sur des graphiques pour la science des données évolutive." Actes du VLDB Endowment 16.6 (2023): 1548-1559.
- Indyk, Piotr et Haike Xu. "Pire des performances des implémentations populaires de recherche de voisins les plus proches approximatives: garanties et limitations." Avances dans les systèmes de traitement des informations neuronales 36 (2024).
- Liu, Jun, et al. "Optimisation de la recherche de voisin approximative basée sur des graphiques: plus forte et plus intelligente." 2022 23e Conférence internationale de l'IEEE sur la gestion des données mobiles (MDM). IEEE, 2022.
- Wang, Hui, Yong Wang et Wan-Lei Zhao. "Recherche NN approximative basée sur des graphiques: une revisit." ARXIV PRÉALLAGE ARXIV: 2204.00824 (2022).
- Peng, Zhen et al. "Speed-Ann: Low-latence et haute précision la recherche du voisin le plus proche via le parallélisme intra-quèche." ARXIV Préprint Arxiv: 2201.13007 (2022).
- Lu, Kejing et al. "HVS: structure de graphe hiérarchique basée sur des diagrammes Voronoi pour résoudre la recherche approximative de voisin le plus proche." Actes du VLDB Endowment 15.2 (2021): 246-258. [Code]
- Yingfan, Liu, Cheng Hong et Cui Jiangtao. "Revisiter $ k $ -Nearest Vensial Graph Construction sur des données de grande dimension: expériences et analyses." ARXIV PRÉALLAGE ARXIV: 2112.02234 (2021).
- Zhu, Dantong et Minjia Zhang. "Comprendre et généraliser les graphiques de proximité monotone pour la recherche approximative du voisin le plus proche." ARXIV Préprint Arxiv: 2107.13052 (2021).
- Gottesbüren, Lars et al. "Débartière de partitionnement du graphique pour la recherche de voisin le plus proche à grande échelle." ARXIV Préprint Arxiv: 2403.01797 (2024).
- Singh, Aditi et al. "Freshdiskann: un index ANN basé sur un graphique rapide et précis pour la recherche de similitude en diffusion." ARXIV Préprint Arxiv: 2105.09613 (2021).
- Wang, Hui, Wan-Lei Zhao et Xiangxiang Zeng. "Construction de graphiques K-NN approximative à grande échelle sur GPU." ARXIV PRÉALLAGE ARXIV: 2103.15386 (2021).
- Patel, Liana, et al. "ACORN: Recherche performante et prédicat-agnostique sur les incorporations vectorielles et les données structurées." ARXIV PRÉALLAGE ARXIV: 2403.04871 (2024).
- Zuo, Chaoji, et al. "Serf: graphique du segment pour la recherche de voisinage approximatif le plus proche." Actes de l'ACM sur la gestion des données 2.1 (2024): 1-26.
- Hezel, Nico, et al. "Un graphique d'exploration avec raffinement continu pour une récupération multimédia efficace." Actes de la Conférence internationale de 2024 sur la récupération multimédia. 2024.
- Xiao, Wentao, et al. "Amélioration de l'indice HNSW pour les mises à jour en temps réel: aborder des points inaccessibles et une dégradation des performances." ARXIV Préprint Arxiv: 2407.07871 (2024).
- Yang, Shuo, et al. "Revisiter la construction de l'indice de la recherche approximative de la proximité des graphiques le plus proche." ARXIV PRÉMENTATION ARXIV: 2410.01231 (2024).
- Gou, Yutong, et al. "SymphonyQG: Vers l'intégration symphonieuse de la quantification et du graphique pour une recherche approximative la plus proche du voisin." ARXIV PRÉALLAGE ARXIV: 2411.12229 (2024).
- Yang, Ming, Yuzheng Cai et Weiguo Zheng. "CSPG: traverser des graphiques de proximité clairsemés pour une recherche approximative la plus proche du voisin." La trente-huitième conférence annuelle sur les systèmes de traitement de l'information neuronale.
? Méthodes basées sur les arbres
- Jayaram Subramanya, Suhas, et al. "Diskann: Recherche de voisin le plus proche du milliard de points plus précis sur un seul nœud." Avances dans les systèmes de traitement de l'information neuronaux 32 (2019). [Code]
- Li, Haitao, et al. "Construire l'indice basé sur les arbres pour une récupération dense efficace et efficace." ARXIV PRÉALLAGE ARXIV: 2304.11943 (2023).
- Engels, Joshua et al. "Approximation de la recherche voisine la plus proche avec des filtres à fenêtre." ARXIV PRÉALLAGE ARXIV: 2402.00943 (2024).
- Song, Yang, et al. "Promis: une recherche maximale de produits intérieure maximale efficace de haute dimension en C avec un indice léger." 2021 IEEE 37th International Conference on Data Engineering (ICDE). IEEE, 2021.
- Zhu, Yifan et al. "GTS: Index d'arborescence basé sur GPU pour la recherche rapide de similitude." ARXIV Préprint Arxiv: 2404.00966 (2024).
- Tatsuno, Kento, et al. "AISAQ: ANN tout en stock avec quantification du produit pour la récupération des informations sans DRAM." ARXIV PRÉALLAGE ARXIV: 2404.06004 (2024).
Hachage
- Documents impressionnants sur l'apprentissage du hachage
- Une enquête sur l'apprentissage du hachage. Wang, Jingdong, Ting Zhang, Ucu Sebe et Heng Tao Shen [papier]
- Une enquête sur les méthodes de hachage profondes. Luo, Xiao, Haixin Wang, Daqing Wu, Chong Chen, Minghua Deng, Jianqiang Huang et Xian-Sheng Hua. [Papier]
- Quantification itérative: une approche procrustean pour apprendre les codes binaires pour la récupération d'images à grande échelle. Gong, Yunchao, Svetlana Lazebnik, Albert Gordo et Florent Perronnin [Paper, Python Code, Matlab Code]
- Gan, Yukang, et al. "La récupération basée sur l'incorporation binaire chez Tencent." ARXIV PRÉALLAGE ARXIV: 2302.08714 (2023).
- Yan, Bencheng, et al. "L'intégration du hachage basé sur le code binaire pour les applications à l'échelle Web." Actes de la 30e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances. 2021.
- Weng, Zhenyu et Yuesheng Zhu. "Hachage en ligne non surveillé avec quantification multi-bits." Actes de la Conférence asiatique sur la vision par ordinateur. 2022.
- Huang, Qiang, Yifan Lei et Anthony Kh Tung. "Point-to-Hyperplane Recherche la plus proche du voisin au-delà de l'hypersphere unitaire." Actes de la Conférence internationale de 2021 sur la gestion des données. 2021.
- Weng, Zhenyu, Yuesheng Zhu et Ruixin Liu. "Recherche rapide sur les codes binaires par distance de Hamming pondérée." ARXIV Préprint Arxiv: 2009.08591 (2020).
- Jian, Xiaozheng, et al. "Recherche rapide de la similitude du cosinus supérieur par le biais de la quantification binaire adaptée aux XOR sur les GPU." ARXIV Préprint Arxiv: 2008.02002 (2020).
- Zheng, Bolong, et al. "PM-LSH: un cadre LSH rapide et précis pour la recherche NN approximative à haute dimension." Actes du VLDB Endowment 13.5 (2020): 643-655.
- Eghbali, Sepehr. "Recherche de voisine la plus proche évolutive avec des codes compacts." (2019).
- Lei, Yifan, et al. "Schéma de hachage sensible à la localité basé sur le co-substring circulaire le plus long." Actes de la Conférence internationale ACM Sigmod 2020 sur la gestion des données. 2020.
- Wei, Jiuqi, et al. "DET-LSH: un schéma de hachage sensible à la localité avec arbre de codage dynamique pour une recherche approximative la plus proche du voisin." ARXIV PRÉMENTATION ARXIV: 2406.10938 (2024).
Autres approches
- Chen, Qi, et al. "Spann: Recherche à l'échelle des milliards de dollars très efficace la recherche la plus proche du voisin." ARXIV PRÉALLAGE ARXIV: 2111.08566 (2021). [Code]
- Li, Yuliang et al. "Le seuil en cosinus basé sur l'indice, interrogeant en cosinus avec des garanties d'optimalité." Théorie des systèmes informatiques 65 (2021): 42-83.
- Chen, Yewang, et al. "Arbre de coque semi-convexe: les requêtes de voisin les plus proches rapides pour les données à grande échelle sur les GPU." Conférence internationale de l'IEEE 2018 sur l'exploration de données (ICDM). IEEE, 2018.
- Engels, Joshua, Benjamin Coleman et Anshumali Shrivastava. "Pratique près de la recherche de voisin via des tests de groupe." Avances dans les systèmes de traitement des informations neuronales 34 (2021): 9950-9962. [Supplément]
- Gong, Long, et al. "IDEC: codes d'estimation de la distance indexable pour la recherche approximative du voisin le plus proche." Actes du VLDB Endowment 13.9 (2020).
- Lu, Kejing et al. "VHP: approximativement la recherche de voisin le plus proche via le partitionnement vif de l'hypersphere." Actes du VLDB Endowment 13.9 (2020): 1443-1455.
- Bing Tian ,, Haikun Liu, Yuhang Tang, Shihai Xiao, ZhuoHUi Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang. "Fusionanns: une architecture de traitement coopérative CPU / GPU efficace pour la recherche de voisin approximative à l'échelle des milliards de dollars." (2024).
- Chen, Zhonghan, et al. "Explorer la signification de la recherche de voisin le plus proche dans un espace de grande dimension." ARXIV PRÉMENTATION ARXIV: 2410.05752 (2024).
- Tepper, Mariano, et al. "Gleanvec: accélération de la recherche de vecteurs avec une réduction minimaliste de la dimensionnalité non linéaire." ARXIV Préprint Arxiv: 2410.22347 (2024).
- Li, Jingyu, et al. "Panther: la recherche privée approximative la recherche la plus proche dans le paramètre de serveur unique." Cryptology Eprint Archive (2024).
- Wei, Jiuqi, et al. "Collision sous-espace: un cadre efficace et précis pour la recherche de voisin approximative de grande dimension la plus proche." ARXIV PRÉALLAGE ARXIV: 2411.14754 (2024).
Systèmes
- Qin, An, et al. "Maze: un système de déduplication vidéo rentable à l'échelle Web." Actes de la 30e Conférence internationale de l'ACM sur le multimédia. 2022.
- Doshi, Ishita, et al. "Lanns: un système de recherche de voisin le plus proche à l'échelle Web approximative." ARXIV Préprint Arxiv: 2010.09426 (2020).
- Chen, Yaoqi, et al. "OneParse: un système unifié pour la recherche vectorielle multi-index." Actes compagnons de l'ACM lors de la conférence Web 2024. 2024.
Autres
- Optimisation de la recherche avec une augmentation de la probabilité de requête et une recherche approximative à deux niveaux de périphériques Edge
- Gao, Jianyang et Cheng Long. "Recherche de voisin approximative de grande dimension la plus proche: avec des opérations de comparaison de distance fiables et efficaces." Actes de l'ACM sur la gestion des données 1.2 (2023): 1-27.
- Approximativement la recherche de voisin le plus proche dans les systèmes de recommandation. Yury Malkov.
- Accélération de la recherche de vecteurs sur le GPU avec Rapids Raft. Corey Nolet
- Gupta, Gaurav et al. "CAPS: un index de partition pratique pour la recherche de similitude filtrée." ARXIV PRÉALLAGE ARXIV: 2308.15014 (2023).
- Zhu, Yuhao. "RTNN: accélérer la recherche de voisin à l'aide du tracé des rayons matériels." Actes du 27e Symposium ACM Sigplan sur les principes et la pratique de la programmation parallèle. 2022. [Code]
- Levi, Asaf et al. "Indexation physique vs logique avec {Idea}: Index inversé {Deduplication-Aware}." 22e conférence USENIX sur les technologies de fichiers et de stockage (Fast 24). 2024. [Code]
- Carra, Damiano et Giovanni néglige. "Prendre deux oiseaux avec un cache K-NN." 2021 IEEE Global Communications Conference (GLOBECOM). IEEE, 2021.
- Salem, Tareq SI, Giovanni Neglia et Damiano Carra. "La mise en cache de similitude en ascension avec des indices approximatifs." Transactions IEEE / ACM sur le réseautage (2022).
- Li, Conglong et al. "Améliorer la recherche approximative du voisin le plus proche grâce à une fin de résiliation adaptative apprise." Actes de la Conférence internationale ACM Sigmod 2020 sur la gestion des données. 2020.
- Karppa, Matti, Martin Aumüller et Rasmus Pagh. "Deann: accélérer l'estimation de la densité du noyau en utilisant une recherche approximative la plus proche du voisin." Conférence internationale sur l'intelligence artificielle et les statistiques. PMLR, 2022.
- Wang, Zeyu, et al. "Opérateurs de comparaison de distance pour la recherche approximative du voisin le plus proche: exploration et référence." ARXIV PRÉALLAGE ARXIV: 2403.13491 (2024).
- Szilvasy, Gergely, Pierre-Emmanuel Mazaré et Matthijs Douze. "Recherche de vecteur avec de petits rayons." ARXIV PRÉMENTATION ARXIV: 2403.10746 (2024).
- Han, Changhun, Suji Kim et Ha-Myung Park. "Recherche de proximité efficace dans les données de haute dimension accumulées dans le temps en utilisant l'indexation des blocs à plusieurs niveaux." (2024).
- Tepper, Mariano, et al. "Leanvec: recherchez vos vecteurs plus rapidement en les faisant en forme." ARXIV Préprint Arxiv: 2312.16335 (2023).
- Harwood, Ben, et al. "Recherche approximative du voisin le plus proche sur les ensembles de données dynamiques: une enquête." ARXIV PRÉALLAGE ARXIV: 2404.19284 (2024).
- Caractérisant le dilemme de la performance et de la taille de l'index dans la recherche de vecteurs à l'échelle des milliards de dollars avec une mémoire de deuxième niveau
- Xu, Haike. Performes pires des implémentations populaires de recherche de voisin les plus proches approximatives: garanties et limitations. Diss. Massachusetts Institute of Technology, 2024.
- Lin, Jimmy. "Conseils opérationnels pour les récupérateurs denses et clairsemés: HNSW, index plats ou inversés?." ARXIV PRÉALLAGE ARXIV: 2409.06464 (2024).
- Zhou, Mingxun, Elaine Shi et Giulia Fanti. "Pacmann: Recherche privée privée efficace la plus proche du voisin." Cryptology Eprint Archive (2024).
? Évaluation et métriques
- Quel BM25 voulez-vous dire? Une étude de reproductibilité à grande échelle des variantes de notation. Kamphuis, Chris, Arjen P. de Vries, Leonid Boytsov et Jimmy Lin [papier]
? Articles et conférences
- Qu'est-ce qu'une base de données vectorielle?
- Bases de données vectorielles (partie 1): Qu'est-ce qui rend chacun différent?
- Le moteur de similitude vectorielle de Vector de similitude à l'échelle et rapide d'Ebay
- Meetup de vision par ordinateur: applications de vision par ordinateur à grande échelle avec des bases de données vectorielles
- Comment choisir votre base de données vectorielle en 2023?
- Avons-nous vraiment besoin d'une base de données vectorielle spécialisée?
- La base de données vectorielle n'est pas une catégorie de base de données distincte
- Bases de données vectorielles: une approche des premiers principes
- Tutoriel Vector Search Rag - Combinez vos données avec des LLM avec une recherche avancée
- Recherche efficace de similitude vectorielle dans les flux de travail des recommandations à l'aide de milvus avec nvidia merlin
- Bases de données vectorielles: Guide du débutant!
- Base de données vectorielle et printemps IA
- Comment gérer un million d'intégrés vectoriels dans les applications de chiffon
- Comment Meilisearch met à jour une base de données Vector Embeddings Millions Vector dans moins d'une minute
- Pièges communs à éviter lors de l'utilisation de bases de données vectorielles
- Début avec des bases de données vectorielles
- Choisir le meilleur modèle de recherche sémantique
Listes connexes
- Moteur de recherche vectoriel génial