? Banco de dados vetorial incrível
Uma lista com curadoria de trabalhos incríveis relacionados à estrutura de alta dimensão/pesquisa e banco de dados vetorial
Serviços
- Pesquisa do Google Vector (Vertex AI)
- Pinecone
- Teleavie [guia para iniciantes]
- Vespa
- txtai
- Marqo
- Vectara
- Epsilla
- Algolia
- Meilisearch
- nucliadb
- OpenSearch
- MyScale
- QDRANTCLOUD
- Zilliz
- Alibabacloud do OpenSearch
- Cloud de TyeSens
- Pesquisa de vetor de atlas do MongoDB
- Superduperdb
- Kbd.ai
Comparações
- De Vespa
- Vector DB Comparação por VectorHub
- MyScale Vector Database Benchmark
Bibliotecas e motores
Dados / vetores multidimensionais
- ? Matriz de características de dB vetorial
- Papel Faiss
- TieSens
- QDRANT
- Tutorial em vídeo, caderno
- irritar
- Ngt
- PGVECTOR
- Chroma
- Llamaindex
- Epsilla
- JVECTOR
- JANGADA
- Vald
- Viajante
- Tinyvector
- Pesquisa
- VECH
- MRPT
- Milvus
- infinidade
- Havenask
- Chromem-Go
- OASYSDB [Notebook]
- Meilisesearch - API de mecanismo de pesquisa para semântica (vetores), texto completo e pesquisa híbrida
- Arroy - Biblioteca Rust aproximada dos vizinhos mais próximos
- bleve
- CUVs
- vsag
- SQLITE-VEC
- MyScaledb
- Hora
- Arroy
- KGRAPH
- Mais próximo de alighbors.jl
- Muopdb
Textos
Outros
- Simsimd: alternativa eficiente para
scipy.spatial.distance e numpy.inner
Benchmarks e bancos de dados
Ann Benchmarks [papel].
Benchmarks de bilhões de Anns em escala
- 2021 Resultado
- Simhadri, Harsha Vardhan, et al. "Resultados da Big Ann: Neurips'23 Competition". Arxiv pré -impressão Arxiv: 2409.17424 (2024).
Beir
VectordBBench - uma ferramenta de benchmark de banco de dados vetorial, [Github]
Bancos de dados vetoriais da QDRANT
Benchmark de banco de dados vetorial do MyScale
Li, Wen, et al. "Pesquisa aproximada mais próxima de vizinhos em dados de alta dimensão - experiências, análises e melhorias". IEEE Transactions on Knowledge and Data Engineering 32.8 (2019): 1475-1488.
Zeng, Xianzhi, et al. "Candy: um benchmark para uma pesquisa de vizinho aproximada mais próxima, com a ingestão dinâmica de dados". Arxiv pré -impressão Arxiv: 2406.19651 (2024).
Conjuntos de dados de pesquisa vetorial da Intellabs
Livros
- Fundamentos de estruturas de dados multidimensionais e métricas
- Introdução à recuperação de informações
- Aprendizagem profunda para pesquisa
- Fundamentos de recuperação de vetores
Conferências e workshops
- Vldb
- Tutorial:
- Novas tendências na pesquisa de similaridade vetorial alta-D [slides, vídeo, papel]
- Recuperação de imagem no selvagem (CVPR20) [vídeo]
- Palheiro
- Pesquisa neural em ação
- ACM MM 2020: eficaz e eficiente: em direção à reivindicação de instância do mundo aberto
- Pesquisa aproximada mais próxima de bilhão em escala: [slides, vídeo]
- A pesquisa de instância é um problema resolvido? [Slides, vídeo]
- Geração aumentada de recuperação e vespa [slides]
- Desafio de indexação do SiSap
- 2023 Competição
- 2024 Competição
Cursos
- Memória de longo prazo em AI - Pesquisa de vetor e bancos de dados (COS 495 - Princeton) [Notas de classe]
- Freiburg Information Retrieval WS 2022-2023 [Site, Palestras de Vídeo]
- Pesquisa de similaridade vetorial e curso FAISS [Lista de reprodução do YouTube]
Outros
- VectorHub: Um site de aprendizado de código aberto gratuito para pessoas (desenvolvedores de software para arquitetos de ML seniores) interessados em adicionar recuperação de vetores à sua pilha de ML.
Publicações
Enquete
- Pan, James Jie, Jianguo Wang e Guoliang Li. "Pesquisa de sistemas de gerenciamento de banco de dados vetoriais". Arxiv pré -impressão Arxiv: 2310.14021 (2023). [Papel]
- Aumüller, Martin e Matteo Ceccarello. "Abordagens e tendências recentes em busca aproximada mais próxima de vizinhos". {IEEE} Boletim de Engenharia de Dados (2023).
- Pesquisa mais próxima do vizinho: o velho, o novo e o impossível. Andoni, Alexandr. [Papel]
- Ganbarov, Ali, et al. "Comparação experimental de algoritmos aproximados de busca de vizinhos aproximados baseados em gráficos em dispositivos de borda". Arxiv pré -impressão Arxiv: 2411.14006 (2024).
Quantização
Fonte: Uma pesquisa sobre quantização do produto.
- PQ: Quantização do produto para a pesquisa de vizinhos mais próxima. Jegou, Herve, Matthijs Douze e Cordelia Schmid. [Artigo, código, Julia Code, Nanopq]
- K-Seleção na GPU: Pesquisa de similaridade em escala de bilhão com GPUs. Johnson, Jeff, Matthijs Douze e Hervé Jégou [Paper, Código]
- Uma pesquisa da quantização do produto. Matsui, Yusuke, Yusuke Uchida, Hervé Jégou e Shin'ichi Satoh [Papel]
- OPQ: quantização otimizada do produto. GE, Tiezheng, Kaiming He, Qifa KE e Jian Sun [página inicial, papel, código, Nanopq]
- ADC mais rápido: desbloqueando o potencial oculto da quantização do produto com o SIMD. André, Fabien, Anne-Marie Kermarrec e Nicolas Le Scouarnec [Artigo, Código]
- Acelerou a pesquisa mais próxima do vizinho com o rápido ADC. André, Fabien, Anne-Marie Kermarrec e Nicolas Le Scouarnec [Paper].
- A localidade do cache não é suficiente: pesquisa de vizinho mais próxima de alto desempenho com quantização do produto Scan. Fabien André, Anne-Marie Kermarrec, Nicolas Le Scouarnec [Paper]
- Scann: Acelerando a inferência em larga escala na quantização do vetor anisotrópico. Guo, Ruiqi, Philip Sun, Erik Lindgren, Quan Geng, David Simcha, Felix Chern e Sanjiv Kumar [Paper, Inferência de Python/C ++, Julia Training/Inference]
- O multi-índice invertido. Babenko, Artem e Victor Lempitsky [papel, código]
- Já estamos lá? Quantização do produto e sua aceleração de hardware. Fernandez-Marques, Javier, Ahmed F. Abouelamayed, Nicholas D. Lane e Mohamed S. Abdelfattah. [Papel]
- Libvq: um kit de ferramentas para otimizar a quantização de vetores e a recuperação neural eficiente. Li, Chaofan, Zheng Liu, Shitao Xiao, Yingxia Shao, Defu Lian e Zhao Cao. [Papel, código]
- Matsui, Yusuke, Ryota Hinami e Shin'ichi Satoh. "Índice invertido reconfigurável." Anais da 26ª Conferência Internacional da ACM sobre Multimídia. 2018. [Artigo, projeto, código]
- Aguerrebere, Cecilia, et al. "Pesquisa de similaridade em um piscar de olhos com índices compactados". Arxiv pré -impressão Arxiv: 2304.04759 (2023).
- Huijben, Iris, et al. "Quantização residual com livros de código neurais implícitos". Arxiv pré -impressão arxiv: 2401.14732 (2024). [Código]
- Rege, Aniket, et al. "Adanns: uma estrutura para pesquisa semântica adaptativa." Avanços nos sistemas de processamento de informações neurais 36 (2024).
- Amara, Kenza, et al. "Pesquisa vizinha mais próxima com códigos compactos: uma perspectiva de decodificador". Anais da Conferência Internacional de 2022 sobre recuperação multimídia. 2022.
- Krishnan, Aditya e Edo Liberty. "Quantização projetiva de produtos de clustering". Arxiv pré -impressão Arxiv: 2112.02179 (2021).
- Noh, Haechan, Taeho Kim e Jae-Pil Heo. "Índice Invertido do Quantizer do Produto para obter uma pesquisa de vizinho mais próximo escalável". Anais da Conferência Internacional IEEE/CVF sobre Visão Computacional. 2021.
- Zhan, Jingtao, et al. "Otimizando em conjunto o codificador de consultas e a quantização do produto para melhorar o desempenho da recuperação". Anais da 30ª Conferência Internacional da ACM sobre Gerenciamento de Informações e Conhecimento. 2021.
- Wang, Runhui e Dong Deng. "Deltapq: compactação do código de quantização do produto sem perdas para pesquisa de similaridade de alta dimensão." Anais da doação do VLDB 13.13 (2020): 3603-3616.
- Jang, Young Kyun e Nam Ik Cho. "Rede de quantização de produtos generalizados para recuperação de imagem semi-supervisionada". Anais da conferência IEEE/CVF sobre visão computacional e reconhecimento de padrões. 2020.
- Chen, Ting, Lala Li e Yizhou Sun. "Quantização diferenciável do produto para compactação de incorporação de ponta a ponta". Conferência Internacional sobre aprendizado de máquina. PMLR, 2020.
- Huang, Rong, et al. "Aprendendo representações discretas de documentos na pesquisa na web." Anais da 29ª Conferência ACM SIGKDD sobre descoberta de conhecimento e mineração de dados. 2023.
- Nardini, Franco Maria, Cosimo Rulli e Rossano Venturini. "Recuperação eficiente de densidade multi-vetor com vetores de bits". Conferência Europeia sobre Recuperação de Informações. Cham: Springer Nature Suíça, 2024. [Código]
- Gao, Jianyang e Cheng Long. "Rabitq: quantizando vetores de alta dimensão com um erro teórico com destino a uma busca aproximada mais próxima do vizinho". Arxiv pré -impressão Arxiv: 2405.12497 (2024). [(Código) [https://github.com/gaoj0017/rabitq]]
- Gao, Jianyang, et al. "Quantização prática e assintoticamente ideal de vetores de alta dimensão no espaço euclidiano para uma busca aproximada mais próxima do vizinho". Arxiv pré -impressão arxiv: 2409.09913 (2024).
- Mohoney, Jason, et al. "Manutenção incremental do índice de fertilização in vitro para pesquisa de vetores de streaming". Arxiv pré -impressão arxiv: 2411.00970 (2024).
- Yang, Mingyu, Wentao Li e Wei Wang. "Pesquisa vizinha aproximada mais próxima de alta dimensão rápida, com tempo e espaço eficientes de índice e espaço". Arxiv pré -impressão Arxiv: 2411.06158 (2024).
Métodos baseados em gráficos
- Wang, Zeyu, et al. "Índices de gráfico e árvore para pesquisa de similaridade vetorial de alta dimensão: análises, comparações e direções futuras". Engenharia de dados (2023): 3-21.
- Uma pesquisa abrangente e uma comparação experimental de busca aproximada mais próxima baseada em gráficos. Wang, Mengzhao, Xiaoliang Xu, Qiang Yue e Yuxiang Wang. [Papel, código]
- Lin, Peng-Cheng e Wan-Lei Zhao. "Pesquisa de vizinho mais próxima baseada em gráficos: promessas e falhas". Arxiv pré -impressão Arxiv: 1904.02077 (2019).
- HNSW: Pesquisa de vizinho aproximada mais próxima eficiente e robusta, usando gráficos mundiais pequenos de navegação hierárquica. Malkov, Yu A. e Dmitry A. Yashunin. [Papel, código, versão de ferrugem, versão Go]
- Algoritmos ANNs baseados em gráficos em escala para conjuntos de dados de bilhões de tamanho: uma análise comparativa. Dobson, Magdalen, Zheqi Shen, Guy E. Blelloch, Laxman Dhulipala, Yan Gu, Harsha Vardhan Simhadri e Yihan Sun. [Papel]
- DO DE PARTE: Inferência rápida para pesquisa aproximada mais próxima baseada em gráficos. Chen, Patrick, Wei-Cheng Chang, Jyun-Yu Jiang, Hsiang-Fu Yu, Inderjit Dhillon e Cho-Jui Hsieh [artigo, vídeo]
- NSG: Navegando gráfico de propagação para busca aproximada mais próxima do vizinho. Fu, Cong, Chao Xiang, Changxu Wang e Deng Cai. [Papel, código]
- Efanna: O algoritmo de pesquisa de vizinhos mais rápido e aproximado mais rápido com base no gráfico KNN. Cong Fu, Deng Cai. [Papel, código]
- Khan, Saim, et al. "BANG: Pesquisa de vizinho aproximada mais próxima em escala de bilhão usando uma única GPU". Arxiv pré -impressão Arxiv: 2401.11324 (2024).
- Ootomo, Hiroyuki, et al. "CAGRA: Construção de gráficos altamente paralela e busca aproximada de vizinho mais próximo de GPUs". Arxiv pré -impressão arxiv: 2308.15136 (2023).
- Oguri, Yutaro e Yusuke Matsui. "Análise teórica e empírica da seleção de pontos de entrada adaptativa para a pesquisa aproximada aproximada de vizinho aproximado baseado em gráfico". Arxiv pré -impressão arxiv: 2402.04713 (2024).
- Oguri, Yutaro e Yusuke Matsui. "Método de ajuste geral e prático para o índice baseado em gráficos pronta para uso: Relatório de Desafio de Indexação do SiSAP por Team Utokyo". Conferência Internacional sobre Pesquisa e Aplicações de Similaridade. Cham: Springer Nature Suíça, 2023.
- Wang, Mengzhao, et al. "Starling: uma estrutura de índice de gráfico com residente em disco com eficiência de E/O para pesquisa de similaridade vetorial de alta dimensão no segmento de dados." Arxiv pré -impressão arxiv: 2401.02116 (2024). [Código]
- Manohar, Magdalen Dobson, et al. "Parlayann: escalável e determinístico paralelo aproximado de algoritmos de pesquisa de vizinhos mais próximos". Anais do 29º Simpósio Anual do ACM Sigplan sobre princípios e prática de programação paralela. 2024. [Código]
- Wang, Mengzhao, et al. "Uma estrutura eficiente e robusta para uma pesquisa de vizinho aproximada mais próxima com restrição de atributo". Avanços nos sistemas de processamento de informações neurais 36 (2024).
- Yu, Shangdi, et al. "Pecann: agrupamento com eficiência paralela com a busca aproximada mais próxima de gráficos." ARXIV ARXIV ARXIV: 2312.03940 (2023).
- Azizi, Ilias, Karima Echihabi e Themis Palpanas. "ELPIS: pesquisa de similaridade baseada em gráficos para ciência de dados escalável". Anais da doação do VLDB 16.6 (2023): 1548-1559.
- Indyk, Piotr e Haike Xu. "O pior desempenho de implementações populares de busca vizinha aproximada mais próxima: garantias e limitações". Avanços nos sistemas de processamento de informações neurais 36 (2024).
- Liu, Jun, et al. "Otimizando a busca aproximada mais próxima de gráficos: mais forte e mais inteligente". 2022 23ª Conferência Internacional do IEEE sobre Gerenciamento de Dados Móveis (MDM). IEEE, 2022.
- Wang, Hui, Yong Wang e Wan-Lei Zhao. "Pesquisa aproximada de NN baseada em gráficos: uma revisita". Arxiv pré -impressão Arxiv: 2204.00824 (2022).
- Peng, Zhen, et al. "Speed-Ann: Pesquisa de vizinho mais próxima de baixa latência e alta precisão por paralelismo intra-quadro". Arxiv pré -impressão arxiv: 2201.13007 (2022).
- Lu, Kejing, et al. "HVS: estrutura de gráficos hierárquicos com base nos diagramas de voronoi para resolver a pesquisa aproximada mais próxima do vizinho". Anais da doação do VLDB 15.2 (2021): 246-258. [Código]
- Yingfan, Liu, Cheng Hong e Cui Jiangtao. "Revisitando $ K $-A construção de gráficos mais interessante em dados de alta dimensão: experimentos e análises". ARXIV ARXIV ARXIV: 2112.02234 (2021).
- Zhu, Dantong e Minjia Zhang. "Entendendo e generalizando gráficos de proximidade monotônica para aproximar a busca mais próxima do vizinho". Arxiv pré -impressão arxiv: 2107.13052 (2021).
- Gottesbüren, Lars, et al. "Liberando a partição de gráficos para a pesquisa de vizinhos mais próxima em larga escala". Arxiv pré -impressão Arxiv: 2403.01797 (2024).
- Singh, Aditi, et al. "Freshdiskann: um índice de Ann Rápido e Preciso baseado em gráficos para pesquisa de similaridade de streaming." Arxiv pré -impressão Arxiv: 2105.09613 (2021).
- Wang, Hui, Wan-Lei Zhao e Xiangxiang Zeng. "Construção de gráficos K-NN aproximada em larga escala na GPU". Arxiv pré -impressão Arxiv: 2103.15386 (2021).
- Patel, Liana, et al. "Bolsa: Pesquisa de Performant e Predicate-Agnóstica sobre incorporações vetoriais e dados estruturados". Arxiv pré -impressão Arxiv: 2403.04871 (2024).
- Zuo, Chaoji, et al. "SERF: Gráfico de segmento para filtragem de faixa aproximada da pesquisa de vizinhos mais próxima". Anais do ACM sobre o gerenciamento de dados 2.1 (2024): 1-26.
- Hezel, Nico, et al. "Um gráfico de exploração com refinamento contínuo para recuperação multimídia eficiente". Anais da Conferência Internacional de 2024 sobre Recuperação multimídia. 2024.
- Xiao, Wentao, et al. "Aprimorando o índice HNSW para atualizações em tempo real: abordando pontos inacessíveis e degradação do desempenho". Arxiv pré -impressão arxiv: 2407.07871 (2024).
- Yang, Shuo, et al. "Revisitando a construção de índices da Proximity Graph aproximadamente a pesquisa de vizinhos mais próxima". ARXIV ARXIV ARXIV: 2410.01231 (2024).
- Gou, Yutong, et al. "Symphonyqg: Rumo a integração sinfoniosa de quantização e gráfico para uma busca aproximada mais próxima do vizinho". Arxiv pré -impressão arxiv: 2411.12229 (2024).
- Yang, Ming, Yuzheng Cai e Weiguo Zheng. "CSPG: cruzando gráficos de proximidade esparsos para a busca aproximada mais próxima do vizinho". A Trigésima Oitava Conferência Anual sobre Sistemas de Processamento de Informações Neurais.
"Métodos baseados em árvores
- Jayaram Subramanya, Suhas, et al. "Diskann: Pesquisa de vizinho de bilhões mais rápida de bilhão mais próximo em um único nó". Avanços nos sistemas de processamento de informações neurais 32 (2019). [Código]
- Li, Haitao, et al. "Construindo o índice baseado em árvores para recuperação densa eficiente e eficaz". Arxiv pré -impressão Arxiv: 2304.11943 (2023).
- Engels, Joshua, et al. "Pesquisa de vizinho mais próxima aproximada com filtros de janelas." Arxiv pré -impressão arxiv: 2402.00943 (2024).
- Song, Yang, et al. "Promesps: eficientes de alta dimensão C-aproxima a pesquisa máxima de produtos internos com um índice leve". 2021 IEEE 37ª Conferência Internacional sobre Engenharia de Dados (ICDE). IEEE, 2021.
- Zhu, Yifan, et al. "GTS: Índice de árvores baseado em GPU para pesquisa rápida de similaridade." Arxiv pré -impressão Arxiv: 2404.00966 (2024).
- Tatsuno, Kento, et al. "AISAQ: Anns All-in-Sorage com quantização do produto para recuperação de informações sem DRAM." Arxiv pré -impressão arxiv: 2404.06004 (2024).
Hashing
- Artigos incríveis sobre aprender a haxh
- Uma pesquisa sobre aprender a hash. Wang, Jingdong, Ting Zhang, Una Sebe e Heng Tao Shen [papel]
- Uma pesquisa sobre métodos profundos de hash. Luo, Xiao, Haixin Wang, Daqing Wu, Chong Chen, Minghua Deng, Jianqiang Huang e Xian-Sheng Hua. [Papel]
- Quantização iterativa: uma abordagem procrustea para aprender códigos binários para recuperação de imagens em larga escala. Gong, Yunchao, Svetlana Lazebnik, Albert Gordo e Florent Perronnin [Paper, Código Python, Código Matlab]
- Gan, Yukang, et al. "Recuperação baseada em incorporação binária na Tencent". Arxiv pré -impressão Arxiv: 2302.08714 (2023).
- Yan, Bencheng, et al. "Incorporação de hash baseada em código binário para aplicativos em escala na Web". Anais da 30ª Conferência Internacional da ACM sobre Gerenciamento de Informações e Conhecimento. 2021.
- Weng, Zhenyu e Yuesheng Zhu. "Hash online sem supervisão com quantização de vários bits". Anais da conferência asiática sobre visão computacional. 2022.
- Huang, Qiang, Yifan Lei e Anthony Kh Tung. "Ponto a hiperplano mais próximo da busca do vizinho além do hiperesfera da unidade". Anais da Conferência Internacional de 2021 sobre Gerenciamento de Dados. 2021.
- Weng, Zhenyu, Yuesheng Zhu e Ruixin Liu. "Pesquisa rápida em códigos binários por distância ponderada de hamming." Arxiv pré -impressão Arxiv: 2009.08591 (2020).
- Jian, Xiaozheng, et al. "Pesquisa rápida de similaridade de cosseno de topo-K por meio da quantização binária amigável ao XOR nas GPUs". Arxiv pré -impressão Arxiv: 2008.02002 (2020).
- Zheng, Bolong, et al. "PM-LSH: uma estrutura LSH rápida e precisa para pesquisa de NN aproximada de alta dimensão." Anais da doação do VLDB 13.5 (2020): 643-655.
- Eghbali, Sepehr. "Pesquisa de vizinho mais próxima escalável com códigos compactos." (2019).
- Lei, Yifan, et al. "Esquema de hash sensível à localidade com base em co-substring circulares mais longas". Anais da Conferência Internacional da ACM Sigmod de 2020 sobre gerenciamento de dados. 2020.
- Wei, Jiuqi, et al. "Det-LSH: um esquema de hash sensível à localidade com árvore de codificação dinâmica para uma busca aproximada mais próxima do vizinho". Arxiv pré -impressão arxiv: 2406.10938 (2024).
Outras abordagens
- Chen, Qi, et al. "Spann: Pesquisa vizinha aproximada mais próxima de bilhões de bilhões de bilhões altamente eficiente". Arxiv pré -impressão Arxiv: 2111.08566 (2021). [Código]
- Li, Yuliang, et al. "Consulta de limiar de cosseno baseada em índice, de alta dimensão, com garantias de otimização". Teoria dos Sistemas de Computação 65 (2021): 42-83.
- Chen, Yewang, et al. "Árvore do casco semi-convexo: consultas vizinhas mais próximas mais próximas para dados em larga escala nas GPUs". 2018 Conferência Internacional do IEEE sobre Mineração de Dados (ICDM). IEEE, 2018.
- Engels, Joshua, Benjamin Coleman e Anshumali Shrivastava. "Prática a busca próxima de vizinhos por meio de testes em grupo". Avanços nos sistemas de processamento de informações neurais 34 (2021): 9950-9962. [Suplemento]
- Gong, Long, et al. "IDEC: Códigos de estimativa de distância indexível para uma busca aproximada mais próxima do vizinho". Anais da doação do VLDB 13.9 (2020).
- Lu, Kejing, et al. "VHP: aproxima a pesquisa mais próxima do vizinho via particionamento virtual de hiperesfera". Anais da doação do VLDB 13.9 (2020): 1443-1455.
- Bing Tian, Haikun Liu, Yuhang Tang, Shihai Xiao, Zhuohui Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang. "FusionAnns: uma arquitetura de processamento cooperativa de CPU/GPU eficiente para uma pesquisa de vizinho aproximada mais próxima de bilhões de escala". (2024).
- Chen, Zhonghan, et al. "Explorando a significância da busca mais próxima do vizinho no espaço de alta dimensão". Arxiv pré -impressão arxiv: 2410.05752 (2024).
- Tepper, Mariano, et al. "Gleanvec: Acelerando a pesquisa de vetores com redução de dimensionalidade não linear minimalista". Arxiv pré -impressão Arxiv: 2410.22347 (2024).
- Li, Jingyu, et al. "Pantera: Private aproxima a pesquisa de vizinhos mais próxima na configuração de servidor único." Arquivo de EPRINT de criptologia (2024).
- Wei, Jiuqi, et al. "Colisão do subespaço: uma estrutura eficiente e precisa para uma pesquisa de vizinha aproximada mais próxima de alta dimensão". Arxiv pré -impressão Arxiv: 2411.14754 (2024).
Sistemas
- Qin, An, et al. "Maze: um sistema de desduplicação de vídeo econômico na escala da Web." Anais da 30ª Conferência Internacional da ACM sobre Multimídia. 2022.
- Doshi, Ishita, et al. "Lanns: um sistema de pesquisa de vizinhos mais próximo em escala na Web." Arxiv pré -impressão Arxiv: 2010.09426 (2020).
- Chen, Yaoqi, et al. "OneSparse: um sistema unificado para pesquisa de vetores com vários índices." Anais complementares da ACM na Conferência da Web 2024. 2024.
Outros
- Otimização de pesquisa com o aumento de verossimilhança de consulta e busca aproximada de dois níveis por dispositivos de borda
- Gao, Jianyang e Cheng Long. "Pesquisa de vizinho aproximada mais próxima de alta dimensão: com operações de comparação de distância confiáveis e eficientes". Anais do ACM sobre o gerenciamento de dados 1.2 (2023): 1-27.
- Pesquisa de vizinho mais próxima aproximada em sistemas de recomendação. Yury Malkov.
- Acelerando a pesquisa de vetores na GPU com a jangada corrediça. Corey Nolet
- Gupta, Gaurav, et al. "Caps: um índice de partição prático para pesquisa de similaridade filtrada." Arxiv pré -impressão arxiv: 2308.15014 (2023).
- Zhu, Yuhao. "RTNN: Acelerando a pesquisa de vizinhos usando o rastreamento de raios de hardware." Anais do 27º Simpósio ACM Sigplan sobre princípios e prática de programação paralela. 2022. [Código]
- Levi, Asaf, et al. "Indexação física vs. lógica com {Idea}: Invertido {Deduplication-Aware} Index." 22ª Conferência do USENIX sobre tecnologias de arquivo e armazenamento (FAST 24). 2024. [Código]
- Carra, Damiano e Giovanni Neglia. "Tomando dois pássaros com um cache K-NN." 2021 Conferência de Comunicações Globais IEEE (Globecom). IEEE, 2021.
- Salem, Tareq Si, Giovanni Neglia e Damiano Carra. "Cache de similaridade de subida com índices aproximados". Transações IEEE/ACM em rede (2022).
- Li, Conglong, et al. "Melhorando a busca aproximada mais próxima do vizinho por meio de terminação precoce adaptativa". Anais da Conferência Internacional da ACM Sigmod de 2020 sobre gerenciamento de dados. 2020.
- Karppa, Matti, Martin Aumüller e Rasmus Pagh. "Deann: acelerar a estimativa de densidade do kernel usando a busca aproximada mais próxima do vizinho". Conferência Internacional sobre Inteligência Artificial e Estatística. PMLR, 2022.
- Wang, Zeyu, et al. "Operadores de comparação de distância para a busca aproximada mais próxima do vizinho: exploração e referência". Arxiv pré -impressão Arxiv: 2403.13491 (2024).
- Szilvasy, Gergely, Pierre-Emmanuel Mazaré e Matthijs Douze. "Pesquise vetorial com pequenos raiosos." Arxiv pré -impressão Arxiv: 2403.10746 (2024).
- Han, Changhun, Suji Kim e Ha-Myung Park. "Pesquisa de proximidade eficiente na acumulação de tempo de alta dimensão, usando a indexação de blocos de vários níveis". (2024).
- Tepper, Mariano, et al. "Leanvec: pesquise seus vetores mais rapidamente, tornando -os em forma." Arxiv pré -impressão arxiv: 2312.16335 (2023).
- Harwood, Ben, et al. "Pesquisa aproximada mais próxima de vizinhos em conjuntos de dados dinâmicos: uma investigação". Arxiv pré -impressão Arxiv: 2404.19284 (2024).
- Caracterizando o dilema do desempenho e o tamanho do índice na pesquisa de vetores em escala de bilhão e quebrando-o com a memória de segundo nível
- Xu, Haike. Pior desempenho de desempenho de implementações populares de busca vizinha aproximada mais próxima: garantias e limitações. Diss. Instituto de Tecnologia de Massachusetts, 2024.
- Lin, Jimmy. "Aconselhamento operacional para retrievers densos e esparsos: HNSW, índices planos ou invertidos?." Arxiv pré -impressão Arxiv: 2409.06464 (2024).
- Zhou, Mingxun, Elaine Shi e Giulia Fanti. "Pacmann: Pesquisa vizinha aproximada mais próxima eficiente e eficiente." Arquivo de EPRINT de criptologia (2024).
? Avaliação e métricas
- Qual BM25 você quer dizer? Um estudo de reprodutibilidade em larga escala das variantes de pontuação. Kamphuis, Chris, Arjen P. de Vries, Leonid Boytsov e Jimmy Lin [papel]
? Artigos e palestras
- O que é um banco de dados vetorial?
- Banco de dados de vetores (Parte 1): O que torna cada um diferente?
- Motor de similaridade vetorial de bilhão de bilhões de bilhões de ebay
- Meetup de visão computacional: Aplicativos de visão computacional em escala com bancos de dados vetoriais
- Como escolher o seu banco de dados vetorial em 2023?
- Realmente precisamos de um banco de dados vetorial especializado?
- O banco de dados vetorial não é uma categoria de banco de dados separada
- Banco de dados de vetores: uma abordagem de primeiros princípios
- Tutorial de Pesquisa de Vector - Combine seus dados com LLMS com pesquisa avançada
- Pesquisa de similaridade vetorial eficiente em fluxos de trabalho de recomendação usando Milvus com Nvidia Merlin
- Banco de dados de vetores: um guia para iniciantes!
- Banco de dados vetorial e primavera ia
- Como lidar com um milhão de incorporações de vetor nas aplicações de pano
- Como o MeiliseSearch atualiza um banco de dados de incorporação de vetor de milhões em menos de um minuto
- Armadilhas comuns a serem evitadas ao usar bancos de dados vetoriais
- Introdução com bancos de dados vetoriais
- Escolhendo o melhor modelo para pesquisa semântica
Listas relacionadas
- Mecanismo de busca de vetor incrível