? 멋진 벡터 데이터베이스
고차원 구조/벡터 검색 및 데이터베이스와 관련된 멋진 작품의 선별 된 목록
서비스
- Google Vector Search (Vertex AI)
- 피네콘
- 직물 [초보자 가이드]
- 베스파
- txtai
- 마르코
- vectara
- 엡실라
- 조류
- meilisearch
- 핵
- OpenSearch
- 미사
- QdrantCloud
- Zilliz
- OpenSearch의 Alibabacloud
- Typesense의 클라우드
- MongoDB Atlas 벡터 검색
- SuperduperDB
- KBD.AI
비교
- Vespa에서
- Vectorhub에 의한 벡터 DB 비교
- MyScale 벡터 데이터베이스 벤치 마크
라이브러리 및 엔진
다차원 데이터 / 벡터
- ? 벡터 DB 기능 매트릭스
- Faiss 종이
- 타입
- qdrant
- 짜증나게 하다
- ngt
- pgvector
- 크로마
- llamaindex
- 엡실라
- Jvector
- 뗏목
- 발드
- 보이저
- 작은 벡터
- usearch
- vearch
- MRPT
- 밀버
- 무한대
- Havenask
- 크롬-고
- OASYSDB [노트북]
- Meilisearch- 시맨틱 (벡터) 용 검색 엔진 API, 전체 텍스트 및 하이브리드 검색
- Arroy- 가장 가까운 이웃 Rust Library
- 블리브
- CUV
- vsag
- Sqlite-Vec
- Myscaledb
- 호라
- Arroy
- kgraph
- 가장 가까운 니 이시버 .JL
- muopdb
텍스트
기타
- Simsimd :
scipy.spatial.distance and numpy.inner 에 대한 효율적인 대안
벤치 마크 및 데이터베이스
앤 벤치 마크 [종이].
10 억 규모의 Anns 벤치 마크
- 2021 결과
- Simhadri, Harsha Vardhan 등. "Big Ann의 결과 : Neurips'23 경쟁." Arxiv preprint arxiv : 2409.17424 (2024).
베르
vectordbbench- 벡터 데이터베이스 벤치 마크 도구, [GitHub]
Qdrant의 벡터 데이터베이스 벤치 마크
MyScale의 벡터 데이터베이스 벤치 마크
Li, Wen, et al. "높은 차원의 데이터에서 가장 가까운 이웃 검색과 비슷한 이웃 검색 (경험, 분석 및 개선)." 지식 및 데이터 엔지니어링에 대한 IEEE 거래 32.8 (2019) : 1475-1488.
Zeng, Xianzhi, et al. "Candy : 동적 데이터 수집을 통해 지속적인 근사한 이웃 검색을위한 벤치 마크." Arxiv preprint arxiv : 2406.19651 (2024).
Intellabs의 벡터 검색 데이터 세트
서적
- 다차원 및 메트릭 데이터 구조의 기초
- 정보 검색 소개
- 검색을위한 딥 러닝
- 벡터 검색의 기초
컨퍼런스 및 워크샵
- VLDB
- 지도 시간:
- High-D 벡터 유사성 검색의 새로운 트렌드 [슬라이드, 비디오, 종이]
- 야생의 이미지 검색 (CVPR20) [비디오]
- 커다란 건초 더미
- 신경 검색 행동
- ACM MM 2020 : 효과적이고 효율적인 : 개방형 인스턴스 재 식별
- 10 억 규모의 가장 가까운 이웃 검색 : [슬라이드, 비디오]
- 인스턴스 검색이 해결 된 문제입니까? [슬라이드, 비디오]
- 증강 증강 세대 및 Vespa [슬라이드]
- SISAP 인덱싱 챌린지
행동
- AI의 장기 메모리 - 벡터 검색 및 데이터베이스 (COS 495 -Princeton) [클래스 노트]
- Freiburg 정보 검색 WS 2022-2023 [웹 사이트, 비디오 강의]
- 벡터 유사성 검색 및 FAISS 코스 [YouTube 재생 목록]
기타
- Vectorhub : ML 스택에 벡터 검색을 추가하는 데 관심이있는 사람들 (소프트웨어 개발자에게 미화 ML 아키텍트)을위한 무료 오픈 소스 학습 웹 사이트.
출판물
조사
- Pan, James Jie, Jianguo Wang 및 Guoliang Li. "벡터 데이터베이스 관리 시스템의 조사." Arxiv preprint arxiv : 2310.14021 (2023). [종이]
- Aumüller, Martin 및 Matteo Ceccarello. "가장 가까운 이웃 검색의 최근 접근과 트렌드." {IEEE} 데이터 엔지니어링 게시판 (2023).
- 가장 가까운 이웃 검색 : 노인, 새롭고 불가능한. Andoni, Alexandr. [종이]
- Ganbarov, Ali, et al. "Edge Devices에서 그래프 기반 근사 이웃 검색 알고리즘의 실험 비교." Arxiv preprint arxiv : 2411.14006 (2024).
양자화
출처 : 제품 양자화 설문 조사.
- PQ : 가장 가까운 이웃 검색을위한 제품 양자화. Jegou, Herve, Matthijs Douze 및 Cordelia Schmid. [종이, 코드, Julia Code, Nanopq]
- GPU의 K- 선택 : GPU를 사용한 10 억 규모의 유사성 검색. Johnson, Jeff, Matthijs Douze 및 Hervé Jégou [종이, 코드]
- 제품 양자화에 대한 조사. Matsui, Yusuke, Yusuke Uchida, Hervé Jégou 및 Shin'ichi Satoh [종이]
- OPQ : 최적화 된 제품 양자화. GE, TIEZHENG, KAIMING HE, QIFA KE 및 JIAN SUN [홈페이지, 종이, 코드, NANOPQ]
- 더 빠른 ADC : SIMD로 제품 양자화의 숨겨진 잠재력을 잠금 해제합니다. André, Fabien, Anne-Marie Kermarrec 및 Nicolas Le Scouarnec [종이, 코드]
- 빠른 ADC로 가장 가까운 이웃 검색 가속. André, Fabien, Anne-Marie Kermarrec 및 Nicolas Le Scouarnec [종이].
- 캐시 지역은 충분하지 않습니다. 제품 양자화 빠른 스캔을 통해 가장 가까운 이웃 검색. Fabien André, Anne-Marie Kermarrec, Nicolas Le Scouarnec [종이]
- 스캐번 : 이방성 벡터 양자화에 대한 대규모 추론을 가속화합니다. Guo, Ruiqi, Philip Sun, Erik Lindgren, Quan Geng, David Simcha, Felix Chern 및 Sanjiv Kumar [종이, Python/C ++ 추론, 줄리아 훈련/추론]
- 역 다수 인덱스. Babenko, Artem 및 Victor Lempitsky [종이, 코드]
- 우리는 아직 거기에 있습니까? 제품 양자화 및 하드웨어 가속. Fernandez-Marques, Javier, Ahmed F. Abouelhamayed, Nicholas D. Lane 및 Mohamed S. Abdelfattah. [종이]
- LIBVQ : 벡터 양자화 및 효율적인 신경 검색을 최적화하기위한 툴킷. Li, Chaofan, Zheng Liu, Shitao Xiao, Yingxia Shao, Defu Lian 및 Zhao Cao. [종이, 코드]
- Matsui, Yusuke, Ryota Hinami 및 Shin'ichi Satoh. "재구성 가능한 반전 인덱스." 멀티미디어에 관한 26 번째 ACM 국제 회의 절차. 2018. [종이, 프로젝트, 코드]
- Aguerrebere, Cecilia, et al. "압축 지수로 눈의 깜박임에서 유사성 검색." Arxiv preprint arxiv : 2304.04759 (2023).
- Huijben, Iris 등 "암시 적 신경 코드 북을 가진 잔류 양자화." Arxiv preprint arxiv : 2401.14732 (2024). [암호]
- Rege, Aniket 등 "Adanns : 적응 시맨틱 검색을위한 프레임 워크." 신경 정보 처리 시스템 36 (2024)의 발전.
- Amara, Kenza 등 "소형 코드가있는 가장 가까운 이웃 검색 : 디코더 관점." 멀티미디어 검색에 관한 2022 국제 회의의 절차. 2022.
- Krishnan, Aditya 및 Edo Liberty. "투영 클러스터링 제품 양자화." Arxiv preprint arxiv : 2112.02179 (2021).
- Noh, Haechan, Taeho Kim 및 Jae-Pil Heo. "제품 양자이기는 확장 가능한 가장 가까운 이웃 검색에 대한 역 지수를 인식합니다." 컴퓨터 비전에 관한 IEEE/CVF 국제 회의의 절차. 2021.
- Zhan, Jingtao 등 "검색 성능을 향상시키기 위해 쿼리 인코더 및 제품 양자화를 공동으로 최적화합니다." 정보 및 지식 관리에 관한 30 번째 ACM 국제 회의 절차. 2021.
- Wang, Runhui 및 Dong Deng. "DELTAPQ : 고 차원 유사성 검색을위한 무손실 제품 양자화 코드 압축." VLDB 기부금 절차 13.13 (2020) : 3603-3616.
- 장, 젊은 쿤, 그리고 남가 초. "반 감독 된 이미지 검색을위한 일반화 된 제품 양자화 네트워크." 컴퓨터 비전 및 패턴 인식에 관한 IEEE/CVF 컨퍼런스의 절차. 2020.
- Chen, Ting, Lala Li 및 Yizhou Sun. "엔드 투 엔드 임베딩 압축을위한 차별화 가능한 제품 양자화." 기계 학습에 관한 국제 회의. PMLR, 2020.
- Huang, Rong 등 "웹 검색에서 개별 문서 표현 학습." 지식 발견 및 데이터 마이닝에 관한 제 29 회 ACM SIGKDD 컨퍼런스의 절차. 2023.
- Nardini, Franco Maria, Cosimo Rulli 및 Rossano Venturini. "비트 벡터가있는 효율적인 다중 벡터 밀도 검색." 정보 검색에 관한 유럽 회의. Cham : Springer Nature Switzerland, 2024. [Code]
- Gao, Jianyang 및 Cheng Long. "Rabitq : 근사한 이웃 검색에 대한 이론적 오류를 갖는 고차원 벡터를 정량화합니다." Arxiv preprint arxiv : 2405.12497 (2024). [(코드) [https://github.com/gaoj0017/rabitq]]
- Gao, Jianyang 등 "가장 가까운 이웃 검색을 위해 유클리드 공간에서 고차원 벡터의 실용적이고 무증상 최적의 양자화." Arxiv preprint arxiv : 2409.09913 (2024).
- Mohoney, Jason 등 "스트리밍 벡터 검색을위한 증분 IVF 인덱스 유지 보수." Arxiv preprint arxiv : 2411.00970 (2024).
- 양, Mingyu, Wentao Li 및 Wei Wang. "효율적인 인덱스 시간과 공간을 갖춘 빠른 고차원 대략적인 이웃 검색." Arxiv preprint arxiv : 2411.06158 (2024).
그래프 기반 방법
- Wang, Zeyu, et al. "고차원 벡터 유사성 검색을위한 그래프 및 트리 기반 인덱스 : 분석, 비교 및 향후 방향." 데이터 공학 (2023) : 3-21.
- 그래프 기반 근사 이웃 검색의 포괄적 인 설문 조사 및 실험 비교. Wang, Mengzhao, Xiaoliang Xu, Qiang Yue 및 Yuxiang Wang. [종이, 코드]
- Lin, Peng-Cheng 및 Wan-Lei Zhao. "그래프 기반 가장 가까운 이웃 검색 : 약속 및 실패." Arxiv preprint arxiv : 1904.02077 (2019).
- HNSW : 계층 적 항해 가능한 작은 세계 그래프를 사용하여 효율적이고 강력한 근사 이웃 검색. Malkov, Yu A. 및 Dmitry A. Yashunin. [종이, 코드, 녹 버전, GO 버전]
- 그래프 기반 Anns 알고리즘을 10 억 크기 데이터 세트로 스케일링 : 비교 분석. Dobson, Magdalen, Zheqi Shen, Guy E. Blelloch, Laxman Dhulipala, Yan Gu, Harsha Vardhan Simhadri 및 Yihan Sun. [종이]
- 손가락 : 그래프 기반 대략적인 가장 가까운 이웃 검색에 대한 빠른 추론. Chen, Patrick, Wei-Cheng Chang, Jyun-Yu Jiang, Hsiang-Fu Yu, Inderjit Dhillon 및 Cho-Jui Hsieh [종이, 비디오]
- NSG : 가장 가까운 이웃 검색을위한 스프레드 아웃 그래프 탐색. Fu, Cong, Chao Xiang, Changxu Wang 및 Deng Cai. [종이, 코드]
- Efanna : KNN 그래프를 기반으로 매우 가까운 가장 가까운 이웃 검색 알고리즘. Cong Fu, Deng Cai. [종이, 코드]
- Khan, Saim, et al. "Bang : 단일 GPU를 사용하여 10 억 규모의 가장 가까운 이웃 검색." Arxiv preprint arxiv : 2401.11324 (2024).
- Ootomo, Hiroyuki 등. "CAGRA : GPU에 대한 매우 평행 한 그래프 구성 및 대략적인 이웃 검색." Arxiv preprint arxiv : 2308.15136 (2023).
- 오구리, 유타로, 유스케 마츠이. "그래프 기반 가장 가까운 이웃 검색을위한 적응 적 진입 점 선택의 이론적이고 경험적 분석." Arxiv preprint arxiv : 2402.04713 (2024).
- 오구리, 유타로, 유스케 마츠이. "기성 그래프 기반 인덱스를위한 일반적이고 실용적인 튜닝 방법 : Team Utokyo의 SISAP 인덱싱 챌린지 보고서." 유사성 검색 및 응용 프로그램에 관한 국제 회의. Cham : Springer Nature Switzerland, 2023.
- Wang, Mengzhao 등 "Starling : 데이터 세그먼트에서 고차원 벡터 유사성 검색을위한 I/O- 효율적인 디스크 상주 그래프 인덱스 프레임 워크." Arxiv preprint arxiv : 2401.02116 (2024). [암호]
- Manohar, Magdalen Dobson 등. "Parlayann : 확장 가능하고 결정적인 병렬 그래프 기반 근사 이웃 검색 알고리즘." 평행 프로그래밍 원칙과 실무에 관한 제 29 회 ACM Sigplan 연례 심포지엄의 절차. 2024. [코드]
- Wang, Mengzhao 등 "속성 제약 조건을 가진 가장 가까운 이웃 검색을위한 효율적이고 강력한 프레임 워크." 신경 정보 처리 시스템 36 (2024)의 발전.
- Yu, Shangdi 등. "Pecann : 그래프 기반 근사 이웃 검색을 가진 병렬 효율 클러스터링." Arxiv preprint arxiv : 2312.03940 (2023).
- Azizi, Ilias, Karima Echihabi 및 Themis Palpanas. "ELPIS : 확장 가능한 데이터 과학에 대한 그래프 기반 유사성 검색." VLDB 엔 다우먼트의 절차 16.6 (2023) : 1548-1559.
- Indyk, Piotr 및 Haike Xu. "인기있는 대략적인 가장 가까운 이웃 검색 구현의 최악의 성능 : 보증 및 제한." 신경 정보 처리 시스템 36 (2024)의 발전.
- Liu, Jun 등 "그래프 기반 대략적인 가장 가까운 이웃 검색 최적화 : 더 강력하고 똑똑합니다." 2022 23rd IEEE 국제 모바일 데이터 관리 (MDM). IEEE, 2022.
- Wang, Hui, Yong Wang 및 Wan-Lei Zhao. "그래프 기반 대략적인 NN 검색 : 재 방문." Arxiv preprint arxiv : 2204.00824 (2022).
- Peng, Zhen, et al. "Speed-ANN : 쿼리 내 병렬 처리를 통한 저명성과 고당도 가장 가까운 이웃 검색." Arxiv preprint arxiv : 2201.13007 (2022).
- Lu, Kejing, et al. "HVS : 가장 가까운 이웃 검색을 해결하기위한 Voronoi 다이어그램을 기반으로 한 계층 적 그래프 구조." VLDB 기부금의 절차 15.2 (2021) : 246-258. [암호]
- Yingfan, Liu, Cheng Hong 및 Cui Jiangtao. "고차원 데이터에 대한 $ k $ -Nearest 이웃 그래프 구성 : 실험 및 분석." Arxiv preprint arxiv : 2112.02234 (2021).
- Zhu, Dantong 및 Minjia Zhang. "가장 가까운 이웃 검색을위한 단조로운 근접 그래프를 이해하고 일반화합니다." Arxiv preprint arxiv : 2107.13052 (2021).
- Gottesbüren, Lars 등. "대규모 가장 가까운 이웃 검색을위한 그래프 파티셔닝을 해제합니다." Arxiv preprint arxiv : 2403.01797 (2024).
- Singh, Aditi 등 "FreshDiskann : 유사성 검색을위한 빠르고 정확한 그래프 기반 Ann Index." Arxiv preprint arxiv : 2105.09613 (2021).
- Wang, Hui, Wan-Lei Zhao 및 Xiangxiang Zeng. "GPU의 대략적인 대략적인 K-NN 그래프 구성." Arxiv preprint arxiv : 2103.15386 (2021).
- Patel, Liana 등 "ACORN : 벡터 임베딩 및 구조화 된 데이터에 대한 수행자 및 술어 공유 검색." Arxiv preprint arxiv : 2403.04871 (2024).
- Zuo, Chaoji 등 "SERF : 가장 가까운 이웃 검색 범위를 파악하기위한 세그먼트 그래프." 데이터 관리에 대한 ACM의 절차 2.1 (2024) : 1-26.
- Hezel, Nico, et al. "효율적인 멀티미디어 검색을위한 지속적인 정제가있는 탐사 그래프." 멀티미디어 검색에 관한 2024 국제 회의의 절차. 2024.
- Xiao, Wentao 등 "실시간 업데이트를위한 HNSW 인덱스 향상 : 도달 할 수없는 포인트 및 성능 저하 해결." Arxiv preprint arxiv : 2407.07871 (2024).
- Yang, Shuo, et al. "근접 그래프 기반 근접 이웃 검색의 인덱스 구성을 다시 방문합니다." Arxiv preprint arxiv : 2410.01231 (2024).
- Gou, Yutong 등 "SymphonyQG : 가장 가까운 이웃 검색을위한 양자화 및 그래프의 대칭 통합을 향해." Arxiv preprint arxiv : 2411.12229 (2024).
- Yang, Ming, Yuzheng Cai 및 Weiguo Zheng. "CSPG : 가장 가까운 이웃 검색을위한 Sparse 근접 그래프를 건너는 교차." 신경 정보 처리 시스템에 관한 제 38 차 연례 회의.
? 트리 기반 방법
- Jayaram Subramanya, Suhas 등. "Diskann : 단일 노드에서 빠른 정확한 10 억 포인트 가장 가까운 이웃 검색." 신경 정보 처리 시스템의 발전 32 (2019). [암호]
- Li, Haitao 등 "효율적이고 효과적인 조밀 한 검색을위한 트리 기반 지수 구성." Arxiv preprint arxiv : 2304.11943 (2023).
- Engels, Joshua 등 "창 필터로 가장 가까운 이웃 검색을 근사화합니다." Arxiv preprint arxiv : 2402.00943 (2024).
- Song, Yang 등 "Promips : 가벼운 지수를 사용하여 효율적인 고차원 C- 근사상 최대 내부 제품 검색." 2021 IEEE 37 번째 국제 데이터 엔지니어링 회의 (ICDE). IEEE, 2021.
- Zhu, Yifan 등 "GTS : 빠른 유사성 검색을위한 GPU 기반 트리 인덱스." Arxiv preprint arxiv : 2404.00966 (2024).
- Tatsuno, Kento 등 "AISAQ : DRAM-free 정보 검색을위한 제품 양자화가있는 올인원 Anns." Arxiv preprint arxiv : 2404.06004 (2024).
해싱
- 해시를 배우는 것에 대한 멋진 논문
- 해시에 대한 학습에 관한 설문 조사. Wang, Jingdong, Ting Zhang, Nicu Sebe 및 Heng Tao Shen [종이]
- 깊은 해싱 방법에 대한 설문 조사. Luo, Xiao, Haixin Wang, Daqing Wu, Chong Chen, Minghua Deng, Jianqiang Huang 및 Xian-Sheng Hua. [종이]
- 반복 양자화 : 대규모 이미지 검색에 대한 이진 코드 학습에 대한 Procrustean 접근법. Gong, Yunchao, Svetlana Lazebnik, Albert Gordo 및 Florent Perronnin [종이, Python Code, Matlab Code]
- 간, 유행 등 "Tencent에서의 이진 임베딩 기반 검색." Arxiv preprint arxiv : 2302.08714 (2023).
- Yan, Bencheng 등 "웹 스케일 응용 프로그램을위한 이진 코드 기반 해시 임베딩." 정보 및 지식 관리에 관한 30 번째 ACM 국제 회의 절차. 2021.
- Weng, Zhenyu 및 Yuesheng Zhu. "멀티 비트 양자화로 감독되지 않은 온라인 해싱." 컴퓨터 비전에 관한 아시아 회의의 절차. 2022.
- Huang, Qiang, Yifan Lei 및 Anthony Kh Tung. "포인트-하이퍼 플레인은 가장 가까운 이웃 검색 장치를 넘어서." 데이터 관리에 관한 2021 국제 회의의 절차. 2021.
- Weng, Zhenyu, Yuesheng Zhu 및 Ruixin Liu. "가중 해밍 거리에 의해 이진 코드에서 빠른 검색." Arxiv preprint arxiv : 2009.08591 (2020).
- Jian, Xiaozheng 등 "GPU에서 XOR 친화적 인 이진 양자화를 통한 빠른 Top-K Cosine 유사성 검색." Arxiv preprint arxiv : 2008.02002 (2020).
- Zheng, Bolong 등 "PM-LSH : 고차원 대략적인 NN 검색을위한 빠르고 정확한 LSH 프레임 워크." VLDB 엔 다우먼트의 절차 13.5 (2020) : 643-655.
- Eghbali, Sepehr. "소형 코드가있는 확장 가능한 가장 가까운 이웃 검색." (2019).
- Lei, Yifan 등 "가장 긴 원형 공동 서핑을 기반으로 한 지역에 민감한 해싱 체계." 데이터 관리에 관한 2020 ACM SIGMOD 국제 회의의 절차. 2020.
- Wei, Jiuqi 등 "DET-LSH : 가장 가까운 이웃 검색을위한 동적 인코딩 트리를 갖춘 지역에 민감한 해싱 체계." Arxiv preprint arxiv : 2406.10938 (2024).
다른 접근법
- Chen, Qi, et al. "스팬 : 매우 효율적인 10 억 규모의 대략적인 이웃 검색." Arxiv preprint arxiv : 2111.08566 (2021). [암호]
- Li, Yuliang 등 "인덱스 기반, 고차원, 코사인 임계 값 쿼리가 최적 보증을 제공합니다." 컴퓨팅 시스템 이론 65 (2021) : 42-83.
- Chen, Yewang 등 "반용당 헐 트리 : GPU의 대규모 데이터에 대한 빠른 가장 가까운 이웃 쿼리." 2018 IEEE 국제 데이터 마이닝 회의 (ICDM). IEEE, 2018.
- Engels, Joshua, Benjamin Coleman 및 Anshumali Shrivastava. "그룹 테스트를 통한 이웃 검색 근처." 신경 정보 처리 시스템의 발전 34 (2021) : 9950-9962. [보충]
- Gong, Long 등 "IDEC : 가장 가까운 이웃 검색에 대한 인덱스 가능한 거리 추정 코드." VLDB 엔 다우먼트 13.9 (2020)의 절차.
- Lu, Kejing, et al. "VHP : Virtual Hypersphere 파티셔닝을 통해 가장 가까운 이웃 검색." VLDB 엔 다우먼트의 절차 13.9 (2020) : 1443-1455.
- Bing Tian ,, Haikun Liu, Yuhang Tang, Shihai Xiao, Zhuohui Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang. "FusionAnns : 10 억 규모의 가장 가까운 이웃 검색을위한 효율적인 CPU/GPU 협력 처리 아키텍처." (2024).
- Chen, Zhonghan, et al. "고차원 공간에서 가장 가까운 이웃 검색의 의미를 탐구합니다." Arxiv preprint arxiv : 2410.05752 (2024).
- Tepper, Mariano 등 "GLEANVEC : 미니멀리스트 비선형 차원 감소로 벡터 검색 가속." Arxiv preprint arxiv : 2410.22347 (2024).
- Li, Jingyu 등 "Panther : 단일 서버 설정에서 가장 가까운 이웃 검색 비공개." 암호화 eprint 아카이브 (2024).
- Wei, Jiuqi 등 "Subspace Collision : 가장 가까운 근사 이웃 검색을위한 효율적이고 정확한 프레임 워크." Arxiv preprint arxiv : 2411.14754 (2024).
시스템
- 진, an 등. "Maze : 웹 스케일의 비용 효율적인 비디오 중복 제거 시스템." 멀티미디어에 관한 30 번째 ACM 국제 회의 절차. 2022.
- Doshi, Ishita 등. "Lanns : 웹 스케일 대략 가장 가까운 이웃 조회 시스템." Arxiv preprint arxiv : 2010.09426 (2020).
- Chen, Yaoqi 등 "OnesParse : 다중 인덱스 벡터 검색을위한 통합 시스템." 웹 컨퍼런스 2024. 2024에서 ACM의 동반 절차.
기타
- 쿼리 가능성 향상 및 에지 장치에 대한 2 단계 근사 검색으로 검색 최적화
- Gao, Jianyang 및 Cheng Long. "고차원 대략적인 가장 가까운 이웃 검색 : 신뢰할 수 있고 효율적인 거리 비교 작업." 데이터 관리에 대한 ACM의 절차 1.2 (2023) : 1-27.
- 추천 시스템에서 가장 가까운 이웃 검색. Yury Malkov.
- Rapids 래프트로 GPU에서 벡터 검색 가속. 코리 놀렛
- Gupta, Gaurav 등. "CAPS : 필터링 유사성 검색을위한 실용적인 파티션 인덱스." Arxiv preprint arxiv : 2308.15014 (2023).
- Zhu, Yuhao. "RTNN : 하드웨어 레이 추적을 사용하여 이웃 검색 가속화." 27 번째 ACM Sigplan Symposium의 원리 및 병렬 프로그래밍 실습 절차. 2022. [코드]
- Levi, Asaf 등 "{idea}를 사용한 물리적 대 논리 인덱싱 : 반전 {wentreplication-Aware} 색인." 파일 및 스토리지 기술에 관한 22 번째 USENIX 회의 (빠른 24). 2024. [코드]
- Carra, Damiano 및 Giovanni Andlia. "K-NN 캐시로 두 마리의 새를 복용합니다." 2021 IEEE Global Communications Conference (Globecom). IEEE, 2021.
- Salem, Tareq SI, Giovanni Andlia 및 Damiano Carra. "대략적인 인덱스를 가진 상승 유사성 캐싱." 네트워킹에 대한 IEEE/ACM 트랜잭션 (2022).
- Li, Conglong 등 "학습 된 적응 형 조기 종료를 통해 가장 가까운 이웃 검색 개선." 데이터 관리에 관한 2020 ACM SIGMOD 국제 회의의 절차. 2020.
- Karppa, Matti, Martin Aumüller 및 Rasmus Pagh. "DeAnn : 가장 가까운 이웃 검색을 사용하여 커널 밀도 추정 속도를 높입니다." 인공 지능 및 통계에 관한 국제 회의. PMLR, 2022.
- Wang, Zeyu, et al. "가장 가까운 이웃 검색을위한 거리 비교 연산자 : 탐색 및 벤치 마크." Arxiv preprint arxiv : 2403.13491 (2024).
- Szilvasy, Gergely, Pierre-Emmanuel Mazaré 및 Matthijs Douze. "반경이 작은 벡터 검색." Arxiv preprint arxiv : 2403.10746 (2024).
- 한, 챈그, 수지 김, 하 마조 파크. "다단계 블록 인덱싱을 사용하여 시간 획득 고차원 데이터의 효율적인 근접 검색." (2024).
- Tepper, Mariano 등 "Leanveec : 벡터를 더 빨리 검색하여 더 빨리 검색하십시오." Arxiv preprint arxiv : 2312.16335 (2023).
- Harwood, Ben, et al. "동적 데이터 세트에서 가장 가까운 이웃 검색 : 조사." Arxiv preprint arxiv : 2404.19284 (2024).
- 10 억 규모의 벡터 검색에서 성능 및 인덱스 크기의 딜레마 특성화 및 2 단계 메모리로 파괴
- xu, 하이키. 인기있는 대략적인 가장 가까운 이웃 검색 구현의 최악의 성능 : 보증 및 제한. diss. 매사추세츠 공과 대학, 2024 년.
- 린, 지미. "조밀하고 희소 한 리트리버에 대한 운영 조언 : HNSW, 플랫 또는 반전 인덱스?" Arxiv preprint arxiv : 2409.06464 (2024).
- Zhou, Mingxun, Elaine Shi 및 Giulia Fanti. "Pacmann : 효율적인 개인 대략적인 가장 가까운 이웃 검색." 암호화 eprint 아카이브 (2024).
? 평가 및 메트릭
- 어떤 BM25를 의미합니까? 점수 변형에 대한 대규모 재현성 연구. Kamphuis, Chris, Arjen P. de Vries, Leonid Boytsov 및 Jimmy Lin [종이]
? 기사 및 대화
- 벡터 데이터베이스 란 무엇입니까?
- 벡터 데이터베이스 (1 부) : 각각이 다른 이유는 무엇입니까?
- eBay의 끔찍한 수십억 스케일 벡터 유사성 엔진
- 컴퓨터 비전 모임 : 벡터 데이터베이스가있는 규모의 컴퓨터 비전 응용 프로그램
- 2023 년에 벡터 데이터베이스를 선택하는 방법은 무엇입니까?
- 우리는 정말 특수 벡터 데이터베이스가 필요합니까?
- 벡터 데이터베이스는 별도의 데이터베이스 범주가 아닙니다
- 벡터 데이터베이스 : 첫 번째 원리 접근법
- 벡터 검색 래그 튜토리얼 - 데이터를 LLM과 고급 검색과 결합합니다.
- Nvidia Merlin과 함께 Milvus를 사용하여 추천 워크 플로에서 효율적인 벡터 유사성 검색
- 벡터 데이터베이스 : 초보자 가이드!
- 벡터 데이터베이스 및 스프링 IA
- 래그 응용 분야에서 백만 벡터 임베딩을 처리하는 방법
- Meilisearch가 1 분 안에 수백만 벡터 임베딩 데이터베이스를 업데이트하는 방법
- 벡터 데이터베이스를 사용할 때 피할 수있는 일반적인 함정
- 벡터 데이터베이스를 시작합니다
- 시맨틱 검색을위한 최고의 모델 선택
관련 목록