- ฐานข้อมูลเวกเตอร์ที่ยอดเยี่ยม
รายการงานที่ยอดเยี่ยมที่เกี่ยวข้องกับโครงสร้างมิติสูง/การค้นหาและฐานข้อมูลเวกเตอร์
บริการ
- Google Search (Vertex AI)
- Pinecone
- ทอผ้า [คู่มือผู้เริ่มต้น]
- เวสป้า
- txtai
- Marqo
- เวสต้ารา
- Epsilla
- อัลโกเลีย
- Meilisearch
- นิวเคลียส
- เปิดการวิจัย
- MyScale
- qdrantcloud
- ซิลลิซ
- Alibabacloud ของ OpenSearch
- คลาวด์ของ Typesense
- การค้นหาเวกเตอร์ MongoDB Atlas
- superduperdb
- kbd.ai
การเปรียบเทียบ
- จาก Vespa
- การเปรียบเทียบ dB เวกเตอร์โดย vectorhub
- มาตรฐานฐานข้อมูลเวกเตอร์ MyScale
ห้องสมุดและเครื่องยนต์
ข้อมูล / เวกเตอร์หลายมิติ
- - เมทริกซ์ฟีเจอร์ฟีเจอร์เวกเตอร์
- กระดาษ faiss
- พิมพ์ดีด
- qdrant
- รบกวน
- NGT
- pgvector
- โครมา
- llamainedex
- Epsilla
- jVector
- แพ
- วัลด์
- นักเดินทาง
- TinyVector
- USEARCH
- การค้นหา
- Mrpt
- Milvus
- อินฟินิตี้
- สวรรค์
- โครเมมโก
- OASYSDB [โน๊ตบุ๊ค]
- Meilisearch - เครื่องมือค้นหา API สำหรับความหมาย (เวกเตอร์), การค้นหาแบบเต็มข้อความและไฮบริด
- Arroy - ห้องสมุดสนิมเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ
- เบลฟ
- cuvs
- VSAG
- sqlite-vec
- MyScaledB
- ชาวฮอร่า
- อาร์รอย
- Kgraph
- ใกล้ที่สุด
- MUOPDB
ตำรา
- ปิซา
- น่ารัก
- เกี่ยวกับเสียง
คนอื่น
- simsimd: ทางเลือกที่มีประสิทธิภาพสำหรับ
scipy.spatial.distance และ numpy.inner
มาตรฐานและฐานข้อมูล
เกณฑ์มาตรฐานของ Ann [กระดาษ]
เกณฑ์มาตรฐาน ANN พันล้าน
- 2021 ผลลัพธ์
- Simhadri, Harsha Vardhan, et al. "ผลลัพธ์ของ Big Ann: Neurips'23 การแข่งขัน" arxiv preprint arxiv: 2409.17424 (2024)
คนโผงผาง
Vectordbbench - เครื่องมือวัดฐานข้อมูลเวกเตอร์ [GitHub]
เกณฑ์มาตรฐานฐานข้อมูลเวกเตอร์ของ Qdrant
มาตรฐานฐานข้อมูลเวกเตอร์ของ MyScale
Li, Wen, et al. "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดในข้อมูลมิติที่สูง - ผ่านการวิเคราะห์และการปรับปรุง" การทำธุรกรรม IEEE เกี่ยวกับความรู้และวิศวกรรมข้อมูล 32.8 (2019): 1475-1488
Zeng, Xianzhi, et al. "Candy: เกณฑ์มาตรฐานสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดอย่างต่อเนื่องด้วยการบริโภคข้อมูลแบบไดนามิก" arxiv preprint arxiv: 2406.19651 (2024)
ชุดข้อมูลการค้นหาเวกเตอร์ของ Intellabs
หนังสือ
- รากฐานของโครงสร้างข้อมูลหลายมิติและตัวชี้วัด
- ข้อมูลเบื้องต้นเกี่ยวกับการดึงข้อมูล
- การเรียนรู้อย่างลึกซึ้งสำหรับการค้นหา
- รากฐานของการดึงเวกเตอร์
การประชุมและการประชุมเชิงปฏิบัติการ
- VLDB
- การสอน:
- แนวโน้มใหม่ในการค้นหาความคล้ายคลึงกันของเวกเตอร์สูง [สไลด์, วิดีโอ, กระดาษ]
- การดึงภาพใน Wild (CVPR20) [วิดีโอ]
- กองหญ้า
- การค้นหาประสาทในการดำเนินการ
- ACM MM 2020: มีประสิทธิภาพและมีประสิทธิภาพ: ไปสู่การระบุตัวตนของอินสแตนซ์แบบเปิดใหม่
- การค้นหาเพื่อนบ้านที่ใกล้ที่สุดนับพันล้านครั้ง: [สไลด์, วิดีโอ]
- การค้นหาอินสแตนซ์เป็นปัญหาที่แก้ไขหรือไม่? [สไลด์วิดีโอ]
- การดึงรุ่นเพิ่มและ Vespa [สไลด์]
- ความท้าทายการจัดทำดัชนี SISAP
- 2023 การแข่งขัน
- การแข่งขัน 2024
หลักสูตร
- หน่วยความจำระยะยาวใน AI - การค้นหาเวกเตอร์และฐานข้อมูล (COS 495 - Princeton) [หมายเหตุคลาส]
- การดึงข้อมูล Freiburg WS 2022-2023 [เว็บไซต์, การบรรยายวิดีโอ]
- การค้นหาความคล้ายคลึงกันของเวกเตอร์และหลักสูตร FAISS [YouTube Playlist]
คนอื่น
- VectorHub: เว็บไซต์การเรียนรู้โอเพนซอร์ซฟรีสำหรับผู้คน (นักพัฒนาซอฟต์แวร์ให้กับสถาปนิก ML อาวุโส) สนใจที่จะเพิ่มการดึงเวกเตอร์ให้กับสแต็ก ML ของพวกเขา
สิ่งพิมพ์
สำรวจ
- Pan, James Jie, Jianguo Wang และ Guoliang Li "การสำรวจระบบการจัดการฐานข้อมูลเวกเตอร์" arxiv preprint arxiv: 2310.14021 (2023) [กระดาษ]
- Aumüller, Martin และ Matteo Ceccarello "แนวทางและแนวโน้มล่าสุดในการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" {IEEE} Bulletin วิศวกรรมข้อมูล (2023)
- การค้นหาเพื่อนบ้านที่ใกล้ที่สุด: เก่าใหม่และเป็นไปไม่ได้ Andoni, Alexandr [กระดาษ]
- Ganbarov, Ali, et al. "การเปรียบเทียบการทดลองของอัลกอริทึมการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณบนกราฟบนอุปกรณ์ขอบ" arxiv preprint arxiv: 2411.14006 (2024)
การวัดปริมาณ
ที่มา: การสำรวจปริมาณผลิตภัณฑ์
- PQ: การหาปริมาณผลิตภัณฑ์สำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุด Jegou, Herve, Matthijs Douze และ Cordelia Schmid [กระดาษ, รหัส, Julia Code, Nanopq]
- K-selection ใน GPU: การค้นหาความคล้ายคลึงกันหลายพันล้านด้วย GPU Johnson, Jeff, Matthijs Douze และHervéJégou [Paper, Code]
- การสำรวจปริมาณผลิตภัณฑ์ Matsui, Yusuke, Yusuke Uchida, HervéJégouและ Shin'ichi Satoh [กระดาษ]
- OPQ: การหาปริมาณผลิตภัณฑ์ที่ดีที่สุด GE, Tiezheng, Kaiming He, Qifa Ke และ Jian Sun [หน้าแรก, กระดาษ, รหัส, Nanopq]
- ADC เร็วขึ้น: ปลดล็อกศักยภาพที่ซ่อนอยู่ของการหาปริมาณผลิตภัณฑ์ด้วย SIMD André, Fabien, Anne-Marie Kermarrec และ Nicolas Le Scouarnec [Paper, Code]
- เร่งการค้นหาเพื่อนบ้านที่ใกล้ที่สุดด้วย ADC อย่างรวดเร็ว André, Fabien, Anne-Marie Kermarrec และ Nicolas Le Scouarnec [Paper]
- Cache Locality ไม่เพียงพอ: การค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดที่มีประสิทธิภาพสูงด้วยการสแกนอย่างรวดเร็วของผลิตภัณฑ์ Fabien André, Anne-Marie Kermarrec, Nicolas Le Scouarnec [Paper]
- Scann: เร่งการอนุมานขนาดใหญ่ด้วยการวัดปริมาณเวกเตอร์ anisotropic Guo, Ruiqi, Philip Sun, Erik Lindgren, Quan Geng, David Simcha, Felix Chern และ Sanjiv Kumar [Paper, Python/C ++ Inference, Julia Training/Inference]
- หลายดัชนีคว่ำ Babenko, Artem และ Victor Lempitsky [Paper, Code]
- เราอยู่ที่นั่นหรือยัง? ปริมาณผลิตภัณฑ์และการเร่งความเร็วของฮาร์ดแวร์ Fernandez-Marques, Javier, Ahmed F. Abouelhamayed, Nicholas D. Lane และ Mohamed S. Abdelfattah [กระดาษ]
- LIBVQ: ชุดเครื่องมือสำหรับการปรับปริมาณเวกเตอร์ให้เหมาะสมและการดึงประสาทที่มีประสิทธิภาพ Li, Chaofan, Zheng Liu, Shitao Xiao, Yingxia Shao, Defu Lian และ Zhao Cao [กระดาษ, รหัส]
- Matsui, Yusuke, Ryota Hinami และ Shin'ichi Satoh "ดัชนีกลับหัวใหม่ที่กำหนดค่าใหม่ได้" การดำเนินการประชุมนานาชาติ ACM ครั้งที่ 26 เรื่องมัลติมีเดีย 2018. [กระดาษ, โครงการ, รหัส]
- Aguerrebere, Cecilia, et al. "การค้นหาความคล้ายคลึงกันในพริบตาด้วยดัชนีบีบอัด" arxiv preprint arxiv: 2304.04759 (2023)
- Huijben, Iris, et al. "ปริมาณที่เหลือด้วยหนังสือพิมพ์ประสาทโดยนัย" arxiv preprint arxiv: 2401.14732 (2024) [รหัส]
- Rege, Aniket, et al. "Adanns: กรอบสำหรับการค้นหาความหมายแบบปรับตัว" ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 36 (2024)
- Amara, Kenza, et al. "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดด้วยรหัสขนาดกะทัดรัด: มุมมองตัวถอดรหัส" การดำเนินการประชุมนานาชาติปีพ. ศ. 2565 เรื่องการดึงมัลติมีเดีย 2022.
- Krishnan, Aditya และ Edo Liberty "การจัดกลุ่มผลิตภัณฑ์การจัดกลุ่ม projective" arxiv preprint arxiv: 2112.02179 (2021)
- Noh, Haechan, Taeho Kim และ Jae-Pil Heo "ดัชนีเชิงปริมาณการรับรู้ดัชนีกลับด้านสำหรับการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดที่ปรับขนาดได้" การดำเนินการของการประชุมนานาชาติ IEEE/CVF เกี่ยวกับวิสัยทัศน์คอมพิวเตอร์ 2021.
- Zhan, Jingtao, et al. "การเพิ่มประสิทธิภาพของตัวเข้ารหัสแบบสอบถามและการหาปริมาณผลิตภัณฑ์เพื่อปรับปรุงประสิทธิภาพการดึง" การดำเนินการประชุมนานาชาติ ACM ครั้งที่ 30 เกี่ยวกับการจัดการข้อมูลและความรู้ 2021.
- Wang, Runhui และ Dong Deng "Deltapq: การบีบอัดรหัสปริมาณผลิตภัณฑ์ที่ไม่สูญเสียสำหรับการค้นหาความคล้ายคลึงกันในมิติสูง" การดำเนินการของการบริจาค VLDB 13.13 (2020): 3603-3616
- จาง, Young Kyun และ Nam Ik Cho "เครือข่ายปริมาณผลิตภัณฑ์ทั่วไปสำหรับการดึงภาพกึ่งผู้ดูแล" การดำเนินการของการประชุม IEEE/CVF เกี่ยวกับการมองเห็นคอมพิวเตอร์และการจดจำรูปแบบ 2020.
- เฉิน, Ting, Lala Li และ Yizhou Sun "การหาปริมาณผลิตภัณฑ์ที่แตกต่างกันสำหรับการบีบอัดการฝังแบบ end-to-end" การประชุมนานาชาติเกี่ยวกับการเรียนรู้ของเครื่องจักร PMLR, 2020
- Huang, Rong, et al. "การเรียนรู้การแสดงเอกสารที่ไม่ต่อเนื่องในการค้นหาเว็บ" การดำเนินการของการประชุม ACM SIGKDD ครั้งที่ 29 เกี่ยวกับการค้นพบความรู้และการขุดข้อมูล 2023.
- Nardini, Franco Maria, Cosimo Rulli และ Rossano Venturini "การดึงข้อมูลหนาแน่นหลายเวกเตอร์ที่มีประสิทธิภาพพร้อมเวกเตอร์บิต" การประชุมยุโรปเกี่ยวกับการดึงข้อมูล Cham: Springer Nature Switzerland, 2024. [รหัส]
- Gao, Jianyang และ Cheng Long "RabitQ: การหาปริมาณเวกเตอร์มิติสูงที่มีข้อผิดพลาดทางทฤษฎีที่ถูกผูกไว้สำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2405.12497 (2024) [(รหัส) [https://github.com/gaoj0017/rabitq]]]
- Gao, Jianyang, et al. "ปริมาณที่เหมาะสมและเชิงเส้นที่ดีที่สุดของเวกเตอร์มิติสูงในพื้นที่ยุคลิดสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2409.09913 (2024)
- Mohoney, Jason, et al. "การบำรุงรักษาดัชนี IVF ที่เพิ่มขึ้นสำหรับการค้นหาเวกเตอร์สตรีมมิ่ง" arxiv preprint arxiv: 2411.00970 (2024)
- Yang, Mingyu, Wentao Li และ Wei Wang "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดในมิติสูงโดยประมาณด้วยเวลาและพื้นที่ที่มีประสิทธิภาพ" arxiv preprint arxiv: 2411.06158 (2024)
วิธีการบนกราฟ
- Wang, Zeyu, et al. "ดัชนีกราฟและต้นไม้สำหรับการค้นหาความคล้ายคลึงกันของเวกเตอร์มิติสูง: การวิเคราะห์การเปรียบเทียบและทิศทางในอนาคต" วิศวกรรมข้อมูล (2023): 3-21
- การสำรวจที่ครอบคลุมและการเปรียบเทียบการทดลองของการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณกราฟ Wang, Mengzhao, Xiaoliang Xu, Qiang Yue และ Yuxiang Wang [กระดาษ, รหัส]
- Lin, Peng-Cheng และ Wan-Lei Zhao "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดตามกราฟ: สัญญาและความล้มเหลว" arxiv preprint arxiv: 1904.02077 (2019)
- HNSW: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดที่มีประสิทธิภาพและมีประสิทธิภาพโดยประมาณโดยใช้กราฟโลกขนาดเล็กที่นำทางได้ตามลำดับชั้น Malkov, Yu A. และ Dmitry A. Yashunin [กระดาษ, รหัส, เวอร์ชันสนิม, เวอร์ชัน Go]
- การปรับสเกลอัลกอริทึม ANNS ที่ใช้กราฟเป็นชุดข้อมูลพันล้านขนาด: การวิเคราะห์เปรียบเทียบ Dobson, Magdalen, Zheqi Shen, Guy E. Blelloch, Laxman Dhulipala, Yan Gu, Harsha Vardhan Simhadri และ Yihan Sun [กระดาษ]
- นิ้ว: การอนุมานอย่างรวดเร็วสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณกราฟ เฉิน, Patrick, Wei-Cheng Chang, Jyun-yu Jiang, Hsiang-Fu Yu, Inderjit Dhillon และ Cho-Jui Hsieh [Paper, Video]
- NSG: การนำทางกราฟการกระจายออกไปสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ Fu, Cong, Chao Xiang, Changxu Wang และ Deng Cai [กระดาษ, รหัส]
- Efanna: อัลกอริทึมการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณที่รวดเร็วมากโดยใช้กราฟ KNN Cong Fu, Deng Cai [กระดาษ, รหัส]
- Khan, Saim, et al. "Bang: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดพันล้านโดยใช้ GPU เดียว" arxiv preprint arxiv: 2401.11324 (2024)
- Ootomo, Hiroyuki, et al. "CAGRA: การสร้างกราฟแบบขนานอย่างสูงและการค้นหา GPU เพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2308.15136 (2023)
- Oguri, Yutaro และ Yusuke Matsui "การวิเคราะห์เชิงทฤษฎีและเชิงประจักษ์ของการเลือกจุดเริ่มต้นแบบปรับตัวสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2402.04713 (2024)
- Oguri, Yutaro และ Yusuke Matsui "วิธีการปรับแต่งทั่วไปและใช้งานได้จริงสำหรับดัชนีกราฟที่ใช้นอกชั้นวาง: รายงานความท้าทายการทำดัชนี SISAP โดย Team Utokyo" การประชุมระหว่างประเทศเกี่ยวกับการค้นหาและแอปพลิเคชันที่คล้ายคลึงกัน Cham: Springer Nature Switzerland, 2023
- Wang, Mengzhao, et al. "Starling: กรอบดัชนีกราฟที่มีถิ่นที่อยู่ในดิสก์ I/O สำหรับการค้นหาความคล้ายคลึงกันของเวกเตอร์ในมิติสูงในเซ็กเมนต์ข้อมูล" arxiv preprint arxiv: 2401.02116 (2024) [รหัส]
- Manohar, Magdalen Dobson, et al. "Parlayann: อัลกอริธึมการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดที่ปรับขนาดได้และกำหนดได้" การประชุมวิชาการประจำปีของ ACM Sigplan ครั้งที่ 29 เกี่ยวกับหลักการและการปฏิบัติของการเขียนโปรแกรมแบบขนาน 2024. [รหัส]
- Wang, Mengzhao, et al. "เฟรมเวิร์กที่มีประสิทธิภาพและมีประสิทธิภาพสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณด้วยข้อ จำกัด ของแอตทริบิวต์" ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 36 (2024)
- Yu, Shangdi, et al. "Pecann: การจัดกลุ่มที่มีประสิทธิภาพแบบขนานกับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณกราฟ" arxiv preprint arxiv: 2312.03940 (2023)
- Azizi, Ilias, Karima Echihabi และ Themis Palpanas "Elpis: การค้นหาความคล้ายคลึงกันตามกราฟสำหรับวิทยาศาสตร์ข้อมูลที่ปรับขนาดได้" การดำเนินการของ VLDB Endowment 16.6 (2023): 1548-1559
- Indyk, Piotr และ Haike Xu "ประสิทธิภาพกรณีที่เลวร้ายที่สุดของการใช้งานการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ: การรับประกันและข้อ จำกัด " ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 36 (2024)
- Liu, Jun, et al. "การเพิ่มประสิทธิภาพการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดโดยประมาณกราฟ: แข็งแกร่งและฉลาดขึ้น" 2022 23 การประชุมนานาชาติ IEEE เกี่ยวกับการจัดการข้อมูลมือถือ (MDM) IEEE, 2022
- Wang, Hui, Yong Wang และ Wan-Lei Zhao "การค้นหา NN โดยประมาณกราฟ: A RevisIt" arxiv preprint arxiv: 2204.00824 (2022)
- Peng, Zhen, et al. "Speed-ANN: การค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดและมีความแม่นยำสูงผ่านการค้นหาแบบคู่ขนานภายใน" arxiv preprint arxiv: 2201.13007 (2022)
- Lu, Kejing, et al. "HVS: โครงสร้างกราฟลำดับชั้นตามไดอะแกรม Voronoi สำหรับการแก้ปัญหาการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" การดำเนินการของ VLDB Endowment 15.2 (2021): 246-258 [รหัส]
- Yingfan, Liu, Cheng Hong และ Cui Jiangtao "การกลับมาใหม่ $ k $-การสร้างกราฟเพื่อนบ้านที่ดีที่สุดในข้อมูลมิติสูง: การทดลองและการวิเคราะห์" arxiv preprint arxiv: 2112.02234 (2021)
- Zhu, Dantong และ Minjia Zhang "การทำความเข้าใจและการสรุปกราฟความใกล้ชิดแบบโมโนโทนิกสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2107.13052 (2021)
- Gottesbüren, Lars, et al. "การปลดปล่อยกราฟการแบ่งพาร์ติชันสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดขนาดใหญ่" arxiv preprint arxiv: 2403.01797 (2024)
- ซิงห์, Aditi, et al. "FreshDiskann: ดัชนี ANN ที่ใช้กราฟที่รวดเร็วและแม่นยำสำหรับการสตรีมการค้นหาความคล้ายคลึงกัน" arxiv preprint arxiv: 2105.09613 (2021)
- Wang, Hui, Wan-Lei Zhao และ Xiangxiang Zeng "การก่อสร้างกราฟ K-NN โดยประมาณขนาดใหญ่บน GPU" arxiv preprint arxiv: 2103.15386 (2021)
- Patel, Liana, et al. "ACORN: การค้นหา performant และ predicate-Agnostic ผ่านการฝังเวกเตอร์และข้อมูลที่มีโครงสร้าง" arxiv preprint arxiv: 2403.04871 (2024)
- Zuo, Chaoji, et al. "SERF: กราฟเซ็กเมนต์สำหรับการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดโดยประมาณ" การดำเนินการของ ACM เกี่ยวกับการจัดการข้อมูล 2.1 (2024): 1-26
- Hezel, Nico, et al. "กราฟการสำรวจที่มีการปรับแต่งอย่างต่อเนื่องสำหรับการดึงมัลติมีเดียที่มีประสิทธิภาพ" การประชุมวิชาการนานาชาติปีพ. ศ. 2567 เรื่องการดึงมัลติมีเดีย 2024.
- Xiao, Wentao, et al. "การเพิ่มดัชนี HNSW สำหรับการอัปเดตแบบเรียลไทม์: การจัดการกับจุดที่ไม่สามารถเข้าถึงได้และการลดลงของประสิทธิภาพ" arxiv preprint arxiv: 2407.07871 (2024)
- Yang, Shuo, et al. "การทบทวนการสร้างดัชนีการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดโดยประมาณกราฟที่ใกล้เคียงที่สุด" arxiv preprint arxiv: 2410.01231 (2024)
- Gou, Yutong, et al. "SymphonyQG: ไปสู่การรวมกลุ่มของปริมาณและกราฟสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2411.12229 (2024)
- Yang, Ming, Yuzheng Cai และ Weiguo Zheng "CSPG: กราฟความใกล้ชิดที่กระจัดกระจายสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" การประชุมประจำปีสามสิบแปดเรื่องเกี่ยวกับระบบการประมวลผลข้อมูลระบบประสาท
วิธีการตามต้นไม้
- Jayaram Subramanya, Suhas, et al. "Diskann: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดที่ใกล้ที่สุดพันล้านจุดที่แม่นยำในโหนดเดียว" ความก้าวหน้าในระบบการประมวลผลข้อมูลประสาท 32 (2019) [รหัส]
- Li, Haitao, et al. "การสร้างดัชนีตามต้นไม้เพื่อการดึงข้อมูลที่มีประสิทธิภาพและมีประสิทธิภาพ" arxiv preprint arxiv: 2304.11943 (2023)
- Engels, Joshua, et al. "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณด้วยตัวกรองหน้าต่าง" arxiv preprint arxiv: 2402.00943 (2024)
- เพลงหยางและคณะ "PROMIPS: การค้นหาผลิตภัณฑ์ภายในที่มีมิติสูงในมิติสูงที่มีประสิทธิภาพสูงด้วยดัชนีที่มีน้ำหนักเบา" 2021 การประชุมนานาชาติ IEEE 37th เกี่ยวกับวิศวกรรมข้อมูล (ICDE) IEEE, 2021
- Zhu, Yifan, et al. "GTS: ดัชนีต้นไม้ที่ใช้ GPU สำหรับการค้นหาความคล้ายคลึงกันอย่างรวดเร็ว" arxiv preprint arxiv: 2404.00966 (2024)
- Tatsuno, Kento, et al. "AISAQ: ANN แบบ All-in-Storage พร้อมการหาปริมาณผลิตภัณฑ์สำหรับการดึงข้อมูลที่ปราศจาก DRAM" arxiv preprint arxiv: 2404.06004 (2024)
การแฮม
- เอกสารที่ยอดเยี่ยมเกี่ยวกับการเรียนรู้แฮช
- การสำรวจการเรียนรู้ที่จะแฮช Wang, Jingdong, Ting Zhang, Nicu Sebe และ Heng Tao Shen [กระดาษ]
- การสำรวจวิธีการแฮชลึก Luo, Xiao, Haixin Wang, Daqing Wu, Chong Chen, Minghua Deng, Jianqiang Huang และ Xian-Sheng Hua [กระดาษ]
- Quantization ซ้ำ: วิธีการ Procrustean ในการเรียนรู้รหัสไบนารีสำหรับการดึงภาพขนาดใหญ่ กง, Yunchao, Svetlana Lazebnik, Albert Gordo และ Florent Perronnin [กระดาษ, รหัส Python, รหัส MATLAB]
- Gan, Yukang, et al. "การดึงแบบฝังฐานไบนารีที่ Tencent" arxiv preprint arxiv: 2302.08714 (2023)
- Yan, Bencheng, et al. "การฝังแฮชที่ใช้รหัสไบนารีสำหรับแอปพลิเคชันเว็บสเกล" การดำเนินการประชุมนานาชาติ ACM ครั้งที่ 30 เกี่ยวกับการจัดการข้อมูลและความรู้ 2021.
- Weng, Zhenyu และ Yuesheng Zhu "การแฮชออนไลน์ที่ไม่ได้รับการดูแลด้วยการหาปริมาณแบบหลายบิต" การดำเนินการประชุมเอเชียเกี่ยวกับวิสัยทัศน์คอมพิวเตอร์ 2022.
- Huang, Qiang, Yifan Lei และ Anthony Kh Tung "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดในการค้นหาที่อยู่ใกล้กับหน่วย Hypersphere" การดำเนินการประชุมนานาชาติปีพ. ศ. 2564 เรื่องการจัดการข้อมูล 2021.
- Weng, Zhenyu, Yuesheng Zhu และ Ruixin Liu "การค้นหาอย่างรวดเร็วเกี่ยวกับรหัสไบนารีโดยระยะทาง hamming ถ่วงน้ำหนัก" arxiv preprint arxiv: 2009.08591 (2020)
- Jian, Xiaozheng, et al. "การค้นหาความคล้ายคลึงกันของโคไซน์ Fast Top-K ผ่านการหาปริมาณไบนารีที่เป็นมิตรกับ XOR บน GPU" arxiv preprint arxiv: 2008.02002 (2020)
- Zheng, Bolong, et al. "PM-LSH: กรอบ LSH ที่รวดเร็วและแม่นยำสำหรับการค้นหา NN โดยประมาณมิติสูง" การดำเนินการของ VLDB Endowment 13.5 (2020): 643-655
- Eghbali, Sepehr "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดที่ปรับขนาดได้ด้วยรหัสขนาดกะทัดรัด" (2019)
- Lei, Yifan, et al. "รูปแบบการแฮชที่ไวต่อท้องถิ่นขึ้นอยู่กับการรวมกันของวงกลมที่ยาวที่สุด" การดำเนินการประชุมนานาชาติ ACM Sigmod ระหว่างปี 2020 เรื่องการจัดการข้อมูล 2020.
- Wei, Jiuqi, et al. "DET-LSH: รูปแบบการแฮชที่ไวต่อท้องถิ่นพร้อมต้นไม้เข้ารหัสแบบไดนามิกสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2406.10938 (2024)
วิธีการอื่น ๆ
- เฉิน, Qi, et al. "Spann: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดพันล้านมีประสิทธิภาพสูง" arxiv preprint arxiv: 2111.08566 (2021) [รหัส]
- Li, Yuliang, et al. "การสืบค้นเกณฑ์ระดับสูงของดัชนีระดับสูงและการสืบค้นด้วยการรับประกันการเพิ่มประสิทธิภาพ" ทฤษฎีระบบคอมพิวเตอร์ 65 (2021): 42-83
- เฉิน, Yewang, et al. "Semi-Convex Hull Tree: การสืบค้นเพื่อนบ้านที่ใกล้ที่สุดอย่างรวดเร็วสำหรับข้อมูลขนาดใหญ่เกี่ยวกับ GPU" 2018 IEEE International Conference เรื่อง Data Mining (ICDM) IEEE, 2018
- Engels, Joshua, Benjamin Coleman และ Anshumali Shrivastava "การค้นหาใกล้เคียงกับเพื่อนบ้านผ่านการทดสอบกลุ่ม" ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 34 (2021): 9950-9962 [เสริม]
- ฆ้องยาวและคณะ "IDEC: รหัสการประมาณระยะทางที่สามารถจัดทำดัชนีสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" การดำเนินการของ VLDB Endowment 13.9 (2020)
- Lu, Kejing, et al. "VHP: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณผ่านพาร์ติชันเสมือนจริง" การดำเนินการของ VLDB Endowment 13.9 (2020): 1443-1455
- Bing Tian, Haikun Liu, Yuhang Tang, Shihai Xiao, Zhuohui Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang "Fusionanns: สถาปัตยกรรมการประมวลผลสหกรณ์ CPU/GPU ที่มีประสิทธิภาพสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณพันล้าน" (2024)
- เฉิน, จงฮัน, และคณะ "สำรวจความหมายของการค้นหาเพื่อนบ้านที่ใกล้ที่สุดในพื้นที่มิติสูง" arxiv preprint arxiv: 2410.05752 (2024)
- Tepper, Mariano, et al. "Gleanvec: เร่งการค้นหาเวกเตอร์ด้วยการลดมิติมิติแบบไม่เชิงเส้น" arxiv preprint arxiv: 2410.22347 (2024)
- Li, Jingyu, et al. "Panther: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณส่วนตัวในการตั้งค่าเซิร์ฟเวอร์เดียว" Cryptology Eprint Archive (2024)
- Wei, Jiuqi, et al. "Subspace Collision: เฟรมเวิร์กที่มีประสิทธิภาพและแม่นยำสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดในมิติสูง" arxiv preprint arxiv: 2411.14754 (2024)
ระบบ
- Qin, An, et al. "เขาวงกต: ระบบการขจัดคราบวิดีโอที่ประหยัดต้นทุนที่เว็บสเกล" การดำเนินการประชุมนานาชาติ ACM ครั้งที่ 30 เกี่ยวกับมัลติมีเดีย 2022.
- Doshi, Ishita, et al. "Lanns: ระบบการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" arxiv preprint arxiv: 2010.09426 (2020)
- Chen, Yaoqi, et al. "Onesparse: ระบบ Unified สำหรับการค้นหาเวกเตอร์หลายดัชนี" การดำเนินการตามสหายของ ACM ในการประชุมทางเว็บ 2024. 2024
คนอื่น
- การเพิ่มประสิทธิภาพการค้นหาด้วยความน่าจะเป็นแบบสอบถามที่เพิ่มขึ้นและการค้นหาโดยประมาณสองระดับสำหรับอุปกรณ์ขอบ
- Gao, Jianyang และ Cheng Long "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ: ด้วยการดำเนินการเปรียบเทียบระยะทางที่เชื่อถือได้และมีประสิทธิภาพ" การดำเนินการของ ACM เกี่ยวกับการจัดการข้อมูล 1.2 (2023): 1-27
- การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณในระบบผู้แนะนำ Yury Malkov
- เร่งการค้นหาเวกเตอร์บน GPU ด้วย Rapids raft Corey Nolet
- Gupta, Gaurav, et al. "CAPS: ดัชนีพาร์ติชันที่ใช้งานได้สำหรับการค้นหาความคล้ายคลึงกันที่กรอง" arxiv preprint arxiv: 2308.15014 (2023)
- Zhu, Yuhao "RTNN: เร่งการค้นหาเพื่อนบ้านโดยใช้การติดตามเรย์ฮาร์ดแวร์" การประชุมวิชาการ ACM Sigplan ครั้งที่ 27 เกี่ยวกับหลักการและการปฏิบัติของการเขียนโปรแกรมแบบขนาน 2022. [รหัส]
- Levi, Asaf, et al. "การจัดทำดัชนีทางกายภาพและการจัดทำดัชนีด้วย {IDEA}: Inverted {ดัชนี deduplication-Aware}" การประชุม USENIX ครั้งที่ 22 เกี่ยวกับเทคโนโลยีไฟล์และการจัดเก็บ (เร็ว 24) 2024. [รหัส]
- Carra, Damiano และ Giovanni Neadia "เอานกสองตัวด้วยแคช K-NN หนึ่งตัว" 2021 IEEE Global Communications Conference (Globecom) IEEE, 2021
- Salem, Tareq Si, Giovanni Neadia และ Damiano Carra "การแคชที่มีความคล้ายคลึงกันเพิ่มขึ้นด้วยดัชนีโดยประมาณ" ธุรกรรม IEEE/ACM บนเครือข่าย (2022)
- Li, Conglong, et al. "การปรับปรุงการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณผ่านการยกเลิกการปรับตัวก่อนกำหนด" การดำเนินการประชุมนานาชาติ ACM Sigmod ระหว่างปี 2020 เรื่องการจัดการข้อมูล 2020.
- Karppa, Matti, Martin Aumüllerและ Rasmus Pagh "Deann: เร่งการประมาณความหนาแน่นของเคอร์เนลโดยใช้การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ" การประชุมนานาชาติเกี่ยวกับปัญญาประดิษฐ์และสถิติ PMLR, 2022
- Wang, Zeyu, et al. "ผู้ให้บริการเปรียบเทียบระยะทางสำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ: การสำรวจและเกณฑ์มาตรฐาน" arxiv preprint arxiv: 2403.13491 (2024)
- Szilvasy, Gergely, Pierre-Emmanuel Mazaréและ Matthijs Douze "การค้นหาเวกเตอร์ด้วยรัศมีขนาดเล็ก" arxiv preprint arxiv: 2403.10746 (2024)
- ฮัน, Changhun, Suji Kim และ Ha-Myung Park "การค้นหาความใกล้ชิดที่มีประสิทธิภาพในการสะสมข้อมูลมิติสูงโดยใช้การจัดทำดัชนีบล็อกหลายระดับ" (2024)
- Tepper, Mariano, et al. "Leanvec: ค้นหาเวกเตอร์ของคุณได้เร็วขึ้นโดยทำให้พอดี" arxiv preprint arxiv: 2312.16335 (2023)
- Harwood, Ben, et al. "การค้นหาเพื่อนบ้านที่ใกล้ที่สุดในชุดข้อมูลแบบไดนามิก: การสอบสวน" arxiv preprint arxiv: 2404.19284 (2024)
- การจำแนกลักษณะของภาวะที่กลืนไม่เข้าคายไม่ออกของประสิทธิภาพและขนาดดัชนีในการค้นหาเวกเตอร์พันล้านและทำลายด้วยหน่วยความจำระดับสอง
- Xu, Haike ประสิทธิภาพกรณีที่เลวร้ายที่สุดของการใช้งานการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณที่ได้รับความนิยม: การรับประกันและข้อ จำกัด แยกออก สถาบันเทคโนโลยีแมสซาชูเซตส์, 2024
- หลินจิมมี่ "คำแนะนำในการปฏิบัติงานสำหรับผู้ติดตามที่หนาแน่นและเบาบาง: HNSW, Flat หรือ Inverted Indexes?" arxiv preprint arxiv: 2409.06464 (2024)
- Zhou, Mingxun, Elaine Shi และ Giulia Fanti "Pacmann: การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณส่วนตัว" Cryptology Eprint Archive (2024)
- การประเมินผลและการวัด
- คุณหมายถึง BM25 ตัวไหน? การศึกษาความสามารถในการทำซ้ำขนาดใหญ่ของตัวแปรการให้คะแนน Kamphuis, Chris, Arjen P. de Vries, Leonid Boytsov และ Jimmy Lin [กระดาษ]
- บทความและการพูดคุย
- ฐานข้อมูลเวกเตอร์คืออะไร?
- ฐานข้อมูลเวกเตอร์ (ตอนที่ 1): อะไรทำให้แต่ละอันแตกต่างกัน?
- เอ็นจิ้นความคล้ายคลึงกันของเวกเตอร์ในระดับพันล้านที่รวดเร็วของ eBay
- Meetup Computer Vision: แอปพลิเคชันการมองเห็นคอมพิวเตอร์ในระดับที่มีฐานข้อมูลเวกเตอร์
- วิธีเลือกฐานข้อมูลเวกเตอร์ของคุณในปี 2023
- เราต้องการฐานข้อมูลเวกเตอร์เฉพาะหรือไม่?
- ฐานข้อมูลเวกเตอร์ไม่ใช่หมวดหมู่ฐานข้อมูลแยกต่างหาก
- ฐานข้อมูลเวกเตอร์: แนวทางหลักการแรก
- การสอนการค้นหา RAG Vector - รวมข้อมูลของคุณกับ LLM ด้วยการค้นหาขั้นสูง
- การค้นหาความคล้ายคลึงกันของเวกเตอร์ที่มีประสิทธิภาพในเวิร์กโฟลว์ผู้แนะนำโดยใช้ Milvus กับ Nvidia Merlin
- ฐานข้อมูลเวกเตอร์: คู่มือผู้เริ่มต้น!
- ฐานข้อมูลเวกเตอร์และสปริง IA
- วิธีจัดการกับการฝังตัวของเวกเตอร์ล้านในแอปพลิเคชัน RAG
- วิธีการที่ Meilisearch อัปเดตฐานข้อมูล Millions Vector Embeddings ในเวลาไม่กี่นาที
- ข้อผิดพลาดทั่วไปที่จะหลีกเลี่ยงเมื่อใช้ฐานข้อมูลเวกเตอร์
- เริ่มต้นใช้งานฐานข้อมูลเวกเตอร์
- การเลือกรุ่นที่ดีที่สุดสำหรับการค้นหาความหมาย
รายการที่เกี่ยวข้อง
- เครื่องมือค้นหาเวกเตอร์ที่ยอดเยี่ยม