เครื่องมือค้นหาเวกเตอร์ที่ยอดเยี่ยม
รายการที่คัดสรรมาอย่างดีของเฟรมเวิร์ก/เอ็นจิ้นการค้นหาเวกเตอร์ที่ยอดเยี่ยมห้องสมุดบริการคลาวด์และงานวิจัยเพื่อค้นหาความคล้ายคลึงกันของเวกเตอร์
บริการแบบสแตนด์อโลน
- Apache Cassandra 5.0-การค้นหาเวกเตอร์ (CEP-30), กรดอนุกรมที่เข้มงวด (CEP-15) ฐานข้อมูลการปรับขนาดในแนวนอน
- qdrant - เครื่องมือค้นหาความคล้ายคลึงกันของเวกเตอร์ที่มีการสนับสนุนการกรองเพิ่มเติม
- Vald - เครื่องมือค้นหาเวกเตอร์แบบกระจายที่ปรับขนาดได้สูง
- MILVUS-ฐานข้อมูลเวกเตอร์แบบคลาวด์ที่มีประสิทธิภาพสูงและปรับขนาดได้สูง
- ทอผ้า-เครื่องมือค้นหาเวกเตอร์แบบเรียลไทม์แบบเรียลไทม์
- Opendistro Elasticsearch KNN - ปลั๊กอินการเรียนรู้ของเครื่องซึ่งรองรับอัลกอริทึมการค้นหา K -NN โดยประมาณสำหรับ Distro แบบเปิดสำหรับ Elasticsearch
- Elastiknn - ปลั๊กอิน Elasticsearch สำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุด
- Epsilla - ระบบการจัดการฐานข้อมูลเวกเตอร์ประสิทธิภาพสูงฮิบโปแคมปัสสำหรับ AI
- VEARCH - ระบบกระจายที่ปรับขนาดได้สำหรับการค้นหาความคล้ายคลึงกันอย่างมีประสิทธิภาพของเวกเตอร์การเรียนรู้ลึก
- PGANN - การค้นหาเพื่อนบ้านที่ใกล้ที่สุด (Ann) โดยประมาณอย่างรวดเร็วด้วยฐานข้อมูล PostgreSQL
- Jina-Jina ช่วยให้คุณสามารถสร้างการค้นหาอย่างลึกล้ำในการค้นหา
- Infinity-ฐานข้อมูล Ai-Native ที่สร้างขึ้นสำหรับแอปพลิเคชัน LLM ให้การค้นหาเวกเตอร์และข้อความเต็มรูปแบบที่รวดเร็วอย่างไม่น่าเชื่อ
- Aquila DB - อัลกอริทึมการค้นหา K -NN ที่เน้นการกระจาย
- Redis HNSW - โมดูล Redis สำหรับการค้นหาที่คล้ายคลึงกันตาม HNSW
- Solr - Apache Solr - มีคุณสมบัติการค้นหาเวกเตอร์หนาแน่นเป็นของ Solr 9.0
- Marqo - เครื่องมือค้นหาความหมายที่รองรับการค้นหาเทนเซอร์ (ลำดับของเวกเตอร์)
- txtai - สร้างแอปพลิเคชันการค้นหาความหมายและเวิร์กโฟลว์
- SEMANTRA - เครื่องมืออเนกประสงค์สำหรับการค้นหาเอกสารเชิงความหมาย
- superduperdb - นำ AI ไปยังฐานข้อมูลที่คุณชื่นชอบ
- TENSORDB - ฐานข้อมูลเวกเตอร์ประสิทธิภาพสูงรองรับการคำนวณที่แตกต่างกัน
- JVector - Java บริสุทธิ์, การพึ่งพาศูนย์, เครื่องมือค้นหาเวกเตอร์แบบฝังตัว, ใช้โดย DataStax Astra DB และ Apache Cassandra
- VQLite - เครื่องมือค้นหาเวกเตอร์ที่เรียบง่ายและมีน้ำหนักเบา
- VexVault - เบราว์เซอร์ 100%, โอเพ่นซอร์ส, การค้นหาเวกเตอร์ที่ปรับขนาดได้ง่าย, เป็นศูนย์, ค่าใช้จ่าย
- Vespa.ai - เครื่องมือค้นหาข้อความและ ... การค้นหาเวกเตอร์โดยประมาณที่รวดเร็ว (Ann)
- การค้นหา ANN ขนาดใหญ่ของ Vespa โดยใช้ดัชนี HNSW-IF อธิบายไว้ที่นี่
ห้องสมุด
- Langstream-Langstream เป็นโครงการโอเพนซอร์ซที่ผสมผสานสถาปัตยกรรมที่ใช้งานมากที่สุดเข้ากับเทคโนโลยี Gen AI ล่าสุด
- CASSIO - CASSIO เป็นทางออกที่ดีที่สุดสำหรับการบูรณาการ Apache Cassandra®เข้ากับปัญญาประดิษฐ์กำเนิดและเวิร์กโหลดการเรียนรู้ของเครื่องอื่น ๆ
- JVector - Java บริสุทธิ์, การพึ่งพาศูนย์, เครื่องมือค้นหาเวกเตอร์แบบฝังตัวที่ใช้โดยฐานข้อมูลแบบกระจายขั้นสูงบางอย่างเช่น DataStax Astra DB & Apache Cassandra ™
- FAISS - ห้องสมุดสำหรับการค้นหาความคล้ายคลึงกันอย่างมีประสิทธิภาพและการจัดกลุ่มของเวกเตอร์หนาแน่น
- Distributed Faiss - ทำงานกับดัชนี FAISS ซึ่งไม่พอดีกับหน่วยความจำเซิร์ฟเวอร์เดียว
- Autofaiss - สร้างดัชนี FAISS KNN โดยอัตโนมัติ
- Scann - การค้นหาความคล้ายคลึงกันของเวกเตอร์ที่มีประสิทธิภาพของไลบรารีในระดับ
- NMSLIB-ไลบรารีอวกาศที่ไม่ใช่เมทริกซึ่งเป็นไลบรารีการค้นหาความคล้ายคลึงกันที่มีประสิทธิภาพสำหรับพื้นที่ที่ไม่ใช่ตัวชี้วัดทั่วไป
- รบกวน - ไลบรารี C ++ พร้อมการผูก Python เพื่อค้นหาคะแนน
- Flann - ห้องสมุดที่เขียนใน C ++ และมีการผูกสำหรับภาษาต่อไปนี้: C, Matlab, Python และ Ruby
- แอพ LLM-ไลบรารี Python โอเพนซอร์
- MRPT - การค้นหาเพื่อนบ้านที่ใกล้ที่สุดอย่างรวดเร็วพร้อมการฉายแบบสุ่ม
- RPForest - Library Python สำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ
- PGVECTOR - ส่วนขยายการค้นหาที่คล้ายคลึงกันของเวกเตอร์โอเพ่นซอร์สสำหรับ postgres
- PASE-ส่วนขยายการค้นหาเพื่อนบ้านที่ใกล้เคียงที่สุดโดยประมาณพิเศษสำหรับ postgres
- Pyserini - ชุดเครื่องมือสำหรับการวิจัยการดึงข้อมูลที่ทำซ้ำได้ด้วยการเป็นตัวแทนที่กระจัดกระจายและหนาแน่น
- NGT - ให้คำสั่งและไลบรารีสำหรับการดำเนินการเพื่อนบ้านที่ใกล้เคียงที่สุดโดยประมาณความเร็วสูง
- NearPy - การค้นหาโดยประมาณโดยใช้วิธีการแฮชที่ไวต่อท้องถิ่นที่แตกต่างกัน
- Toros N2 - ห้องสมุดเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณที่มีน้ำหนักเบา
- Puffinn - การค้นพบเพื่อนบ้านที่ใกล้ที่สุดและเป็นสากลและเป็นสากล
- Sptag - ห้องสมุดการค้นหาพื้นที่ใกล้เคียงที่ใกล้ที่สุด (Ann) โดยประมาณ
- Pynndescent - ลูกหลานที่ใกล้ที่สุดของ Python สำหรับเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณ
- TARSOSLSH - ห้องสมุด Java ที่ใช้อัลกอริทึมการค้นหาเพื่อนบ้านที่ใกล้ที่สุดสำหรับเวกเตอร์หลายมิติ
- Torchpq - การใช้งานที่มีประสิทธิภาพของการหาปริมาณผลิตภัณฑ์และตัวแปรโดยใช้ Pytorch และ Cuda
- GRANNE - การดึงข้อมูลกราฟของเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณในการเกิดสนิม
- EmbeddingHub - ฐานข้อมูลที่สร้างขึ้นสำหรับการเรียนรู้ของเครื่องฝังตัว
- HORA - ห้องสมุดการค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณที่มีประสิทธิภาพ
- Voy - เครื่องมือค้นหาความคล้ายคลึงกันของเวกเตอร์ WASM ที่เขียนด้วย Rust
- Chroma - ฐานข้อมูลการฝังโอเพนซอร์ซสำหรับการสร้างแอพ LLM ใน Python หรือ JavaScript พร้อมหน่วยความจำ
- USEARCH - เครื่องมือค้นหาเวกเตอร์ขนาดเล็กและเร็วขึ้นสำหรับ C ++, Python, JavaScript, Rust, Java, Golang, Wolfram
- Golang Vector Stores Collection - Chroma, Pgvector Interfaces
- การค้นหาเวกเตอร์ที่ปรับขนาดได้ (SVS) - ไลบรารีประสิทธิภาพสำหรับการค้นหาความคล้ายคลึงกันของเวกเตอร์
บริการคลาวด์
- Epsilla Cloud - ฐานข้อมูลเวกเตอร์แบบไร้เซิร์ฟเวอร์ที่ได้รับการจัดการอย่างสมบูรณ์พร้อม 10 เท่าเร็วกว่าและดีกว่า
- DataStax Astra Vector - DBAAs เวกเตอร์แบบไม่มีเซิร์ฟเวอร์แบบไม่มีเซิร์ฟเวอร์
- เกี่ยวข้องกับ AI - แพลตฟอร์มเวกเตอร์ตั้งแต่การทดลองจนถึงการปรับใช้
- Pinecone - การค้นหาเวกเตอร์ที่มีการจัดการด้วยการกรองการอัปเดตดัชนีสดการปรับขนาดแนวนอนและอื่น ๆ อีกมากมาย
- MyScale - ฐานข้อมูลเวกเตอร์ที่ได้รับการจัดการตาม Clickhouse
- Redis Cloud - ฐานข้อมูลเวกเตอร์ที่มีการจัดการใน Redis
- ZILLIZ Cloud - บริการคลาวด์สำหรับ Milvus
งานวิจัย
รายการวิธีการเกี่ยวกับวิธีการค้นหาอัลกอริทึมการค้นหาเวกเตอร์โดยประมาณสามารถใช้งานได้อย่างมีประสิทธิภาพมากขึ้น
- Spann: การค้นหาพื้นที่ใกล้เคียงที่ใกล้ที่สุดพันล้านพันล้านที่มีประสิทธิภาพสูง-Neurips 2021
- ทบทวนดัชนีคว่ำสำหรับเพื่อนบ้านที่ใกล้ที่สุดนับพันล้านคน - ECCV 2018
- เร่งการอนุมานขนาดใหญ่ด้วย anisotropic vector quantization
- การค้นหาความคล้ายคลึงกันพันล้านด้วย GPUs
- การค้นหาเพื่อนบ้านที่ใกล้ที่สุดที่มีประสิทธิภาพและมีประสิทธิภาพโดยประมาณโดยใช้กราฟโลกขนาดเล็กที่นำทางได้ตามลำดับชั้น
- การเพิ่มประสิทธิภาพของการจัดทำดัชนีตามกราฟเพื่อนบ้าน K-nearest สำหรับการค้นหาความใกล้ชิดในข้อมูลมิติสูง
- ในการค้นหาคำที่คล้ายกันโดยประมาณ - ACL 2016