멋진 벡터 검색 엔진
멋진 벡터 검색 프레임 워크/엔진, 라이브러리, 클라우드 서비스 및 연구 논문의 선별 된 목록 벡터 유사성 검색
독립형 서비스
- Apache Cassandra 5.0-벡터 검색 (CEP-30), 엄격한 직렬화 가능한 산 (CEP-15), 수평 스케일링 데이터베이스
- QDRANT- 확장 필터링 지원이있는 벡터 유사성 검색 엔진
- Vald- 확장 가능한 분산 벡터 검색 엔진
- MILVUS- 고성능 및 확장 성이 높은 클라우드 네이티브 벡터 데이터베이스.
- weaviate- 클라우드 네이티브, 실시간 벡터 검색 엔진
- Opendistro Elasticsearch Search KNN- Elasticsearch를위한 오픈 배포판을위한 대략적인 K -NN 검색 알고리즘을 지원하는 머신 러닝 플러그인
- Elastiknn- 가장 가까운 이웃 검색을위한 elasticsearch 플러그인
- Epsilla- 고성능 벡터 데이터베이스 관리 시스템, AI 해마
- vearch- 딥 러닝 벡터의 효율적인 유사성 검색을위한 확장 가능한 분산 시스템
- PGANN- PostgreSQL 데이터베이스로 가장 가까운 가장 가까운 이웃 (ANN) 검색
- Jina-Jina를 사용하면 딥 러닝 구동의 검색을 구축 할 수 있습니다.
- Infinity- LLM 애플리케이션을 위해 구축 된 AI-Native 데이터베이스, 엄청나게 빠른 벡터 및 전체 텍스트 검색을 제공합니다.
- Aquila DB- 분포 중심 K -NN 검색 알고리즘
- REDIS HNSW- HNSW를 기반으로 유사성 검색을위한 Redis 모듈
- Solr -Apache Solr- Solr 9.0의 조밀 한 벡터 검색 기능이 있습니다.
- marqo- 텐서 검색을 지원하는 시맨틱 검색 엔진 (벡터 순서)
- TXTAI- 시맨틱 검색 응용 프로그램 및 워크 플로를 구축하십시오
- SEMANTRA- 문서를 의미 적으로 검색하기위한 다목적 도구.
- SuperDuperDB- AI를 좋아하는 데이터베이스로 가져옵니다
- TensordB- 이종 컴퓨팅을 지원하는 고성능 벡터 데이터베이스
- Jvector- DataStax Astra DB 및 Apache Cassandra가 사용하는 순수한 Java, Zero Decendency, Embedded Vector Search Engine.
- VQLITE- 간단하고 경량 벡터 검색 엔진
- Vexvault -100% 브라우저 기반, 오픈 소스, 확장 가능, 단순, 제로 비용 벡터 검색
- vespa.ai- 텍스트 검색 엔진 및 ... 빠른 근사 벡터 검색 (Ann)
- HNSW-IF 인덱스를 사용한 Vespa의 대규모 Ann 검색은 여기에 설명되어 있습니다.
도서관
- Langstream-Langstream은 최고의 이벤트 기반 아키텍처와 최신 Gen AI 기술을 결합한 오픈 소스 프로젝트입니다.
- Cassio -Cassio는 Apache Cassandra®를 생성 인공 지능 및 기타 기계 학습 워크로드와 완벽하게 통합하기위한 최고의 솔루션입니다.
- JVECTOR- DataStax Astra DB & Apache Cassandra ™와 같은 일부 고급 분산 데이터베이스에서 사용하는 순수한 Java, 제로 의존성, 임베디드 벡터 검색 엔진.
- FAISS- 밀도가 높은 벡터의 효율적인 유사성 검색 및 클러스터링을위한 라이브러리
- 분산 FAISS- 단일 서버 메모리에 맞지 않는 FAISS 인덱스 작업
- Autofaiss- 자동으로 FAISS KNN 지수를 만듭니다
- 스캔 - 규모에 따라 라이브러리 효율적인 벡터 유사성 검색.
- NMSLIB- 비 메트릭 우주 라이브러리, 일반적인 비 메트릭 공간에 대한 효율적인 유사성 검색 라이브러리
- 짜증 - 포인트 검색에 파이썬 바인딩이있는 C ++ 라이브러리
- Flann- 도서관 C ++로 작성되었으며 다음 언어에 대한 바인딩이 포함되어 있습니다 : C, Matlab, Python 및 Ruby
- LLM 앱-실시간 데이터를위한 오픈 소스 Python 라이브러리 KNN (K-NAREARTEST NEURDORS) 색인
- MRPT- 임의의 투영이있는 빠른 가장 가까운 이웃 검색
- RPFOREST- 가장 가까운 이웃 검색을위한 파이썬 라이브러리
- PGVECTOR- Postgres에 대한 오픈 소스 벡터 유사성 검색 확장
- PASE- 우편에 대한 초고 차원 근사 가장 가까운 이웃 검색 확장
- Pyserini- 재현 가능한 정보 검색 연구를위한 툴킷 희소하고 조밀 한 표현을 가진 툴킷
- NGT- 가장 가까운 이웃을 수행하기위한 명령과 라이브러리를 제공합니다.
- 가까운 지역 - 민감한 해싱 방법을 사용한 근사 검색
- Toros N2- 경량 대략 가장 가까운 이웃 라이브러리
- Puffinn- 가장 가까운 이웃의 매개 변수 및 보편적 빠른 발견
- SPTAG- 배포 된 대략적인 가장 가까운 이웃 검색 (ANN) 라이브러리
- Pynndescent- 가장 가까운 이웃을위한 가장 가까운 이웃 출신의 파이썬 가장 가까운 이웃.
- Tarsoslsh- 다차원 벡터에 대한 실용적인 가장 가까운 이웃 검색 알고리즘을 구현하는 Java 라이브러리
- TorchPQ- Pytorch 및 Cuda를 사용한 제품 양자화 및 변형의 효율적인 구현
- GRANNE- Rust에서 Witten의 대략적인 가장 가까운 이웃의 그래프 기반 검색
- EmbeddingHub- 머신 러닝 임베드를 위해 구축 된 데이터베이스
- HORA- 효율적인 대략적인 가장 가까운 이웃 검색 알고리즘 컬렉션 라이브러리가 Rust로 작성되었습니다.
- Voy -A WASM VECTOR 유사성 검색 엔진이 녹슬 었습니다.
- Chroma -Python 또는 JavaScript에서 LLM 앱을 구축하기위한 오픈 소스 임베딩 데이터베이스.
- USEARCH -C ++, Python, JavaScript, Rust, Java, Golang, Wolfram 용 작고 빠른 벡터 검색 엔진
- Golang Vector Stores Collection- Chroma, PGVector 인터페이스
- 확장 가능한 벡터 검색 (SVS) - 벡터 유사성 검색을위한 성능 라이브러리
클라우드 서비스
- Epsilla Cloud- 10 배 더 빠르고 저렴하며 더 나은 완전 관리되는 서버리스 벡터 데이터베이스.
- DataStax Astra Vector- 멀티 클라우드, 서버리스 벡터 DBAA
- 관련성 AI- 실험에서 배포까지 벡터 플랫폼
- PENECONE- 필터링, 라이브 인덱스 업데이트, 수평 스케일링 등을 통한 관리 벡터 검색 등
- MYSCALE- 클릭 하우스를 기반으로 한 관리 벡터 데이터베이스
- Redis Cloud- Redis의 관리 벡터 데이터베이스
- Zilliz Cloud- Milvus를위한 클라우드 네이티브 서비스
연구 논문
근사 벡터 검색 알고리즘을보다 효과적으로 구현할 수있는 방법에 대한 메소드 목록.
- SPANN : 매우 효율적인 10 억 규모의 대략 가장 가까운 이웃 검색-Neurips 2021
- 10 억 규모의 대략적인 이웃에 대한 역 지수 재 방문 -ECCV 2018
- 이방성 벡터 양자화에 대한 대규모 추론을 가속화합니다
- GPU를 사용한 10 억 규모의 유사성 검색
- 계층 적 탐색 가능한 작은 세계 그래프를 사용하여 효율적이고 강력한 근사 이웃 검색
- 고차원 데이터에서 근접 검색을위한 K-NAREARTE 이웃 그래프를 기반으로 한 인덱싱 최적화
- 대략 유사한 단어 임베딩을 검색하여 -ACL 2016