Потрясающая векторная поисковая система
Кураторский список удивительных векторных структур поиска/двигателя, библиотеки, облачных сервисов и исследовательских работ для вектора Поиск сходства
Автономный сервис
- Apache Cassandra 5.0-векторный поиск (CEP-30), строгая сериализируемая кислота (CEP-15), база данных горизонтальной масштабирования
- Qdrant - Поисковая система сходства вектора с расширенной поддержкой фильтрации
- Вальд - высоко масштабируемая поисковая система с распределенной векторной векторной
- MILVUS-облачная векторная база данных с высокой производительностью и высокой масштабируемостью.
- Weaviate-облачная поисковая система вектора в реальном времени
- Opendistro Elasticsearch KNN - плагин машинного обучения, который поддерживает приблизительный алгоритм поиска K -NN для открытого дистрибуции для Elasticsearch
- Elastiknn - плагин Elasticsearch для поиска ближайшего соседа
- Epsilla - высокоэффективная система управления базами данных, гиппокамп для искусственного интеллекта
- Vearch - масштабируемая распределенная система для эффективного поиска сходства векторов глубокого обучения
- PGANN - быстрый приблизительный соседский (ANN)
- Джина-Джина позволяет вам построить глубокий поиск в качестве услуги.
- Бесконечность-база данных AI-местной, созданной для приложений LLM, обеспечивая невероятно быстрый вектор и полнотекстовый поиск
- Aquila DB - Алгоритм поиска K -NN, ориентированный на распределение
- Redis HNSW - модуль Redis для поиска сходства на основе HNSW
- Solr - Apache Solr - имеет плотную функцию поиска вектора по состоянию на Solr 9.0
- Marqo - семантическая поисковая система, которая поддерживает поиск тензора (последовательность векторов)
- txtai - сборка семантических поисковых приложений и рабочих процессов
- Semantra - многоцелевой инструмент для семантически поиска документов.
- SuperDuperdb - принесите ИИ в любимую базу данных
- Tensordb - база данных высокой производительности, поддерживающая гетерогенные вычисления
- JVector - чистая Java, нулевая зависимость, встроенная поисковая система вектора, используемая DataStax Astra DB и Apache Cassandra.
- VQLite - простая и легкая поисковая система векторной векторной
- Vexvault - 100% браузер на основе, с открытым исходным кодом, масштабируемый, простой, нулевой векторный поиск
- Vespa.ai - текстовая поисковая система и ... быстрый приблизительный векторный поиск (ANN)
- Крупный поиск ANN Vespa с использованием индексов HNSW-IF описан здесь
Библиотека
- Langstream-Langstream-это проект с открытым исходным кодом, который объединяет лучшие архитектуры на основе событий с новейшими технологиями AI.
- Cassio - Cassio - это окончательное решение для беспроблемной интеграции Apache Cassandra® с генеративным искусственным интеллектом и другими рабочими нагрузками машинного обучения
- JVector - чистая Java, нулевая зависимость, встроенная поисковая система вектора, используемая некоторыми из расширенных распределенных баз данных, таких как DataStax Astra DB & Apache Cassandra ™
- FAISS - Библиотека для эффективного поиска сходства и кластеризации плотных векторов
- Распределенный FAISS - Работайте с индексами FAISS, которые не вписываются в единую память сервера
- AutoFaiss - автоматически создавать индексы FAISS KNN
- Сканан - библиотечный эффективный поиск сходства вектора в масштабе.
- NMSLIB-НЕ-МЕТРИКА
- Раздражайте - библиотека C ++ с привязками Python для поиска очков
- FLANN - Библиотека, написанная в C ++ и содержит привязки для следующих языков: C, Matlab, Python и Ruby
- Приложение LLM-библиотека Python с открытым исходным кодом для индексации данных в реальном времени (K-ближайшие соседи)
- MRPT - быстрый поиск ближайшего соседа со случайной проекцией
- RPForest - Библиотека Python для приблизительного поиска ближайших соседей
- PGVECTOR - Расширение поиска сходного сходства с открытым исходным кодом для Postgres
- PASE-Ультра-высокий приблизительный приблизительный расширение поиска ближайшего соседа для Postgres
- Pyserini - инструментарий для исследования поиска информации с разреженными и плотными представлениями
- NGT - предоставляет команды и библиотеку для выполнения высокоскоростного приблизительного ближайшего соседа
- Ближний - приблизительный поиск с использованием различных методов хеширования, чувствительных к местности
- Toros N2 - Легкая приблизительная ближайшая библиотека ближайшего соседа
- Puffinn - без параметра и универсальный быстрый поиск ближайших соседей
- SPTAG - распределенная ближайшая библиотека поиска по соседству (ANN)
- Pynndescent - ближайший сосед
- Tarsoslsh - библиотека Java, внедряющая практический алгоритм поиска ближайших соседей для многомерных векторов
- TOCHPQ - Эффективные реализации квантования продукта и его вариантов с использованием Pytorch и CUDA
- Granne - график поиск приблизительных ближайших соседей Виттен в ржавчине
- EnceddingHub - база данных, созданная для встраивания машинного обучения
- HORA - Эффективная приблизительная библиотека с коллекциями алгоритма ближайшего соседа, написанная в Rust
- Voy - Поисковая система сходства с вектором wasm, написанная в ржавчине
- Chroma - база данных встроенного открытого исходного кода для создания приложений LLM в Python или JavaScript с памятью
- Usearch - Меньшая и более быстрая поисковая система векторной векторной
- Коллекция векторов Golang - Chroma, интерфейсы PGVector
- Масштабируемый векторный поиск (SVS) - библиотека производительности для поиска сходства вектора
Облачный сервис
- Epsilla Cloud - полностью управляемая векторная база данных без сервера с более 10 раз быстрее, дешевле и лучше.
- DataStax Astra Vector - Multi -Cloud, без сервера Vector DBAAS
- Актуальность AI - векторная платформа от экспериментов до развертывания
- PINECONE - Управляемый векторный поиск с фильтрацией, обновлениями живого индекса, горизонтальным масштабированием и гораздо большим количеством
- MyScale - управляемая векторная база данных на основе Clickhouse
- Redis Cloud - управляемая векторная база данных в Redis
- Zilliz Cloud - облачный сервис для Milvus
Исследовательские работы
Список методов о том, как приблизительный алгоритм поиска вектора может быть реализован более эффективно.
- Спанн: высокоэффективный примерный миллиардный шкал ближайший поиск по соседству-Neurips 2021
- Пересмотр инвертированных индексов для приблизительных ближайших соседей - ECCV 2018 - ECCV 2018
- Ускорение крупномасштабного вывода с квантованием анизотропного вектора
- Поиск сходства в миллиардах с помощью графических процессоров
- Эффективный и надежный приблизительный поиск ближайшего соседа с использованием иерархических судоходных графиков маленького мира
- Оптимизация индексации на основе графика K-ближайшего соседа для поиска близости в высокомерных данных
- Приблизительно в поисках аналогичных встроенных слов - ACL 2016