? Потрясающая векторная база данных
Курированный список удивительных работ, связанных с высокой размерной структурой/векторным поиском и базой данных
Услуги
- Поиск Google Vector (Vertex AI)
- Pinecone
- Weaviate [Guide Guide]
- Веспа
- txtai
- Марко
- Vectara
- Эпсилла
- Алголия
- Meilisearch
- Nucliadb
- OpenSearch
- MyScale
- QdrantCloud
- Zilliz
- Alibabacloud от Opensearch
- Типовсенс облако
- Поиск вектора MongoDB Atlas
- Superduperdb
- KBD.ai
Сравнения
- От Vespa
- Сравнение вектора DB с помощью VectorHub
- MyScale Vector Database Clarkmark
Библиотеки и двигатели
Многомерные данные / векторы
- ? Векторная матрица функции DB
- Faiss Paper
- Типы
- Qdrant
- раздражать
- Индикатор
- PGVector
- Хрома
- Lmamaindex
- Эпсилла
- jvector
- Плот
- Вальд
- Voyager
- крошечный вектор
- Usearch
- vearch
- MRPT
- Милвус
- бесконечность
- Havenask
- Хролемм-хо
- Oasysdb [записная книжка]
- Meilisearch - API поисковой системы для семантического (векторы), полнотекстовый и гибридный поиск
- Аррой - приблизительная библиотека ржавчины ближайших соседей
- пролечить
- CUVS
- VSAG
- SQLite-Vec
- Myscaledb
- Хора
- Аррой
- Kgraph
- Ближайший клейбр.jl
- Muopdb
Тексты
Другие
- Simsimd: эффективная альтернатива
scipy.spatial.distance и numpy.inner
Бессмыслы и базы данных
Энн Бессхарки [бумага].
МИЛЛИОСКОЕ ОСНОВНЫЕ ОСНОВЫ
- 2021 Результат
- Симхадри, Харша Вардхан и др. «Результаты Big Ann: Neurips'23 конкуренции». Arxiv Preprint arxiv: 2409.17424 (2024).
Бреть
VectordBbench - инструмент для эталона векторной базы данных, [GitHub]
Цельные значения векторной базы данных Qdrant
Цельный эталон векторной базы данных MyScale
Li, Wen, et al. «Приблизительный поиск ближайшего соседа по данным высокой размерности - экспериментах, анализе и улучшении». IEEE транзакции по знаниям и разработке данных 32.8 (2019): 1475-1488.
Zeng, Xianzhi, et al. «Конфеты: эталон для непрерывного приблизительного поиска ближайшего соседа с динамическим употреблением данных». Arxiv Preprint arxiv: 2406.19651 (2024).
Наборы данных Vector's Vector's Vectors
Книги
- Основы многомерных и метрических структур данных
- Введение в поиск информации
- Глубокое обучение для поиска
- Основы поиска вектора
Конференции и семинары
- ВОЛДБ
- Учебник:
- Новые тенденции в поиске сходства с высоким вектором [слайды, видео, бумага]
- Поиск изображения в дикой природе (CVPR20) [Видео]
- Сетей
- Нейронный поиск в действии
- ACM MM 2020: Эффективно и эффективно: в направлении повторной идентификации экземпляра открытого мира
- Приблизительный примерный соседский поиск в миллиардах.
- Является ли экземпляр поиска решением? [Слайды, видео]
- Поиск дополненного поколения и Vespa [слайды]
- SISAP Indexing Challenge
- 2023 Конкурс
- 2024 Конкурс
Курсы
- Долгосрочная память в AI - векторный поиск и базы данных (COS 495 - Принстон) [Примечания к классу]
- Freiburg Information поиск WS 2022-2023 [Веб-сайт, Видео-лекции]
- Поиск сходства вектора и курс FAISS [Playlist YouTube]
Другие
- VectorHub: бесплатный сайт обучения с открытым исходным кодом для людей (разработчики программного обеспечения для старших архитекторов ML), заинтересованный в добавлении векторного поиска в свой стек ML.
Публикации
Опрос
- Пан, Джеймс Цзе, Цзянгу Ван и Гуолиан Ли. «Обзор систем управления базами данных векторных баз.» Arxiv Preprint arxiv: 2310.14021 (2023). [Бумага]
- Аумуллер, Мартин и Маттео Цеккарелло. «Недавние подходы и тенденции в приблизительном поиске ближайшего соседа». {IEEE} Бюллетень по проектированию данных (2023).
- Ближайший соседский поиск: старый, новый и невозможный. Андони, Александр. [Бумага]
- Ganbarov, Ali, et al. «Экспериментальное сравнение приблизительных алгоритмов поиска ближайших соседей на графиках на устройствах с краями». Arxiv Preprint arxiv: 2411.14006 (2024).
Квантование
Источник: обзор квантования продукта.
- PQ: Квантование продукта для ближайшего соседского поиска. Джегу, Эрве, Маттийс Дуз и Корделия Шмид. [Paper, Code, Julia Code, NanoPQ]
- Ksection на графическом процессоре: поиск сходства в миллиардах с помощью графических процессоров. Джонсон, Джефф, Маттийс Дуз и Херве Жегу [бумага, код]
- Обзор квантования продукта. Мацуи, Юсуке, Юсуке Учида, Херве Жегу и Шин'Ичи Сато [бумага]
- OPQ: Оптимизированное квантование продукта. GE, Tiezheng, Kaiming HE, Qifa Ke и Jian Sun [Домашняя страница, бумага, код, нанопк]
- Более быстрая АЦП: разблокировка скрытого потенциала квантования продукта с помощью SIMD. Андре, Фабьен, Анн-Мари Кермаррек и Николас Ле Скуарнек [бумага, код]
- Ускоренный поиск ближайшего соседа с быстрым АЦП. Андре, Фабьен, Анн-Мари Кермаррек и Николас Ле Скуарнек [бумага].
- Кэш-местность недостаточно: высокопроизводительный поиск ближнего соседа с быстрым сканированием квантования продукта. Фабен Андре, Анн-Мари Кермаррек, Николас Ле Скуарнек [бумага]
- СКАСН: Ускорение крупномасштабного вывода с квантованием анизотропного вектора. Го, Руики, Филип Сан, Эрик Линдгрен, Куан Генг, Дэвид Симча, Феликс Черн и Санджив Кумар [бумага, вывод Python/C ++, обучение/вывод Юлии]
- Инвертированный мультииндекс. Бабенко, Артем и Виктор Лемпицкий [бумага, код]
- Мы уже там? Квантование продукта и его аппаратное ускорение. Фернандес-Маркес, Хавьер, Ахмед Ф. Абуэлхамайед, Николас Д. Лейн и Мохамед С. Абдфельфатта. [Бумага]
- LIBVQ: инструментарий для оптимизации квантования вектора и эффективного извлечения нервного нерва. Ли, Чаофан, Чжэн Лю, Шитао Сяо, Инсия Шао, ДеФу Лиан и Чжао Цао. [Paper, Code]
- Мацуи, Юсуке, Риота Хинами и Шин'Ичи Сато. «Реконфигурируемый перевернутый индекс». Материалы 26 -й Международной конференции ACM по мультимедиа. 2018. [Paper, Project, Code]
- Aguerrebere, Cecilia, et al. «Поиск сходства в мгновение ока с сжатыми индексами». Arxiv Preprint arxiv: 2304.04759 (2023).
- Huijben, Iris, et al. «Остаточное квантование с неявными нейронными кодовыми книгами». Arxiv Preprint arxiv: 2401.14732 (2024). [Код]
- Rege, Aniket, et al. «Аданны: структура для адаптивного семантического поиска». Достижения в системах обработки нейронной информации 36 (2024).
- Amara, Kenza, et al. «Ближайший соседский поиск с компактными кодами: перспектива декодера». Материалы Международной конференции 2022 года по мультимедийному поиску. 2022.
- Кришнан, Адитья и Эдо Либерти. «Проективная квантование продукта кластеризации». Arxiv Preprint arxiv: 2112.02179 (2021).
- Noh, haechan, taeho kim и jae-pil Heo. «Квантователь продуктов, осведомленный инвертированный индекс для масштабируемого поиска ближайшего соседа». Материалы Международной конференции IEEE/CVF по компьютерному видению. 2021.
- Zhan, Jingtao, et al. «Совместно оптимизировать энкодер запросов и квантование продукта для повышения производительности поиска». Материалы 30 -й Международной конференции ACM по управлению информацией и знаниями. 2021.
- Ван, Рунхуй и Дон Денг. «DelTAPQ: сжатие кода кода продукта без потерь для поиска сходства высокого размера». Материалы ВОЛДБ. 13.13 (2020): 3603-3616.
- Джанг, молодой Кюн и Нам Ик Чо. «Обобщенная сеть квантования продукта для полупрофильного поиска изображений». Материалы конференции IEEE/CVF по компьютерному зрению и распознаванию шаблонов. 2020.
- Чен, Тинг, Лала Ли и Йижоу Сан. «Дифференцируемое квантование продукта для сквозного сжатия встраивания». Международная конференция по машинному обучению. PMLR, 2020.
- Huang, Rong, et al. «Обучение дискретным представлениям документов в веб -поиске». Материалы 29 -й конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. 2023.
- Нардини, Франко Мария, Козимо Рулли и Россано Вентурини. «Эффективное многоветающее плотное извлечение с векторами битов». Европейская конференция по поиску информации. CHAM: Springer Nature Switzerland, 2024. [Код]
- Гао, Цзяньян и Ченг Лонг. «Rabitq: квантование высокоразмерных векторов с теоретической ошибкой, связанной с приблизительным поиском ближайшего соседа». Arxiv Preprint arxiv: 2405.12497 (2024). [(Код) [https://github.com/gaoj0017/rabitq]]]
- Gao, Jianyang, et al. «Практическое и асимптотически оптимальное квантование высокоразмерных векторов в евклидовом пространстве для приблизительного поиска ближайших соседей». Arxiv Preprint arxiv: 2409.09913 (2024).
- Mohoney, Jason, et al. «Индекс индекса ЭКО для потокового вектора поиска». Arxiv Preprint arxiv: 2411.00970 (2024).
- Ян, Минью, Вдоо Ли и Вэй Ван. «Быстрый высокоразмерный приблизительный поиск ближайшего соседа с эффективным временем и пространством индекса». Arxiv Preprint arxiv: 2411.06158 (2024).
Графические методы
- Wang, Zeyu, et al. «Индексы на основе графиков и деревьев для поиска сходства с высокоразмерным вектором: анализы, сравнения и будущие направления». Инжиниринг данных (2023): 3-21.
- Комплексное обследование и экспериментальное сравнение приблизительного поиска ближайших соседей на основе графиков. Ван, Менгао, Сяолианг Сюй, Цянь Юэ и Юсиан Ванг. [Paper, Code]
- Лин, Пенг-Ченг и Ван-Лей Чжао. «Поиск по ближайшему соседству на графике: обещания и неудачи». Arxiv Preprint arxiv: 1904.02077 (2019).
- HNSW: Эффективный и надежный приблизительный поиск ближайшего соседа с использованием иерархических судоходных малых графиков мира. Малков, Ю. А. и Дмитрий А. Яшунин. [Бумага, код, версия ржавчины, версия Go]
- Масштабирование алгоритмов ANNS на основе графиков для наборов данных размером с миллиард: сравнительный анализ. Добсон, Магдален, Чжэки Шен, Гай Э. Блеллох, Лаксман Дулипала, Ян Гу, Харша Вардхан Симхадри и Ихан Сан. [Бумага]
- Палец: Быстрый вывод для приблизительного поиска ближайшего соседа на основе графиков. Чен, Патрик, Вей-Ченг Чанг, Джюн-Ю Цзян, Сян-Фу Ю, Индерджит Диллон и Чо-Юи Сьи [бумага, видео]
- NSG: навигация на график разброса для приблизительного поиска ближайшего соседа. Фу, Конг, Чао Сян, Чанксу Ванг и Дэн Кай. [Paper, Code]
- Эфанна: чрезвычайно быстрый алгоритм поиска ближайшего соседей на основе графика KNN. Cong Fu, Deng Cai. [Paper, Code]
- Хан, Сайм и др. «Банг: приблизительный поиск ближайшего соседа в миллиардном масштабе с использованием одного графического процессора». Arxiv Preprint arxiv: 2401.11324 (2024).
- Ootomo, Hiroyuki, et al. «CAGRA: очень параллельная конструкция графика и приблизительный ближайший соседский поиск графических процессоров». Arxiv Preprint arxiv: 2308.15136 (2023).
- Огури, Ютаро и Юсуке Мацуи. «Теоретический и эмпирический анализ выбора адаптивной точки входа для приблизительного поиска ближайшего соседа на основе графиков». Arxiv Preprint arxiv: 2402.04713 (2024).
- Огури, Ютаро и Юсуке Мацуи. «Общий и практический метод настройки для готового индекса на основе графика: отчет SISAP Indexing Challenge от Team Utokyo». Международная конференция по поиску сходства и приложениям. CHAM: Springer Nature Switzerland, 2023.
- Wang, Mengzhao, et al. «Starling: индекс индекса графиков-графиков с вводом/выводом для рисунков для рисунков для высокомерного поиска сходства вектора в сегменте данных». Arxiv Preprint arxiv: 2401.02116 (2024). [Код]
- Manohar, Magdalen Dobson, et al. «Парлайанн: масштабируемые и детерминированные параллельные графические примерные алгоритмы поиска ближайших соседей». Материалы 29 -го годового симпозиума ACM Sigplan по принципам и практике параллельного программирования. 2024. [Код]
- Wang, Mengzhao, et al. «Эффективная и надежная структура для приблизительного поиска ближайшего соседа с ограничением атрибутов». Достижения в системах обработки нейронной информации 36 (2024).
- Ю, Шанди и др. «Пекан: параллельная эффективная кластеризация с приблизительным поиском ближайшего соседа на основе графиков». Arxiv Preprint arxiv: 2312.03940 (2023).
- Азизи, Илиас, Карима Эхиби и Тмис Палпанас. «ELPIS: Поиск сходства на основе графиков для масштабируемой науки данных». Материалы ВОЛДБ. 16.6 (2023): 1548-1559.
- Indyk, Piotr и Haike Xu. «Худшие результаты популярных приблизительных реализаций по поиску ближнего соседа: гарантии и ограничения». Достижения в системах обработки нейронной информации 36 (2024).
- Liu, Jun, et al. «Оптимизация приблизительного поиска ближайших соседей на основе графиков: сильнее и умнее». 2022 23 -я Международная конференция IEEE по управлению мобильными данными (MDM). IEEE, 2022.
- Ван, Хуэй, Юн Ван и Ван-Лей Чжао. «Примерный поиск NN на основе графика: пересмотр». Arxiv Preprint arxiv: 2204.00824 (2022).
- Peng, Zhen, et al. «Speed-Ann: низкая задержка и высокая токальность ближайшего соседа поиск через параллелизм внутриквета». Arxiv Preprint arxiv: 2201.13007 (2022).
- Lu, Kejing, et al. «HVS: иерархическая структура графика, основанная на диаграммах Voronoi для решения приблизительного поиска ближайшего соседа». Материалы ВОЛДБ. 15.2 (2021): 246-258. [Код]
- Ингфан, Лю, Ченг Хонг и Куй Цзянтао. «Пересмотр $ k $ -narest соседний график построения на высоких данных: эксперименты и анализы». Arxiv Preprint arxiv: 2112.02234 (2021).
- Чжу, Дантонг и Минджиа Чжан. «Понимание и обобщение графиков монотонной близости для приблизительного поиска ближайших соседей». Arxiv Preprint arxiv: 2107.13052 (2021).
- Gottesbüren, Lars, et al. «Разделение графика для крупномасштабного поиска ближайшего соседа». Arxiv Preprint arxiv: 2403.01797 (2024).
- Singh, Aditi, et al. «Freshdiskann: быстрый и точный графический индекс ANN для потокового поиска сходства». Arxiv Preprint arxiv: 2105.09613 (2021).
- Ван, Хуэй, Ван-Лей Чжао и Сянксиан Зенг. «Крупномасштабная приблизительная конструкция графика K-NN на графическом процессоре». Arxiv Preprint arxiv: 2103.15386 (2021).
- Patel, Liana, et al. «Acorn: Performant и предикат-агростический поиск по векторным встрокам и структурированным данным». Arxiv Preprint arxiv: 2403.04871 (2024).
- Zuo, Chaoji, et al. «SERF: график сегмента для приблизительного поиска ближайшего соседства». Материалы ACM по управлению данными 2.1 (2024): 1-26.
- Hezel, Nico, et al. «График разведки с непрерывным уточнением для эффективного извлечения мультимедиа». Материалы Международной конференции по мультимедиа 2024 года. 2024.
- Xiao, Wonao, et al. «Улучшение индекса HNSW для обновлений в реальном времени: адресация недоступных очков и деградации производительности». Arxiv Preprint arxiv: 2407.07871 (2024).
- Ян, Шуо и др. «Пересмотр индекса конструкции близости на основе графика приблизительного графика. Arxiv Preprint arxiv: 2410.01231 (2024).
- Gou, Yutong, et al. «SymphonyQG: к симфонической интеграции квантования и графика для приблизительного поиска ближайшего соседа». Arxiv Preprint arxiv: 2411.12229 (2024).
- Ян, Мин, Южэнг Кай и Вейгуо Чжэн. «CSPG: пересечение скудных графиков близости для приблизительного поиска ближайших соседей». Тридцать восьмая ежегодная конференция по системам обработки нейронной информации.
«Методы на основе деревьев»
- Jayaram Subramanya, Suhas, et al. «Дисконн: быстрый точный миллиард точек ближайшего соседа поиска на одном узле». Достижения в системах обработки нейронной информации 32 (2019). [Код]
- Ли, Хайтао и др. «Построение индекса на основе деревьев для эффективного и эффективного плотного поиска». Arxiv Preprint arxiv: 2304.11943 (2023).
- Энгельс, Джошуа и др. «Приблизительный поиск ближайшего соседа с оконными фильтрами». Arxiv Preprint arxiv: 2402.00943 (2024).
- Song, Yang, et al. «Обладает: эффективный высокоразмерный C-приблизительный максимальный поиск внутреннего продукта с легким индексом». 2021 IEEE 37 -я Международная конференция по технике данных (ICDE). IEEE, 2021.
- Zhu, Yifan, et al. «GTS: индекс дерева на основе графического процессора для быстрого поиска сходства». Arxiv Preprint arxiv: 2404.00966 (2024).
- Tatsuno, Kento, et al. «AISAQ: All-in-horage ANNS с квантованием продукта для получения бесплатной информации». Arxiv Preprint arxiv: 2404.06004 (2024).
Хешинг
- Потрясающие статьи по обучению хеши
- Опрос по обучению в хэш. Ван, Цзиндон, Тинг Чжан, Ниту Себе и Хенг Тао Шен [бумага]
- Опрос о методах глубокого хеширования. Ло, Сяо, Хайсин Ван, Дацинг Ву, Чонг Чен, Мингхуа Дэн, Цзяньцен Хуан и Сянь-Шенг Хуа. [Бумага]
- Итеративное квантование: прокрустовый подход к изучению бинарных кодов для крупномасштабного поиска изображений. Gong, Yunchao, Svetlana Lazebnik, Albert Gordo и Florent Perronnin [Paper, Python Code, Matlab Code]
- Gan, Yukang, et al. «Бинарное встроенное поиск в Tencent». Arxiv Preprint arxiv: 2302.08714 (2023).
- Ян, Скальни и др. «Бинарный код на основе хэш-встраивания для приложений для веб-масштаба». Материалы 30 -й Международной конференции ACM по управлению информацией и знаниями. 2021.
- Вэн, Чжени и Юшенг Чжу. «Неконтролируемое онлайн-хешинг с многобиточным квантованием». Труды Азиатской конференции по компьютерному видению. 2022.
- Хуанг, Цянь, Йифан Лей и Энтони Кх Тунг. «Поиск ближайшего соседа с точкой до гиперпланы за пределами гиперсфере подразделения». Материалы Международной конференции по управлению данными 2021 года. 2021.
- Вэн, Чжени, Юшенг Чжу и Руисин Лю. «Быстрый поиск на двоичных кодах по взвешенным расстоянию Хэмминга». Arxiv Preprint arxiv: 2009.08591 (2020).
- Jian, Xiazheng, et al. «Быстрый поиск сходства с косинусом Top-K через бинарную квантизация, подходящую для XOR на графических процессорах». Arxiv Preprint arxiv: 2008.02002 (2020).
- Zheng, Bolong, et al. «PM-LSH: быстрая и точная платформа LSH для высокомерного приблизительного поиска NN». Материалы ВОЛДБ. 13.5 (2020): 643-655.
- Eghbali, Sepehr. «Масштабируемый поиск ближайшего соседа с компактными кодами». (2019).
- Lei, Yifan, et al. «Чувствительная к местности схема хэширования, основанная на самой длинной круговой совместной промышленности». Материалы Международной конференции ACM SIGMOD ACM SIGMOD по управлению данными. 2020.
- Wei, Jiuqi, et al. «Det-Lsh: чувствительная к местности схема хэширования с динамичным деревом кодирования для приблизительного поиска ближайшего соседа». Arxiv Preprint arxiv: 2406.10938 (2024).
Другие подходы
- Chen, Qi, et al. «Spann: высокоэффективный примерный в миллиардном поиске соседей». Arxiv Preprint arxiv: 2111.08566 (2021). [Код]
- Li, Yuliang, et al. «На основе индекса, высокомерный, косинус-пороговый запрос с гарантиями оптимальности». Теория вычислительных систем 65 (2021): 42-83.
- Chen, Yewang, et al. «Полу-конструктивное дерево корпуса: быстрое ближайшее соседское запросы для крупномасштабных данных о графических процессорах». Международная конференция IEEE 2018 года по добыче данных (ICDM). IEEE, 2018.
- Энгельс, Джошуа, Бенджамин Коулман и Аншумали Шривастава. «Практично поиск соседей по групповым тестированию». Достижения в системах обработки нейронной информации 34 (2021): 9950-9962. [Добавка]
- Gong, Long, et al. «IDEC: индексируемые коды оценки расстояний для приблизительного поиска ближайшего соседа». Материалы ВОЛДБ Фонда 13.9 (2020).
- Lu, Kejing, et al. «VHP: приблизительный поиск ближайшего соседа с помощью виртуального распределения гиперсферы». Материалы ВОЛДБ. 13.9 (2020): 1443-1455.
- Bing Tian, Haikun Liu, Yuhang Tang, Shihai Xiao, Zhuohui Duan, Xiaofei Liao, Xuecang Zhang, Junhua Zhu, Yu Zhang. «FusionAnns: эффективная архитектура совместной обработки процессора/графического процессора для приблизительного поиска ближайшего соседа в миллиардном масштабе». (2024).
- Chen, Zhonghan, et al. «Изучение значимости ближайшего соседского поиска в высоком пространстве». Arxiv Preprint arxiv: 2410.05752 (2024).
- Tepper, Mariano, et al. «GleanVec: ускоряющий поиск вектора с минималистским нелинейным уменьшением размерности». Arxiv Preprint arxiv: 2410.22347 (2024).
- Li, Jingyu, et al. «Panther: частный приблизительный поиск ближайшего соседа в одном сервере». Криптология eprint Archive (2024).
- Wei, Jiuqi, et al. «Столкновение подпространства: эффективная и точная структура для высокомерного приблизительного поиска ближайшего соседа». Arxiv Preprint arxiv: 2411.14754 (2024).
Система
- Цин, Ан и др. «Лабиринт: экономичная система видео дедупликации в веб-масштабе». Материалы 30 -й Международной конференции ACM по мультимедиа. 2022.
- Doshi, Ishita, et al. «Ланнс: приблизительная система ближайшего соседа в Интернете». Arxiv Preprint arxiv: 2010.09426 (2020).
- Chen, Yaoqi, et al. «OneSparse: унифицированная система для многоиндексного поиска вектора». Сопутствующие процессы ACM на веб -конференции 2024 г. 2024.
Другие
- Оптимизация поиска с повышением вероятности вероятности запросов и двухуровневым приблизительным поиском устройств Edge
- Гао, Цзяньян и Ченг Лонг. «Высокомерный приблизительный поиск ближайшего соседа: с надежными и эффективными операциями сравнения расстояний». Материалы ACM по управлению данными 1.2 (2023): 1-27.
- Приблизительный поиск ближайшего соседа в системах рекомендации. Юр Малков.
- Ускоряющий векторный поиск на графическом процессоре с Rapids Raft. Кори Ноле
- Gupta, Gaurav, et al. «Caps: практическое индекс разделения для фильтрации поиска сходства». Arxiv Preprint arxiv: 2308.15014 (2023).
- Чжу, Юхао. «Rtnn: ускорение поиска соседей с помощью аппаратного трассировки лучей». Материалы 27 -го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. 2022. [Код]
- Levi, Asaf, et al. «Физическая и логическая индексация с {Idea}: инвертированный {deduplication-aware} индекс». » 22 -я конференция USENIX по технологиям файлов и хранения (Fast 24). 2024. [Код]
- Карра, Дамиано и Джованни Бриллиа. «Возьмите двух птиц с одним кэшем K-NN». 2021 IEEE Global Communications Conference (Globecom). IEEE, 2021.
- Салем, Тарек С.И., Джованни Бриллиа и Дамиано Карра. «Сходство сходства восхождения с приблизительными индексами». IEEE/ACM Транзакции в сети (2022).
- Li, Conglong, et al. «Улучшение приблизительного поиска ближайших соседей посредством изученного адаптивного раннего прекращения». Материалы Международной конференции ACM SIGMOD ACM SIGMOD по управлению данными. 2020.
- Карппа, Матти, Мартин Аумуллер и Расмус Паг. «Deann: ускорение оценки плотности ядра с использованием приблизительного поиска ближайшего соседа». Международная конференция по искусственному интеллекту и статистике. PMLR, 2022.
- Wang, Zeyu, et al. «Операторы сравнения расстояния для приблизительного поиска ближайшего соседа: исследования и эталона». Arxiv Preprint arxiv: 2403.13491 (2024).
- Szilvasy, Gergely, Pierre-Emmanuel Mazaré и Matthijs Douze. «Векторный поиск с небольшими радиусами». Arxiv Preprint arxiv: 2403.10746 (2024).
- Хан, Чангун, Суджи Ким и парк Ха-Мюн. «Эффективный поиск близости в временных аккумуляционных данных с использованием многоуровневой индексации блока». (2024).
- Tepper, Mariano, et al. «LeanVec: Ищите свои векторы быстрее, делая их в форме». Arxiv Preprint arxiv: 2312.16335 (2023).
- Harwood, Ben, et al. «Примерный поиск ближайшего соседа в динамических наборах данных: расследование». Arxiv Preprint arxiv: 2404.19284 (2024).
- Характеризация дилеммы производительности и размера индекса в поиске вектора миллиарда в биллиард.
- Сюй, Хайк. Худшее производительность популярных приближений ближайшего соседа реализации поиска: гарантии и ограничения. Дисс. Массачусетский технологический институт, 2024.
- Лин, Джимми. «Оперативные советы для плотных и редких ретриверов: HNSW, плоские или перевернутые индексы?». Arxiv Preprint arxiv: 2409.06464 (2024).
- Чжоу, Мингксун, Элейн Ши и Джулия Фанти. «Пакманн: эффективный частный приблизительный поиск ближайшего соседа». Криптология eprint Archive (2024).
? Оценка и метрики
- Какой BM25 вы имеете в виду? Крупномасштабное исследование воспроизводимости вариантов оценки. Кампхуис, Крис, Арджен П. де Врис, Леонид Бойтсов и Джимми Лин [бумага]
? Статьи и разговоры
- Что такое векторная база данных?
- Векторные базы данных (часть 1): Что отличает каждого из них?
- Ebay's Blazly Bast Million-Scale Vector Sake Engine
- Computer Vision Meetup: приложения Computer Vision в масштабе с векторными базами данных
- Как выбрать векторную базу данных в 2023 году?
- Нам действительно нужна специализированная векторная база данных?
- Векторная база данных не является отдельной категорией базы данных
- Векторные базы данных: подход из первых принципов
- Учебное пособие по версии поиска в вектор - объедините свои данные с LLM с расширенным поиском
- Эффективный поиск сходства вектора в рабочих процессах рекомендации с использованием Milvus с Nvidia Merlin
- Векторные базы данных: руководство для начинающих!
- Векторная база данных и пружина IA
- Как обрабатывать миллион векторных встроений в тряпные приложения
- Как Meilisearch обновляет базу данных векторных векторов за минуту за минуту
- Общие ловушки, которых следует избегать при использовании векторных баз данных
- Начало работы с векторными базами данных
- Выбор лучшей модели для семантического поиска
Связанные списки
- Потрясающая векторная поисковая система