nnv скачать - загрузка исходного кода nnv

nnv

Другой исходный код

1.0.0

Скачать

Nnv (no-named.v)

логотип

NNV (no-named.v)-это база данных, предназначенная для реализации с нуля к производству. NNV может быть развернут в Edge Environments и используется в небольших настройках производства. Благодаря инновационному архитектурному подходу, описанному ниже, он предполагается и разработан для надежного использования и в крупномасштабных производственных средах.

? Обновление релиза - 2024.12.09

Для полной истории обновления см. Историю обновления.

Мы планируем поддержать CFLAT, который может облегчить различные услуги благодаря более сложным операциям, которые позволяют поиск многоклереров. CFLAT - это просто имя, которое я придумал. Пожалуйста, примите к сведению!

? Nnv-edge

Запланированная работа по повышению производительности края : во время текущей основной разработки мы достигли очень быстрого написания и чтения операций с помощью методов шардинга. Мы планируем добавить эту логику шардинга в край, чтобы ожидать улучшения скорости на краю и учесть существующие повышения производительности.

? ННВ

Тест HNSW завершен : достиг 0,87 миллисекунд при поиске 1 миллиона векторов. Это 0,87 миллисекунд, а не секунд (второе - 0,00087 секунд). Это очень приятное достижение.
Прогресс в PQ и BQ : непрерывный обзор PQ и BQ продолжается.
Интеграция существующего квантования : планирование продолжить интеграцию квантования (работа отчета задерживается из -за тяжелой рабочей нагрузки.?)

Обновление предварительного просмотра

️ Ожидаемая дата выпуска - TBD. Развитие продолжается, и обновления будут добавлены по мере продвижения. (Это медленно, потому что я работаю в свободное время за пределами работы.) ?

? Запланированные функции и улучшения

Nnv-edge

Усовершенствованные журналы : будет добавлена подробная регистрация для лучшей отслеживаемости и отладки.
Интеграция проекта на основе Edge : постоянная работа с проектами на основе Edge будет продолжена, с улучшениями, основанными на прогрессе и обратной связи.

ННВ

Совместимость сходства косинуса : PQ (квантование продукта) работает в основном с евклидовым расстоянием. Однако при сходстве косинуса требуется логика нормализации вектора. (Нормализованные векторы для производительности европейского расстояния, аналогичные сходству косинуса.)
Настройка RPC для HNSW : RPC Funcation для HNSW планируется облегчить удаленное использование.
Усовершенствования хранения : будет введено быстрое хранилище в памяти и надежное хранение на основе дисков.
Системное резервное копирование в системе : автоматический процесс резервного копирования будет добавлен для периодического сохранения данных во время состояний холостого хода.
Автоматическое восстановление : будет реализована функция для автоматического восстановления.
Усовершенствованная фильтрация : поддержка выражений и различных поисков диапазона будет включена в функциональность фильтра.
Производительность производительности : Комплексное сравнительный анализ будет проводиться после стабилизации системы.
Балансировщик нагрузки : балансировщик нагрузки будет разработан после стабилизации для эффективной управления системной нагрузкой.

️ Важное уведомление

Производительность может быть временно снижена из -за постоянной разработки. Спасибо за терпение!

Запустите из исходного кода.

Windows & Linux
git clone https://github.com/sjy-dv/nnv
cd nnv
# start edge
go run cmd/root/main.go -mode=edge
# start core
go run cmd/root/main.go -mode=root


MacOS
** The CPU acceleration (SSE, AVX2, AVX-512) code has caused an error where it does not function on Mac, and it is not a priority to address at this time. **

git clone https://github.com/sjy-dv/nnv
cd nnv
source .env
deploy
make edge-docker

Индекс

Функции
АРХИТЕКТУРА
- LoadBalancer & DatabaseIntegration
- Internaldatasharddesign
- Internaldataflow
- Много векторный поиск
- Когда используется CFLAT?
- Край
Bugfix

Функции

Планируя этот проект, я много думал.

При настройке кластерной среды для большинства разработчиков естественно выбирать алгоритм плота, как я всегда делал раньше. Причина в том, что это проверенный подход, используемый успешными проектами.

Тем не менее, я начал задаваться вопросом: разве это не сложно? Рэт увеличивает доступность чтения, но снижает доступность записи. Итак, как бы я решил это, если в долгосрочной перспективе станет необходимым мультипит?

Учитывая природу векторных баз данных, я предположил, что большинство услуг будут структурированы на партийных рабочих местах, а не в письменной форме в реальном времени. Но значит ли это, что я могу просто пропустить решение проблемы? Я так не думал. Тем не менее, создание многолудочной установки поверх плота, используя что-то вроде сплетен, было чрезвычайно сложным и трудным.

Поэтому на сегодняшний день (2024-10-20) я рассматриваю два архитектурных подхода.

АРХИТЕКТУРА

Архитектура разделена на два подхода.

Интеграция LoadBalancer и базы данных

Во -первых, спереди расположен балансировщиком нагрузки, поддерживая как шардинг, так и интеграцию данных. Внутренняя база данных существует в чистом состоянии.


Реплика lb	Шард LB

Балансировщик нагрузки на репликацию ждет успешного завершения всех баз данных, прежде чем совершать или откатываться назад, в то время как балансировщик нагрузки на шард распределяет нагрузку равномерно по базам данных Shard, чтобы обеспечить аналогичные возможности хранения.

Ключевое отличие состоит в том, что репликация может замедлить операции записи, но обеспечивает более быструю производительность считывания в среднем и долгосрочной перспективе по сравнению с балансировщиком нагрузки Shard. С другой стороны, подход Shard предлагает более быстрые скорости записи, потому что он только поступает в определенный осколок, но чтение требует сбора данных от всех осколков, что изначально медленнее, но может стать быстрее, чем репликация по мере роста набора данных.

Следовательно, для управления большими объемами данных, балансировщик Shard немного более рекомендуется. Тем не менее, основной момент обеих архитектур является их простота в настройке и управлении, что делает их такими же простыми для обработки, как типичный бэкэнд -сервер. Arch1_structure

JetStream (NATS) Multi-Leader

архи4

Второй подход использует JetStream для конфигурации.

Хотя это архитектурно проще, чем предыдущий подход, с точки зрения пользователя, настройка существенно не отличается от плота.

Тем не менее, ключевое отличие состоит в том, что, в отличие от RAFT, он поддерживает мультипийные и многочисленные конфигурации, а не однопийную и многочисленную.

В этом подходе база данных настроена в формате репликации, а JetStream используется для включения конфигураций с несколькими лидерами.

арха5 Каждая база данных содержит свой собственный JetStream, и эти JetStreams присоединяются к одной и той же группе тем и кластеров. В этом случае, когда все узлы пытаются публиковать изменения в строке, они проходят через один и тот же JetStream. Если два узла попытаются изменить одни и те же данные параллельно, они будут конкурировать, чтобы опубликовать свои изменения. Хотя можно предотвратить распространение изменений, это может привести к потере данных. Согласно ограничению плота кворума в JetStream, только один писатель может опубликовать изменения. Поэтому мы спроектировали систему, чтобы позволить последнему писателю победить. Это не проблема для векторных баз данных, потому что, по сравнению с традиционными базами данных, структура данных проще (это не означает, что сама система проста, а скорее, что существует меньше сложных транзакций и процедур, таких как сериализация транзакций). Это также избегает глобальных замков и узких мест производительности.

краткое содержание

Краткое содержание:

Ограничения плота и кворума
RAFT - это алгоритм, который диктует, какой сервер сначала записывает данные. В RAFT концепция кворума относится к минимальному количеству серверов, необходимых для подтверждения данных до его написания. Это гарантирует, что даже если два сервера пытаются записать данные одновременно, RAFT позволяет сначала один сервер.
Последний писатель победит
Даже если один сервер сначала записывает данные, сервер, который в конечном итоге записывает в конечном итоге «выигрывает». Это означает, что данные с последнего сервера для записи будут перезаписать данные предыдущего сервера.
Стоализация транзакций
Сериализация транзакций относится к обеспечению того, чтобы последовательные действия происходили в нескольких таблицах. В NNV, чтобы повысить производительность, глобальная блокировка (блокировка всех серверов перед написанием данных) избегается. Вместо этого, когда несколько серверов изменяют данные одновременно, последний, который изменит его, победит. Этот подход осуществляется, потому что векторные базы данных проще, чем традиционные базы данных - они не требуют сложной сериализации транзакций по нескольким таблицам или коллекциям.
Почему этот дизайн?
Основной причиной является производительность. Заблокирование всех серверов перед обработкой данных безопасна, но медленная. Вместо этого, позволяя каждому серверу свободно изменять данные и принимать последнюю модификацию, поскольку конечный результат является быстрее и эффективнее.

Старая архитектура (~ 2024.12.09)

Посмотреть старую архитектуру

Дизайн шардинга для внутренних данных

архи10 Как правило, такие системы, как базы данных, получают одну и ту же память или диск, многократно выполняя операции чтения и записи. В этом процессе, такие методы, как HNSW, могут достигать эффективных временных сложностей, таких как O (log n) . Тем не менее, методы, которые требуют точности, таких как плоский и CFLAT, обычно выполняют линейные поиски со сложностью времени O (n) .

Проблема возникает при избегании спора данных. При чтении или написании, такие потоки, как Goroutines, изолируют соответствующие ресурсы через замки. Конкретно:

Чтение : доступ к запертым ресурсам разрешен.
Написание : доступ к запертым ресурсам ограничен, что предотвращает чтения во время операций записи. При вставке больших объемов данных или обработки многочисленных запросов чтения, которые требуют написания, постепенно появляются узкие места производительности.

Чтобы решить эту проблему, мы разработали систему для эффективного создания осколков в памяти и назначения данных каждому осколкам, не теряя сущность системы. Каждый осколок имеет механизм блокировки, который позволяет:

Более быстрый выпуск блокировки : при вставке больших объемов данных или выполнения операций чтения. Разделенная вставка данных : облегчение операций с плавными системами, позволяя вставить данные в разделенные сегменты. Этот дизайн гарантирует, что система может беспрепятственно работать даже при тяжелой вставке данных или сценариях запросов с высоким чтением, тем самым смягчая узкие места производительности.

Внутренний поток данных

арха11

HNSW (иерархический судоходный маленький мир):

Хранение графика : воссоздание графика каждый раз неэффективен; Следовательно, график хранится слегка в бинарном формате.
Избыточность данных : одновременно хранится во внутреннем хранилище ключевых значений (KV), чтобы предотвратить ненормальную потерю данных.
Использование диска : однако, этот подход приводит к относительно высокому использованию дисков, что делает его опцией, которую пользователи выберут в долгосрочной перспективе.

Flat/Cflat (составная плоская):

Поиск данных : Поскольку поиск данных по своей природе является линейным, он не хранится отдельно.
Обработка данных : создан с использованием метода, где данные хранятся в хранилище KV, а затем загружаются в память.

CFLAT (составная плоская): многоветающий поиск

CFLAT (Composite Flat) - это метод индексации, который ищет несколько векторов и дает составные результаты на основе важности двух векторов.

Применение композитного векторного поиска к алгоритмам графиков, таких как HNSW, является сложным, поскольку он требует значительного объема памяти и плохо соответствует структурам соседства, что требует нескольких графиков. Хотя сложность времени для поиска по -прежнему сходится к O (2 log n) ≈ o (log n), сложность пространства значительно плохая.

Эти проблемы становятся все более проблематичными по мере роста объема данных. Кроме того, метод слияния и оценки на основе композитных клавиш в структуре графика игнорирует Topk и значительно увеличивает размер кучи для одного поиска.

Поэтому мы решили обрабатывать на основе квартиры. Несмотря на то, что временная сложность составляет O (n) (без каких -либо постоянных капель), сложность пространства остается такой же, как плоская, и она очень эффективна для слияния и оценки на основе композитных ключей.

Когда используется CFLAT?

Magine Мы разрабатываем сервис для компании, которая помогает пользователям найти своих идеальных партнеров на основе критериев ввода. Мы будем рассматривать различные факторы, такие как личность и другие атрибуты. Однако использование одного вектора означает объединение этих факторов в одно предложение для поиска, что значительно увеличивает вероятность искажения точности.

Например: арха12 Желаемые черты: {Личность: решающий, идеальный тип: высокий и тонкий} В этом сценарии пользователь предпочитает личность, которая делает идеальный тип, который может оценить его, сосредоточившись на поиске партнера на основе внешних атрибутов.

Однако рассмотрим другой случай:

Желаемые черты: {Личность: легкий, идеальный тип: решающий} Здесь кто -то, кто хочет легкую личность, сочетающуюся с решающим идеальным типом, может привести к неправильным совпадениям, таким как совпадение с людьми, которые решают так, чтобы не соответствовать истинным предпочтениям пользователя.

арха13 В таких случаях CFLAT (Composite Flat) вычисляет оценки, совместно оценивая сходство в личности и сходство в идеальном типе. Пользователи могут назначать уровни важности каждому атрибуту, позволяя предоставлять более высокие оценки аспектам с большим сходством на основе определенных пользовательских приоритетов.

Что такое nnv-edge?

Edge относится к возможности передачи и получения данных на близлежащих устройствах без связи с центральным сервером. Однако на практике «Edge» в программном обеспечении иногда может отличаться от этой концепции, так как она часто используется в более легких, ограниченных ресурсных средах по сравнению с центральным сервером.

NNV-Edge предназначен для быстрого работы на наборах векторных данных меньшего масштаба (до 1 миллиона векторов) легким образом, передавая автоматические задачи из исходного NNV обратно пользователю для большего контроля.

Расширенные алгоритмы, такие как HNSW, Faiss и Any, превосходны, но вы не думаете, что они могут быть немного тяжелыми для более мелких характеристик? И отменить алгоритмы, в то время как такие проекты, как Milvus, Weaviate и Qdrant, создаются блестящими умами, разве они не слишком ресурсоемкие, чтобы работать вместе с другими программными средствами на небольших портативных устройствах? архи9 Вот где входит NNV-Edge.

Что если вы распределяете несколько краев? Используя NNV-Edge с ранее упомянутым балансировщиком нагрузки, вы можете создать расширенную настройку, которая раскрывает данные по нескольким ребрам и агрегирует ее плавно!

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-05-28
размер 15.34MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

nnv

Nnv (no-named.v)

? Обновление релиза - 2024.12.09

? Nnv-edge

? ННВ

Обновление предварительного просмотра

? Запланированные функции и улучшения

Nnv-edge

ННВ

️ Важное уведомление

Запустите из исходного кода.

Индекс

Функции

АРХИТЕКТУРА

Интеграция LoadBalancer и базы данных

JetStream (NATS) Multi-Leader

Краткое содержание:

Старая архитектура (~ 2024.12.09)

Дизайн шардинга для внутренних данных

Внутренний поток данных

CFLAT (составная плоская): многоветающий поиск

Когда используется CFLAT?

Что такое nnv-edge?

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express