nnv -Download - nnv -Quellcode -Download

nnv

Anderer Quellcode

1.0.0

Herunterladen

NNV (No-Named.V)

Logo

NNV (No-Named.V) ist eine Datenbank, die von Grund auf Produktion implementiert werden soll. NNV kann in Kantenumgebungen eingesetzt und in kleinen Produktionsumgebungen verwendet werden. Durch den nachstehend beschriebenen innovativen architektonischen Ansatz ist er vorgesehen und entwickelt, um auch in großflächigen Produktionsumgebungen zuverlässig eingesetzt zu werden.

? Release -Update - 2024.12.09

Weitere Informationen finden Sie in Update History.

Wir planen, CFLAT zu unterstützen, was verschiedene Dienste durch komplexere Operationen erleichtern kann, die Multi-Vektor-Suchvorgänge ermöglichen. CFLAT ist nur ein Name, den ich geprägt habe. Bitte beachten Sie!

? NNV-Edge

Geplante Arbeiten zur Verbesserung der Kantenleistung : Während der aktuellen Kernentwicklung haben wir sehr schnelle Schreib- und Lesen von Operationen durch Sharding -Methoden erreicht. Wir planen, diese Sharding -Logik am Rande hinzuzufügen, um Geschwindigkeitsverbesserungen am Rand zu erwarten und vorhandene Leistungsverbesserungen zu beheben.

? Nnv

HNSW -Test abgeschlossen : Bei der Suche nach 1 Million Vektoren wurden 0,87 Millisekunden erreicht. Es sind 0,87 Millisekunden, nicht Sekunden (zweiter ist 0,00087 Sekunden). Dies ist eine sehr erfreuliche Leistung.
Fortschritte bei PQ und BQ : Die kontinuierliche Überprüfung von PQ und BQ ist im Gange.
Integration der vorhandenen Quantisierung : Planung, mit der Quantisierungsintegration fortzufahren (Berichtsarbeit wird aufgrund einer starken Arbeitsbelastung verzögert.

Vorschau aktualisieren

Euen Das erwartete Veröffentlichungsdatum ist TBD. Die Entwicklung wird fortgesetzt und Updates werden im Fortschritt hinzugefügt. (Es ist langsam, weil ich in meiner Freizeit außerhalb der Arbeit arbeite.) ?

? Geplante Funktionen und Verbesserungen

NNV-Edge

Verbessertes Protokollieren : Eine detaillierte Protokollierung wird hinzugefügt, um eine bessere Rückverfolgbarkeit und Debuggierung zu erzielen.
Edge-basierte Projektintegration : Die laufenden Arbeiten mit Edge-basierten Projekten werden fortgesetzt, mit Verbesserungen auf der Grundlage von Fortschritten und Feedback.

Nnv

Kompatibilität der Kosinusähnlichkeit : PQ (Produktquantisierung) arbeitet hauptsächlich mit euklidischer Entfernung. Bei der Ähnlichkeit der Kosinus ist jedoch die Vektor -Normalisierungslogik erforderlich. (Normalisierte Vektoren für die euklidische Entfernungsrendite ähnlich der Ähnlichkeit mit Cosinus.)
RPC -Setup für HNSW : RPC -Funktionalität für HNSW ist geplant, um die Remote -Nutzung zu erleichtern.
Speicherverbesserungen : Ein schneller Speicher und ein zuverlässiger Speicher auf Diskorten werden eingeführt.
Backup für das System im Leerlaufzustand : Ein automatischer Sicherungsprozess wird hinzugefügt, um Daten in Leerlaufzuständen regelmäßig zu speichern.
Automatische Wiederherstellung : Eine Funktion für die automatische Wiederherstellung wird implementiert.
Fortgeschrittene Filterung : Die Unterstützung für Ausdrücke und verschiedene Bereichssuche wird in die Filterfunktionalität aufgenommen.
Performance -Benchmarking : Nach dem Stabilisieren des Systems wird ein umfassendes Benchmarking durchgeführt.
Lastausgleich : Ein Lastausgleich wird nach der Stabilisierung entwickelt, um die Systemlast effektiv zu verwalten.

Euen Wichtige Bekanntmachung

Die Leistung kann aufgrund einer laufenden Entwicklung vorübergehend reduziert werden. Vielen Dank für Ihre Geduld!

Aus dem Quellcode laufen.

Windows & Linux
git clone https://github.com/sjy-dv/nnv
cd nnv
# start edge
go run cmd/root/main.go -mode=edge
# start core
go run cmd/root/main.go -mode=root


MacOS
** The CPU acceleration (SSE, AVX2, AVX-512) code has caused an error where it does not function on Mac, and it is not a priority to address at this time. **

git clone https://github.com/sjy-dv/nnv
cd nnv
source .env
deploy
make edge-docker

Index

Merkmale
ARCHITEKTUR
- LoadBalancer & DataBaseInteGeGation
- Internaldatasharddesign
- Internaldataflow
- Multi-Vektor-Suche
- Wann wird CFLAT verwendet?
- Rand
Bugfix

Merkmale

Bei der Planung dieses Projekts habe ich mir viel darüber nachgedacht.

Bei der Einrichtung der Cluster -Umgebung ist es für die meisten Entwickler natürlich, den Raft -Algorithmus zu wählen, wie ich es immer zuvor getan habe. Der Grund dafür ist, dass es sich um einen bewährten Ansatz handelt, der von erfolgreichen Projekten verwendet wird.

Ich habe mich jedoch gefragt: Ist es nicht ein bisschen komplex? RAFT erhöht die Verfügbarkeit von Lesen, verringert jedoch die Verfügbarkeit der Schreibweise. Wie würde ich das lösen, wenn Multi-Write auf lange Sicht notwendig wird?

Angesichts der Art der Vektordatenbanken nahm ich an, dass die meisten Dienste eher auf Batch-Jobs als in Echtzeit schreiben würden. Aber bedeutet das, dass ich einfach überspringen kann, um das Problem anzugehen? Ich habe das nicht gedacht. Der Bau eines Multi-Leader-Setups auf Floß mit etwas wie Klatsch war jedoch äußerst komplex und schwierig.

Daher erwähne ich bis heute (2024-10-20) zwei architektonische Ansätze.

ARCHITEKTUR

Die Architektur ist in zwei Ansätze unterteilt.

LoadBalancer & Datenbankintegration

Zunächst wird vorne ein Lastausgleich platziert, wodurch sowohl die Sharding als auch die Integration der Daten unterstützt werden. Die interne Datenbank existiert in einem reinen Zustand.


Replik lb	Shard lb

Der Replikations -Last -Balancer wartet darauf, dass alle Datenbanken geschriebene Schreibvorgänge erfolgreich abschließen, bevor er sich verpflichtet oder zurückrollt, während der Shard -Last -Balancer die Last gleichmäßig über die Shard -Datenbanken verteilt, um ähnliche Speicherkapazitäten zu gewährleisten.

Der Hauptunterschied besteht darin, dass die Replikation Schreibvorgänge verlangsamen kann, aber im Vergleich zum Shard -Last -Balancer eine schnellere Leseleistung im Medium bis langfristig liefert. Andererseits bietet der Shard -Ansatz schnellere Schreibgeschwindigkeiten, da er nur zu einem bestimmten Shard verpflichtet ist. Das Lesen erfordert jedoch das Sammeln von Daten aus allen Scherben, was anfangs langsamer ist, aber schneller werden kann als die Replikation, wenn der Datensatz wächst.

Für die Verwaltung großer Datenmengen ist der Shard Balancer daher etwas mehr empfohlen. Der Hauptpunkt beider Architekturen ist jedoch ihre Einfachheit in der Einrichtung und des Managements, sodass sie als typischer Backend -Server so einfach zu handhaben. Arch1_struktur

Jetstream (NATS) Multi-Leader

Arch4

Der zweite Ansatz verwendet Jetstream für die Konfiguration.

Während dies architektonisch einfacher ist als der vorherige Ansatz, unterscheidet sich das Setup aus Sicht des Benutzers nicht wesentlich von Raft.

Der wichtigste Unterschied besteht jedoch darin, dass es im Gegensatz zu Raft mehrschreiber und mehrschichtige Konfigurationen anstelle von Einzelschreiber und Mehrfachlesen unterstützt.

In diesem Ansatz ist die Datenbank in einem Replikationsformat konfiguriert, und Jetstream wird verwendet, um Multi-Leader-Konfigurationen zu ermöglichen.

Arch5 Jede Datenbank enthält ihren eigenen Jetstream, und diese Jetstreams beitreten derselben Gruppe von Themen und Clustern. In diesem Fall, wenn alle Knoten versuchen, Änderungen in einer Zeile zu veröffentlichen, gehen sie durch denselben Jetstream. Wenn zwei Knoten versuchen, dieselben Daten parallel zu ändern, konkurrieren sie um ihre Änderungen. Es ist zwar möglich, zu verhindern, dass Änderungen vermehrt werden, dies könnte zu einem Datenverlust führen. Nach der Raft -Quorum -Einschränkung in Jetstream kann nur ein Schriftsteller die Änderung veröffentlichen. Daher haben wir das System so gestaltet, dass der letzte Schriftsteller gewinnen kann. Dies ist kein Problem für Vektordatenbanken, da die Datenstruktur im Vergleich zu herkömmlichen Datenbanken einfacher ist (dies bedeutet nicht, dass das System selbst einfach ist, sondern dass es weniger komplexe Transaktionen und Verfahren gibt, wie z. B. Serialisierung der Transaktion). Dies vermeidet auch globale Schlösser und Leistungs Engpässe.

Zusammenfassung

Zusammenfassung:

Floß- und Quorum -Einschränkungen
RAFT ist ein Algorithmus, der vorschreibt, welchen Server zuerst Daten schreibt. In RAFT bezieht sich das Konzept eines Quorums auf die Mindestanzahl der Server, die zur Bestätigung von Daten erforderlich sind, bevor sie geschrieben wurden. Dies stellt sicher, dass auch wenn zwei Server versuchen, gleichzeitig Daten zu schreiben, RAFT ermöglicht nur mit einem Server, zuerst zu schreiben.
Der letzte Schriftsteller gewinnt
Auch wenn ein Server zuerst Daten schreibt, ist der Server, der schreibt, letztendlich "gewinnt". Dies bedeutet, dass die Daten vom zuletzt zu schreibenen Server die Daten des vorherigen Servers überschreiben.
Transaktionserialisierung Bedenken
Die Transaktionsserialisierung bezieht sich darauf, sicherzustellen, dass konsistente Aktionen über mehrere Tabellen hinweg auftreten. In NNV wird zur Verbesserung der Leistung das globale Sperren (das Sperren aller Server vor dem Schreiben von Daten) vermieden wird. Wenn mehrere Server die Daten gleichzeitig ändern, wird der letzte, der sie ändern, gewinnt. Dieser Ansatz ist machbar, da Vektordatenbanken einfacher sind als herkömmliche Datenbanken - sie erfordern keine komplexe Transaktionsserialisierung über mehrere Tabellen oder Sammlungen hinweg.
Warum dieses Design?
Der Hauptgrund ist die Leistung. Es ist sicher, alle Server vor dem Verarbeiten von Daten zu sperren, aber langsam. Stattdessen ist es schneller und effizienter.

Alte Architektur (~ 2024.12.09)

Alte Architektur anzeigen

Sharding -Design für interne Daten

Arch10 In der Regel greifen Systeme wie Datenbanken auf denselben Speicher oder die gleiche Festplatte zu und führen wiederholt Lese- und Schreibvorgänge durch. In diesem Prozess können Methoden wie HNSW effiziente zeitliche Komplexität wie O (log n) erreichen. Techniken, die Genauigkeit wie flach und cflat erfordern, führen jedoch im Allgemeinen lineare Suchvorgänge mit einer zeitlichen Komplexität von O (n) durch.

Das Problem tritt bei der Vermeidung von Datenkonflikten auf. Beim Lesen oder Schreiben isolieren Themen wie Goroutines die jeweiligen Ressourcen durch Schlösser. Speziell:

Lesen : Der Zugang zu gesperrten Ressourcen ist gestattet.
Schreiben : Der Zugriff auf gesperrte Ressourcen ist eingeschränkt und verhindert Lesevorgänge während des Schreibvorgangs. Beim Einsetzen großer Datenmengen oder zur Bearbeitung zahlreicher Leseanfragen, die ein Schreiben erfordern, entstehen allmählich Leistungs Engpässe.

Um dies zu beheben, haben wir das System so gestaltet, dass wir effizient Scharden im Speicher erstellen und jedem Shard Daten zuweisen, ohne die Essenz des Systems zu verlieren. Jeder Shard verfügt über einen Verriegelungsmechanismus, der es ermöglicht:

Schnellere Sperrfreigabe : Beim Einsetzen großer Datenmengen oder der Durchführung von Lesevorgängen. Partitionierte Dateninsertion : Erleichterung der reibungslosen Systemvorgänge, indem Daten in geteilte Segmente eingefügt werden können. Dieses Design stellt sicher, dass das System auch unter schweren Dateneinfügungen oder hohen Szenarien für Anforderungen nahtlos arbeiten kann, wodurch die Leistungs Engpässe gemindert werden.

Interner Datenfluss

Arch111

HNSW (hierarchische schiffbare kleine Welt):

Graphspeicher : Das Erstellen des Diagramms jedes Mal ist ineffizient. Daher wird die Grafik in einem binären Format leicht gespeichert.
Daten Redundanz : Gleichzeitig im internen Schlüsselwert (KV) gespeichert, um einen abnormalen Datenverlust zu verhindern.
Festplattennutzung : Dieser Ansatz führt jedoch zu einer relativ hohen Disk -Nutzung, was es zu einer Option macht, die Benutzer langfristig wählen.

Flach/cflat (zusammengesetzter flach):

Datensuche : Da die Datensuche von Natur aus linear ist, wird sie nicht separat gespeichert.
Datenhandhabung : Erstellt mit einer Methode, bei der Daten im KV -Speicher gespeichert und dann in den Speicher hochgeladen werden.

CFLAT (Composite Flat): Multi-Vektor-Suche

CFLAT (Composite Flat) ist eine Indizierungsmethode, die mehrere Vektoren durchsucht und zusammengesetzte Ergebnisse basierend auf der Bedeutung von zwei Vektoren erzeugt.

Die Anwendung der zusammengesetzten Vektorsuche auf Graph -Algorithmen wie HNSW ist eine Herausforderung, da sie eine erhebliche Menge an Speicher erfordert und nicht gut mit Nachbarschaftsstrukturen übereinstimmt, was mehrere Grafiken erfordert. Obwohl die Zeitkomplexität für die Suche immer noch zu O (2 log n) ≈ O (log n) konvergiert, ist die Raumkomplexität erheblich schlecht.

Diese Probleme werden mit zunehmendem Datenmengen immer problematischer. Darüber hinaus ignoriert die Verschmelzung und Bewertung auf der Grundlage von zusammengesetzten Schlüssel innerhalb der Graph -Struktur TOPK und erhöht die Haufengröße für eine einzelne Suche signifikant.

Daher haben wir uns für die Verarbeitung auf der Basis von Flat entschieden. Obwohl die zeitliche Komplexität O (n) ist (ohne konstante Tropfen), bleibt die Raumkomplexität die gleiche wie flach und ist hochwirksam für das Zusammenführen und Bewertung auf der Grundlage von Verbundtasten.

Wann wird CFLAT verwendet?

MAGINE Wir entwickeln einen Dienst für ein Matchmaking -Unternehmen, das Benutzern hilft, ihre idealen Partner auf der Grundlage von Input -Kriterien zu finden. Wir werden verschiedene Faktoren wie Persönlichkeit und andere Attribute in Betracht ziehen. Die Verwendung eines einzelnen Vektors bedeutet jedoch, diese Faktoren zu einem Satz für die Suche zu kombinieren, was die Wahrscheinlichkeit einer Genauigkeitsverzerrung erheblich erhöht.

Zum Beispiel: Arch12 Wünschte Merkmale: {Persönlichkeit: Entschlossen, idealer Typ: groß und schlank} In diesem Szenario bevorzugt der Benutzer ein Persönlichkeitsmerkmal, der den idealen Typ macht, der sie wahrscheinlich schätzt und sich darauf konzentriert, einen Partner basierend auf externen Attributen zu finden.

Betrachten Sie jedoch einen anderen Fall:

Wünschte Merkmale: {Persönlichkeit: Locker, idealer Typ: Entscheidend} Hier kann jemand, der eine lockere Persönlichkeit mit einem entscheidenden Ideal -Typ gepaart hat, zu falschen Übereinstimmungen führen, z.

Arch13 In solchen Fällen berechnet CFLAT (Composite Flat) die Bewertungen, indem die Ähnlichkeit der Persönlichkeit und die Ähnlichkeit des idealen Typs gemeinsam bewertet wird. Benutzer können jedem Attribut Bedeutung zuweisen, sodass die Aspekte mit größerer Ähnlichkeit auf der Grundlage benutzerdefinierter Prioritäten höhere Ergebnisse vergeben können.

Was ist NNV-Edge?

Edge bezieht sich auf die Fähigkeit, Daten auf nahe gelegenen Geräten ohne Kommunikation mit einem zentralen Server zu übertragen und zu empfangen. In der Praxis kann "Edge" in der Software jedoch manchmal von diesem Konzept abweichen, da es häufig in leichteren, ressourcenbezogenen Umgebungen im Vergleich zu einem zentralen Server eingesetzt wird.

NNV-Edge ist so konzipiert, dass sie in leichten Weise in kleineren Vektor-Datensätzen (bis zu 1 Million Vektoren) schnell betrieben werden und automatisierte Aufgaben vom ursprünglichen NNV zurück an den Benutzer übertragen werden, um eine größere Kontrolle zu erhalten.

Erweiterte Algorithmen wie HNSW, Faiss und Ärger sind ausgezeichnet, aber glauben Sie nicht, dass sie für kleinere Spezifikationen etwas schwer sind? Und wenn sie Algorithmen beiseite lassen, während Projekte wie Milvus, Weaviate und Qdrant von brillanten Köpfen aufgebaut werden, sind sie nicht zu ressourcenintensiv, um neben anderen Software auf kleinen, tragbaren Geräten zu laufen? Arch9 Hier kommt NNV-Edge ins Spiel.

Was ist, wenn Sie mehrere Kanten verteilen? Durch die Verwendung von NNV-Edge mit dem zuvor erwähnten Last-Balancer können Sie ein erweitertes Setup erstellen, das Daten an mehreren Kanten über mehrere Kanten leitet und es nahtlos aggregiert!

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-05-28
Größe 15.34MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

nnv

NNV (No-Named.V)

? Release -Update - 2024.12.09

? NNV-Edge

? Nnv

Vorschau aktualisieren

? Geplante Funktionen und Verbesserungen

NNV-Edge

Nnv

Euen Wichtige Bekanntmachung

Aus dem Quellcode laufen.

Index

Merkmale

ARCHITEKTUR

LoadBalancer & Datenbankintegration

Jetstream (NATS) Multi-Leader

Zusammenfassung:

Alte Architektur (~ 2024.12.09)

Sharding -Design für interne Daten

Interner Datenfluss

CFLAT (Composite Flat): Multi-Vektor-Suche

Wann wird CFLAT verwendet?

Was ist NNV-Edge?

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express