Download de nnv - Download de código -fonte nnv

nnv

Outro código-fonte

1.0.0

Baixar

NNV (não-nomed.v)

logotipo

O NNV (não-named.v) é um banco de dados projetado para ser implementado do zero para a produção. O NNV pode ser implantado em ambientes de borda e usado em configurações de produção em pequena escala. Através da abordagem arquitetônica inovadora descrita abaixo, ela é prevista e desenvolvida para ser usada de maneira confiável em ambientes de produção em larga escala também.

? Atualização de lançamento - 2024.12.09

Para o histórico completo de atualização, consulte o histórico de atualização.

Planejamos apoiar o CFLAT, que pode facilitar vários serviços por meio de operações mais complexas que permitem pesquisas multi-vetoriais. CFLAT é apenas um nome que eu cunhei. Por favor, tome nota!

? Nnv-borda

Trabalho planejado para aprimorar o desempenho da borda : durante o atual desenvolvimento do núcleo, alcançamos operações de gravação e leitura muito rápidas por meio de métodos de sharding. Planejamos adicionar essa lógica de sharding à borda para esperar melhorias de velocidade na borda e abordar os aprimoramentos de desempenho existentes.

? Nnv

Teste de HNSW concluído : alcançado 0,87 milissegundos na pesquisa de 1 milhão de vetores. São 0,87 milissegundos, não segundos (segundo é 0,00087 segundos). Esta é uma conquista muito gratificante.
Progresso em PQ e BQ : A revisão contínua de PQ e BQ está em andamento.
Integração da quantização existente : planejando prosseguir com a integração de quantização (o trabalho do relatório é adiado devido a uma carga de trabalho pesada.)?)

Atualizar visualização

️ A data de lançamento esperada é TBD. O desenvolvimento está em andamento e as atualizações serão adicionadas à medida que avançamos (é lento porque eu trabalho no meu tempo livre fora do trabalho.) ?

? Recursos e melhorias planejadas

Nnv-borda

Montagem aprimorada : o registro detalhado será adicionado para uma melhor rastreabilidade e depuração.
Integração de projetos baseada em arestas : o trabalho contínuo com projetos baseados em borda continuará, com melhorias com base no progresso e feedback.

Nnv

Compatibilidade de similaridade de cosseno : PQ (quantização do produto) opera principalmente com a distância euclidiana. No entanto, com similaridade de cosseno, é necessária a lógica de normalização do vetor. (Vetores normalizados para o desempenho do rendimento da distância euclidiana semelhante à similaridade de cosseno.)
A configuração do RPC para HNSW : funcionalidade RPC para HNSW está planejada para facilitar o uso remoto.
Aprimoramentos de armazenamento : O armazenamento rápido na memória e o armazenamento baseado em disco confiável serão introduzidos.
Backup de estado ocioso do sistema : um processo de backup automático será adicionado para salvar periodicamente dados durante os estados ociosos.
Recuperação automática : um recurso para recuperação automática será implementada.
Filtragem avançada : o suporte para expressões e várias pesquisas de intervalo será incluído na funcionalidade do filtro.
Benchmarking de desempenho : o benchmarking abrangente será realizado quando o sistema se estabilizar.
Balanceador de carga : Um balanceador de carga será desenvolvido após a estabilização para gerenciar a carga do sistema de maneira eficaz.

️ Aviso importante

O desempenho pode ser temporariamente reduzido devido ao desenvolvimento contínuo. Obrigado pela sua paciência!

Fugir do código -fonte.

Windows & Linux
git clone https://github.com/sjy-dv/nnv
cd nnv
# start edge
go run cmd/root/main.go -mode=edge
# start core
go run cmd/root/main.go -mode=root


MacOS
** The CPU acceleration (SSE, AVX2, AVX-512) code has caused an error where it does not function on Mac, and it is not a priority to address at this time. **

git clone https://github.com/sjy-dv/nnv
cd nnv
source .env
deploy
make edge-docker

Índice

Características
ARQUITETURA
- LoadBalancer & DatabaseIntegation
- InternalDataShardDesign
- InternalDataflow
- Pesquisa multi-vetor
- Quando o cflat é usado?
- Borda
Bugfix

Características

Ao planejar este projeto, pensei muito.

Ao configurar o ambiente de cluster, é natural que a maioria dos desenvolvedores escolha o algoritmo da balsa, como eu sempre fiz antes. A razão é que é uma abordagem comprovada usada por projetos bem -sucedidos.

No entanto, comecei a me perguntar: não é um pouco complexo? A jangada aumenta a disponibilidade de leitura, mas diminui a disponibilidade de gravação. Então, como eu resolveria isso se o Multi-Write se tornar necessário a longo prazo?

Dada a natureza dos bancos de dados de vetores, presumi que a maioria dos serviços seria estruturada em torno de trabalhos em lotes, em vez de escrever em tempo real. Mas isso significa que eu posso simplesmente pular abordando o problema? Eu não pensei assim. No entanto, a criação de uma configuração com vários líderes no topo da balsa usando algo como fofocas parecia extremamente complexa e difícil.

Portanto, até hoje (2024-10-20), estou considerando duas abordagens arquitetônicas.

ARQUITETURA

A arquitetura é dividida em duas abordagens.

LoadBalancer e integração de banco de dados

Primeiro, um balanceador de carga é colocado na frente, apoiando o sharding e a integração dos dados. O banco de dados interno existe em um estado puro.


Réplica lb	Shard lb

O balanceador de carga de replicação aguarda que todos os bancos de dados concluam as gravações com êxito antes de se comprometer ou reverter, enquanto o balanceador de carga do Shard distribui a carga uniformemente nos bancos de dados do Shard para garantir capacidades de armazenamento semelhantes.

A principal diferença é que a replicação pode desacelerar as operações de gravação, mas fornece um desempenho de leitura mais rápido a médio a longo prazo em comparação com o balanceador de carga do Shard. Por outro lado, a abordagem do Shard oferece velocidades de gravação mais rápidas, porque só se compromete com um fragmento específico, mas a leitura requer a coleta de dados de todos os fragmentos, que são mais lentos inicialmente, mas podem se tornar mais rápidos que a replicação à medida que o conjunto de dados cresce.

Portanto, para gerenciar grandes volumes de dados, o balancer do Shard é um pouco mais recomendado. No entanto, o ponto principal de ambas as arquiteturas é sua simplicidade na configuração e gerenciamento, tornando -as fáceis de manusear como um servidor de back -end típico. Arch1_Structure

JetStream (Nats) Multi-líderes

Arch4

A segunda abordagem utiliza o JetStream para a configuração.

Embora isso seja arquitetonicamente mais simples que a abordagem anterior, da perspectiva do usuário, a configuração não é significativamente diferente da balsa.

No entanto, a principal diferença é que, diferentemente da RAFT, ele suporta configurações multi-escriv para leitura múltipla, em vez de uma gravação única e de leitura múltipla.

Nesta abordagem, o banco de dados é configurado em um formato de replicação, e o JetStream é usado para ativar as configurações de vários líderes.

Arch5 Cada banco de dados contém seu próprio JetStream, e esses JetsTreams se juntam ao mesmo grupo de tópicos e clusters. Nesse caso, sempre que todos os nós tentam publicar alterações em uma linha, eles passam pelo mesmo JetStream. Se dois nós tentarem modificar os mesmos dados em paralelo, eles competirão para publicar suas alterações. Embora seja possível impedir que as mudanças sejam propagadas, isso pode levar à perda de dados. De acordo com a restrição de quorum da balsa em JetStream, apenas um escritor pode publicar a mudança. Portanto, projetamos o sistema para permitir que o último escritor vence. Isso não é um problema para bancos de dados vetoriais porque, em comparação com os bancos de dados tradicionais, a estrutura de dados é mais simples (isso não implica que o sistema em si seja simples, mas sim que há menos transações e procedimentos complexos, como a serialização da transação). Isso também evita bloqueios globais e gargalos de desempenho.

resumo

Resumo:

Restrições de jangada e quorum
A jangada é um algoritmo que determina qual servidor grava dados primeiro. Na balsa, o conceito de um quorum refere -se ao número mínimo de servidores necessários para confirmar os dados antes de serem escritos. Isso garante que, mesmo que dois servidores tentem gravar dados simultaneamente, a RAFT permite que apenas um servidor escreva primeiro.
Último escritor vence
Mesmo se um servidor gravar dados primeiro, o servidor que grava pela última vez "vence". Isso significa que os dados do último servidor para gravar substituirão os dados do servidor anterior.
Preocupações de serialização da transação
A serialização da transação refere -se a garantir que ações consistentes ocorram em várias tabelas. Na NNV, para melhorar o desempenho, é evitado o bloqueio global (bloqueando todos os servidores antes de escrever dados). Em vez disso, quando vários servidores modificam os dados simultaneamente, o último a modificá -los ganhará. Essa abordagem é viável porque os bancos de dados de vetores são mais simples que os bancos de dados tradicionais - eles não exigem serialização complexa de transações em várias tabelas ou coleções.
Por que esse design?
O principal motivo é o desempenho. O bloqueio de todos os servidores antes do processamento de dados é seguro, mas lento. Em vez disso, permitir que cada servidor modifique livremente os dados e aceitar a última modificação, pois o resultado final é mais rápido e mais eficiente.

Arquitetura antiga (~ 2024.12.09)

Veja a arquitetura antiga

Design de sharding para dados internos

Arch10 Normalmente, sistemas como bancos de dados acessam a mesma memória ou disco, executando repetidamente operações de leitura e gravação. Nesse processo, métodos como o HNSW podem obter complexidades de tempo eficientes como O (log n) . No entanto, técnicas que requerem precisão, como plana e cflat, geralmente executam pesquisas lineares com uma complexidade de tempo de O (n) .

O problema surge ao evitar a contenção de dados. Ao ler ou escrever, tópicos como Goroutines isolam os respectivos recursos por meio de bloqueios. Especificamente:

Leitura : o acesso a recursos bloqueados é permitido.
Escrita : O acesso a recursos bloqueados é restrito, impedindo leituras durante as operações de gravação. Ao inserir grandes volumes de dados ou lidar com inúmeras solicitações de leitura que exigem escrita, os gargalos de desempenho emergem gradualmente.

Para resolver isso, projetamos o sistema para criar com eficiência fragmentos na memória e atribuir dados a cada shard sem perder a essência do sistema. Cada fragmento apresenta um mecanismo de travamento que permite:

Liberação mais rápida de bloqueio : ao inserir grandes quantidades de dados ou executar operações de leitura. Inserção de dados particionados : facilitando as operações suaves do sistema, permitindo que os dados sejam inseridos em segmentos divididos. Esse design garante que o sistema possa operar perfeitamente, mesmo sob inserção de dados pesados ou cenários de solicitação de alta leitura, atenuando assim os gargalos de desempenho.

Fluxo de dados interno

Arch11

HNSW (mundo pequeno hierárquico navegável):

Armazenamento de gráficos : recriar o gráfico toda vez é ineficiente; Portanto, o gráfico é armazenado levemente em um formato binário.
Redundância de dados : Simultaneamente armazenado no armazenamento de valor-chave interno (KV) para evitar perda de dados anormal.
Uso do disco : no entanto, essa abordagem resulta em uso relativamente alto do disco, tornando -a uma opção que os usuários escolherão a longo prazo.

Plana/cflat (composto plano):

Pesquisa de dados : Como a pesquisa de dados é inerentemente linear, ela não é armazenada separadamente.
Manuseio de dados : criado usando um método em que os dados são armazenados no armazenamento KV e depois enviados na memória.

CFLAT (Composto Flat): Pesquisa multi-vetorial

O CFLAT (Composite Flat) é um método de indexação que pesquisa vários vetores e produz resultados compostos com base na importância de dois vetores.

A aplicação da pesquisa de vetores compostos em gráficos de algoritmos como o HNSW é um desafio porque requer uma quantidade significativa de memória e não se alinha bem às estruturas da vizinhança, necessitando de vários gráficos. Embora a complexidade do tempo da pesquisa ainda converja para O (2 log n) ≈ O (log n), a complexidade do espaço é consideravelmente ruim.

Esses problemas se tornam cada vez mais problemáticos à medida que a quantidade de dados cresce. Além disso, o método de fusão e avaliação com base nas teclas compostas na estrutura do gráfico ignora Topk e aumenta significativamente o tamanho da pilha de uma única pesquisa.

Portanto, optamos por processar com base no plano. Embora a complexidade do tempo seja O (n) (sem quedas constantes), a complexidade do espaço permanece a mesma que plana e é altamente eficaz para mesclar e avaliar com base em teclas compostas.

Quando o cflat é usado?

Magine, estamos desenvolvendo um serviço para uma empresa de matchmaking que ajuda os usuários a encontrar seus parceiros ideais com base nos critérios de entrada. Estaremos considerando vários fatores, como personalidade e outros atributos. No entanto, o uso de um único vetor significa combinar esses fatores em uma frase para a pesquisa, o que aumenta muito a probabilidade de distorção da precisão.

Por exemplo: Arch12 Características desejadas: {Personalidade: decisiva, tipo ideal: alto e fino} Nesse cenário, o usuário prefere um traço de personalidade que torna o tipo ideal que alguém provavelmente os apreciará, concentrando -se em encontrar um parceiro com base em atributos externos.

No entanto, considere outro caso:

Características desejadas: {Personalidade: Equilíbrio, Tipo Ideal: decisivo} Aqui, alguém que deseja uma personalidade descontraída emparelhada com um tipo ideal decisivo pode resultar em correspondências incorretas, como a correspondência com indivíduos que são decisivos de maneiras que não se alinham às verdadeiras preferências do usuário.

Arch13 Nesses casos, o CFLAT (composto FLAT) calcula os escores avaliando em conjunto a similaridade na personalidade e a similaridade no tipo ideal. Os usuários podem atribuir níveis de importância a cada atributo, permitindo que pontuações mais altas sejam fornecidas aos aspectos com maior similaridade com base em prioridades definidas pelo usuário.

O que é NNV-Edge?

O Edge refere -se à capacidade de transmitir e receber dados em dispositivos próximos sem comunicação com um servidor central. No entanto, na prática, "Edge" no software às vezes pode diferir desse conceito, pois é frequentemente implantado em ambientes mais leves e com restrição de recursos em comparação com um servidor central.

O NNV-Edge foi projetado para operar rapidamente em conjuntos de dados vetoriais em menor escala (até 1 milhão de vetores) de maneira leve, transferindo tarefas automatizadas do NNV original de volta ao usuário para maior controle.

Algoritmos avançados como HNSW, FAISS e Irrita são excelentes, mas você não acha que eles podem ser um pouco pesados para especificações de menor escala? E deixando de lado os algoritmos, enquanto projetos como Milvus, Weaviate e Qdrant são construídos por mentes brilhantes, eles não são muito intensivos para executar ao lado de outros softwares em dispositivos pequenos e portáteis? Arch9 É aí que entra.

E se você distribuir várias arestas? Ao usar a borda NNV com o balanceador de carga mencionado anteriormente, você pode criar uma configuração avançada que encala os dados em várias arestas e agregue-os perfeitamente!

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-05-28
tamanho 15.34MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos