Download client vector search - client vector search Download do código fonte

client vector search

Outro código-fonte

1.0.0

Baixar

Pesquisa do cliente-vetor

Uma biblioteca de pesquisa de vetores do lado que pode incorporar, pesquisar e cache. Funciona no navegador e no lado do servidor.

Ele supera o texto-Ada-Ada-002 do OpenAI e é muito mais rápido que o Pinecone e outros Vecordbs.

Sou o fundador da SearchBase.App e precisávamos disso para nossos produtos e clientes. Usaremos esta biblioteca em produção. Você pode ter certeza de que será mantido e aprimorado.

Incorporar documentos usando transformadores por padrão: gte-small (~ 30 MB).
Calcule a similaridade de cosseno entre as incorporações.
Crie um índice e pesquise no lado do cliente
Vetores de cache com suporte de cache de navegador.

Muitas melhorias estão chegando!

Roteiro

Nosso objetivo é criar uma pesquisa de vetores super simples e rápida que funcione com centenas a milhares de vetores. ~ 1K Vetores por usuário cobre 99% dos casos de uso.

Inicialmente, manteremos as coisas super simples e sub 100ms

Todos

Adicione o índice HNSW que funcione no nó e no navegador Env, não confie no HNSW Binder Libs
Adicione uma suíte de teste adequada e CI/CD para a lib
- testes de saúde simples
  - zombar do @Xenova/Transformers for Jest, não está feliz com isso
- Testes de desempenho, recall, uso de memória, uso da CPU etc.

Instalação

npm i client-vector-search

Investir rápido

Esta biblioteca fornece uma solução plug-and-play para incorporação e pesquisa de vetores. Ele foi projetado para ser fácil de usar, eficiente e versátil. Aqui está um guia de início rápido:

  import { getEmbedding , EmbeddingIndex } from 'client-vector-search' ;

  // getEmbedding is an async function, so you need to use 'await' or '.then()' to get the result
  const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

  // Each object should have an 'embedding' property of type number[]
  const initialObjects = [
  { id : 1 , name : "Apple" , embedding : embedding } ,
  { id : 2 , name : "Banana" , embedding : await getEmbedding ( "Banana" ) } ,
  { id : 3 , name : "Cheddar" , embedding : await getEmbedding ( "Cheddar" ) } ,
  { id : 4 , name : "Space" , embedding : await getEmbedding ( "Space" ) } ,
  { id : 5 , name : "database" , embedding : await getEmbedding ( "database" ) } ,
  ] ;
  const index = new EmbeddingIndex ( initialObjects ) ; // Creates an index

  // The query should be an embedding of type number[]
  const queryEmbedding = await getEmbedding ( 'Fruit' ) ; // Query embedding
  const results = await index . search ( queryEmbedding , { topK : 5 } ) ; // Returns top similar objects

  // specify the storage type
  await index . saveIndex ( 'indexedDB' ) ;
  const results = await index . search ( [ 1 , 2 , 3 ] , {
    topK : 5 ,
    useStorage : 'indexedDB' ,
    // storageOptions: { // use only if you overrode the defaults
    //   indexedDBName: 'clientVectorDB',
    //   indexedDBObjectStoreName: 'ClientEmbeddingStore',
    // },
  } ) ;

  console . log ( results ) ;

  await index . deleteIndexedDB ( ) ; // if you overrode default, specify db name

Solução de problemas

NextJs

Para usá -lo nos projetos NextJS, você precisará atualizar o arquivo next.config.js para incluir o seguinte:

 module . exports = {
  // Override the default webpack configuration
  webpack : ( config ) => {
    // See https://webpack.js.org/configuration/resolve/#resolvealias
    config . resolve . alias = {
      ... config . resolve . alias ,
      sharp$ : false ,
      "onnxruntime-node$" : false ,
    } ;
    return config ;
  } ,
} ;

Carga do modelo após a página é carregada

Você pode inicializar o modelo antes de usá -lo para gerar incorporação. Isso garantirá que o modelo seja carregado antes de usá -lo e fornecer um UX melhor.

 import { initializeModel } from "client-vector-search"
. . .
  useEffect ( ( ) => {
    try {
      initializeModel ( ) ;
    } catch ( e ) {
      console . log ( e ) ;
    }
  } , [ ] ) ;

Guia de uso

Este guia fornece um passo a passo passo a passo dos principais recursos da biblioteca. Ele abrange tudo, desde a geração de incorporações para uma string até a execução de operações no índice, como adicionar, atualizar e remover objetos. Ele também inclui instruções sobre como salvar o índice em um banco de dados e executar operações de pesquisa nele.

Até termos uma documentação de referência, você pode encontrar todos os métodos e seu uso neste guia. Cada etapa é acompanhada por um trecho de código para ilustrar o uso do método em questão. Certifique -se de seguir adiante e experimente os exemplos em seu próprio ambiente para entender melhor como tudo funciona.

Vamos começar!

Etapa 1: gerar incorporações para string

Gere incorporação para uma determinada string usando o método getEmbedding .

 const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

Nota : getEmbedding é assíncrono; Certifique -se de usar await .

Etapa 2: Calcule a similaridade de cosseno

Calcule a similaridade de cosseno entre duas incorporações.

 const similarity = cosineSimilarity ( embedding1 , embedding2 , 6 ) ;

Nota : Ambas as incorporações devem ter o mesmo comprimento.

Etapa 3: Crie um índice

Crie um índice com uma matriz inicial de objetos. Cada objeto deve ter uma propriedade 'incorporação'.

 const initialObjects = [ ... ] ;
const index = new EmbeddingIndex ( initialObjects ) ;

Etapa 4: adicione ao índice

Adicione um objeto ao índice.

 const objectToAdd = { id : 6 , name : 'Cat' , embedding : await getEmbedding ( 'Cat' ) } ;
index . add ( objectToAdd ) ;

Etapa 5: Índice de atualização

Atualize um objeto existente no índice.

 const vectorToUpdate = { id : 6 , name : 'Dog' , embedding : await getEmbedding ( 'Dog' ) } ;
index . update ( { id : 6 } , vectorToUpdate ) ;

Etapa 6: Retire do índice

Remova um objeto do índice.

 index . remove ( { id : 6 } ) ;

Etapa 7: recuperar do índice

Recuperar um objeto do índice.

 const vector = index . get ( { id : 1 } ) ;

Etapa 8: Pesquise o índice

Pesquise o índice com uma consulta incorporada.

 const queryEmbedding = await getEmbedding ( 'Fruit' ) ;
const results = await index . search ( queryEmbedding , { topK : 5 } ) ;

Etapa 9: Imprima o índice

Imprima todo o índice para o console.

 index . printIndex ( ) ;

Etapa 10: Salvar índice no indexedDB (para navegador)

Salve o índice em um banco de dados IndexedDB persistente. Observação

 await index . saveIndex ( "indexedDB" , { DBName : "clientVectorDB" , objectStoreName : "ClientEmbeddingStore" } )

IMPORTANTE: Pesquisar no indexedDB

Execute uma operação de pesquisa no indexedDB.

 const results = await index . search ( queryEmbedding , {
  topK : 5 ,
  useStorage : "indexedDB" ,
  storageOptions : { // only if you want to override the default options, defaults are below
    indexedDBName : 'clientVectorDB' ,
    indexedDBObjectStoreName : 'ClientEmbeddingStore'
  }
} ) ;

-- -

### Delete Database
To delete an entire database .

`` ` ts
await IndexedDbManager . deleteIndexedDB ( "clientVectorDB" ) ;

Excluir armazenamento de objetos

Para excluir um armazenamento de objetos de um banco de dados.

 await IndexedDbManager . deleteIndexedDBObjectStore ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Recuperar todos os objetos

Para recuperar todos os objetos de um armazenamento de objetos específico.

 const allObjects = await IndexedDbManager . getAllObjectsFromIndexedDB ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-05
tamanho 64.63KB
Vindo de Github

Aplicativos Relacionados

java client

2024-11-12
amneziawg windows client

2024-11-11
rdt client

2024-11-09
discord bot client

2024-11-09
Pesquisa de palavras 800

2024-11-08
azure search python samples

2024-11-05

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos