Descarga client vector search - Descargar el código fuente del código client vector search

client vector search

Otro código fuente

1.0.0

Descargar

búsqueda de vector de cliente

Una biblioteca de búsqueda vectorial del lado del cliente que puede incrustar, buscar y caché. Funciona en el navegador y el lado del servidor.

Supera el texto de OpenAI-Embeding-ADA-002 y es mucho más rápido que Pinecone y otros Vectordbs.

Soy el fundador de SearchBase.App y necesitamos esto para nuestro producto y clientes. Usaremos esta biblioteca en producción. Puede estar seguro de que se mantendrá y mejorará.

Incorporar documentos utilizando transformadores de forma predeterminada: GTE-Small (~ 30mb).
Calcule la similitud coseno entre incrustaciones.
Crear un índice y buscar en el lado del cliente
Vectores de caché con soporte de almacenamiento en caché del navegador.

¡Vienen muchas mejoras!

Hoja de ruta

Nuestro objetivo es construir una búsqueda vectorial súper simple y rápida que funcione con un par cien a miles de vectores. ~ 1k vectores por usuario cubre el 99% de los casos de uso.

Inicialmente mantendremos cosas súper simples y sub 100 m.

Diádico

Agregue el índice HNSW que funcione en el nodo y el envidio del navegador, no confíe en HNSW Binder Libs
Agregue una suite de prueba adecuada y CI/CD para el LIB
- Pruebas de salud simples
  - burlarse de @xenova/transformers para broma, no está contento con eso
- Pruebas de rendimiento, retiro, uso de memoria, uso de CPU, etc.

Instalación

npm i client-vector-search

Inicio rápido

Esta biblioteca proporciona una solución plug-and-play para la incrustación y la búsqueda vectorial. Está diseñado para ser fácil de usar, eficiente y versátil. Aquí hay una guía de inicio rápido:

  import { getEmbedding , EmbeddingIndex } from 'client-vector-search' ;

  // getEmbedding is an async function, so you need to use 'await' or '.then()' to get the result
  const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

  // Each object should have an 'embedding' property of type number[]
  const initialObjects = [
  { id : 1 , name : "Apple" , embedding : embedding } ,
  { id : 2 , name : "Banana" , embedding : await getEmbedding ( "Banana" ) } ,
  { id : 3 , name : "Cheddar" , embedding : await getEmbedding ( "Cheddar" ) } ,
  { id : 4 , name : "Space" , embedding : await getEmbedding ( "Space" ) } ,
  { id : 5 , name : "database" , embedding : await getEmbedding ( "database" ) } ,
  ] ;
  const index = new EmbeddingIndex ( initialObjects ) ; // Creates an index

  // The query should be an embedding of type number[]
  const queryEmbedding = await getEmbedding ( 'Fruit' ) ; // Query embedding
  const results = await index . search ( queryEmbedding , { topK : 5 } ) ; // Returns top similar objects

  // specify the storage type
  await index . saveIndex ( 'indexedDB' ) ;
  const results = await index . search ( [ 1 , 2 , 3 ] , {
    topK : 5 ,
    useStorage : 'indexedDB' ,
    // storageOptions: { // use only if you overrode the defaults
    //   indexedDBName: 'clientVectorDB',
    //   indexedDBObjectStoreName: 'ClientEmbeddingStore',
    // },
  } ) ;

  console . log ( results ) ;

  await index . deleteIndexedDB ( ) ; // if you overrode default, specify db name

Solución de problemas

Nextjs

Para usarlo dentro de los proyectos NextJS, deberá actualizar el archivo next.config.js para incluir lo siguiente:

 module . exports = {
  // Override the default webpack configuration
  webpack : ( config ) => {
    // See https://webpack.js.org/configuration/resolve/#resolvealias
    config . resolve . alias = {
      ... config . resolve . alias ,
      sharp$ : false ,
      "onnxruntime-node$" : false ,
    } ;
    return config ;
  } ,
} ;

La carga del modelo después de la página está cargada

Puede inicializar el modelo antes de usarlo para generar incrustaciones. Esto asegurará que el modelo se cargue antes de usarlo y proporcionará un mejor UX.

 import { initializeModel } from "client-vector-search"
. . .
  useEffect ( ( ) => {
    try {
      initializeModel ( ) ;
    } catch ( e ) {
      console . log ( e ) ;
    }
  } , [ ] ) ;

Guía de uso

Esta guía proporciona un tutorial paso a paso de las características principales de la biblioteca. Cubre todo, desde la generación de incrustaciones para una cadena hasta realizar operaciones en el índice, como agregar, actualizar y eliminar objetos. También incluye instrucciones sobre cómo guardar el índice en una base de datos y realizar operaciones de búsqueda dentro de ella.

Hasta que tengamos una documentación de referencia, puede encontrar todos los métodos y su uso en esta guía. Cada paso se acompaña de un fragmento de código para ilustrar el uso del método en cuestión. Asegúrese de seguir y probar los ejemplos en su propio entorno para comprender mejor cómo funciona todo.

¡Comencemos!

Paso 1: Genere incrustaciones para la cadena

Genere incrustaciones para una cadena dada utilizando el método getEmbedding .

 const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

Nota : getEmbedding es asíncrono; Asegúrese de usar await .

Paso 2: Calcular la similitud del coseno

Calcule la similitud cosena entre dos incrustaciones.

 const similarity = cosineSimilarity ( embedding1 , embedding2 , 6 ) ;

Nota : Ambos incrustaciones deben ser de la misma longitud.

Paso 3: crear un índice

Cree un índice con una matriz inicial de objetos. Cada objeto debe tener una propiedad de 'incrustación'.

 const initialObjects = [ ... ] ;
const index = new EmbeddingIndex ( initialObjects ) ;

Paso 4: Agregar al índice

Agregue un objeto al índice.

 const objectToAdd = { id : 6 , name : 'Cat' , embedding : await getEmbedding ( 'Cat' ) } ;
index . add ( objectToAdd ) ;

Paso 5: índice de actualización

Actualizar un objeto existente en el índice.

 const vectorToUpdate = { id : 6 , name : 'Dog' , embedding : await getEmbedding ( 'Dog' ) } ;
index . update ( { id : 6 } , vectorToUpdate ) ;

Paso 6: Eliminar del índice

Elimine un objeto del índice.

 index . remove ( { id : 6 } ) ;

Paso 7: Recuperar del índice

Recuperar un objeto del índice.

 const vector = index . get ( { id : 1 } ) ;

Paso 8: Busque el índice

Busque el índice con una incrustación de consulta.

 const queryEmbedding = await getEmbedding ( 'Fruit' ) ;
const results = await index . search ( queryEmbedding , { topK : 5 } ) ;

Paso 9: imprima el índice

Imprima el índice completo en la consola.

 index . printIndex ( ) ;

Paso 10: Guarde el índice en IndexedDB (para el navegador)

Guarde el índice en una base de datos INDEDDB persistente. Nota

 await index . saveIndex ( "indexedDB" , { DBName : "clientVectorDB" , objectStoreName : "ClientEmbeddingStore" } )

IMPORTANTE: Búsqueda en IndexedDB

Realice una operación de búsqueda en IndexedDB.

 const results = await index . search ( queryEmbedding , {
  topK : 5 ,
  useStorage : "indexedDB" ,
  storageOptions : { // only if you want to override the default options, defaults are below
    indexedDBName : 'clientVectorDB' ,
    indexedDBObjectStoreName : 'ClientEmbeddingStore'
  }
} ) ;

-- -

### Delete Database
To delete an entire database .

`` ` ts
await IndexedDbManager . deleteIndexedDB ( "clientVectorDB" ) ;

Eliminar tienda de objetos

Para eliminar un almacén de objetos de una base de datos.

 await IndexedDbManager . deleteIndexedDBObjectStore ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Recuperar todos los objetos

Para recuperar todos los objetos de una tienda de objetos específico.

 const allObjects = await IndexedDbManager . getAllObjectsFromIndexedDB ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-05
tamaño 64.63KB
Proviene de Github

Aplicaciones relacionadas

java client

2024-11-12
amneziawg windows client

2024-11-11
rdt client

2024-11-09
discord bot client

2024-11-09
Búsqueda de palabras 800

2024-11-08
azure search python samples

2024-11-05

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo