Скачать client vector search - Загрузка исходного кода client vector search

client vector search

Другой исходный код

1.0.0

Скачать

Клиент-вектор-поиск

Библиотека поиска на стороне клиента, которая может встраивать, поиск и кэш. Работает в браузере и на стороне сервера.

Он превзойдет текстовое вручение в Openai-ADA-002 и намного быстрее, чем PineCone и другие Vectordbs.

Я основатель SearchBase.App, и мы нуждались в этом для нашего продукта и клиентов. Мы будем использовать эту библиотеку в производстве. Вы можете быть уверены, что это будет поддерживаться и улучшить.

Встроенные документы с использованием трансформаторов по умолчанию: gte-small (~ 30 МБ).
Рассчитайте сходство косинуса между встроениями.
Создайте индекс и поиск на стороне клиента
Векторы кеша с поддержкой кэширования браузера.

Много улучшений наступает!

Дорожная карта

Наша цель - построить супер простой, быстрый векторный поиск, который работает с парами до тысяч векторов. ~ 1K векторы на пользователя охватывают 99% вариантов использования.

Изначально мы сохраним вещи супер и подразделением 100 мс.

Тодос

Добавить индекс HNSW, который работает на Node и Browser Env, не полагайтесь на HNSW Binder Libs
Добавить правильный набор тестирования и CI/CD для LIB
- Простые медицинские тесты
  - издеваться над @xenova/transformers для шутки, это не довольна этим
- Тесты производительности, отзыв, использование памяти, использование процессора и т. Д.

Установка

npm i client-vector-search

QuickStart

Эта библиотека обеспечивает решение для подключения и игры для внедрения и векторного поиска. Он разработан, чтобы быть простым в использовании, эффективном и универсальном. Вот быстрое руководство:

  import { getEmbedding , EmbeddingIndex } from 'client-vector-search' ;

  // getEmbedding is an async function, so you need to use 'await' or '.then()' to get the result
  const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

  // Each object should have an 'embedding' property of type number[]
  const initialObjects = [
  { id : 1 , name : "Apple" , embedding : embedding } ,
  { id : 2 , name : "Banana" , embedding : await getEmbedding ( "Banana" ) } ,
  { id : 3 , name : "Cheddar" , embedding : await getEmbedding ( "Cheddar" ) } ,
  { id : 4 , name : "Space" , embedding : await getEmbedding ( "Space" ) } ,
  { id : 5 , name : "database" , embedding : await getEmbedding ( "database" ) } ,
  ] ;
  const index = new EmbeddingIndex ( initialObjects ) ; // Creates an index

  // The query should be an embedding of type number[]
  const queryEmbedding = await getEmbedding ( 'Fruit' ) ; // Query embedding
  const results = await index . search ( queryEmbedding , { topK : 5 } ) ; // Returns top similar objects

  // specify the storage type
  await index . saveIndex ( 'indexedDB' ) ;
  const results = await index . search ( [ 1 , 2 , 3 ] , {
    topK : 5 ,
    useStorage : 'indexedDB' ,
    // storageOptions: { // use only if you overrode the defaults
    //   indexedDBName: 'clientVectorDB',
    //   indexedDBObjectStoreName: 'ClientEmbeddingStore',
    // },
  } ) ;

  console . log ( results ) ;

  await index . deleteIndexedDB ( ) ; // if you overrode default, specify db name

Поиск неисправностей

NextJs

Чтобы использовать его внутри проектов NextJS, вам необходимо обновить файл next.config.js , чтобы включить следующее:

 module . exports = {
  // Override the default webpack configuration
  webpack : ( config ) => {
    // See https://webpack.js.org/configuration/resolve/#resolvealias
    config . resolve . alias = {
      ... config . resolve . alias ,
      sharp$ : false ,
      "onnxruntime-node$" : false ,
    } ;
    return config ;
  } ,
} ;

Загрузка модели после загрузки страницы

Вы можете инициализировать модель перед использованием ее для генерации встраиваний. Это гарантирует, что модель загружается перед тем, как использовать ее, и обеспечит лучший UX.

 import { initializeModel } from "client-vector-search"
. . .
  useEffect ( ( ) => {
    try {
      initializeModel ( ) ;
    } catch ( e ) {
      console . log ( e ) ;
    }
  } , [ ] ) ;

Руководство по использованию

Это руководство обеспечивает пошаговое прохождение основных функций библиотеки. Он охватывает все, от генерации внедрения для строки до выполнения операций по индексу, таких как добавление, обновление и удаление объектов. Он также включает в себя инструкции о том, как сохранить индекс в базу данных, и выполнить поисковые операции внутри него.

Пока у нас не будет справочной документации, вы можете найти все методы и их использование в этом руководстве. Каждый шаг сопровождается фрагментом кода, чтобы проиллюстрировать использование рассматриваемого метода. Обязательно следуйте и попробуйте примеры в вашей собственной среде, чтобы лучше понять, как все работает.

Начнем!

Шаг 1: генерировать встроения для строки

Создайте встроения для данной строки, используя метод getEmbedding .

 const embedding = await getEmbedding ( "Apple" ) ; // Returns embedding as number[]

ПРИМЕЧАНИЕ : getEmbedding асинхронно; Обязательно используйте await .

Шаг 2: Рассчитайте сходство косинуса

Рассчитайте сходство косинуса между двумя вставками.

 const similarity = cosineSimilarity ( embedding1 , embedding2 , 6 ) ;

Примечание . Оба вторжения должны иметь одинаковую длину.

Шаг 3: Создайте индекс

Создайте индекс с начальным массивом объектов. Каждый объект должен иметь свойство «встраивания».

 const initialObjects = [ ... ] ;
const index = new EmbeddingIndex ( initialObjects ) ;

Шаг 4: Добавьте к индексу

Добавьте объект в индекс.

 const objectToAdd = { id : 6 , name : 'Cat' , embedding : await getEmbedding ( 'Cat' ) } ;
index . add ( objectToAdd ) ;

Шаг 5: Индекс обновления

Обновите существующий объект в индексе.

 const vectorToUpdate = { id : 6 , name : 'Dog' , embedding : await getEmbedding ( 'Dog' ) } ;
index . update ( { id : 6 } , vectorToUpdate ) ;

Шаг 6: Снимите из индекса

Удалить объект из индекса.

 index . remove ( { id : 6 } ) ;

Шаг 7: Извлечь из индекса

Получить объект из индекса.

 const vector = index . get ( { id : 1 } ) ;

Шаг 8: Поиск индекса

Поиск индекса с помощью запроса.

 const queryEmbedding = await getEmbedding ( 'Fruit' ) ;
const results = await index . search ( queryEmbedding , { topK : 5 } ) ;

Шаг 9: Распечатайте индекс

Распечатайте весь индекс в консоли.

 index . printIndex ( ) ;

Шаг 10: Сохраните индекс в IndexedDB (для браузера)

Сохраните индекс в постоянную базу данных IndexedDB. Примечание

 await index . saveIndex ( "indexedDB" , { DBName : "clientVectorDB" , objectStoreName : "ClientEmbeddingStore" } )

ВАЖНО: Поиск в IndexedDB

Выполните операцию поиска в IndexedDB.

 const results = await index . search ( queryEmbedding , {
  topK : 5 ,
  useStorage : "indexedDB" ,
  storageOptions : { // only if you want to override the default options, defaults are below
    indexedDBName : 'clientVectorDB' ,
    indexedDBObjectStoreName : 'ClientEmbeddingStore'
  }
} ) ;

-- -

### Delete Database
To delete an entire database .

`` ` ts
await IndexedDbManager . deleteIndexedDB ( "clientVectorDB" ) ;

Удалить магазин объектов

Чтобы удалить хранилище объекта из базы данных.

 await IndexedDbManager . deleteIndexedDBObjectStore ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Получить все объекты

Чтобы получить все объекты из определенного магазина объектов.

 const allObjects = await IndexedDbManager . getAllObjectsFromIndexedDB ( "clientVectorDB" , "ClientEmbeddingStore" ) ;

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-05
размер 64.63KB
От Github

Связанные приложения

java client

2024-11-12
amneziawg windows client

2024-11-11
rdt client

2024-11-09
discord bot client

2024-11-09
Поиск слов 800

2024-11-08
azure search python samples

2024-11-05

client vector search

Клиент-вектор-поиск

Дорожная карта

Тодос

Установка

QuickStart

Поиск неисправностей

NextJs

Загрузка модели после загрузки страницы

Руководство по использованию

Шаг 1: генерировать встроения для строки

Шаг 2: Рассчитайте сходство косинуса

Шаг 3: Создайте индекс

Шаг 4: Добавьте к индексу

Шаг 5: Индекс обновления

Шаг 6: Снимите из индекса

Шаг 7: Извлечь из индекса

Шаг 8: Поиск индекса

Шаг 9: Распечатайте индекс

Шаг 10: Сохраните индекс в IndexedDB (для браузера)

ВАЖНО: Поиск в IndexedDB

Удалить магазин объектов

Получить все объекты

java client

amneziawg windows client

rdt client

discord bot client

Поиск слов 800

azure search python samples

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express