vector storage herunterladen - vector storage herunterladen

vector storage

Anderer Quellcode

1.0.0

Herunterladen

Vektorspeicherung

Der Vektorspeicher ist eine leichte und effiziente Vektor -Datenbank, die Dokumentvektoren im indexierten Browser indexiert ist. Mit diesem Paket können Sie semantische Ähnlichkeitssuche in Textdokumenten mithilfe von Vektoreinbettungen durchführen. Die semantische Suche bezieht sich auf die Fähigkeit, die Bedeutung und den Kontext von Textdokumenten und Abfragen zu verstehen und genauer und relevantere Suchergebnisse zu ermöglichen. Vektorspeicher nutzt OpenAi -Einbettungen, um Textdokumente in Vektoren umzuwandeln, und bietet eine Schnittstelle zur Suche nach ähnlichen Dokumenten basierend auf der Ähnlichkeit von Cosinus.

Merkmale

Speichern und verwalten Dokumentvektoren in indiziertenDB
Führen Sie Ähnlichkeitssuche in Textdokumenten durch
Filterergebnisse basierend auf Metadaten oder Textinhalten filtern
Verwalten Sie automatisch die Speichergröße und entfernen

Cosinus -Ähnlichkeitsalgorithmus

Die Ähnlichkeit der Kosinus ist ein Maß für die Ähnlichkeit zwischen zwei Vektoren ungleich Null in einem inneren Produktraum. Es ist definiert als der Cosinus des Winkels zwischen den beiden Vektoren. Der Kosinus -Ähnlichkeitswert reicht von -1 bis 1, wobei 1 eine vollständige Ähnlichkeit angibt, 0 gibt keine Ähnlichkeit an und -1 zeigt eine vollständige Unähnlichkeit an.

In diesem Paket wird die Ähnlichkeit der Cosinus verwendet, um die Ähnlichkeit zwischen Dokumentvektoren und dem Abfragebericht zu messen. Der Cosinus -Ähnlichkeitswert wird unter Verwendung des Punktprodukts der Vektoren berechnet, geteilt durch das Produkt ihrer Größen.

LRU -Mechanismus

Der am wenigsten verwendete (LRU) -Mechanismus (LRU) wird verwendet, um die Speichergröße zu verwalten und Dokumente automatisch zu entfernen, wenn die Speichergröße die angegebene Grenze überschreitet. Dokumente werden nach ihrem Trefferschalter (aufsteigend) und dann durch ihren Zeitstempel (aufsteigend) sortiert. Dokumente mit der niedrigsten Trefferzahl und ältesten Zeitstempel werden zuerst entfernt, bis die Speichergröße unter der Grenze liegt.

Installation

Installieren Sie das Paket mit NPM:

npm i vector-storage

Verwendung

Hier ist ein grundlegendes Beispiel für die Verwendung der VectorStorage -Klasse:

 import { VectorStorage } from "vector-storage" ;

// Create an instance of VectorStorage
const vectorStore = new VectorStorage ( { openAIApiKey : "your-openai-api-key" } ) ;

// Add a text document to the store
await vectorStore . addText ( "The quick brown fox jumps over the lazy dog." , {
  category : "example" ,
} ) ;

// Perform a similarity search
const results = await vectorStore . similaritySearch ( {
  query : "A fast fox leaps over a sleepy hound." ,
} ) ;

// Display the search results
console . log ( results ) ;

API

VectorStorage

Die Hauptklasse für die Verwaltung von Dokumentenvektoren in IndexedDB.

Konstruktor (Optionen: IVSoptionen)

Erstellt eine neue Instanz von VectorStorage.

Optionen : Ein Objekt, das die folgenden Eigenschaften enthält:

 interface IVSOptions {
  openAIApiKey : string ; // The OpenAI API key used for generating embeddings.
  maxSizeInMB ?: number ; // The maximum size of the storage in megabytes. Defaults to 2GB
  debounceTime ?: number ; // The debounce time in milliseconds for saving to IndexedDB. Defaults to 0.
  openaiModel ?: string ; // The OpenAI model used for generating embeddings. Defaults to 'text-embedding-ada-002'.
}

AddText (Text: String, Metadaten: Objekt): Versprechen

Fügt dem Geschäft ein Textdokument hinzu und gibt das erstellte Dokument zurück.

Text : Der Textinhalt des Dokuments.
Metadaten : Ein Objekt, das mit dem Dokument zugeordnete Metadaten enthält.

AddTexts (Texte: String [], Metadatas: Objekt []): Versprechen <ivsdocument []>

Fügt dem Geschäft mehrere Textdokumente hinzu und gibt eine Reihe erstellter Dokumente zurück.

Texte : Eine Reihe von Textinhalten für die Dokumente.
Metadaten : Eine Reihe von Metadatenobjekten, die den Dokumenten zugeordnet sind.

Ähnlichkeitswissenschaft (Params: IsiMilaritySearchParams): Versprechen <ivsdocument []>

Führt eine Ähnlichkeitssuche in den gespeicherten Dokumenten durch und gibt eine Reihe von übereinstimmenden Dokumenten zurück.

Parameter : Ein Objekt, das die folgenden Eigenschaften enthält:

Abfrage : Der Abfragetext oder Vektor für die Suche.
K (optional): Die Anzahl der zu zurückgegebenen Top -Ergebnisse (Standard: 4).
Filteroptionen (optional): Ein Objekt, das Filterkriterien für die Suche angibt.

IVSDocument -Schnittstelle

Die IVSDocument -Schnittstelle stellt ein Dokumentobjekt dar, das in der Vektor -Datenbank gespeichert ist. Es enthält die folgenden Eigenschaften:

 interface IVSDocument {
  hits ?: number ; // The number of hits (accesses) for the document. Omit if the value is 0.
  metadata : object ; // The metadata associated with the document for filtering.
  text : string ; // The text content of the document.
  timestamp : number ; // The timestamp indicating when the document was added to the store.
  vectorMag : number ; // The magnitude of the document vector.
  vector : number [ ] ; // The vector representation of the document.
}

Beitragen

Beiträge zu diesem Projekt sind willkommen! Wenn Sie einen Beitrag leisten möchten, befolgen Sie bitte die folgenden Schritte:

Geben Sie das Repository auf GitHub.
Klonen Sie Ihre Gabel auf Ihre lokale Maschine.
Erstellen Sie einen neuen Zweig für Ihre Änderungen.
Nehmen Sie Ihre Änderungen vor und verpflichten Sie sie zu Ihrer Niederlassung.
Drücken Sie Ihre Änderungen an Ihrer Gabel auf GitHub.
Öffnen Sie eine Pull -Anfrage von Ihrem Zweig zum Hauptrepository.

Bitte stellen Sie sicher, dass Ihr Code dem Codierungsstil des Projekts folgt und dass alle Tests bestehen, bevor Sie eine Pull -Anfrage senden. Wenn Sie Fehler finden oder Vorschläge für Verbesserungen haben, können Sie ein Problem auf GitHub eröffnen.