Téléchargement LintDB - Téléchargement du code source LintDB

LintDB

Autre code source

v0.5.1

Télécharger

Lintdb

LintDB est une base de données multi-vecteurs destinée à la génération AI. LintDB soutient nativement l'interaction tardive comme Colbert et Plaid.

Caractéristiques clés

Prise en charge multi-vecteurs : LintDB stocke plusieurs vecteurs par ID de document et calcule la similitude maximale entre les vecteurs pour déterminer la pertinence.
Compression au niveau du bit : LintDB implémente entièrement la compression des bits de Plaid, stockant 128 intégres de dimension dans aussi bas que 16 octets.
Embedded : LintDB peut être intégré directement dans votre application Python. Pas besoin de configurer une base de données distincte.
Support complet pour Plaid et Colbert : LintDB est construit autour de Plaid et Colbert.
Filtrage : LintDB prend en charge le filtrage sur n'importe quel champ du schéma.

Installation

LintDB s'appuie sur OpenBlas pour la multiplication de la matrice accélée. Pour lisser le processus d'installation, nous prenons uniquement le conda.

 conda install lintdb -c deployql -c conda-forge

Usage

LintDB facilite la téléchargement de données, même si vous avez plusieurs locataires.

Ci-dessous montre la création d'une base de données. LintDB définit un schéma pour une base de données donnée qui peut être utilisée pour indexer des intégres, des flotteurs, des chaînes et même des dates. Les champs peuvent être indexés, stockés ou utilisés comme filtre.

 from lintdb . core import (
  Schema ,
  ColbertField ,
  QuantizerType ,
  Configuration ,
  IndexIVF
)

schema = Schema (
  [
    ColbertField ( 'colbert' , DataType . TENSOR , {
      'dimensions' : 128 ,
      'quantization' : QuantizerType . BINARIZER ,
      "num_centroids" : 32768 ,
      "num_iterations" : 10 ,
    })
  ]
)
config = Configuration ()
index = IndexIVF ( index_path , schema , config )
)

Et interroger la base de données. Nous pouvons interroger l'un des champs de données que nous avons indexés.

 from lintdb . core import (
Query ,
VectorQueryNode
)
for id , query in zip ( data . qids , data . queries ):
  embedding = checkpoint . queryFromText ( query )
e = np . squeeze ( embedding . cpu (). numpy (). astype ( 'float32' ))

query = Query (
  VectorQueryNode (
    TensorFieldValue ( 'colbert' , e )
  )
)
results = index . search ( 0 , query , 10 )
print ( results )

Support du modèle d'interaction tardive

LintDB vise à soutenir l'interaction tardive et les modèles de récupération plus avancés.

Colbertv2 avec plaid
Xtr

Feuille de route

LintDB vise à être une plate-forme de récupération pour Gen AI. Nous pensons que pour ce faire, nous devons soutenir des méthodes de récupération et de notation flexibles tout en maintenant un niveau élevé de performance.

Améliorer les performances et l'évolutivité
Benchmarks amélioré
Soutenez la citadelle pour une interaction tardive évolutive
Soutenez les adaptateurs de requête apprenables dans le pipeline de récupération
Améliorer le soutien aux fonctions de récupération et de classement arbitraires
Soutenir les fonctions de classement apprenables

Comparaison avec d'autres bases de données vectorielles

LintDB est l'une des deux bases de données qui prennent en charge les incorporations de token. L'autre étant Vespa.

Intégres de niveau de jeton

Vespa

Vespa est un moteur de recherche mature robuste avec de nombreuses fonctionnalités. Cependant, la courbe d'apprentissage pour démarrer et utiliser Vespa est élevée. Avec du lintdb embarqué, aucune configuration n'est requise. conda install lintdb -c deployql et démarrer.

Intégré

Chrome

Le chroma est une base de données vectorielle intégrée disponible dans Python et JavaScript. LintDB ne prend actuellement en charge que Python.

Cependant, contrairement à ChroMA, le LintDB offre un support multi-location.

Documentation

Pour une documentation détaillée sur l'utilisation de LintDB, reportez-vous à la documentation officielle

Licence

LintDB est concédé sous licence Apache 2.0. Voir le fichier de licence pour plus de détails.

Nous voulons offrir un service géré

Nous avons besoin de votre aide! Si vous souhaitez un LintDB géré, tendez la main et faites-le nous savoir.

Temps de réservation sur le calendrier du fondateur: https://calendar.app.google/fsymsztvt8sip9xx6

Développer

Informations supplémentaires

Version v0.5.1
Type Autre code source
Date de mise à jour 2025-05-26
taille 13MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout