Lintdb -это многоветарная база данных, предназначенная для Gen AI. Lintdb изначально поддерживает позднее взаимодействие, например, Колберт и Плед.
Lintdb полагается на Openblas для укрепившейся матрицы. Чтобы сгладить процесс установки, мы поддерживаем только Conda.
conda install lintdb -c deployql -c conda-forge
Lintdb позволяет легко загружать данные, даже если у вас есть несколько арендаторов.
Ниже показано создание базы данных. Lintdb определяет схему для данной базы данных, которую можно использовать для индексации встроенных, плавающих, струнных и даже дат. Поля могут быть проиндексированы, хранятся или используются в качестве фильтра.
from lintdb . core import (
Schema ,
ColbertField ,
QuantizerType ,
Configuration ,
IndexIVF
)
schema = Schema (
[
ColbertField ( 'colbert' , DataType . TENSOR , {
'dimensions' : 128 ,
'quantization' : QuantizerType . BINARIZER ,
"num_centroids" : 32768 ,
"num_iterations" : 10 ,
})
]
)
config = Configuration ()
index = IndexIVF ( index_path , schema , config )
)И запрос базы данных. Мы можем запросить любую из полей данных, которые мы индексировали.
from lintdb . core import (
Query ,
VectorQueryNode
)
for id , query in zip ( data . qids , data . queries ):
embedding = checkpoint . queryFromText ( query )
e = np . squeeze ( embedding . cpu (). numpy (). astype ( 'float32' ))
query = Query (
VectorQueryNode (
TensorFieldValue ( 'colbert' , e )
)
)
results = index . search ( 0 , query , 10 )
print ( results )Lintdb стремится поддержать позднее взаимодействие и более продвинутые модели поиска.
Lintdb стремится стать платформой поиска для Gen AI. Мы считаем, что для этого мы должны поддерживать гибкие методы поиска и оценки, сохраняя при этом высокий уровень производительности.
Lintdb - одна из двух баз данных, которые поддерживают встроенные встроены токенов. Другим является Веспа.
Vespa - это надежная, зрелая поисковая система со многими функциями. Тем не менее, кривая обучения для начала и управления VESPA высока. Со встроенным Lintdb не требуется настройка. conda install lintdb -c deployql и начать работу.
Chroma - это встроенная векторная база данных, доступная в Python и JavaScript. Lintdb в настоящее время поддерживает только Python.
Однако, в отличие от Chroma, Lintdb предлагает многоцелевую поддержку.
Для получения подробной документации по использованию LintDB см. Официальную документацию
Lintdb лицензирован по лицензии Apache 2.0. Смотрите файл лицензии для получения подробной информации.
Нам нужна ваша помощь! Если вы хотите управлять Lintdb, протяните руку и дайте нам знать.
Время книги в календаре основателя: https://calendar.app.google/fsymsztvt8sip9xx6