Descargar llm elasticsearch cache - llm elasticsearch cache código fuente descarga

llm elasticsearch cache

Código Fuente de IA

1.0.0

Descargar

Importante

Esta biblioteca ahora forma parte de Langchain, siga la documentación oficial, por ejemplo, para el caché LLM

LLM-Elasticsearch-Cache

Una capa de almacenamiento en caché para LLM que explota Elasticsearch, totalmente compatible con el almacenamiento en caché de Langchain, tanto para los modelos de chat como de incrustaciones.

Instalar

pip install llm-elasticsearch-cache

Uso de caché de chat

El caché Langchain se puede usar de manera similar a las otras integraciones de caché.

Ejemplo básico

 from langchain . globals import set_llm_cache
from llmescache . langchain import ElasticsearchCache
from elasticsearch import Elasticsearch

es_client = Elasticsearch ( hosts = "http://localhost:9200" )
set_llm_cache (
    ElasticsearchCache (
        es_client = es_client , 
        es_index = "llm-chat-cache" , 
        metadata = { "project" : "my_chatgpt_project" }
    )
)

El parámetro es_index también puede tomar alias. Esto permite usar el ILM: administre el ciclo de vida del índice que sugerimos considerar para administrar la retención y controlar el crecimiento del caché.

Mire el documento de clase para todos los parámetros.

Indexar el texto generado

Los datos en caché no se pueden buscar de forma predeterminada. El desarrollador puede personalizar la construcción del documento Elasticsearch para agregar campos de texto indexados, dónde poner, por ejemplo, el texto generado por el LLM.

Esto se puede hacer subclasificando los métodos de anulación de extremo. La nueva clase de caché se puede aplicar también a un índice de caché preexistente:

 from llmescache . langchain import ElasticsearchCache
from elasticsearch import Elasticsearch
from langchain_core . caches import RETURN_VAL_TYPE
from typing import Any , Dict , List
from langchain . globals import set_llm_cache
import json


class SearchableElasticsearchCache ( ElasticsearchCache ):

    @ property
    def mapping ( self ) -> Dict [ str , Any ]:
        mapping = super (). mapping
        mapping [ "mappings" ][ "properties" ][ "parsed_llm_output" ] = { "type" : "text" , "analyzer" : "english" }
        return mapping
    
    def build_document ( self , prompt : str , llm_string : str , return_val : RETURN_VAL_TYPE ) -> Dict [ str , Any ]:
        body = super (). build_document ( prompt , llm_string , return_val )
        body [ "parsed_llm_output" ] = self . _parse_output ( body [ "llm_output" ])
        return body

    @ staticmethod
    def _parse_output ( data : List [ str ]) -> List [ str ]:
        return [ json . loads ( output )[ "kwargs" ][ "message" ][ "kwargs" ][ "content" ] for output in data ]


es_client = Elasticsearch ( hosts = "http://localhost:9200" )
set_llm_cache ( SearchableElasticsearchCache ( es_client = es_client , es_index = "llm-chat-cache" ))

Uso de caché de incrustaciones

Los incrustaciones de almacenamiento en caché se obtienen utilizando CacheBackedEmbeddings, de una manera ligeramente diferente a la documentación oficial.

 from llmescache . langchain import ElasticsearchStore
from elasticsearch import Elasticsearch
from langchain . embeddings import CacheBackedEmbeddings
from langchain_openai import OpenAIEmbeddings

es_client = Elasticsearch ( hosts = "http://localhost:9200" )

underlying_embeddings = OpenAIEmbeddings ( model = "text-embedding-3-small" )
store = ElasticsearchStore (
    es_client = es_client , 
    es_index = "llm-embeddings-cache" ,
    namespace = underlying_embeddings . model ,
    metadata = { "project" : "my_llm_project" }
)
cached_embeddings = CacheBackedEmbeddings (
    underlying_embeddings , 
    store
)

De manera similar al caché de chat, se puede subclase ElasticsearchStore para indexar vectores para la búsqueda.

 from llmescache . langchain import ElasticsearchStore
from typing import Any , Dict , List

class SearchableElasticsearchStore ( ElasticsearchStore ):

    @ property
    def mapping ( self ) -> Dict [ str , Any ]:
        mapping = super (). mapping
        mapping [ "mappings" ][ "properties" ][ "vector" ] = { "type" : "dense_vector" , "dims" : 1536 , "index" : True , "similarity" : "dot_product" }
        return mapping
    
    def build_document ( self , llm_input : str , vector : List [ float ]) -> Dict [ str , Any ]:
        body = super (). build_document ( llm_input , vector )
        body [ "vector" ] = vector
        return body

Tenga en cuenta que CacheBackedEmbeddings actualmente no es compatible con consultas en caché, esto significa que las consultas de texto, para las búsquedas vectoriales, no se almacenarán en caché. Sin embargo, al anular el método embed_query , uno debe poder implementarlo fácilmente.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-07-01
tamaño 64.51KB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
elasticsearch

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
promptl

Código Fuente de IA

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo