llm_adaptive_router Download - llm_adaptive_router Código fonte download

llm_adaptive_router

Código-Fonte de IA

1.0.0

Baixar

Roteador adaptativo LLM

O roteador adaptativo LLM é um pacote Python que permite a seleção de modelo dinâmico com base no conteúdo de consulta. Ele usa pesquisa de vetores eficientes para a categorização inicial e a seleção de granulação fina baseada em LLM para casos complexos. O roteador pode se adaptar e aprender com o feedback, tornando -o adequado para uma ampla gama de aplicações.

Características

Seleção de modelo dinâmico com base no conteúdo de consulta
Pesquisa vetorial eficiente da categorização inicial
Seleção de grão fino baseado em LLM para casos complexos
Aprendizagem adaptativa com o feedback
Configuração flexível de rotas e modelos
Integração fácil com Langchain e vários fornecedores de LLM

Instalação

Você pode instalar o roteador adaptativo LLM usando PIP:

pip3 install llm-adaptive-router

Início rápido

Aqui está um exemplo básico de como usar o roteador adaptativo LLM:

 from llm_adaptive_router import AdaptiveRouter , RouteMetadata
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings , ChatOpenAI
from dotenv import load_dotenv
load_dotenv ()

gpt_3_5_turbo = ChatOpenAI ( model = "gpt-3.5-turbo" )
mini = ChatOpenAI ( model = "gpt-4o-mini" )
gpt_4 = ChatOpenAI ( model = "gpt-4" )

routes = {
    "general" : RouteMetadata (
        invoker = gpt_3_5_turbo ,
        capabilities = [ "general knowledge" ],
        cost = 0.002 ,
        example_sentences = [ "What is the capital of France?" , "Explain photosynthesis." ]
    ),
    "mini" : RouteMetadata (
        invoker = mini ,
        capabilities = [ "general knowledge" ],
        cost = 0.002 ,
        example_sentences = [ "What is the capital of France?" , "Explain photosynthesis." ]
        
    ),
    "math" : RouteMetadata (
        invoker = gpt_4 ,
        capabilities = [ "advanced math" , "problem solving" ],
        cost = 0.01 ,
        example_sentences = [ "Solve this differential equation." , "Prove the Pythagorean theorem." ]
    )
}

llm = ChatOpenAI ( model = "gpt-3.5-turbo" )

router = AdaptiveRouter (
    vectorstore = Chroma ( embedding_function = OpenAIEmbeddings ()),
    llm = llm ,
    embeddings = OpenAIEmbeddings (),
    routes = routes
)

query = "How are you"
query2 = "Write a Python function to hello world"
selected_model_route = router . route ( query )
selected_model_name = selected_model_route
print ( selected_model_name )
invoker = selected_model_route . invoker
response = invoker . invoke ( query )

print ( f"Response: { response } " )

Uso detalhado

Criando metadados de rota

Use a função create_route_metadata para definir rotas:

 from llm_adaptive_router import create_route_metadata

route = create_route_metadata (
    invoker = model_function ,
    capabilities = [ "capability1" , "capability2" ],
    cost = 0.01 ,
    example_sentences = [ "Example query 1" , "Example query 2" ],
    additional_info = { "key" : "value" }
)

Inicializando o adaptiveRouter

Crie uma instância do AdaptiveRouter com suas rotas configuradas:

 router = AdaptiveRouter (
    vectorstore = your_vectorstore ,
    llm = your_llm ,
    embeddings = your_embeddings ,
    routes = your_routes
)

Consultas de roteamento

Use o método route para selecionar o modelo apropriado para uma consulta:

 selected_model_route = router . route ( "Your query here" )
selected_model_name = selected_model_route . model
invoker = selected_model_route . invoker
response = invoker . invoke ( "Your query here" )

Adicionando feedback

Melhore o desempenho do roteador, fornecendo feedback:

 router . add_feedback ( query , selected_model , performance_score )

Recursos avançados

LOJAS VECTORES Custom: O roteador adaptativo LLM suporta várias lojas vetoriais. Você pode usar qualquer loja de vetores que implemente a interface VectorStore da Langchain.
Atualizações dinâmicas de rota: você pode adicionar ou remover rotas dinamicamente:

 router . add_route ( "new_route" , new_route_metadata )
router . remove_route ( "old_route" )

Ajustando o comportamento do roteador: ajuste o comportamento do roteador:

 router . set_complexity_threshold ( 0.8 )
router . set_update_frequency ( 200 )

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-19
tamanho 14.3KB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Cachorro_Fox_Coelho

2022-08-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos