Download semantic router - Download do código fonte semantic router

semantic router

Outro código-fonte

v0.0.72

Baixar

O roteador semântico é uma camada de decisão super rápida para seus LLMs e agentes. Em vez de aguardar as gerações Slow LLM para tomar decisões de uso de ferramentas, usamos a magia do espaço vetorial semântico para tomar essas decisões- roteando nossas solicitações usando o significado semântico .

Leia os documentos

Investir rápido

Para começar com o semântico, o instalamos assim:

 pip install -qU semantic-router

❗️ Se quiser usar uma versão totalmente local do roteador semântico, você pode usar HuggingFaceEncoder e LlamaCppLLM ( pip install -qU "semantic-router[local]" , veja aqui). Para usar o HybridRouteLayer , você deve pip install -qU "semantic-router[hybrid]" .

Começamos definindo um conjunto de objetos Route . Esses são os caminhos de decisão que o roteador semântico pode decidir usar, vamos tentar duas rotas simples por enquanto - uma para conversar sobre política e outra para o Chitchat :

 from semantic_router import Route

# we could use this as a guide for our chatbot to avoid political conversations
politics = Route (
    name = "politics" ,
    utterances = [
        "isn't politics the best thing ever" ,
        "why don't you tell me about your political opinions" ,
        "don't you just love the president" ,
        "they're going to destroy this country!" ,
        "they will save the country!" ,
    ],
)

# this could be used as an indicator to our chatbot to switch to a more
# conversational prompt
chitchat = Route (
    name = "chitchat" ,
    utterances = [
        "how's the weather today?" ,
        "how are things going?" ,
        "lovely weather today" ,
        "the weather is horrendous" ,
        "let's go to the chippy" ,
    ],
)

# we place both of our decisions together into single list
routes = [ politics , chitchat ]

Temos nossas rotas prontas, agora inicializamos um modelo de incorporação / codificador. Atualmente, apoiamos um CohereEncoder e OpenAIEncoder - mais codificadores serão adicionados em breve. Para inicializá -los, fazemos:

 import os
from semantic_router . encoders import CohereEncoder , OpenAIEncoder

# for Cohere
os . environ [ "COHERE_API_KEY" ] = "<YOUR_API_KEY>"
encoder = CohereEncoder ()

# or for OpenAI
os . environ [ "OPENAI_API_KEY" ] = "<YOUR_API_KEY>"
encoder = OpenAIEncoder ()

Com nossas routes e encoder definidos, agora criamos um RouteLayer . A camada de rota lida com nossa tomada de decisão semântica.

 from semantic_router . layer import RouteLayer

rl = RouteLayer ( encoder = encoder , routes = routes )

Agora podemos usar nossa camada de rota para tomar decisões super rápidas com base nas consultas do usuário. Vamos tentar com duas consultas que devem acionar nossas decisões de rota:

 rl ( "don't you love politics?" ). name

 [Out]: 'politics'

Decisão correta, vamos tentar outro:

 rl ( "how's the weather today?" ). name

 [Out]: 'chitchat'

Temos as duas decisões corretas! Agora vamos tentar enviar uma consulta não relacionada:

 rl ( "I'm interested in learning about llama 2" ). name

 [Out]:

Nesse caso, nenhuma decisão poderia ser tomada, pois não tínhamos correspondências - então nossa camada de rota retornou None !

Integrações

Os codificadores do roteador semântico incluem integrações fáceis de usar com Cohere, Openai, Abragem de rosto, fastembed e muito mais-até apoiamos a multimodalidade!.

Nosso espaço vetorial de enunciado também se integra com Pinecone e Qdrant!

Recursos

Documentos

Caderno	Descrição
Introdução	Introdução ao roteador semântico e rotas estáticas
Rotas dinâmicas	Rotas dinâmicas para geração de parâmetros e chamadas de funçãoC
Salvar/carregar camadas	Como salvar e carregar `RouteLayer` do arquivo
Integração de Langchain	Como integrar o roteador semântico com agentes Langchain
Execução local	Roteador semântico totalmente local com rotas dinâmicas- modelos locais, como o Mistral 7B, supera o GPT-3.5 na maioria dos testes
Otimização de rota	Como treinar limiares de camada de rota para otimizar o desempenho
Rotas multimodais	Usando rotas multimodais para identificar fotos de shrek vs. não-shrek

Curso online

Curso de roteador semântico

Comunidade

Dimitrios Manias, Ali Chouman, Abdallah Shami, roteamento semântico para um desempenho aprimorado do gerenciamento de rede 5G com base em Intent assistido por LLM, IEEE GLOBECOM 2024
Julian Horsey, camada de decisão super -rápida do roteador semântico para agentes LLMs e AI, gadgets nerds
Azhar, Beyond Basic Chatbots: Como o roteador semântico está mudando o jogo, ai insights @ médio
Daniel Avila, roteador semântico: aprimorando o controle em conversas LLM, codeGPT @ Medium
Yogendra Sisodia, Stop Chat-Gpt de ir desonesto em produção com roteador semântico, Medium
Aplicativos Aniket Hingane, LLM: Por que você deve saber o roteador semântico em 2024: Parte 1, Médio
Vendas de Adrien ,? Roteador semântico w. Ollama/Gemma2: Desafio da linha direta da vida real?
Adrien Sales, Kaggle Notebook? Roteador semântico: ollama / gemma2:9b Hotline

Expandir

Informações adicionais

Versão v0.0.72
Tipo Outro código-fonte
Data da Última Atualização 2025-02-24
tamanho 21.5MB
Vindo de Github

Aplicativos Relacionados

router

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos