Descarga semantic router - Descargar el código fuente semantic router

semantic router

Otro código fuente

v0.0.72

Descargar

El enrutador semántico es una capa de toma de decisiones súper rápida para sus LLM y agentes. En lugar de esperar a que las generaciones de LLM lentas tomen decisiones de uso de herramientas, utilizamos la magia del espacio vectorial semántico para tomar esas decisiones, enrutando nuestras solicitudes utilizando el significado semántico .

Leer los documentos

Inicio rápido

Para comenzar con el enrutador semántico lo instalamos así:

 pip install -qU semantic-router

❗️ Si desea usar una versión totalmente local del enrutador semántico, puede usar HuggingFaceEncoder y LlamaCppLLM ( pip install -qU "semantic-router[local]" , ver aquí). Para usar el HybridRouteLayer , debe pip install -qU "semantic-router[hybrid]" .

Comenzamos definiendo un conjunto de objetos Route . Estos son los caminos de decisión que el enrutador semántico puede decidir usar, intentemos dos rutas simples por ahora, una para hablar sobre política y otra para Chitchat :

 from semantic_router import Route

# we could use this as a guide for our chatbot to avoid political conversations
politics = Route (
    name = "politics" ,
    utterances = [
        "isn't politics the best thing ever" ,
        "why don't you tell me about your political opinions" ,
        "don't you just love the president" ,
        "they're going to destroy this country!" ,
        "they will save the country!" ,
    ],
)

# this could be used as an indicator to our chatbot to switch to a more
# conversational prompt
chitchat = Route (
    name = "chitchat" ,
    utterances = [
        "how's the weather today?" ,
        "how are things going?" ,
        "lovely weather today" ,
        "the weather is horrendous" ,
        "let's go to the chippy" ,
    ],
)

# we place both of our decisions together into single list
routes = [ politics , chitchat ]

Tenemos nuestras rutas listas, ahora inicializamos un modelo de incrustación / codificador. Actualmente apoyamos un CohereEncoder y OpenAIEncoder ; pronto se agregarán más codificadores. Para inicializarlos lo hacemos:

 import os
from semantic_router . encoders import CohereEncoder , OpenAIEncoder

# for Cohere
os . environ [ "COHERE_API_KEY" ] = "<YOUR_API_KEY>"
encoder = CohereEncoder ()

# or for OpenAI
os . environ [ "OPENAI_API_KEY" ] = "<YOUR_API_KEY>"
encoder = OpenAIEncoder ()

Con nuestras routes y encoder definidos, ahora creamos un RouteLayer . La capa de ruta maneja nuestra toma de decisiones semánticas.

 from semantic_router . layer import RouteLayer

rl = RouteLayer ( encoder = encoder , routes = routes )

Ahora podemos usar nuestra capa de ruta para tomar decisiones súper rápidas basadas en consultas de usuarios. Intentemos con dos consultas que deberían activar nuestras decisiones de ruta:

 rl ( "don't you love politics?" ). name

 [Out]: 'politics'

Decisión correcta, intentemos otra:

 rl ( "how's the weather today?" ). name

 [Out]: 'chitchat'

¡Tenemos ambas decisiones correctas! Ahora intentemos enviar una consulta no relacionada:

 rl ( "I'm interested in learning about llama 2" ). name

 [Out]:

En este caso, no se pudo tomar una decisión, ya que no tuvimos coincidencias, por lo que nuestra capa de ruta no devolvió None .

Integración

Los codificadores del enrutador semántico incluyen integraciones fáciles de usar con Cohere, OpenAi, abrazando la cara, la comida rápida y más, ¡incluso apoyamos la multimodalidad!

¡Nuestro espacio vectorial enunciado también se integra con Pinecone y Qdrant!

Recursos

Documento

Computadora portátil	Descripción
Introducción	Introducción al enrutador semántico y las rutas estáticas
Rutas dinámicas	Rutas dinámicas para las llamadas de generación de parámetros y funciones
Guardar/cargar capas	Cómo guardar y cargar `RouteLayer` desde el archivo
Integración de Langchain	Cómo integrar el enrutador semántico con los agentes de Langchain
Ejecución local	Enrutador semántico totalmente local con rutas dinámicas: modelos locales como Mistral 7B superan a GPT-3.5 en la mayoría de las pruebas
Optimización de ruta	Cómo entrenar los umbrales de la capa de ruta para optimizar el rendimiento
Rutas multimodales	Uso de rutas multimodales para identificar fotos de Shrek vs. Not-Shrek

Curso en línea

Curso de enrutador semántico

Comunidad

Dimitrios Manias, Ali Chouman, Abdallah Shami, enrutamiento semántico para un mejor rendimiento de la gestión y orquestación de redes básicas basadas en la intención de LLM, IEEE Globecom 2024
Julian Horsey, capa de decisión súper rápida de enrutador semántico para LLM y agentes de IA, gadgets geeky
Azhar, más allá de los chatbots básicos: cómo el enrutador semántico está cambiando el juego, AI Insights @ Medium
Daniel Avila, enrutador semántico: mejora del control en las conversaciones de LLM, CodeGpt @ Medium
Yogendra Sisodia, deja de chat-GPT para que se vuelva pícaro en producción con enrutador semántico, medio
Aplicaciones de Aniket Hingane, LLM: por qué debes conocer el enrutador semántico en 2024: Parte 1, Medio
Adrien Ventas ,? Enrutador semántico w. Ollama/Gemma2: ¿Desafío de línea directa de la vida real?
Adrien Sales, Kaggle Notebook? Enrutador semántico: ollama / gemma2:9b Línea directa

Expandir

Información adicional

Versión v0.0.72
Tipo Otro código fuente
Fecha de actualización 2025-02-24
tamaño 21.5MB
Proviene de Github

Aplicaciones relacionadas

router

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo