Download archgw - download do código -fonte do archgw

archgw

Outro código-fonte

release 0.1.5 ?

Baixar

Construa agentes de IA rápidos, observáveis e personalizados.

O ARCH é um proxy distribuído da camada inteligente 7 projetado para proteger, observar e personalizar agentes de IA com suas APIs.

Projetado com LLMs criados para propósitos, lida com as tarefas críticas, mas indiferenciadas, relacionadas ao manuseio e processamento de instruções, incluindo a detecção e rejeição de tentativas de jailbreak, chamando de forma inteligente as APIs de "back-end" para atender à solicitação do usuário, de acordo com a solicitação de uma solicitação de lotes, a devolução de uma solicitação de llms.

Arch é construído sobre (e pelos principais colaboradores de) proxy do enviado com a crença de que:

Os avisos são solicitações de usuário diferenciadas e opacas, que exigem os mesmos recursos que as solicitações tradicionais de HTTP, incluindo manuseio seguro, roteamento inteligente, observabilidade robusta e integração com sistemas de back -end (API) para personalização - toda a lógica de negócios externa.*

Recursos principais :

Construído em Enviado: o Arch é executado ao lado de servidores de aplicativos e se baseia no topo dos recursos comprovados de gerenciamento e escalabilidade HTTP da Envoy para lidar com o tráfego de entrada e saída relacionado a prompts e LLMs.
Função chamando aplicativos de agênticos e rag rápidos. Projetado com LLMs criados para propósitos para lidar com tarefas rápidas, econômicas e precisas baseadas em prompt, como chamadas de função/API e extração de parâmetros de prompts.
Guarda rápida: o Arch centraliza o Prompt Guardrails para evitar tentativas de jailbreak e garantir interações seguras do usuário sem escrever uma única linha de código.
Gerenciamento de tráfego: o Arch gerencia chamadas LLM, oferecendo tentativas inteligentes, corte automático e conexões a montante resilientes para disponibilidade contínua.
Observabilidade baseada em padrões: o ARCH usa o padrão de contexto W3C Trace para permitir o rastreamento completo de solicitações entre aplicativos, garantindo compatibilidade com ferramentas de observabilidade e fornece métricas para monitorar a latência, uso de token e taxas de erro, ajudando a otimizar o desempenho do aplicativo de IA.

Salte para nossos documentos para saber como você pode usar o Arch para melhorar a velocidade, a segurança e a personalização de seus aplicativos genai.

Importante

Hoje, a função Calling LLM (arqui-função) projetada para os cenários Agentic e Rag é hospedada gratuitamente na região central dos EUA. Para oferecer latências e taxa de transferência consistentes e gerenciar nossas despesas, permitiremos o acesso à versão hospedada por meio de teclas de desenvolvedores em breve e forneceremos a opção de executar esse LLM localmente. Para mais detalhes, consulte esta edição #258

Contato

Para entrar em contato conosco, junte -se ao nosso servidor Discord. Estaremos monitorando isso ativamente e oferecendo suporte lá.

Demos

Previsão do tempo - Anduque os recursos de chamada de função principal do Arch Gateway usando o serviço de previsão do tempo
Agente de seguros - Construa um agente de seguros completo com arco
Agente de rede - Construa um co -piloto/agente de rede com arco

Investir rápido

Siga este guia para aprender a configurar rapidamente o Arch e integrá -lo aos seus aplicativos generativos de IA.

Pré -requisitos

Antes de começar, verifique se você tem o seguinte:

Docker & Python instalado em seu sistema
API Keys para provedores de LLM (se estiver usando LLMs externos)

Etapa 1: Instale o arco

A CLI de Arch permite que você gerencie e interaja com o Gateway do Arch com eficiência. Para instalar a CLI, basta executar o seguinte comando: Dica: Recomendamos que os desenvolvedores criem um novo ambiente virtual do Python para isolar dependências antes de instalar o Arch. Isso garante que o ARCHGW e suas dependências não interfiram em outros pacotes em seu sistema.

Certifique -se de ter os seguintes utilitários instalados antes de prosseguir,

Sistema Docker (V24)
Docker Compose (v2.29)
Python (v3.12)
Poesia (v1.8.3. Nota: Somente necessária para o desenvolvimento local )

$ python -m venv venv
$ source venv/bin/activate   # On Windows, use: venvScriptsactivate
$ pip install archgw

Etapa 2: Configure o Arch com seu aplicativo

O ARCH opera com base em um arquivo de configuração, onde você pode definir provedores de LLM, metas solicitadas, corrimão, etc. Abaixo está um exemplo de configuração para você começar:

 version : v0.1
listener :
  address : 127.0.0.1
  port : 8080 # If you configure port 443, you'll need to update the listener with tls_certificates
  message_format : huggingface

# Centralized way to manage LLMs, manage keys, retry logic, failover and limits in a central way
llm_providers :
  - name : OpenAI
    provider : openai
    access_key : $OPENAI_API_KEY
    model : gpt-3.5-turbo
    default : true

# default system prompt used by all prompt targets
system_prompt : |
  You are a network assistant that helps operators with a better understanding of network traffic flow and perform actions on networking operations. No advice on manufacturers or purchasing decisions.

prompt_targets :
    - name : device_summary
      description : Retrieve network statistics for specific devices within a time range
      endpoint :
        name : app_server
        path : /agent/device_summary
      parameters :
        - name : device_ids
          type : list
          description : A list of device identifiers (IDs) to retrieve statistics for.
          required : true  # device_ids are required to get device statistics
        - name : days
          type : int
          description : The number of days for which to gather device statistics.
          default : " 7 "
    - name : reboot_devices
      description : Reboot a list of devices
      endpoint :
        name : app_server
        path : /agent/device_reboot
      parameters :
        - name : device_ids
          type : list
          description : A list of device identifiers (IDs).
          required : true
        - name : days
          type : int
          description : A list of device identifiers (IDs)
          default : " 7 "

# Arch creates a round-robin load balancing between different endpoints, managed via the cluster subsystem.
endpoints :
  app_server :
    # value could be ip address or a hostname with port
    # this could also be a list of endpoints for load balancing
    # for example endpoint: [ ip1:port, ip2:port ]
    endpoint : host.docker.internal:18083
    # max time to wait for a connection to be established
    connect_timeout : 0.005s

Etapa 3: Usando o cliente OpenAi com Arch como um gateway de saída

Faça chamadas de saída via Arch

 from openai import OpenAI

# Use the OpenAI client as usual
client = OpenAI (
  # No need to set a specific openai.api_key since it's configured in Arch's gateway
  api_key = '--' ,
  # Set the OpenAI API base URL to the Arch gateway endpoint
  base_url = "http://127.0.0.1:12000/v1"
)

response = client . chat . completions . create (
    # we select model from arch_config file
    model = "--" ,
    messages = [{ "role" : "user" , "content" : "What is the capital of France?" }],
)

print ( "OpenAI Response:" , response . choices [ 0 ]. message . content )

Observabilidade

O Arch foi projetado para apoiar a melhor observabilidade da classe, apoiando padrões abertos. Leia nossos documentos sobre observabilidade para obter mais detalhes sobre rastreamento, métricas e logs

TEXTO DE ALT

Contribuição

Adoraríamos feedback sobre o nosso roteiro e recebemos contribuições para Arch ! Esteja você corrigindo bugs, adicionando novos recursos, melhorando a documentação ou criando tutoriais, sua ajuda é muito apreciada. Visite nosso guia de contribuição para mais detalhes

Expandir

Informações adicionais