Descargar ToolEmu - Descargar el código fuente de ToolEmu

ToolEmu

Código Fuente de IA

1.0.0

Descargar

Toolemu: Identificación de los riesgos de los agentes de LM con un Sandbox emulado LM

[? Papel] [Sitio web] [? Demo] [? Gorjeo]

Los avances recientes en los agentes del Modelo de Lenguaje (LM) y el uso de la herramienta, ejemplificados por aplicaciones como los complementos de ChatGPT, permiten un conjunto rico de capacidades pero también amplifican los riesgos potenciales, como la fuga de datos privados o causan pérdidas financieras. Identificar estos riesgos es laborioso, lo que requiere la implementación de las herramientas, estableciendo manualmente el medio ambiente para cada escenario de prueba y encontrar casos de riesgo. A medida que las herramientas y los agentes se vuelven más complejos, el alto costo de probar estos agentes hará que sea cada vez más difícil encontrar riesgos de alto riesgo y cola larga. ToolEmu es un marco de emulación basado en LM que permite identificar y evaluar dichos riesgos a escala, facilitando el desarrollo de agentes de Safter LM.

Este repositorio contiene el código para:

Prueba de agentes de LM con casos de prueba específicos en emulación
Evaluación de agentes de LM con nuestros evaluadores automáticos y un punto de referencia curado
Curando sus propios kits de herramientas y casos de prueba

La flexibilidad de ToolEmu facilita la curación de nuevos kits de herramientas y casos de prueba para probar agentes de LM. ¡Lo invitamos calurosamente a mejorar nuestro punto de referencia al contribuir con sus kits de herramientas curados y casos de prueba!

Toolemu

Toolemu.mp4

Toolemu ayuda a identificar rápidamente las fallas realistas de los agentes de LM en diversas herramientas y escenarios dentro de un entorno emulado de LM y facilita el desarrollo de agentes LM más seguros con evaluaciones automatizadas de LM. Consiste en 3 componentes principales:

Emuladores de herramientas : ToolEmu utiliza un LM fuerte (por ejemplo, GPT-4) para emular la ejecución de herramientas en un sandbox virtual utilizando solo sus especificaciones e entradas, sin necesidad de sus implementaciones. Esto permite una prototipos más rápido de los agentes de LM en diferentes escenarios, al tiempo que acomoda la evaluación de herramientas de alto riesgo que pueden carecer de API existentes o implementaciones de Sandbox.
Evaluadores de seguridad y ayuda : para apoyar las evaluaciones de riesgos escalables y cuantitativas, ToolEmu incluye un evaluador de seguridad basado en LM para automatizar la identificación de fallas potenciales causadas por los agentes de LM y cuantifica las gravedades de riesgo asociadas. Para capturar la compensación potencial entre seguridad y efectividad, ToolEmu también incluye un evaluador de ayuda basado en LM.
Benchmark curado : Toolemu se envía con un punto de referencia inicial que cubre 36 kits de herramientas (311 herramientas) y 144 casos de prueba para una evaluación cuantitativa de agentes de LM en diversas herramientas y escenarios. La escamas de herramientas permite expandirlo a más herramientas y escenarios.

Configuración

Instalación

Para ejecutar nuestro código, requerimos la instalación de otro paquete llamado PromptCoder. Este Pacakge se utiliza para administrar nuestro sistema de indicaciones de manera modularizada. Tenga en cuenta que este paquete todavía está en desarrollo.

Le sugerimos que instale el paquete usando PIP en modo editable, lo que significa que cualquier cambio que realice en el código será efectivo instantáneamente sin necesidad de reinstalar el paquete. Para instalar los paquetes, ejecute los siguientes comandos:

 # Clone the repositories
git clone https://github.com/ryoungj/ToolEmu.git
git clone https://github.com/dhh1995/PromptCoder.git
# Install the packages
cd PromptCoder
pip install -e .
cd ../ToolEmu
pip install -e .

Configurar las teclas API

Después de la instalación, debe configurar sus teclas API OpenAI o Claude. Puede hacer esto creando un archivo llamado .env en el directorio del proyecto, y luego ingresando sus claves en este archivo de la siguiente manera:

OPENAI_API_KEY=[YOUR_OPENAI_KEY]

Si desea ejecutar el modelo Claude , también se requiere el ANTHROPIC_API_KEY .

Comienzo rápido

Ejecución de casos de prueba específicos en emulación

[Prueba nuestra demostración] [Ejecutar en cuaderno]

Para comenzar, pruebe casos de prueba específicos en nuestro emulador a través de nuestra demostración. Aquí, puede ejecutar nuestros casos de muestra y cualquiera de sus propios casos curados. Además, ofrecemos un cuaderno donde puede seleccionar y ejecutar casos desde nuestro extenso conjunto de datos curados y tener control granular sobre la configuración. Se proporcionan instrucciones detalladas dentro.

Evaluación de agentes de LM con nuestro punto de referencia

Para evaluar un agente de LM específico dentro de nuestro punto de referencia curado que consta de 144 casos de prueba y 36 kits de herramientas en los assets/ carpeta, ejecute el siguiente comando:

python scripts/run.py

El script ejecutará el agente en nuestro emulador (con scripts/emulate.py ) y luego evaluará las trayectorias emuladas (con scripts/evaluate.py ). Los resultados de la evaluación se imprimirán en la consola utilizando scripts/helper/read_eval_results.py . Para evaluar con una configuración específica, especifique los siguientes argumentos:

--agent-model : el modelo base para el agente, predeterminado gpt-4-0613 .
--agent-temperature : la temperatura del agente, predeterminado 0.
--agent-type : el tipo de agente, predeterminado naive con el mensaje básico que incluye solo las instrucciones y ejemplos de formato. Otras opciones incluyen ss_only (incluyen requisitos de seguridad) o helpful_ss (incluyen requisitos de seguridad y ayuda)
--simulator-type : el tipo de simulador, predeterminado que se debe ser adv_thought (para el emulador adversario). Otra opción es std_thought (para emulador estándar).
--batch-size : el tamaño de lote utilizado para ejecutar la emulación y la evaluación, predeterminada 5. Puede encontrar un error de límite de velocidad frecuente si lo establece para que sea mayor de 10.

Tenga en cuenta que el costo de ejecutar y evaluar un caso de prueba es de aproximadamente $ 1.2 , por un total de ~ $ 170 por ejecutar todo el conjunto de datos. Para evaluar un subconjunto de los casos de prueba, puede especificar el número de casos ( --trunc-num ) para ejecutar. Por ejemplo, establecerlo en 10 solo ejecutará los primeros 10 casos de prueba (después de la baraja aleatoria con --shuffle ).

Para obtener un control detallado sobre la tubería, consulte los scripts/ carpeta.

Curación de sus kits de herramientas y casos de prueba

Si desea curar sus propios kits de herramientas o casos de prueba después de nuestras especificaciones, proporcionamos scripts para hacer una lluvia de ideas y generar un conjunto inicial con GPT-4 del que puede revisar, filtrar y refinar a su conjunto curado.

Dependiendo de su caso de uso específico, es posible que desee considerar las siguientes opciones, que van desde la curación de datos simple hasta más compleja:

Finalización del caso de prueba : si tiene un caso de prueba específico (es decir, kit de herramientas, instrucción del usuario y riesgos potenciales) en mente, y desea utilizar GPT-4 para completar campos adicionales (por ejemplo, subsecificaciones) requeridos por nuestro emulador adversario y evaluador de seguridad, utilice este cuaderno.
Curación del caso de prueba : si desea seleccionar un conjunto grande y diverso de casos de prueba con nuestro conjunto de kit de herramientas curadas, y use GPT-4 para hacer una lluvia de ideas un conjunto inicial, consulte la curación del caso de prueba para obtener detalles.
Curación del kit de herramientas : si desea crear un nuevo conjunto de kits de herramientas y usar GPT-4 para hacer una lluvia de ideas sobre un conjunto inicial o generar las especificaciones del kit de herramientas, consulte la curación del kit de herramientas para obtener detalles.

Para obtener más detalles, consulte el ReadMe de generación.

Que contribuye

Agradecemos las contribuciones a este repositorio, especialmente al contribuir con nuevas herramientas y probar casos para expandir nuestro punto de referencia de evaluación. Consulte las pautas contribuyentes para obtener más detalles.

Citación

 @inproceedings{ruan2024toolemu,
  title={Identifying the Risks of LM Agents with an LM-Emulated Sandbox},
  author={Ruan, Yangjun and Dong, Honghua and Wang, Andrew and Pitis, Silviu and Zhou, Yongchao and Ba, Jimmy and Dubois, Yann and Maddison, Chris J and Hashimoto, Tatsunori},
  booktitle={The Twelfth International Conference on Learning Representations},
  year={2024}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-06
tamaño 2.85MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo