ToolEmu Download - ToolEmu Quellcode herunterladen

ToolEmu

AI-Quellcode

1.0.0

Herunterladen

Toolemu: Identifizierung der Risiken von LM-Wirkstoffen mit einem LM-emulierten Sandkasten

[? Papier] [Website] [? Demo] [? Twitter]

Jüngste Fortschritte in den Agenten und die Verwendung von Instrumenten im Sprachmodell (LM) und der Verwendung von Tools, die von Anwendungen wie ChatGPT -Plugins veranschaulicht werden, ermöglichen eine große Reihe von Funktionen, verstärken jedoch auch potenzielle Risiken - wie ein undesesendes privates Daten oder die Verursachung von finanziellen Verlusten. Die Identifizierung dieser Risiken ist arbeitsintensiv, erfordert die Implementierung der Tools, die manuelle Einrichtung der Umgebung für jedes Testszenario und die Suche nach riskanten Fällen. Wenn Werkzeuge und Agenten komplexer werden, werden die hohen Kosten für die Prüfung dieser Agenten es immer schwieriger, hohe Einsätze, langschwanzige Risiken zu finden. Toolemu ist ein LM-basierter Emulationsrahmen, mit dem die Identifizierung und Bewertung solcher Risiken im Maßstab identifiziert werden kann, wodurch die Entwicklung von Safter LM-Agenten erleichtert wird.

Dieses Repo enthält den Code für:

Testen von LM -Wirkstoffen mit spezifischen Testfällen in der Emulation
Bewertung von LM -Agenten mit unseren automatischen Bewertern und kuratierten Benchmark
Kurieren Sie Ihre eigenen Toolkits und Testfälle

Die Flexibilität von Toolemu erleichtert es einfach, neue Toolkits und Testfälle für das Testen von LM -Agenten zu kuratieren. Wir laden Sie herzlich ein, unseren Benchmark zu verbessern, indem wir Ihre kuratierten Toolkits und Testfälle beitragen!

Toolemu

Toolemu.mp4

Toolemu hilft dabei, realistische Ausfälle von LM-Agenten in verschiedenen Werkzeugen und Szenarien in einer LM-emulierten Umgebung schnell zu identifizieren und erleichtert die Entwicklung sicherer LM-Wirkstoffe mit LM-automatischen Bewertungen. Es besteht aus 3 Hauptkomponenten:

Tool-Emulatoren : Toolemu verwendet ein starkes LM (z. B. GPT-4), um die Ausführung von Tools in einer virtuellen Sandkiste nur mit ihren Spezifikationen und Eingaben zu emulieren, ohne ihre Implementierungen zu benötigen. Dies ermöglicht eine schnellere Prototypierung von LM-Wirkstoffen in verschiedenen Szenarien und berücksichtigt gleichzeitig die Bewertung von Tools mit hohen Einsätzen, denen möglicherweise vorhandene APIs oder Sandbox-Implementierungen fehlen.
Sicherheits- und Hilfsmaßnahmen für Evaluatoren : Toolemu umfasst skalierbare und quantitative Risikobewertungen und umfasst einen LM-basierten Sicherheitsbewerter, um die Identifizierung potenzieller Fehler zu automatisieren, die von LM-Agenten verursacht werden, und quantifiziert die damit verbundenen Risikostreifen. Um den potenziellen Kompromiss zwischen Sicherheit und Effektivität zu erfassen, umfasst Toolemu auch einen LM-basierten Hilfsförderer.
Kuratiertem Benchmark : Toolemu wird mit einem ersten Benchmark mit 36 Toolkits (311 Tools) und 144 Testfällen für eine quantitative Bewertung von LM -Wirkstoffen über verschiedene Werkzeuge und Szenarien geliefert. Die Skalable von Toolemu ermöglicht die Erweiterung von mehr Tools und Szenarien.

Aufstellen

Installation

Um unseren Code auszuführen, erfordern wir die Installation eines anderen Pakets namens Eingabeaufforderung. Dieser Pacakge wird verwendet, um unser System von Eingabeaufforderungen modularisiert zu verwalten. Bitte beachten Sie, dass dieses Paket noch in der Entwicklung ist.

Wir empfehlen Ihnen, das Paket mit PIP im bearbeitbaren Modus zu installieren. Dies bedeutet, dass alle Änderungen, die Sie am Code vornehmen, sofort effektiv sind, ohne das Paket neu zu installieren. Führen Sie die folgenden Befehle aus, um die Pakete zu installieren:

 # Clone the repositories
git clone https://github.com/ryoungj/ToolEmu.git
git clone https://github.com/dhh1995/PromptCoder.git
# Install the packages
cd PromptCoder
pip install -e .
cd ../ToolEmu
pip install -e .

API -Schlüssel einrichten

Nach der Installation müssen Sie Ihre OpenAI- oder Claude -API -Schlüssel einrichten. Sie können dies tun, indem Sie eine Datei namens .env im Projektverzeichnis erstellen und Ihre Schlüssel wie folgt in diese Datei eingeben:

OPENAI_API_KEY=[YOUR_OPENAI_KEY]

Wenn Sie das Claude -Modell ausführen möchten, ist auch der ANTHROPIC_API_KEY erforderlich.

Schneller Start

Ausführen spezifischer Testfälle in der Emulation ausführen

[Probieren Sie unsere Demo aus] [Rennen Sie in Notebook]

Probieren Sie zunächst bestimmte Testfälle in unserem Emulator über unsere Demo aus. Hier können Sie sowohl unsere Beispielfälle als auch alle Ihrer eigenen kuratierten Fälle ausführen. Darüber hinaus bieten wir ein Notizbuch an, in dem Sie Fälle aus unserem umfangreichen kuratierten Datensatz auswählen und ausführen können und über das Setup eine granulare Kontrolle haben. Innerhalb detaillierter Anweisungen werden innerhalb dessen gegeben.

Bewertung von LM -Agenten mit unserem Benchmark

Um einen bestimmten LM -Agenten in unserem kuratierten Benchmark zu bewerten, das aus 144 Testfällen und 36 Toolkits im assets/ im Ordner besteht, führen Sie den folgenden Befehl aus:

python scripts/run.py

Das Skript wird den Agenten in unserem Emulator ausführen (mit scripts/emulate.py ) und dann die emulierten Trajektorien (mit scripts/evaluate.py ) bewerten. Die Bewertungsergebnisse werden mit scripts/helper/read_eval_results.py in die Konsole gedruckt. Um mit einem bestimmten Setup zu bewerten, geben Sie die folgenden Argumente an:

--agent-model : Das Basismodell für den Agenten, Standard gpt-4-0613 .
--agent-temperature : Die Temperatur des Wirkstoffs, Standard 0.
--agent-type : Die Art des Agenten, standardmäßig naive mit der grundlegenden Eingabeaufforderung, einschließlich nur der Formatanweisungen und Beispiele. Weitere Optionen sind ss_only (inklusive Sicherheitsanforderungen) oder helpful_ss (umfassen sowohl Sicherheitsanforderungen als auch Hilfsbereitschaft).
--simulator-type : Der Typ des Simulators, standardmäßig adv_thought (für den kontroversen Emulator). Eine andere Option ist std_thought (für Standard -Emulator).
--batch-size : Die Stapelgröße, die zum Ausführen der Emulation und Bewertung verwendet wird, Standard 5. Sie können auf häufige Ratengrenzfehler stoßen, wenn Sie sie auf größer als 10 einstellen.

Beachten Sie, dass die Kosten für das Ausführen und Bewerten eines Testfalles etwa 1,2 USD beträgt, was einem Gesamtabstand von ~ 170 US -Dollar für das Ausführen des gesamten Datensatzes beträgt. Um eine Teilmenge der Testfälle zu bewerten, können Sie die Anzahl der Fälle ( --trunc-num ) angeben. Wenn Sie es beispielsweise auf 10 festlegen, werden nur die ersten 10 Testfälle ausgeführt (nach zufälliger Shuffle mit --shuffle ).

Eine detaillierte Kontrolle über die Pipeline finden Sie in den Skripten/ den Ordner.

Kurieren Sie Ihre Toolkits und Testfälle

Wenn Sie Ihre eigenen Toolkits oder Testfälle nach unseren Spezifikationen kuratieren möchten, stellen wir Skripte für das Brainstorming an und generieren einen Anfangssatz mit GPT-4, von dem Sie Ihren kuratierten Satz überprüfen, filtern und verfeinern können.

Abhängig von Ihrem spezifischen Anwendungsfall möchten Sie möglicherweise die folgenden Optionen berücksichtigen, die von einfach bis zu komplexerer Datenkuration reichen:

Fertigstellung von Testfall : Wenn Sie über einen bestimmten Testfall (dh Toolkit, Benutzeranweisung und potenzielle Risiken) verfügen und GPT-4 verwenden möchten, um zusätzliche Felder (z. B. Unterspezifikationen) auszufüllen, die von unserem kontinarischen Emulator und Sicherheitsbewerter erforderlich sind, verwenden Sie dieses Notizbuch.
Testfall Kuration : Wenn Sie einen großen und vielfältigen Satz von Testfällen mit unserem kuratierten Toolkit-Set kuratieren und mit GPT-4 einen Brainstorming eines ersten Satzes verwenden möchten, finden Sie Einzelheiten zum Testfall.
Toolkit Curation : Wenn Sie einen neuen Satz von Toolkits erstellen möchten und GPT-4 verwenden möchten, um einen anfänglichen Satz oder///die Toolkit-Spezifikationen zu erzeugen, finden Sie eine Toolkit-Kuration für Details.

Weitere Informationen finden Sie in der Generation Readme.

Beitragen

Wir begrüßen Beiträge zu diesem Repository, insbesondere zu neuen Tools und Testfällen, um unseren Bewertungsbenchmark zu erweitern. Weitere Informationen finden Sie in den beitragenden Richtlinien.

Zitat

 @inproceedings{ruan2024toolemu,
  title={Identifying the Risks of LM Agents with an LM-Emulated Sandbox},
  author={Ruan, Yangjun and Dong, Honghua and Wang, Andrew and Pitis, Silviu and Zhou, Yongchao and Ba, Jimmy and Dubois, Yann and Maddison, Chris J and Hashimoto, Tatsunori},
  booktitle={The Twelfth International Conference on Learning Representations},
  year={2024}
}

Expandieren

Zusätzliche Informationen