Unduh ToolEmu - Unduh Kode Sumber ToolEmu

ToolEmu

Kode Sumber AI

1.0.0

Unduh

Toolemu: Mengidentifikasi risiko agen LM dengan kotak pasir yang ditemui LM

[? Kertas] [situs web] [? Demo] [? Twitter]

Kemajuan terbaru dalam agen model bahasa (LM) dan penggunaan alat, dicontohkan oleh aplikasi seperti plugin chatgpt, memungkinkan serangkaian kemampuan yang kaya tetapi juga memperkuat risiko potensial - seperti membocorkan data pribadi atau menyebabkan kerugian keuangan. Mengidentifikasi risiko ini bersifat padat karya, mengharuskan penerapan alat, secara manual mengatur lingkungan untuk setiap skenario pengujian, dan menemukan kasus yang berisiko. Ketika alat dan agen menjadi lebih kompleks, biaya pengujian yang tinggi akan membuatnya semakin sulit untuk menemukan risiko taruhan tinggi, berekor panjang. Toolemu adalah kerangka kerja emulasi berbasis LM yang memungkinkan mengidentifikasi dan menilai risiko tersebut pada skala, memfasilitasi pengembangan agen LM Safter.

Repo ini berisi kode untuk:

menguji agen LM dengan kasus uji spesifik dalam emulasi
Mengevaluasi agen LM dengan evaluator otomatis dan tolok ukur dikuratori kami
Kurator Toolkit dan Kasing Uji Anda Sendiri

Fleksibilitas ToolEMU memudahkan untuk membuat alat baru dan kasus uji untuk menguji agen LM. Kami dengan hangat mengundang Anda untuk meningkatkan tolok ukur kami dengan menyumbangkan toolkit dan tes koper Anda!

Toolemu

Toolemu.mp4

Toolemu membantu dalam mengidentifikasi kegagalan realistis agen LM dengan cepat di berbagai alat dan skenario dalam lingkungan yang ditemui LM dan memfasilitasi pengembangan agen LM yang lebih aman dengan evaluasi LM-automated. Ini terdiri dari 3 komponen utama:

Emulator Alat : Toolemu menggunakan LM yang kuat (misalnya GPT-4) untuk meniru eksekusi alat dalam kotak pasir virtual hanya menggunakan spesifikasi dan inputnya, tanpa memerlukan implementasinya. Hal ini memungkinkan prototipe yang lebih cepat dari agen LM di berbagai skenario, sambil mengakomodasi evaluasi alat-alat berisiko tinggi yang mungkin tidak memiliki implementasi API atau kotak pasir yang ada.
Evaluator Keselamatan & Bantuan : Untuk mendukung penilaian risiko yang dapat diskalakan dan kuantitatif, ToolEMU mencakup evaluator keselamatan berbasis LM untuk mengotomatisasi identifikasi kegagalan potensial yang disebabkan oleh agen LM dan mengukur keparahan risiko yang terkait. Untuk menangkap potensi tradeoff antara keselamatan dan efektivitas, Toolemu juga mencakup evaluator bantuan berbasis LM.
Benchmark yang dikuratori : Kapal Toolemu dengan tolok ukur awal yang mencakup 36 toolkit (311 alat) dan 144 kasus uji untuk evaluasi kuantitatif agen LM di berbagai alat dan skenario. Skalablility Toolemu memungkinkan memperluasnya ke lebih banyak alat dan skenario.

Pengaturan

Instalasi

Untuk menjalankan kode kami, kami memerlukan instalasi paket lain yang disebut PromptCoder. Pacakge ini digunakan untuk mengelola sistem petunjuk kami dengan cara yang dimodulasi. Harap dicatat bahwa paket ini masih dalam pengembangan.

Kami menyarankan Anda menginstal paket menggunakan PIP dalam mode editing, yang berarti bahwa setiap perubahan yang Anda lakukan ke kode akan langsung efektif tanpa perlu menginstal ulang paket. Untuk menginstal paket, jalankan perintah berikut:

 # Clone the repositories
git clone https://github.com/ryoungj/ToolEmu.git
git clone https://github.com/dhh1995/PromptCoder.git
# Install the packages
cd PromptCoder
pip install -e .
cd ../ToolEmu
pip install -e .

Siapkan Kunci API

Setelah instalasi, Anda perlu mengatur tombol API OpenAI atau Claude Anda. Anda dapat melakukan ini dengan membuat file bernama .env di direktori proyek, dan kemudian memasukkan kunci Anda ke dalam file ini sebagai berikut:

OPENAI_API_KEY=[YOUR_OPENAI_KEY]

Jika Anda ingin menjalankan model Claude , ANTHROPIC_API_KEY juga diperlukan.

Awal yang cepat

Menjalankan kasus uji spesifik dalam emulasi

[Coba Demo Kami] [Jalankan di Notebook]

Untuk memulai, cobalah kasus uji khusus di emulator kami melalui demo kami. Di sini, Anda dapat menjalankan kedua kasus sampel kami dan salah satu dari kasus Anda sendiri. Selain itu, kami menawarkan buku catatan di mana Anda dapat memilih dan menjalankan casing dari dataset kurasi kami yang luas dan memiliki kontrol granular atas pengaturan. Instruksi terperinci disediakan di dalam.

Mengevaluasi agen LM dengan tolok ukur kami

Untuk mengevaluasi agen LM spesifik dalam patokan kurasi kami yang terdiri dari 144 kasus uji dan 36 toolkit dalam assets/ folder, jalankan perintah berikut:

python scripts/run.py

Script akan menjalankan agen dalam emulator kami (dengan scripts/emulate.py ), dan kemudian mengevaluasi lintasan yang ditiru (dengan scripts/evaluate.py ). Hasil evaluasi akan dicetak ke konsol menggunakan scripts/helper/read_eval_results.py . Untuk mengevaluasi dengan pengaturan tertentu, tentukan argumen berikut:

--agent-model : Model dasar untuk agen, default gpt-4-0613 .
--agent-temperature : Suhu agen, default 0.
--agent-type : Jenis agen, naive default dengan prompt dasar termasuk hanya instruksi dan contoh format. Opsi lain termasuk ss_only (termasuk persyaratan keselamatan) atau helpful_ss (termasuk persyaratan keselamatan dan bantuan)
--simulator-type : Jenis simulator, default menjadi adv_thought (untuk emulator permusuhan). Opsi lain adalah std_thought (untuk emulator standar).
--batch-size : Ukuran batch yang digunakan untuk menjalankan emulasi dan evaluasi, default 5. Anda mungkin mengalami kesalahan batas tingkat sering jika Anda mengaturnya lebih besar dari 10.

Perhatikan bahwa biaya untuk menjalankan dan mengevaluasi kasus uji adalah sekitar $ 1,2 , total ~ $ 170 untuk menjalankan seluruh dataset. Untuk mengevaluasi subset dari kasus uji, Anda dapat menentukan jumlah kasus ( --trunc-num ) untuk dijalankan. Misalnya, mengaturnya ke 10 hanya akan menjalankan 10 kasus uji pertama (setelah acak shuffle dengan --shuffle ).

Untuk kontrol terperinci atas pipa, silakan merujuk ke skrip/ folder.

Kurator toolkit dan test case Anda

Jika Anda ingin mengkuratori toolkit Anda sendiri atau kasus uji mengikuti spesifikasi kami, kami menyediakan skrip untuk bertukar pikiran dan menghasilkan set awal dengan GPT-4 dari mana Anda dapat meninjau, memfilter, dan memperbaiki ke set yang dikuratori.

Bergantung pada kasus penggunaan spesifik Anda, Anda mungkin ingin mempertimbangkan opsi berikut, mulai dari kurasi data yang sederhana hingga yang lebih kompleks:

Penyelesaian Kasus Uji : Jika Anda memiliki kasus uji tertentu (yaitu, toolkit, instruksi pengguna, dan risiko potensial) dalam pikiran, dan ingin menggunakan GPT-4 untuk mengisi bidang tambahan (mis.
Kurasi Test Case : Jika Anda ingin mengkuratori serangkaian uji yang besar dan beragam dengan set toolkit kami yang dikuratori, dan menggunakan GPT-4 untuk melakukan brainstorming set awal, silakan lihat kurasi test case untuk detailnya.
Kurasi Toolkit : Jika Anda ingin membuat set toolkit baru, dan menggunakan GPT-4 untuk melakukan brainstorming set awal atau/dan menghasilkan spesifikasi toolkit, silakan lihat kurasi toolkit untuk detailnya.

Untuk detail lebih lanjut, silakan merujuk ke ReadMe generasi.

Berkontribusi

Kami menyambut kontribusi untuk repositori ini, terutama dalam menyumbangkan alat baru dan kasus uji untuk memperluas tolok ukur evaluasi kami. Silakan merujuk ke pedoman yang berkontribusi untuk detail lebih lanjut.

Kutipan

 @inproceedings{ruan2024toolemu,
  title={Identifying the Risks of LM Agents with an LM-Emulated Sandbox},
  author={Ruan, Yangjun and Dong, Honghua and Wang, Andrew and Pitis, Silviu and Zhou, Yongchao and Ba, Jimmy and Dubois, Yann and Maddison, Chris J and Hashimoto, Tatsunori},
  booktitle={The Twelfth International Conference on Learning Representations},
  year={2024}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-06
ukuran 2.85MB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua