Agen bertenaga LLM yang luar biasa
Berkat kemampuan perencanaan, penalaran, dan pemanggil alat yang mengesankan dari model bahasa besar (LLM), orang secara aktif mempelajari dan mengembangkan agen bertenaga LLM. Agen -agen ini dimungkinkan untuk menyelesaikan tugas kompleks secara otonom (dan kolaboratif), atau mensimulasikan interaksi manusia.
Tujuan kami dengan proyek ini adalah untuk membangun koleksi sumber daya luar biasa yang relevan dengan agen bertenaga LLM yang meliputi kertas, repositori, dan banyak lagi. Kami berusaha untuk menjaga ini diperbarui secara teratur dan terus menerus. Kami sangat menghargai kontribusi apa pun melalui PRS, masalah, email, atau metode lainnya.
Perhatikan bahwa repositori ini tidak dalam pemeliharaan aktif. Ini terutama berisi makalah yang muncul sebelum Oktober 2023, dengan beberapa makalah lebih lanjut. Jika Anda ingin memasukkan kertas Anda, jangan ragu untuk memulai permintaan tarik.
- Dokumen
- Pemecah tugas otonom
- Penalaran Umum & Perencanaan & Alat Menggunakan
- Kerjasama multi-agen
- Kerangka kerja & open-source
- Aplikasi
- Agen web
- Agen RL
- Robotika & AI yang diwujudkan
- Bermain game & bermain peran
- Aplikasi lain
- Terpercaya
- Simulasi interaksi manusia
- Interaksi agen manusia
- LLMS bertenaga agen
- Benchmark
- Survei & Tutorial
- Proyek open-source
- Proyek pemecah tugas otonom
- Proyek simulasi multi-agen
- Perspektif
- Sumber terkait lainnya
- Pengakuan
Dokumen
Untuk makalah dengan> 50 kutipan atau repositori dengan> 200 bintang.
untuk makalah yang diterima oleh konferensi/jurnal terkenal.
Pemecah tugas otonom
Penalaran Umum & Perencanaan & Alat Menggunakan
- [Mei 2024] "Pelatihan offline agen model bahasa dengan fungsi sebagai bobot yang dapat dipelajari." Shaokun Zhang (PSU) et al. ICML 2024. [Kertas] [Kode]
- [Mar 2024] "Agen-flan: merancang data dan metode penyetelan agen yang efektif untuk model bahasa besar." Zehui Chen (USTC) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Desember 2023] "Clova: Asisten visual loop tertutup dengan penggunaan alat dan pembaruan." Zhi Gao (Bigai) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Desember 2023] "SayCanPay: Perencanaan heuristik dengan model bahasa besar menggunakan pengetahuan domain yang dapat dipelajari." Rishi Hazra et al. AAAI 2024 [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Pencarian pohon agen bahasa menyatukan penalaran akting dan perencanaan dalam model bahasa." Andy Zhou (UIUC) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Model bahasa besar belum dapat mengoreksi penalaran diri." Jie Huang (UIUC) et al. ICLR 2024. [Kertas]
- [Okt 2023] "Mengadaptasi agen LLM melalui komunikasi." Kuan Wang (Gatech & Microsoft) et al. arxiv. [kertas]
- [Okt 2023] "Toolchain*: Navigasi Ruang Tindakan yang Efisien dalam Model Bahasa Besar dengan* pencarian" Yuchen Zhuang (Gatech & Adobe) et al. ICLR 2024. [Kertas]
- [Sep 2023] "Avis: Informasi visual otonom mencari dengan model bahasa besar." Ziniu Hu (Google) et al. Neurips 2023. [Kertas]
- [Sep 2023] "Alasan untuk masa depan, bertindak untuk saat ini: kerangka kerja prinsip untuk agen LLM otonom dengan efisiensi sampel yang dapat dibuktikan." Zhihan Liu (Northwestern) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "Landasan yang Digerakkan Diri: Agen Model Bahasa Besar dengan Pembelajaran Keterampilan yang Selaras Bahasa Otomatis." Shaohui Peng (CAS) et al. arxiv. [kertas]
- [Agustus 2023] "Expel: Agen LLM adalah pelajar pengalaman." Andrew Zhao (Thu) et al. arxiv. [kertas]
- [Agustus 2023] "Integrasi sinergis dari model bahasa besar dan arsitektur kognitif untuk AI yang kuat: analisis eksplorasi." Oscar J. Romero (CMU) et al. arxiv. [kertas]
- [Agustus 2023] "Perencanaan Dinamis dengan LLM." Gautier Dagan (U of Edinburgh) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "Retroformer: Retrospektif Agen Bahasa Besar dengan Optimalisasi Gradien Kebijakan." Weiran Yao (Salesforce) et al. arxiv. [kertas]
- [Mei 2023] "Rewoo: Decoupling Alasan dari Pengamatan untuk Model Bahasa augmented yang efisien." Binfeng Xu et al. arxiv. [kertas] [kode]
- [Mei 2023] "SwiftSage: Agen generatif dengan pemikiran cepat dan lambat untuk tugas interaktif yang kompleks." Bill Yuchen Lin (AI2) et al. Neurips 2023. [Kertas] [kode] [Halaman Proyek]
- [Mei 2023] "Adaplanner: Perencanaan Adaptif dari Umpan Balik dengan Model Bahasa." Haotian Sun (Gatech) et al. Neurips 2023. [Kertas] [Kode]
- [Mei 2022] "Penalaran dengan model bahasa sedang merencanakan dengan model dunia." Shibo Hao (UCSD) et al. EMNLP 2023. [Kertas] [Kode] [Halaman Proyek]
- [Mei 2023] "Memanfaatkan model bahasa besar pra-terlatih untuk membangun dan memanfaatkan model dunia untuk perencanaan tugas berbasis model." Lin Guan (ASU) et al. Neurips 2023. [Kertas] [kode] [Halaman Proyek]
- [Mei 2023] "Chatcot: Alat-augmented Chain-of-Thought Rale pada model bahasa besar berbasis obrolan." Zhipeng Chen (RUC) et al. Temuan EMNLP 2023. [kertas] [kode]
- [Mei 2023] "Kritik: Model bahasa besar dapat mengoreksi diri dengan kritik interaktif alat." Zhibin Gou (Thu & Microsoft) et al. arxiv. [kertas] [kode]
- [Apr 2023] "LLM+P: Memberdayakan Model Bahasa Besar dengan Kemahiran Perencanaan Optimal." Bo Liu (UT Austin) et al. arxiv. [kertas] [kode]
- [Mar 2023] "Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal." Nuh Shinn (Northeastern) et al. Neurips 2023. [Kertas] [Kode]
- [Desember 2022] "Jangan menghasilkan, membedakan: proposal untuk model bahasa grounding ke lingkungan dunia nyata" Yu gu (OSU) et al. ACL 2023. [Kertas] [Kode]
- [Okt 2022] "Bereaksi: Penalaran Sinergis dan Bertindak dalam Model Bahasa." Shunyu Yao (Princeton & Google Brain) et al. ICLR 2023. [Kertas] [Kode] [Halaman Proyek]
Kerjasama multi-agen
- [Agustus 2024] "Megaagent: Kerangka kerja praktis untuk kerja sama otonom dalam sistem agen LLM skala besar" Qian Wang (Nus) et al.* Arxiv. [kertas]
- [Mei 2024] "Kesesuaian, Konferensi, dan Peniruan: Ketidaksetujuan Persona dalam Kolaborasi LLM Multi-Agen." Razan Baltaji (UIUC) et al.* Arxiv. [kertas] [kode]
- [April 2024] "Comm: Multi-Agen Kolaboratif, Multi-Reasoning-Path Meminta untuk Pemecahan Masalah Kompleks." Pei Chen (TAMU) et al.* NAACL 2024. [Kertas] [Kode]
- [Jan 2024] "L2MAC: Model Bahasa Besar Komputer Otomatis untuk Pembuatan Kode yang Luas." Samuel Holt (Cambridge) et al. ICLR 2024. [Kertas] [Kode] [Halaman Proyek]
- [Okt 2023] "Mengevaluasi kemampuan koordinasi multi-agen dalam model bahasa besar." Saaket Agashe (UCSC) et al. arxiv. [kertas]
- [Okt 2023] "Jaringan Dinamis LLM-Agent: Kerangka Kolaborasi LLM-Agent dengan Optimalisasi Tim Agen." Zijun Liu (Thu & Stanford) et al. arxiv. [kertas] [kode]
- [Okt 2023] "Menjelajahi Mekanisme Kolaborasi untuk Agen LLM: Pandangan Psikologi Sosial." Jintian Zhang (Zju) et al. arxiv. [kertas] [kode]
- [Okt 2023] "Corex: Mendorong batas-batas penalaran kompleks melalui kolaborasi multi-model." Qiushi Sun (Shanghai Ai Lab & Nus) et al. arxiv. [kertas] [kode]
- [Sep 2023] "LLM-Deliberation: Mengevaluasi LLM dengan game negosiasi multi-agen interaktif." Sahar Abdelnabi (Cispa) et al. arxiv. [kertas] [kode]
- [SEP 2023] "Kolaborasi multi-robot yang dapat diskalakan dengan model bahasa besar: sistem terpusat atau terdesentralisasi?" Yongchao Chen (MIT & Harvard) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "Rekonsiliasi: Konferensi Tabel Bulat meningkatkan penalaran melalui konsensus di antara LLM yang beragam." Justin Chih-Yao Chen (UNC Chapel Hill) et al. arxiv. [kertas] [kode]
- [SEP 2023] "MindAgent: Interaksi Permainan yang Muncul." Xiaojian MA (Bigai) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Agustus 2023] "Proagent: Membangun AI Koperasi Proaktif dengan Model Bahasa Besar." Ceyao Zhang (Cuhk & Pku) et al. arxiv. [Kertas] [Halaman Proyek]
- [Agustus 2023] "Agenverse: memfasilitasi kolaborasi multi-agen dan mengeksplorasi perilaku yang muncul dalam agen." Weize Chen (Thu) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "GPT-IN-The-loop: Pengambilan keputusan adaptif untuk sistem multi-agen." Nathalia nascimento (U of Waterloo) et al. arxiv. [kertas]
- [Agustus 2023] "Betapa rentannya llms terhadap kesalahan logis?" Amirreza Payandeh (GMU & Vail Systems) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "Chateval: Menuju evaluator berbasis LLM yang lebih baik melalui debat multi-agen." Chi-Min Chan (Thu) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "llm sebagai DBA." Xuanhe Zhou (Thu) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "Gentopia: Platform Kolaboratif untuk LLMS-Agusted Tool." Binfeng Xu et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Agustus 2023] "Metagpt: Pemrograman Meta untuk Kerangka Kolaboratif Multi-Agen." Sirui Hong (Deepwisdom) et al. arxiv. [kertas] [kode]
- [Jul 2023] "PRD: Peer Rank dan Diskusi Meningkatkan Evaluasi Berbasis Model Bahasa Besar." Ruosen Li (UT Dallas) et al. arxiv. [kertas] [halaman proyek] [kode]
- [Jul 2023] "Melepaskan Sinergi Kognitif dalam Model Bahasa Besar: Agen Pemecahan Tugas Melalui Penolaan Diri Multi-Persona." Zhenhailong Wang (UIUC & MSRA) et al. arxiv. [kertas] [kode]
- [Jul 2023] "ROCO: Kolaborasi multi-robot dialektik dengan model bahasa besar." Mandi Zhao (Columbia) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jul 2023] "AI generatif multi-agen nirkabel: dari kecerdasan yang terhubung ke kecerdasan kolektif." Hang Zou (Technology Innovation Institute, UEA) et al. arxiv. [kertas]
- [Jul 2023] "Membangun agen yang diwujudkan koperasi secara modular dengan model bahasa besar." Hongxin Zhang (UMass) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jun 2023] "RESTGPT: Menghubungkan model bahasa besar dengan aplikasi dunia nyata melalui API REST." Lagu Yifan (PKU) et al. arxiv. [Kertas] [Halaman Proyek]
- [Jun 2023] "Kolaborasi Multi-Agen: Memanfaatkan Kekuatan Agen LLM Cerdas." Yashar Talebirad (Ualberta) et al. arxiv. [kertas]
- [Mei 2023] "Mendorong pemikiran yang berbeda dalam model bahasa besar melalui debat multi-agen." Tian Liang (Thu & Tencent) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Model bahasa besar sebagai pembuat alat." Tianle Cai (Deepmind & Princeton) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Meningkatkan faktualitas dan penalaran dalam model bahasa melalui debat multi -agen." Yilun du (MIT) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Mei 2023] "Perjanjian dan Efisiensi Statistik dalam Model Persepsi Bayesian." Yash Deshpande (MIT) et al. arxiv. [kertas]
- [Mei 2023] "Meningkatkan Model Bahasa Negosiasi dengan mandiri dan pembelajaran dalam konteks dari umpan balik AI." Yao Fu (U dari Edinburgh) et al. arxiv. [kertas] [kode]
Kerangka kerja & open-source
- [Okt 2023] "OpenAgents: Platform terbuka untuk agen bahasa di alam liar." Tianbao Xie (HKU & Xlang Lab) et al. arxiv. [kertas] [kode]
- [Sep 2023] "Autoagents: Kerangka kerja untuk generasi agen otomatis." Guangyao Chen (PKU) et al. arxiv. [kertas] [kode]
- [Sep 2023] "Agen: Kerangka kerja open-source untuk agen bahasa otonom." Wangchunshu Zhou (AI Waves) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "Arsitektur Kognitif untuk Agen Bahasa." Theodore Sumers (Princeton) et al. arxiv. [kertas] [repo]
- [Agustus 2023] "Autogen: Mengaktifkan aplikasi LLM generasi berikutnya melalui kerangka percakapan multi-agen." Qingyun Wu et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Agustus 2023] "Fastagency: Cara tercepat untuk membawa alur kerja multi-agen ke produksi." Curu Runje et al. [Kode] [Halaman Proyek]
Aplikasi
Agen web
- [Sep 2023] "Anda hanya melihat layar: agen rantai aksi multimodal." Zhuosheng Zhang (Sjtu) et al. arxiv. [kertas] [kode]
- [Sep 2023] "Laser: Agen LLM dengan Eksplorasi Ruang Negara untuk Navigasi Web." Kaixin MA (Tencent) et al. arxiv. [kertas] [kode]
- [Jul 2023] "Webarena: lingkungan web yang realistis untuk membangun agen otonom." Shuyan Zhou (CMU) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jul 2023] "Webagent dunia nyata dengan perencanaan, pemahaman konteks panjang, dan sintesis program." Izzeddin Gur (DeepMind) et al. arxiv. [kertas]
- [Jun 2023] "Mind2Web: Menuju Agen Generalis untuk Web." Xiang Deng (OSU) et al. Neurips 2023. [Kertas] [kode] [Halaman Proyek]
- [Mei 2023] "Menambah agen autotelic dengan model bahasa besar." Cédric Colas (MIT & Inria) et al. arxiv. [kertas]
- [Mei 2023] "Mobile-ENV: Platform evaluasi dan tolok ukur untuk agen interaktif di era LLM." Danyang Zhang (Sjtu) et al. arxiv. [kertas] [kode]
- [Apr 2023] "Kemampuan penelitian ilmiah otonom yang muncul dari model bahasa besar." Daniil A. Boiko (CMU) et al. arxiv. [kertas]
- [Mar 2023] "Model bahasa dapat menyelesaikan tugas komputer." Geunwoo Kim (UCI) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jul 2022] "Webshop: Menuju interaksi web dunia nyata yang dapat diskalakan dengan agen bahasa grounded." Shunyu Yao (Princeton) et al. Neurips 2022. [Kertas] [kode] [Halaman Proyek]
Agen RL
- [Mei 2024] "Penemuan Keterampilan Agen." Xufeng Zhao (Uhh) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Mei 2024] "Cerdas Go-Explore: Berdiri di bahu model fondasi raksasa." Cong Lu (UBC) et al. arxiv. [kertas]
- [Nov 2023] "Lafite-RL:" Mengakses Penguatan Penguatan Manipulasi Robot melalui Umpan Balik dari Model Bahasa Besar " Kun Chu (Uhh) et al. CRL WS @ CORL 2023. [Kertas]
- [Okt 2023] "Motif: Motivasi Intrinsik dari Umpan Balik Kecerdasan Buatan." Martin Klissarov (Mila & Meta & McGill) et al. arxiv. [kertas]
- [Sep 2023] "Rladapter: Menjembatani model bahasa besar untuk penguatan pembelajaran di dunia terbuka." Wanpeng Zhang (PKU) et al. arxiv. [kertas]
- [Agustus 2023] "LAGR-SEQ: Pembelajaran penguatan yang dipandu bahasa dengan kueri yang efisien sampel." Thommen George Karimpanal (Deakin University) et al. arxiv. [kertas] [kode]
- [Jul 2023] "Pembentukan Dialog: Agen Pemberdayaan melalui Interaksi NPC." Wei Zhou (Gatech) et al. arxiv. [kertas]
- [Jul 2023] "Menuju Agen Terpadu dengan Model Yayasan." Norman di Palo (ICL & DeepMind) et al. Reinkarnasi RL @ ICLR 2023. [Kertas]
- [Jun 2023] "Model bahasa besar adalah agen pembelajaran penguatan semi-parametrik." Danyang Zhang (Sjtu) et al. Neurips 2023. [Kertas]
- [Mei 2023] "Dekomposisi tugas yang selaras secara semantik dalam pembelajaran penguatan multi-agen." Wenhao Li (Cuhk) et al. arxiv. [kertas]
Robotika & AI yang diwujudkan
- [Nov 2024] "Agen Buruh: Model Bahasa Besar untuk Mengatur Robot Bimanual" , Kun Chu (Uhh) et al. Humanoids 2024. [Kertas] [Situs Web], [Kode]
- [Jul 2024] "Odyssey: Agen pemberdayaan dengan keterampilan dunia terbuka." Shunyu Liu (Universitas Zhejiang) et al. arxiv. [kertas] [kode]
- [Nov 2023] "Leo: Agen Generalis yang Diwujudkan di Dunia 3D." Xiaojian MA (Bigai) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Nov 2023] "Jarvis-1: agen multi-tugas-dunia terbuka dengan model bahasa multimodal yang bertukar memori." Zihao Wang (PKU) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Menuju pengambilan keputusan yang diwujudkan dari ujung ke ujung melalui model bahasa besar multi-modal: eksplorasi dengan gpt4-vision dan seterusnya." Liang Chen (PKU) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Lancar: Memanfaatkan Bahasa untuk Penggerak Robot Aware Context di lingkungan yang tidak terstruktur." Chak Lam Shek (UMD) et al. arxiv. [Kertas] [Halaman Proyek]
- [Sep 2023] "LLM-Grounder: Landasan Visual 3D Vokabulary Terbuka dengan Model Bahasa Besar Sebagai Agen." Jianing Yang (Umich) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "Smart-LLM: Perencanaan tugas robot multi-agen pintar menggunakan model bahasa besar." Shyam Sundar Kannan (Purdue) et al. arxiv. [Kertas] [Halaman Proyek]
- [SEP 2023] "Colokkan chip pengaman: menegakkan kendala untuk agen robot yang digerakkan LLM." Ziyi Yang et al. arxiv. [kertas] [Kode & Video]
- [SEP 2023] "Saynav: Landasan Model Bahasa Besar untuk Perencanaan Dinamis untuk Navigasi di Lingkungan Baru." Abhinav Rajvanshi (SRI International) et al. arxiv. [kertas]
- [Sep 2023] "Perancah perkembangan dengan model bahasa besar." M. Batuhan Celik (Universitas Bogazici) et al. arxiv. [kertas]
- [Jul 2023] "March in Chat: Interactive Foreding untuk Ekspresi Referensi yang Diwujudkan Jarak Jauh." Yanyuan Qiao (Universitas Adelaide) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "A^2NAV: Navigasi Robot Zero-Shot Action-Action dengan mengeksploitasi kemampuan penglihatan-dan-bahasa dari model yayasan." Peihao Chen (Scut) et al. arxiv. [kertas]
- [Jul 2023] "Perencanaan tugas yang diwujudkan dengan model bahasa besar." Zhenyu Wu (Bupt) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jun 2023] "Mengaktifkan interaksi cerdas antara agen dan LLM: pendekatan pembelajaran penguatan." Bin Hu (Zhejiang Lab) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Ghost in the Minecraft: Agen yang umumnya mampu untuk lingkungan dunia terbuka melalui model bahasa besar dengan pengetahuan dan memori berbasis teks." Xizhou Zhu (Thu & Sensetim) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Voyager: Agen yang diwujudkan terbuka dengan model bahasa besar." Guanzhi Wang (Nvidia & Caltech) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Mei 2023] "Rencanakan, menghilangkan, dan melacak - model bahasa adalah guru yang baik untuk agen yang diwujudkan." Yue Wu (CMU) et al. arxiv. [kertas]
- [Feb 2023] "Jelaskan, jelaskan, rencanakan, dan pilih: Perencanaan interaktif dengan model bahasa besar memungkinkan agen multi-tugas dunia terbuka." Zihao Wang (PKU) et al. Neurips 2023. [Kertas] [Kode]
- [Feb 2023] "Berkolaborasi dengan model bahasa untuk penalaran yang diwujudkan." Ishita dasgupta (Deepmind) et al. Larel @ Neurips 2022. [Kertas]
- [Jan 2023] "Do Agen yang Diwujudkan Mimpi Domba Pixelated: Pengambilan Keputusan yang Diwujudkan Menggunakan Pemodelan Dunia Terpandu Bahasa." Kolby Nottingham (UCI) et al. ICML 2023. [Kertas] [Kode] [Halaman Proyek]
- [Desember 2022] "LLM-Planner: beberapa perencanaan ground untuk agen yang diwujudkan dengan model bahasa besar." Lagu Chan Hee (OSU) et al. ICCV 2023. [Kertas] [Halaman Proyek]
Bermain game & bermain peran
- [Mei 2024] "Timechara: Mengevaluasi Halusinasi Karakter Point-in-Time dari Model Bahasa Besar Bermain Peran." Jaewoo Ahn (Snu) et al. Temuan ACL 2024. [Kertas] [Kode] [Halaman Proyek]
- [Okt 2023] "Dari teks ke taktik: mengevaluasi LLMS memainkan permainan Avalon." Jonathan Light (RPI) et al. arxiv. [kertas] [kode]
- [Okt 2023] "Ruffle & Riley: Menuju Induksi Otomatis Sistem Bimbingan Percakapan." Robin Schmucker (CMU) et al. arxiv. [kertas]
- [Okt 2023] "Game of Thoughts Avalon: pertempuran melawan penipuan melalui kontemplasi rekursif." Shenzhi Wang (Thu) et al. arxiv. [kertas]
- [SEP 2023] "MindAgent: Interaksi Permainan yang Muncul." Xiaojian MA (Bigai) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "Agen Kecurigaan: Bermain Game Informasi yang Tidak Sfect Dengan Teori Pikiran Sadar GPT-4." Jiaxian Guo (U dari Tokyo) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "Petualangan Ambient: Mengajar Chatgpt tentang Mengembangkan Cerita Kompleks." Zexin Chen (Gatech) et al. arxiv. [kertas]
- [Jul 2023] "Tachikuma: memahami interaksi kompleks dengan multi-karakter dan objek baru dengan model bahasa besar." Yuanzhi Liang (UTS) et al. arxiv. [kertas]
- [Mei 2023] "Bermain peran dengan model bahasa besar." Murray Shanahan (Deepmind & ICL) et al. arxiv. [kertas]
- [Mei 2023] "Clembench: Menggunakan permainan permainan untuk mengevaluasi model bahasa yang dioptimalkan obrolan sebagai agen percakapan." Kranti Chalasalasetti (University of Potsdam) et al. arxiv. [kertas] [kode]
- [Apr 2023] "Menuju Sistem Otonom: Sistem Produksi Modular Fleksibel Ditingkatkan dengan Agen Model Bahasa Besar." Yuchen Xia (Universitas Stuttgart) et al. arxiv. [kertas] [kode]
- [Mar 2023] "Unta: Agen Komunikatif untuk Eksplorasi" Pikiran "Masyarakat Model Bahasa Skala Besar." Guohao Li (Kaust) et al. Neurips 2023. [Kertas] [kode] [Halaman Proyek]
Aplikasi lain
- [Mei 2024] "Agenclinic: Benchmark agen multimodal untuk mengevaluasi AI dalam lingkungan klinis yang disimulasikan" Samuel Schmidgall (Jhu & Stanford) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Apr 2024] "ClinicalAgent: Sistem multi-agen uji klinis dengan penalaran berbasis model bahasa besar" Ling Yue (RPI) et al. arxiv. [kertas] [kode]
- [Jan 2024] "Ehragent: Kode memberdayakan model bahasa besar untuk beberapa penalaran tabel kompleks beberapa-shot pada catatan kesehatan elektronik." Wenqi Shi (Gatech) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Optimus: Pemodelan Optimasi Menggunakan Pemecah MIP dan Model Bahasa Besar." Ali Ahmaditeshnizi (Stanford) et al. arxiv. [kertas] [kode]
- [Okt 2023] "Model evolusi sifat kepribadian yang terkait dengan perilaku kooperatif menggunakan model bahasa yang besar." Reiji Suzuki (Universitas Nagoya) et al. arxiv. [kertas]
- [Okt 2023] "Model Bahasa Besar (LLM) sebagai sistem beberapa agen ahli: Suatu pendekatan untuk menyelesaikan tantangan abstraksi dan penalaran corpus (ARC)." John Chong Min Tan (Nus) et al. arxiv. [kertas]
- [Okt 2023] "Pendekatan agen-bahasa untuk pembuktian teorema formal." Amitayush Thakur (UT Austin) et al. arxiv. [kertas]
- [Okt 2023] "Agen Kesehatan Conversational: Kerangka Kerja Agen bertenaga LLM yang dipersonalisasi." Mahyar Abbasian (UCI) et al. arxiv. [kertas]
- [Okt 2023] "OceanGpt: Model Bahasa Besar untuk Tugas Ilmu Laut." Zhen Bi (Zju & Donghai Lab) et al. arxiv. [Kertas] [Halaman Proyek]
- [Okt 2023] "Voice2Action: Model bahasa sebagai agen untuk interaksi real-time yang efisien dalam realitas virtual." Yang Su (Cornell Tech). arxiv. [kertas]
- [Sep 2023] "Tora: Agen penalaran yang terintegrasi dengan alat untuk pemecahan masalah matematika." Zhibin Gou (Thu & Microsoft) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [SEP 2023] "" Teach AI Cara Kode ": Menggunakan model bahasa besar sebagai agen yang dapat diajar untuk pendidikan pemrograman." Hyoungwook Jin (Kaist) et al. arxiv. [kertas]
- [Sep 2023] "SurrealDriver: Merancang Kerangka Simulasi Agen Pengemudi Generatif dalam Konteks Perkotaan Berdasarkan Model Bahasa Besar." Ye Jin (Thu) et al. arxiv. [kertas]
- [Sep 2023] "Model bahasa besar sebagai agen di klinik." Nikita Mehandru (UC Berkeley) et al. arxiv. [kertas]
- [Sep 2023] "Arsitektur rantai-emosi berbasis penilaian untuk agen permainan model bahasa afektif." Maximilian Croissant (Uoy) et al. arxiv. [kertas]
- [Sep 2023] "Melepaskan kekuatan pembelajaran grafik melalui agen otonom berbasis LLM." Lanning Wei (CAS & 4Paradigm) et al. arxiv. [kertas]
- [SEP 2023] "Tradinggpt: Sistem Multi-Agen dengan memori berlapis dan karakter yang berbeda untuk peningkatan kinerja perdagangan keuangan." Yang Li (Sit) et al. arxiv. [kertas]
- [SEP 2023] "Modelscope-Agent: Membangun sistem agen yang dapat disesuaikan dengan model bahasa besar open-source." Chenliang Li (Alibaba) et al. arxiv. [kertas] [kode] [demo]
- [Agustus 2023] "Agen AI Rekomendasi: Mengintegrasikan model bahasa besar untuk rekomendasi interaktif." Xu Huang (USTC) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "RecMind: Agen bertenaga model bahasa besar untuk rekomendasi." Yancheng Wang (ASU) et al. arxiv. [kertas]
- [Agustus 2023] "Transfer Sim-to-Real yang Didukung LLM untuk kontrol sinyal lalu lintas." Longchao DA (ASU) et al. arxiv. [kertas]
- [Agustus 2023] "Keluar dari kandang: Bagaimana burung beo stokastik menang di lingkungan keamanan cyber." Maria Rigaki (čvut) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "Apakah ada prinsip sosial untuk agen berbasis LLM?" Jitao Bai (TJU) et al. arxiv. [kertas]
- [Agustus 2023] "Chata: Agen otonom bertenaga model bahasa besar untuk EDA." Zhuolun He (Cuhk & Shanghai Ai Lab) et al. arxiv. [kertas]
- [Agustus 2023] "Panduan Hitchhiker untuk Analisis Program: Perjalanan dengan Model Bahasa Besar." Haonan Li (UCR) et al. arxiv. [kertas]
- [Jun 2023] "Menuju agen pengujian otonom melalui model bahasa besar percakapan." Robert Feldt (Universitas Teknologi Chalmers) et al. arxiv. [kertas]
- [Apr 2023] "Genegpt: Menambah model bahasa besar dengan alat domain untuk meningkatkan akses ke informasi biomedis." Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu Arxiv. [kertas] [kode]
- [Mar 2023] "HuggingGpt: Memecahkan tugas AI dengan chatgpt dan teman -temannya di wajah memeluk." Yongliang Shen (ZJU & MSRA) et al. arxiv. [kertas] [kode]
Terpercaya
- [Feb 2024] "Dapatkah agen model bahasa besar mensimulasikan perilaku kepercayaan manusia?" Chengxing Xie (Kaust) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Sep 2023] "Mengidentifikasi risiko agen LM dengan kotak pasir yang ditemui LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arxiv. [kertas] [kode] [demo] [halaman proyek]
- [Agustus 2023] "Meningkatkan kepercayaan pada agen otomatisasi AI berbasis LLM: pertimbangan baru dan tantangan di masa depan." Sivan Schwartz (IBM Research) et al. Otomatis @ ijcai 2023. [Kertas]
Simulasi interaksi manusia
- [Mar 2024] "Munculnya norma-norma sosial dalam masyarakat agen berbasis model bahasa besar." Siyue Ren (NWPU) et al. arxiv. [kertas] [kode]
- [Jan 2024] "Model terbuka, pikiran tertutup? Pada kemampuan agen dalam meniru kepribadian manusia melalui model bahasa besar terbuka." Lucio la Cava (University of Calabria) et al. arxiv. [kertas]
- [Okt 2023] "Sotopia: Evaluasi Interaktif untuk Kecerdasan Sosial dalam Agen Bahasa" *Xuhui Zhou (CMU) et al. *ICLR [kertas]
- [Okt 2023] "Competeai: Memahami Perilaku Persaingan dalam Agen Berbasis Model Bahasa Besar." Qinlin Zhao (USTC) et al. arxiv. [kertas]
- [Okt 2023] "Simulasi media sosial menggunakan model bahasa besar untuk mengevaluasi algoritma umpan berita alternatif." Petter Törnberg (U dari Amsterdam) et al. arxiv. [kertas]
- [Okt 2023] "Tempatkan uang Anda di mana mulut Anda adalah: mengevaluasi perencanaan strategis dan pelaksanaan agen LLM di arena lelang." Jiangjie Chen (FDU & AI2) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Okt 2023] "Agen Lyfe: Agen Generatif untuk Interaksi Sosial Real-Time Berbiaya Rendah." Zhao Kaiya (MIT) et al. arxiv. [kertas]
- [Sep 2023] "Mengidentifikasi risiko agen LM dengan kotak pasir yang ditemui LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arxiv. [kertas] [kode] [demo] [halaman proyek]
- [SEP 2023] "Pemodelan Berbasis Agen Generatif: Meluncurkan Dinamika Sistem Sosial Melalui Model Mekanistik Kopling Dengan Kecerdasan Buatan Generatif." Navid Ghaffarzadegan (Virginia Tech) et al. arxiv. [kertas]
- [Agustus 2023] "CGMI: Kerangka Interaksi Multi-Agen Umum yang Dapat Dikonfigurasi." Jinxin Shi (Ecnu) et al. arxiv. [kertas]
- [Agustus 2023] "Menjelajahi persimpangan model bahasa besar dan pemodelan berbasis agen melalui rekayasa cepat." Edward Junprung (UC Berkeley) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "AgentSims: kotak pasir open-source untuk evaluasi model bahasa besar." Jiaju Lin (PTA Studio & PSU) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Jul 2023] "S^3: Sistem Simulasi Jarang Sosial dengan Agen Bermerayakan Model Bahasa Besar." Chen Gao (Thu) et al. arxiv. [kertas]
- [Jul 2023] "Apakah Anda berada di topeng? Menjelajahi perilaku dan dampak dari model sosial yang didorong bot sosial di jejaring sosial online." Siyu Li (SCU) et al. arxiv. [kertas] [dataset]
- [Jul 2023] "Agen komunikatif untuk pengembangan perangkat lunak." Chen Qian (Thu) et al. arxiv. [kertas]
- [Jul 2023] "Pemodelan epidemi dengan agen generatif." Ross Williams (Virginia Tech) et al. arxiv. [kertas] [kode]
- [Jul 2023] "To Infinity and Beyond: Show-1 dan agen showrunner dalam simulasi multi-agen." Philipp Maas (Fable Studio) et al. pracetak. [Kertas] [Halaman Proyek]
- [Jun 2023] "Rekagen: Paradigma Simulasi Novel untuk Sistem Rekomendasi." Lei Wang (RUC) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Bermain game berulang dengan model bahasa besar." Elif Akata (U of Tübingen) et al. arxiv. [kertas]
- [Mei 2023] "Peran ringkasan dalam agen generatif: perspektif awal." Xiachong Feng (Hit) et al. arxiv. [kertas]
- [Apr 2023] "Obrolan multi-partai: agen percakapan dalam pengaturan grup dengan manusia dan model." Jimmy Wei (Cornell & Meta) et al. arxiv. [kertas] [dataset] [kode]
- [Apr 2023] "Agen Generatif: Simulacra Interaktif Perilaku Manusia." Joon Sung Park (Stanford) et al. arxiv. [kertas] [kode]
Interaksi agen manusia
- [Okt 2023] "Bagaimana pemrosesan AI menunda kreativitas: mengeksplorasi pertanyaan pertanyaan penelitian dengan agen berbasis LLM." Yiren Liu (UIUC) et al. arxiv. [kertas]
- [Agustus 2023] "Mengukur dampak model bahasa besar pada dinamika opini kolektif." Chao Li (Zju) et al. arxiv. [kertas]
- [Agustus 2023] "Sapien: agen virtual afektif yang ditenagai oleh model bahasa besar." Masum Hasan (U dari Rochester) et al. arxiv. [kertas]
- [Jul 2023] "Memahami manfaat dan tantangan menggunakan agen percakapan berbasis model bahasa besar untuk dukungan kesejahteraan mental." Zilin MA (Harvard) et al. arxiv. [kertas]
LLMS bertenaga agen
- [Okt 2023] "Agen menginstruksikan model bahasa besar sebagai penalaran zero-shot umum." Nicholas Crispino (Washu) et al. arxiv. [kertas] [kode]
- [Okt 2023] "ß-Coder: Pembelajaran penguatan mendalam berbasis nilai untuk sintesis program." Zishun Yu (UIC & Bytedance) et al. arxiv. [kertas]
- [Mei 2023] "Pelatihan model bahasa yang selaras secara sosial dalam masyarakat manusia yang disimulasikan." Ruibo Liu (Dartmouth) et al. arxiv. [kertas] [kode]
- [Mei 2023] "Model bahasa memenuhi model dunia: pengalaman yang diwujudkan meningkatkan model bahasa." Jiannan Xiang (UCSD) et al. Neurips 2023. [Kertas] [Kode]
Benchmark
- [Jul 2024] "AppWorld: Dunia aplikasi dan orang -orang yang dapat dikendalikan untuk membandingkan agen pengkodean interaktif." Harsh Trivedi (Stony Brook University) et al. ACL 2024. [Kertas] [Kode] [Halaman Proyek]
- [Desember 2023] "T-Eval: Mengevaluasi Kemampuan Pemanfaatan Alat Model Bahasa Besar Langkah demi Langkah." Zehui Chen (USTC, Shanghai Ai Lab) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Nov 2023] "Sihir: Investigasi model bahasa besar bertenaga multi-agen dalam kognisi, kemampuan beradaptasi, rasionalitas dan kolaborasi." * Lin Xu et al. (Nus, Bytedance, Stanford & UC Berkeley) * Arxiv. [Kertas] [Halaman Proyek]
- [Okt 2023] "Menyeimbangkan otonomi dan penyelarasan: taksonomi multi-dimensi untuk arsitektur multi-agen bertenaga LLM yang otonom." Thorsten Händler (Fernfh) et al. arxiv. [kertas]
- [Okt 2023] "Benchmarking Model Bahasa Besar sebagai Agen Penelitian AI." Qian Huang (Stanford) et al. arxiv. [kertas] [kode]
- [Okt 2023] "Benchmark metatool untuk model bahasa besar: memutuskan apakah akan menggunakan alat dan yang digunakan." Yue Huang (Universitas Lehigh) et al. arxiv. [kertas] [dataset]
- [Okt 2023] "Smartplay: Benchmark untuk LLMS sebagai agen cerdas." Yue Wu (CMU & Microsoft) et al. arxiv. [kertas] [kode]
- [Sep 2023] "Mengidentifikasi risiko agen LM dengan kotak pasir yang ditemui LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arxiv. [kertas] [kode] [demo] [halaman proyek]
- [Agustus 2023] "BolaA: Benchmarking dan Orchestrating LLM-Agents Autonomous Agents." Zhiwei Liu (Salesforce) et al. arxiv. [kertas] [kode]
- [Agustus 2023] "AgenBench: Mengevaluasi LLMS sebagai Agen." Xiao Liu (Thu) et al. arxiv. [kertas] [kode] [Halaman Proyek]
- [Agustus 2023] "TPTU: Perencanaan Tugas dan Penggunaan Alat Agen AI Berbasis Model Bahasa." Jingqing Ruan (sensetime) et al. arxiv. [kertas]
- [Juni 2023] "ToolQA: Dataset untuk pertanyaan LLM menjawab dengan alat eksternal." Yuchen Zhuang (Gatech) et al. Neurips 2023. [Kertas] [Kode]
Survei & Tutorial
- [Sep 2023] "Pemodelan konteks berbasis bahasa alami dan penalaran dengan LLMS: Tutorial." Haoyi Xiong (Baidu) et al. arxiv. [kertas]
- [Sep 2023] "Survei mendalam tentang agen kecerdasan buatan berbasis model bahasa besar." PENGYU ZHAO (BJTU) et al. arxiv. [kertas]
- [Sep 2023] "Kenaikan dan potensi agen berbasis model bahasa besar: survei." Zhiheng XI (FDU) et al. arxiv. [Kertas] [GitHub]
- [Agustus 2023] "Survei tentang agen otonom berbasis model bahasa besar." Lei Wang (RUC) et al. arxiv. [Kertas] [GitHub]
- [Mar 2023] "Survei model bahasa besar (Bagian 6.3 - Perencanaan untuk Pemecahan Tugas Kompleks)." Wayne Xin Zhao (RUC) et al. arxiv. [Kertas] [GitHub]
Proyek open-source
Proyek pemecah tugas otonom
- AUTO-GPT-Upaya sumber terbuka eksperimental untuk membuat GPT-4 sepenuhnya otonom.
- ? ️? Langchain - Membangun aplikasi dengan LLM melalui komposabilitas.
- GPT Engineer - Tentukan apa yang Anda inginkan, AI meminta klarifikasi, dan kemudian membangunnya.
- Metagpt -? Kerangka kerja multi-agen: Diberikan satu persyaratan baris, pengembalian PRD, desain, tugas, repo.
- Babyagi - Sistem manajemen tugas bertenaga AI.
- L2MAC - Kerangka Komputer Otomatis LLM: L2MAC
- Yacana - ?? Powering OpenSource LLMS dengan obrolan multi-agen dan alur kerja builing.
Proyek simulasi multi-agen
- Ai Town ?? - Starter kit yang dapat digunakan untuk membangun dan menyesuaikan versi Anda sendiri dari AI Town - sebuah kota virtual tempat karakter AI hidup, mengobrol, dan bersosialisasi.
- GPTEAM-Simulasi multi-agen open-source.
- ? Chatarena - Lingkungan game bahasa multi -agen untuk LLMS.
- ? Agenverse? - Kerangka kerja fleksibel yang menyederhanakan proses membangun lingkungan multi-agen khusus untuk model bahasa besar (LLM).
Perspektif
- Agen Bahasa: Langkah Evolusi Kritis Kecerdasan Buatan - Yu Su (OSU), 5 Sep 2023.
- Introducing XLang: An Open-Source Framework for Building Language Model Agents via Executable Language Grounding - XLANG Lab, Aug 9, 2023.
- What are GPT Agents? A deep dive into the AI interface of the future - Learn why Agents are a core part of the future of AI, Logan Kilpatrick (OpenAI), Jul 25, 2023.
- Language Agents in the Digital World: Opportunities and Risks - Shunyu Yao (Princeton) et al., Jul 24, 2023.
- KokoMind: Can LLMs Understand Social Interactions? - Imagine an AI ? at a cocktail party ?, Weiyan Shi (Columbia) et al., Jul, 2023
- LLM Powered Autonomous Agents - Amazing blog by Lilian Weng (OpenAI), Jun 23, 2023.
Other Related Sources
- Personalized Generative AI @ CIKM'23
- LLM-Agents-Papers - A repo lists papers about LLM role playing, memory mechanism and LLM game playing.
- LLMAgentPapers - Must-read papers on multiagents of LLMs.
- awesome-llm-agents - A curated list of awesome LLM agents.
Pengakuan
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).