? Coala: agen bahasa yang luar biasa

Kompilasi agen bahasa yang menggunakan arsitektur kognitif untuk kerangka kerja agen bahasa (? CoalA) .
- Kertas Coala (16 halaman konten utama): https://arxiv.org/abs/2309.02427
- Tweet CoalA (6 Threads): https://twitter.com/shunyuyao12/status/1699396834983362690
- File Bibtex CoalA dengan 300+ Kutipan Terkait: CoalA.BIB
- Kutipan Bibtex CoalA Jika Anda menemukan pekerjaan/sumber daya kami berguna:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}Tinjauan coala
COALA dengan rapi menentukan agen bahasa yang dimulai dengan ruang tindakannya , yang memiliki 2 bagian:
- Tindakan eksternal untuk berinteraksi dengan lingkungan eksternal ( landasan )
- Tindakan internal untuk berinteraksi dengan ingatan internal ( penalaran , pengambilan , pembelajaran )
- Agen bahasa memiliki memori kerja jangka pendek dan beberapa kenangan jangka panjang (opsional) (episodik untuk pengalaman, semantik untuk pengetahuan, prosedural untuk kode/llm)
- Penalaran = Perbarui memori kerja (dengan LLM)
- Pengambilan = baca memori jangka panjang
- Belajar = Tulis memori jangka panjang

Lalu bagaimana agen bahasa memilih tindakan mana yang harus diambil? Tindakannya disusun menjadi siklus pengambilan keputusan , dan setiap siklus memiliki dua tahap:
- Perencanaan : Agen menerapkan tindakan penalaran/pengambilan untuk (secara iteratif) mengusulkan dan mengevaluasi tindakan, kemudian memilih tindakan pembelajaran/landasan.
- Eksekusi : Tindakan pembelajaran/landasan yang dipilih dieksekusi untuk mempengaruhi memori internal atau dunia eksternal.

Untuk memahami lebih lanjut, baca bagian 4 dari makalah kami.
Dokumen
Di bawah ini hanya sebagian kertas yang dikikis dari coala.bib plus permintaan yang ditarik, dengan label ruang aksi yang berpotensi salah. Tanggal didasarkan pada Arxiv V1. Mereka tidak mewakili semua pekerjaan agen bahasa, dan kami berencana untuk menambahkan lebih banyak pekerjaan (permintaan tarik selamat datang), dan memiliki label untuk pekerjaan yang sangat dikutip.
- (2021-10) Rantai AI: Interaksi manusia-AI yang transparan dan dapat dikendalikan dengan merantai model bahasa besar (penalaran)
- (2021-10) Silg: Benchmark Pembumian Bahasa Interaktif Simbolik Multi-Lingkungan (Lingkungan)
- (2022-01) Model bahasa sebagai perencana zero-shot: mengekstraksi pengetahuan yang dapat ditindaklanjuti untuk agen yang diwujudkan (landasan)
- (2022-03) PromptChainer: Rantai Model Bahasa Besar Ditumpahkan Melalui Pemrograman Visual (Landasan)
- (2022-03) ScienceWorld: Apakah agen Anda lebih pintar dari siswa kelas 5? (lingkungan)
- (2022-04) lakukan semampu saya, bukan seperti yang saya katakan: bahasa landasan dalam biaya robot (landasan)
- (2022-04) Model Sokrates: menyusun penalaran multimodal nol-shot dengan bahasa (landasan)
- (2022-07) Webshop: Menuju interaksi web dunia nyata yang dapat diskalakan dengan agen bahasa grounded (lingkungan)
- (2022-09) ProgPrompt: Menghasilkan rencana tugas robot yang terletak menggunakan model bahasa besar (landasan)
- (2022-10) Didekomposisi dorongan: Pendekatan modular untuk menyelesaikan tugas kompleks (penalaran)
- (2022-10) Mind's Eye: Model Bahasa Berbasis Beralih melalui Simulasi (Landasan)
- (2022-10) Bereaksi: Penalaran Sinergis dan Bertindak dalam Model Bahasa (Landasan, Penalaran)
- (2022-11) Model bahasa besar adalah insinyur prompt tingkat manusia (penalaran)
- (2022-12) LLM-Planner: Perencanaan ground beberapa-shot untuk agen yang diwujudkan dengan model bahasa besar (landasan)
- (2022-12) Jangan menghasilkan, membedakan: proposal untuk model bahasa grounding ke lingkungan dunia nyata (landasan)
- (2023-02) Rantai Hindsight menyelaraskan model bahasa dengan umpan balik (pembelajaran)
- (2023-02) Jelaskan, jelaskan, rencanakan dan pilih: Perencanaan interaktif dengan model bahasa besar memungkinkan agen multi-tugas dunia terbuka (landasan, penalaran)
- (2023-02) ToolFormer: Model bahasa dapat mengajar diri mereka sendiri untuk menggunakan alat (landasan)
- (2023-03) Model Yayasan untuk Pengambilan Keputusan: Masalah, Metode, dan Peluang (Survei)
- (2023-03) HuggingGpt: Memecahkan tugas AI dengan chatgpt dan teman-temannya di wajah pelukan (landasan)
- (2023-03) Palm-E: Model Bahasa Multimodal yang Diwujudkan (Landasan)
- (2023-03) Refleksi: Agen bahasa dengan pembelajaran penguatan verbal (landasan, penalaran, pembelajaran)
- (2023-03) Mandiri diri: penyempurnaan iteratif dengan feedback sendiri (penalaran)
- (2023-03) Pembuatan kode perencanaan diri dengan model bahasa besar (penalaran)
- (2023-04) Agen generatif: simulacra interaktif perilaku manusia (landasan, penalaran, pengambilan, pembelajaran)
- (2023-04) Kemampuan penelitian ilmiah otonom yang muncul dari model bahasa besar (landasan, penalaran)
- (2023-04) LLM+P: Memberdayakan Model Bahasa Besar dengan Kemahiran Perencanaan Optimal (Landasan, Penalaran)
- (2023-04) Penyulap: Penalaran Umpan Balik tentang Representasi Menengah (Penalaran)
- (2023-04) Mengajar Model Bahasa Besar untuk Dewan Diri (Penalaran)
- (2023-04) Genegpt: Menambah model bahasa besar dengan alat domain untuk meningkatkan akses ke informasi biomedis (landasan, penalaran)
- (2023-05) Kritik: Model bahasa besar dapat mengoreksi diri dengan kritik interaktif alat (landasan, penalaran, pengambilan)
- (2023-05) menambah agen autotelic dengan model bahasa besar (landasan, penalaran, pengambilan, pembelajaran)
- (2023-05) CHATCOT: Penalaran berantai-beraih alat yang dipikirkan pada model bahasa besar berbasis obrolan (landasan, penalaran)
- (2023-05) ToolkEngpt: Augmenting Model Bahasa Frozen dengan Alat Masif Melalui Tool Embeddings (Grounding, Reasoning)
- (2023-05) Dekomposisi meningkatkan penalaran melalui decoding yang dipandu evaluasi diri (penalaran)
- (2023-05) Mendorong pemikiran yang berbeda dalam model bahasa besar melalui debat multi-agen (landasan, penalaran)
- (2023-05) Meningkatkan faktualitas dan penalaran dalam model bahasa melalui debat multiagen (landasan, penalaran)
- (2023-05) Adaplanner: perencanaan adaptif dari umpan balik dengan model bahasa (landasan, pengambilan, pembelajaran)
- (2023-05) PENGOBATAN RENCANA-AND COLCED: Meningkatkan penalaran rantai nol-shot dengan model bahasa besar (penalaran)
- (2023-05) Rewoo: Decoupling Reasoning dari Observasi untuk Model Bahasa augmented yang efisien (landasan, penalaran)
- (2023-05) SwiftSage: Agen generatif dengan pemikiran cepat dan lambat untuk tugas interaktif yang kompleks (landasan, penalaran)
- (2023-05) Pohon Pikiran: Penyelesaian Masalah yang Disengaja Dengan Model Bahasa Besar (Penalaran)
- (2023-05) Voyager: Agen yang diwujudkan terbuka dengan model bahasa besar (landasan, penalaran, pengambilan, pembelajaran)
- (2023-06) Intercode: Standardizing dan Benchmarking Coding Interaktif dengan Umpan Balik Eksekusi (Grounding, Reasoning)
- (2023-06) ToolQA: Dataset untuk pertanyaan LLM menjawab dengan alat eksternal (landasan)
- (2023-06) Mind2Web: Menuju Agen Generalis untuk Web (Lingkungan)
- (2023-06) RESTGPT: Menghubungkan model bahasa besar dengan API Restful dunia nyata (landasan, penalaran)
- (2023-06) Tougalpaca: Pembelajaran alat umum untuk model bahasa dengan 3000 kasus simulasi (landasan, penalaran)
- (2023-07) Webagent dunia nyata dengan perencanaan, pemahaman konteks panjang, dan sintesis program (landasan, penalaran)
- (2023-07) RT-2: Model Visi-Aksi-Aksi Mentransfer Pengetahuan Web ke Kontrol Robot (Pembumian)
- (2023-07) ROCO: Kolaborasi multi-robot dialektik dengan model bahasa besar (landasan)
- (2023-07) Robot yang meminta bantuan: Ketidakpastian penyelarasan untuk perencana model bahasa besar (landasan)
- (2023-07) S $^3 $: Sistem Simulasi Jaringan Sosial dengan Agen Terpenok Model Bahasa Besar (Landasan, Penalaran)
- (2023-07) TOOLLLM: Memfasilitasi model bahasa besar untuk menguasai 16000+ API dunia nyata (landasan, penalaran, pengambilan)
- (2023-07) Memahami manfaat dan tantangan menggunakan agen percakapan berbasis model bahasa besar untuk dukungan kesejahteraan mental (landasan)
- (2023-07) Melepaskan Sinergi Kognitif dalam Model Bahasa Besar: Agen Pemecahan Tugas Melalui Penolaan Diri Multi-Pria (Landasan, Penalaran)
- (2023-07) Webarena: Lingkungan web yang realistis untuk membangun agen otonom (lingkungan)
- (2023-08) AgenBench: Mengevaluasi LLMS sebagai Agen (Lingkungan)
- (2023-08) Agentverse: memfasilitasi kolaborasi multi-agen dan mengeksplorasi perilaku yang muncul di agen (lingkungan)
- (2023-08) Autogen: Mengaktifkan aplikasi LLM generasi berikutnya melalui kerangka kerja percakapan multi-agen (pentanahan, penalaran)
- (2023-08) CGMI: Kerangka interaksi multi-agen umum yang dapat dikonfigurasi (pentanahan, penalaran)
- (2023-08) Chateval: Menuju evaluator berbasis LLM yang lebih baik melalui debat multi-agen (landasan, penalaran)
- (2023-08) Penalaran kumulatif dengan model bahasa besar (penalaran)
- (2023-08) Expel: Agen LLM adalah pelajar pengalaman (landasan, penalaran, pengambilan, pembelajaran)
- (2023-08) GPT-IN-The-loop: Pengambilan keputusan adaptif untuk sistem multiagen (pentanahan, penalaran)
- (2023-08) GENOPIA: Platform kolaboratif untuk LLMS-Agusted LLMS (Lingkungan)
- (2023-08) METAGPT: Pemrograman Meta untuk Kerangka Kolaboratif Multi-Agen (Landasan, Penalaran)
- (2023-08) Proagent: Membangun AI koperasi proaktif dengan model bahasa besar (landasan, penalaran)
- (2023-08) Retroformer: Agen bahasa besar retrospektif dengan optimasi gradien kebijakan (landasan, penalaran, pembelajaran)
- (2023-08) SAPIEN: Agen virtual afektif ditenagai oleh model bahasa besar (landasan, penalaran)
- (2023-08) Integrasi sinergis dari model bahasa besar dan arsitektur kognitif untuk AI yang kuat: analisis eksplorasi (landasan, penalaran, pengambilan, pembelajaran)
- (2023-09) TORA: Agen penalaran yang terintegrasi dengan alat untuk pemecahan masalah matematika (landasan, penalaran, pembelajaran)
- (2023-09) Mengidentifikasi risiko agen LM dengan kotak pasir yang ditemui LM (lingkungan)
- (2023-09) Agen Kecurigaan: Bermain permainan informasi yang tidak sempurna dengan teori pikiran sadar GPT-4 (landasan, penalaran)
- (2024-01) Kontras diri: refleksi yang lebih baik melalui perspektif pemecahan yang tidak konsisten (penalaran, refleksi)
- (2024-02) Agen-Pro: Belajar berkembang melalui refleksi dan optimasi tingkat kebijakan (penalaran, refleksi, pembelajaran)
- (2024-03) LLM3: Tugas berbasis model bahasa besar dan perencanaan gerak dengan penalaran kegagalan gerak. (perencanaan, penalaran)
- (2024-04) memberdayakan penemuan biomedis dengan agen AI (ilmuwan AI, penelitian biomedis)
- (2024-05) Timechara: Mengevaluasi Halusinasi Karakter Titik-Dalam Waktu dari Model Bahasa Bermain Peran (Penalaran, Pengambilan)
(Lebih lanjut akan ditambahkan segera. Tarik Permintaan Selamat Datang.)
Sumber daya
- LLM Powered Autonomous Agents (Lil'log)
- LLM-agents-Papers
- Llmagentpapers
- agen bertenaga-llm-llm
(Lebih lanjut akan ditambahkan segera. Tarik Permintaan Selamat Datang.)