Documentos de lectura imprescindible en agentes de modelos de idiomas grandes.
"Aquí hay algunas otras listas de documentos en las que podría estar interesado:
Pronto 4RazoningPapers: razonamiento con el modelo de idioma que impulsa los documentos.
? Conocimiento en los pagadores: documentos de lectura obligatoria sobre edición de conocimiento para modelos de idiomas grandes.
Lo invitamos sinceramente a sumergirnos en estas colecciones de documentos y recursos, cada uno ofreciendo un viaje distintivo de exploración y descubrimiento. ? "
Procesamiento interactivo del lenguaje natural
Zekun Wang, Ge Zhang, Kexin Yang, Ning Shi, Wangchunshu Zhou, Shaochun Hao, Guangzheng Xiong, Yizhi Li, Mong Yuan Sim, Xiuying Chen, Qingqing Zhu, Zhenzhu Yang, Adam Nik, Qi Liu, Chenghua Lin, Shi Wang, Ruibo Liu, Wenhu Chen, Ke Xu, Dayiheng Liu, Yike Guo, Jie Fu. [ABS], 2023.5
Una encuesta sobre agentes autónomos basados en modelos de idiomas grandes
Lei Wang, Chen MA, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhiyuan Chen, Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen. [ABS], 2023.8
El aumento y el potencial de los agentes basados en modelos de idiomas grandes: una encuesta
Zhiheng Xi, Wenxiang Chen, Xin Guo, Wei He, Yiwen Ding, Boyang Hong, Ming Zhang, Junzhe Wang, Senjie Jin, Enyu Zhou, Rui Zheng, Xiaoran Fan, Xiao Wang, Limao Xiong, Yuhao Zhou, Weiran Wang, Changhao Jiang, Yicheng Zou, Xiangyang Liu, Zhangyue Yin, Shihan Dou, Rongxiang Weng, Wensen Cheng, Qi Zhang, Wenjuan Qin, Yongyan Zheng, Xipeng Qiu, Xuanjing Huang, Tao Gui. [ABS], 2023.9
Si LLM es el asistente, entonces el código es la varita: una encuesta sobre cómo el código permite que los modelos de idiomas grandes sirvan como agentes inteligentes
Ke Yang, Jiateng Liu, John Wu, Chaoqi Yang, Yi R. Fung, Sha Li, Zixuan Huang, Xu Cao, Xingyao Wang, Yiquan Wang, Heng Ji, Chengxiang Zhai. [ABS], 2024.1
Agente AI: encuestando los horizontes de la interacción multimodal
Zane Durante, Qiuyuan Huang, Naoki Wake, Ran Gong, Jae Sung Park, Bidipta Sarkar, Rohan Taori, Yusuke Noda, Demetri Terzopoulos, Yejin Choi, Katsushi Ikeuchi, Hoi Vo, Li Fei-Fei, Jianfeng Gao. [ABS], 2024.1
Agentes personales de LLM: información y encuestas sobre la capacidad, la eficiencia y la seguridad
Yuanchun Li, Hao Wen, Weijun Wang, Xiangyu Li, Yizhen Yuan, Guohong Liu, Jiacheng Liu, Wenxing Xu, Xiang Wang, Yi Sun, Rui Kong, Yile Wang, Hanfei Geng, Jian Luan, Xuefeng Jin, Zilong Ye, Guanjing Xiong, Fan Zhang, Xiang Li, Mengwei Xu, Zhijun Li, Peng Li, Yang Liu, Ya-Qin Zhang, Yunxin Liu. [ABS], 2024.1
Una encuesta de inteligencia del código neuronal: paradigmas, avances y más allá
Qiushi Sun, Zhirui Chen, Fangzhi Xu, Kanzhi Cheng, Chang MA, Zhangyue Yin, Jianing Wang, Chengcheng Han, Renyu Zhu, Shuai Yuan, Qipeng Guo, Xipeng Qiu, Pengcheng Yin, Xiaoli, Fei Yuan, Lingpeng Kong, Xipeng, Zhiy Wu. [ABS], 2024.3
La teoría de la mente puede haber surgido espontáneamente en modelos de idiomas grandes
Michal Kosinski. [ABS], 2023.2
Toxicidad en ChatGPT: Análisis de modelos de idiomas asignados a la persona
Ameet Deshpande, Vishvak Murahari, Tanmay Rajpurohit, Ashwin Kalyan, Karthik Narasimhan. [ABS], 2023.4
Jugar juegos repetidos con modelos de idiomas grandes
Elif Akata, Lion Schulz, Julian Coda-Forno, Seong Joon Oh, Matthias Bethge, Eric Schulz. [ABS], 2023.5
Expertprompting: instruyendo a los grandes modelos de idiomas a ser expertos distinguidos
Benfeng Xu, An Yang, Junyang Lin, Quan Wang, Chang Zhou, Yongdong Zhang, Zhendong Mao. [ABS], 2023.5
Juego de roles con modelos de idiomas grandes
Murray Shanahan, Kyle McDonell, Laria Reynolds. [ABS], 2023.5
Tidybot: Asistencia de robot personalizado con modelos de idiomas grandes
Jimmy Wu, Rika Antonova, Adam Kan, Marion Lepert, Andy Zeng, Shuran Song, Jeannette Bohg, Szymon Rusinkiewicz, Thomas Funkhouser. [ABS], 2023.5
Rasgos de personalidad en modelos de idiomas grandes
Mustafa Safdari, Greg Serapio-García, Clément Crepy, Stephen Fitz, Peter Romero, Luning Sun, Marwa Abdulhai, Aleksandra Faust, Maja Matarić. [ABS], 2023.7
¿LLMS poseen una personalidad? Hacer que la prueba MBTI sea una evaluación sorprendente para modelos de idiomas grandes
Keyu Pan, Yawen Zeng. [ABS], 2023.7
Conciencia en inteligencia artificial: ideas de la ciencia de la conciencia
Patrick Butlin, Robert Long, Eric Elmoznino, Yoshua Bengio, Jonathan Birch, Axel Constant, George Deane, Stephen M. Fleming, Chris Frith, Xu Ji, Ryota Kanai, Colin Klein, Grace Lindsay, Matthias Michel, Liad Mudrik, MEGAN AK PETERS, INCREÍBLE DE COLINGCEL, JONATHABEL, JONATHABEL, JONATHABEL, JONATHABEL, JONATHABEL, JONATHEBEL, JONATHA Rufin Vanrullen. [ABS], 2023.8
Tomado fuera de contexto: al medir la conciencia situacional en LLMS
Lukas Berglund, Asa Cooper Stickland, Mikita Balesni, Max Kaufmann, Meg Tong, Tomasz Korbak, Daniel Kokotajlo, Owain Evans. [ABS], 2023.9
¿Pueden los agentes del modelo de lenguaje grande simular comportamientos de confianza humana?
Chengxing Xie, Canyu Chen, Feiran Jia, Ziyu Ye, Kai Shu, Adel Bibi, Ziniu Hu, Philip Torr, Bernard Ghanem, Guohao Li. [ABS], 2024.02
Colt5: transformadores de largo alcance más rápidos con cálculo condicional
Joshua Ainslie, Tao Lei, Michiel de Jong, Santiago Ontañón, Siddhartha Brahma, Yury Zemlyanskiy, David Uthus, Mandy Guo, James Lee-Thorp, Yi Tay, Yun-Hsuan Sung, Sumit Sanghai. [ABS], 2023.3
Memorización emergente y predecible en modelos de idiomas grandes
Stella Biderman, Usvsn Sai Prashanth, Lintang Sutawika, Hailey Schoelkopf, Quentin Anthony, Shivanshu Purohit, Edward Raff. [ABS], 2023.4
Desatar la capacidad de entrada de longitud infinita para modelos de lenguaje a gran escala con un sistema de memoria autocontrolado
Xinnian Liang, Bing Wang, Hui Huang, Shuangzhi Wu, Peihao Wu, Lu Lu, Zejun MA, Zhoujun Li. [ABS], 2023.4
ChatLog: grabar y analizar chatgpt a lo largo del tiempo
Shangqing Tu, Chunyang Li, Jifan Yu, Xiaozhi Wang, Lei Hou, Juanzi Li. [ABS], 2023.4
Aprender a razonar y memorizar con notas
Jack Lanchantin, Shubham Toshniwal, Jason Weston, Arthur Szlam, Sainbayar Sukhbaatar. [ABS], 2023.5
Unlimiformer: transformadores de largo alcance con entrada de longitud ilimitada
Amanda Bertsch, Uri Alon, Graham Neubig, Matthew R. Gormley. [ABS], 2023.5
Los modelos pequeños son complementos valiosos para modelos de idiomas grandes
Canwen Xu, Yichong Xu, Shuohang Wang, Yang Liu, Chenguang Zhu, Julian McAuley. [ABS], 2023.5
MemoryBank: Mejora de modelos de idiomas grandes con memoria a largo plazo
Wanjun Zhong, Liangughong Guo, Qiqi Gao, He Ye, Yanlin Wang. [ABS], 2023.5
Toolkengpt: Aumento de modelos de lenguaje congelado con herramientas masivas a través de insertos de herramientas
Shibo Hao, Tianyang Liu, Zhen Wang, Zhiting Hu. [ABS], 2023.5
RecurrentGPT: Generación interactiva de texto (arbitrariamente) largo
Wangchunshu Zhou, Yuchen Eleanor Jiang, Peng Cui, Tiannan Wang, Zhenxin Xiao, Yifan Hou, Ryan Cotterell, Mrinmaya Sachan. [ABS], 2023.5
Ret-llm: hacia una memoria general de lectura-escritura para modelos de idiomas grandes
Ali Modarressi, Ayyoob Imani, Mohsen Fayyaz, Hinrich Schütze. [ABS], 2023.5
Adaptar modelos de lenguaje para comprimir contextos
Alexis Chevalier, Alexander Wettig, Anirudh Ajith, Danqi Chen. [ABS], 2023.5
Revisando ventanas de contexto paralelo: una alternativa frustrantemente simple y deterioro de la cadena de pensamiento
Kejuan Yang, Xiao Liu, Kaiwen Men, Aohan Zeng, Yuxiao Dong, Jie Tang. [ABS], 2023.5
Atención histórica: longitud de contexto infinito de acceso aleatorio para transformadores
Amirkeivan Mohtashami, Martin Jaggi. [ABS], 2023.5
Codificaciones posicionales aleatorias Generalización de la longitud de impulso de transformadores
Anian Ruoss, Grégoire Delétang, Tim Genewein, Jordi Grau-Moya, Róbert Csordás, Mehdi Bennani, Shane Legg, Joel Veness. [ABS], 2023.5
Atención de la ubicación monotónica para la generalización de la longitud
Jishnu Ray Chowdhury, Cornelia Caragea. [ABS], 2023.5
Chatdb: Aumento de LLM con bases de datos como su memoria simbólica
Chenxu Hu, Jie Fu, Chenzhuang du, Simian Luo, Junbo Zhao, Hang Zhao. [ABS], 2023.6
Arquitecturas cognitivas para agentes lingüísticos
Theodore Sumers, Shunyu Yao, Karthik Narasimhan, Thomas L. Griffiths [ABS], 2023.9
JARVIS-1: agentes de tareas múltiples de mundo abierto con modelos de lenguaje multimodal acuático
Zihao Wang, Shaofei Cai, Anji Liu, Yonggang Jin, Jinbing Hou, Bowei Zhang, Haowei Lin, Zhaofeng He, Zilong Zheng, Yaodong Yang, Xiaojian MA, Yitao Liang . [ABS], 2023.11
Una encuesta sobre el mecanismo de memoria de los agentes basados en modelos de lenguaje grande
Zeyu Zhang, Xiaohe BO, Chen MA, Rui Li, Xu Chen, Quanyu Dai, Jieming Zhu, Zhenhua Dong, Ji-Rong Wen . [ABS], 2024.4
Hipporag: memoria a largo plazo inspirada en neurobiológicamente para modelos de idiomas grandes
Bernal Jiménez Gutiérrez, Yiheng Shu, Yu Gu, Michihiro Yasunaga, Yu Su. [ABS], 2024.5
Búfer de pensamientos: razonamiento de lo que es lo que se refiere a los modelos de idiomas grandes
Ling Yang, Zhaochen Yu, Tianjun Zhang, Shiyi Cao, Minkai Xu, Wentao Zhang, Joseph E. González, Bin Cui. [ABS], 2024,6
Modelos de lenguaje como planificadores de disparo cero: extrayendo conocimiento procesable para agentes incorporados
Wenlong Huang, Pieter Abbeel, Deepak Pathak, Igor Mordatch . [ABS], 2022.1
Monólogo interno: razonamiento encarnado a través de la planificación con modelos de idiomas
Wenlong Huang, Fei Xia, Ted Xiao, Harris Chan, Jacky Liang, Pete Florence, Andy Zeng, Jonathan Tompson, Igor Mordatch, Yevgen Chebotar, Pierre Sermanet, Noah Brown, Tomas Jackson, Linda Luu, Sergey Levine, Karol Hausman, Brian Ichter . [ABS], 2022.7
React: sinergizando razonamiento y actuación en modelos de idiomas
Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan du, Izhak Shafran, Karthik Narasimhan, Yuan Cao. [ABS], 2022.10
Mind's Eye: razonamiento del modelo de lenguaje fundaminado a través de la simulación
Ruibo Liu, Jason Wei, Shixiang Shane GU, Te-Yen Wu, Soroush Vosoughi, Claire Cui, Denny Zhou, Andrew M. Dai. [ABS], 2022.10
LLM-Planner: Planificación de pocos disparos para agentes incorporados con modelos de idiomas grandes
Canción de Chan Hee, Jiaman Wu, Clayton Washington, Brian M. Sadler, Wei-Lun Chao, Yu Su . [ABS], 2022.12
No genere, discrimine: una propuesta para base a modelos de lenguaje a los entornos del mundo real
Yu Gu, Xiang Deng, Yu Su. [ABS], 2022.12
¿Los agentes encarnados sueñan con ovejas pixeladas?: Toma de decisiones incorporadas utilizando modelado mundial guiado de idiomas
Kolby Nottingham, Prithviraj Ammanabrolu, Alane Suhr, Yejin Choi, Hannaneh Hajishirzi, Sameer Singh, Roy Fox . [ABS], 2023.1
Describa, explique, planifique y seleccione: la planificación interactiva con modelos de idiomas grandes permite agentes de tareas múltiples de mundo abierto
Zihao Wang, Shaofei Cai, Anji Liu, Xiaojian MA, Yitao Liang . [ABS], 2023.2
Palm-E: un modelo de lenguaje multimodal incorporado
Danny Driess, Fei Xia, Mehdi Sm Sajjadi, Corey Lynch, Aakanksha Chowdhery, Brian Ichter, Ayzaan Wahid, Jonathan Tompson, Quan Vuong, Tianhe Yu, Wenlong Huang, Yevgen Chebotar, Pierre Sermanet, Daniel Duckworth, Servgey, Vince, Vinguin Vanhoucke, Karol Hausman, Marc Toussaint, Klaus Greff, Andy Zeng, Igor Mordatch, Pete Florence. [ABS], 2023.3
Reflexión: Agentes del lenguaje con aprendizaje de refuerzo verbal
Noah Shinn, Federico Cassano, Beck Labash, Ashwin Gopinath, Karthik Narasimhan, Shunyu Yao. [ABS], 2023.3
Chatear con el entorno: percepción multimodal interactiva utilizando modelos de idiomas grandes
Xufeng Zhao, Mengdi Li, Cornelius Weber, Muhammad Burhan Hafez, Stefan Wermter . [ABS], 2023.3
Plan4MC: Aprendizaje y planificación de refuerzo de habilidades para tareas de Minecraft de mundo abierto
Haoqi Yuan, Chi Zhang, Hongcheng Wang, Feiyang Xie, Penglin Cai, Hao Dong, Zongqing Lu. [ABS], 2023.3
AutoRefino: Refinamiento iterativo con autocuración
Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Shashank Guppta, Bodhisattwa Prasad Majumder, Katherine Hermann, Sean Welleck, AMIRBAKH, PETRESTWA, PETERSET Clark. [ABS], 2023.3
Enseñar modelos de idiomas grandes a sí mismo.
Xinyun Chen, Maxwell Lin, Nathanael Schärli, Denny Zhou. [ABS], 2023.4
Wizardlm: Empoderar modelos de idiomas grandes para seguir instrucciones complejas
Can Xu, Qingfeng Sun, Kai Zheng, Xiubo Geng, Pu Zhao, Jiazhan Feng, Chongyang Tao, Daxin Jiang. [ABS], 2023.4
Frugalgpt: cómo usar modelos de idiomas grandes al tiempo que reduce el costo y mejora el rendimiento
Lingjiao Chen, Matei Zaharia, James Zou. [ABS], 2023.5
Árbol de pensamientos: resolución deliberada de problemas con modelos de idiomas grandes
Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan. [ABS], 2023.5
Plan, eliminar y rastrear: los modelos de idiomas son buenos maestros para agentes encarnados
Yue Wu, So Yeon Min, Yonatan Bisk, Ruslan Salakhutdinov, Amos Azaria, Yuanzhi Li, Tom Mitchell, Shrimai Prabhumoye . [ABS], 2023.5
Agentes mejorados por el conocimiento para juegos de texto interactivos
Prateek Chhikara, Jiarui Zhang, Filip Ilievski, Jonathan Francis, Kaixin MA. [ABS], 2023.5
Voyager: un agente incorporado abierto con modelos de idiomas grandes
Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar . [ABS], 2023.5
SwiftSage: un agente generativo con un pensamiento rápido y lento para tareas interactivas complejas
Bill Yuchen Lin, Yicheng Fu, Karina Yang, Prithviraj Ammanabrolu, Feeze Brahman, Shiyu Huang, Chandra Bhagavatula, Yejin Choi, Xiang Ren. [ABS], 2023.5
Los modelos de idiomas se encuentran con modelos mundiales: las experiencias incorporadas mejoran los modelos de idiomas
Jiannan Xiang, Tianhua Tao, Yi GU, Tianmin Shu, Zirui Wang, Zichao Yang, Zhiting Hu. [ABS], 2023.5
Ghost in the Minecraft: agentes generalmente capaces para entornos de mundo abierto a través de modelos de idiomas grandes con conocimiento y memoria basados en texto
Xizhou Zhu, Yuntao Chen, Hao Tian, Chenxin Tao, Weijie Su, Chenyu Yang, Gao Huang, Bin Li, Lewei Lu, Xiaogang Wang, Yu Qiao, Zhaoxiang Zhang, Jifeng Dai. [ABS], 2023.5
Adaplanner: planificación adaptativa a partir de comentarios con modelos de idiomas
Sun Haotian, Yuchen Zhuang, Lingkai Kong, Bo Dai, Chao Zhang. [ABS], 2023.5
El razonamiento con el modelo de idioma es planificar con el modelo mundial
Shibo Hao, Yi Gu, Haodi MA, Joshua Jiahua Hong, Zhen Wang, Daisy Zhe Wang, Zhiting Hu. [ABS], 2023.5
Preparación de planificación y resuelto: Mejora del razonamiento de la cadena de pensamiento cero de los modelos de idiomas grandes
Lei Wang, Wanyu Xu, Yihuai Lan, Zhiqiang Hu, Yunshi Lan, Roy Ka-Wei Lee, Ee-Peng Lim. [ABS], 2023.5
Habilitar interacciones inteligentes entre un agente y un LLM: un enfoque de aprendizaje de refuerzo
Bin Hu, Chenyang Zhao, Pu Zhang, Zihao Zhou, Yuanhang Yang, Zenglin Xu, Bin Liu. [ABS], 2023.6
Recagente: un nuevo paradigma de simulación para sistemas de recomendación
Lei Wang, Jingsen Zhang, Xu Chen, Yankai Lin, Ruihua Song, Wayne Xin Zhao, Ji-Rong Wen. [ABS], 2023.6
Hacia un agente unificado con modelos de base.
Norman di Palo, Arunkumar Byravan, Leonard Hasenclever, Markus Wulfmeier, Nicolas Heess, Martin Riedmiller. [ABS], 2023.7
Pangu-coder2: impulsar modelos de idiomas grandes para el código con comentarios de clasificación
Bo Shen, Jiaxin Zhang, Taihong Chen, Daoguang Zan, Bing Geng, An Fu, Muhan Zeng, Ailun Yu, Jichuan Ji, Jingyang Zhao, Yuenan Guo, Qianxiang Wang. [ABS], 2023.7
Un webagent del mundo real con la planificación, la comprensión del contexto largo y la síntesis de programas
Izzeddin Gur, Hiroki Furuta, Austin Huang, Mustafa Safdari, Yutaka Matsuo, Douglas Eck, Aleksandra Faust. [ABS], 2023.7
Reformador: agentes de lenguaje grande retrospectivo con optimización de gradiente de políticas
Weiran Yao, Shelby Heinecke, Juan Carlos Niebles, Zhiwei Liu, Yihao Feng, Le Xue, Rithesh Murthy, Zeyuan Chen, Jianguo Zhang, Devansh Arpit, Ran Xu, Phil Mui, Huan Wang, Caiming Xiong, Silvio Savarese. [ABS], 2023.8
SelfCheck: Uso de LLMS a cero disparo Verifique su propio razonamiento paso a paso
Ning Miao, Yee Whye Teh, Tom Rainforth. [ABS], 2023.8
Expel: los agentes de LLM son alumnos experimentales
Andrew Zhao, Daniel Huang, Quentin Xu, Matthieu Lin, Yong-Jin Liu, Gao Huang. [ABS], 2023.8
Conraña autónoma: agentes modelo de lenguaje grande con aprendizaje de habilidades automáticas alineadas en lenguaje
Shaohui Peng, Xing Hu, Qi Yi, Rui Zhang, Jiaming Guo, Di Huang, Zikang Tian, Ruizhi Chen, Zidong du, Qi Guo, Yunji Chen, Ling Li. [ABS], 2023.9
JARVIS-1: agentes de tareas múltiples de mundo abierto con modelos de lenguaje multimodal acuático
Zihao Wang, Shaofei Cai, Anji Liu, Yonggang Jin, Jinbing Hou, Bowei Zhang, Haowei Lin, Zhaofeng He, Zilong Zheng, Yaodong Yang, Xiaojian MA, Yitao Liang . [ABS], 2023.11
Leo: un agente generalista incorporado en el mundo 3D
Jiangyong Huang, Silong Yong, Xiaojian MA, Xiongkun Linghu , Puhao Li, Yan Wang, Qing Li, Song-Chun Zhu, Baoxiong Jia, Siyuan Huang* [Abs], 2023.11
Cadena de código: razonamiento con un emulador de código acuático de modelos de idioma
Chengshu Li, Jacky Liang, Andy Zeng, Xinyun Chen, Karol Hausman, Dorsa Sadigh, Sergey Levine, Li Fei-Fei, Fei Xia, Brian Ichter. [ABS], 2023.12
REST se encuentra con reaccionar: superación personal para un agente de razonamiento de múltiples pasos LLM
Renat Aksitov, Sobhan Miryoosefi, Zonglin Li, Daliang Li, Sheila Babayan, Kavya Kopparapu, Zachary Fisher, Ruiqi Guo, Sushant Prakash, Pranesh Srinivasan, Manzil Zaheer, Felix Yu, Sanjiv Kumar. [ABS], 2023.12
Autocontraste: mejor reflexión a través de perspectivas de resolución inconsistentes
Wenqi Zhang, Yongliang Shen, Linjuan Wu, Qiuying Peng, Jun Wang, Yueting Zhuang, Weiming Lu. [ABS], 2024.01
AutoAct: agente automático que aprende desde cero a través de la planificación automática
Shuofei Qiao, Ningyu Zhang, Runnan Fang, Yujie Luo, Wangchunshu Zhou, Yuchen Eleanor Jiang, Chengfei LV, Huajun Chen. [ABS], 2024.01
TravelPlanner: un punto de referencia para la planificación del mundo real con agentes de idiomas
Jian Xie, Kai Zhang, Jiangjie Chen, Tinghui Zhu, Renze Lou, Yuandong Tian, Yanghua Xiao, Yu Su. [ABS], 2024.02
Agente-Pro: Aprender a evolucionar a través de la reflexión y optimización a nivel de política
Wenqi Zhang, Ke Tang, Hai Wu, Mengna Wang, Yongliang Shen, Guiyang Hou, Zeqi Tan, Peng Li, Yueting Zhuang, Weiming Lu. [ABS], 2024.02
KnowAgent: Planificación de conocimiento de conocimiento para agentes basados en LLM
Yuqi Zhu, Shuofei Qiao, Yixin Ou, Shumin Deng, Ningyu Zhang, Shiwei Lyu, Yue Shen, Lei Liang, Jinjie GU, Huajun Chen. [ABS], 2024.03
Sotopia-π: aprendizaje interactivo de agentes de lenguaje socialmente inteligente
Ruiyi Wang, Haofei Yu, Wenxin Zhang, Zhengyang Qi, Maarten Sap, Graham Neubig, Yonatan Bisk, Hao Zhu. [ABS], 2024.03
Autoguide: generación automatizada y selección de pautas conscientes del estado para agentes de modelos de idiomas grandes
Yao Fu, Dong-Ki Kim, Jaekyeom Kim, Sungryull Sohn, Lajanugen Logeswaran, Kyunghoon Bae, Honglak Lee. [ABS], 2024.03
Empoderar agentes de modelos de idiomas grandes a través del aprendizaje de acción
Haiteng Zhao, Chang MA, Guoyin Wang, Jing Su, Lingpeng Kong, Jingjing Xu, Zhi-Hong Deng, Hongxia Yang. [ABS], 2024.02
Devil's Advocate: reflexión anticipada para los agentes de LLM
Haoyu Wang, Tao Li, Zhiwei Deng, Dan Roth, Yang Li. [ABS], 2024.05
Planificación de agentes con el modelo de conocimiento mundial
Shuofei Qiao, Runnan Fang, Ningyu Zhang, Yuqi Zhu, Xiang Chen, Shumin Deng, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen. [ABS], 2024.05
Explore de GO inteligente: pararse sobre los hombros de los modelos de la Fundación Gigante
Cong Lu, Shengran Hu, Jeff Clune. [ABS], 2024.05
Razonamiento lógico fiel a través de la cadena de pensamiento simbólica
Jundong Xu, Hao Fei, Liangming Pan, Qian Liu, Mong-Li Lee, Wynne Hsu. [ABS], 2024.05
Alicia en el país de las maravillas: tareas simples que muestran un desglose de razonamiento completo en modelos de idiomas grandes de última generación
Marianna Nezhurina, Lucia Cipolina-Kun, Mehdi Cherti, Jenia Jitsev. [ABS], 2024.06
TextGrad: "diferenciación" automática a través del texto
Mert Yuksekgonul, Federico Bianchi, Joseph Boen, Sheng Liu, Zhi Huang, Carlos Guestrin, James Zou. [ABS], 2024.06
El aprendizaje simbólico permite a los agentes auto evolución
Wangchunshu Zhou, Yixin Ou, Shengwei Ding, Long Li, Jialong Wu, Tiannan Wang, Jiamin Chen, Shuai Wang, Xiaohua Xu, Ningyu Zhang, Huajun Chen, Yuchen Eleanor Jiang. [ABS], 2024.06
OS-Copilot: hacia los agentes informáticos generalistas con superación personal
Zhiyong Wu, Chengcheng Han, Zichen Ding, Zhenmin Weng, Zhoumiange Liu, Shunyu Yao, Tao Yu, Lingpong Kong. [ABS], 2024.02
Seeclick: aprovechando la base de la GUI para agentes visuales de GUI avanzados
Kanzhi Cheng, Qiushi Sun, YoanGang Chu, Fangzhi Xu, Yantao Li, Jianbing Zhang, Zhiyong Wu. [ABS], 2024.01
WebGPT: cuestionamiento asistido por el navegador, respuesta de retroalimentación humana
Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna Elleidou, Gretchen Krueger, Kevin Button, Matthew Knight, Benjaman, Benjamamin, Juan, Juan Schulman. [ABS], 2021.12
Formador de herramientas: los modelos de idiomas pueden enseñarse a usar herramientas
Timo Schick, Jane Dwivedi-yu, Roberto Desta, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom. [ABS], 2023.2
MM-REACC: Involucrar a ChatGPT para razonamiento y acción multimodal
Zhengyuan Yang, Linjie Li, Jianfeng Wang, Kevin Lin, Ehsan Azarnasab, Faisal Ahmed, Zicheng Liu, Ce Liu, Michael Zeng, Lijuan Wang. [ABS], 2023.3
Hugginggpt: Resolver tareas de IA con ChatGPT y sus amigos en la cara de abrazo
Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu, Yueting Zhuang. [ABS], 2023.3
Chatgpt visual: hablar, dibujar y editar con modelos de Foundation Visual
Chenfei Wu, Shengming Yin, Weizhen Qi, Xiaodong Wang, Zecheng Tang, Nan Duan. [ABS], 2023.3
Arte: razonamiento automático de varios pasos y uso de herramientas para modelos de idiomas grandes
Bhargavi Paranjape, Scott Lundberg, Sameer Singh, Hannaneh Hajishirzi, Luke Zettlemoyer, Marco Tulio Ribeiro. [ABS], 2023.3
Taskmatrix.ai: completar tareas conectando modelos de base con millones de API
Yaobo Liang, Chenfei Wu, Ting Song, Wenshan Wu, Yan Xia, Yu Liu, Yang Ou, Shuai Lu, Lei Ji, Shaguang Mao, Yun Wang, Linjun Shou, Ming Gong, Nan Duan. [ABS], 2023.3
Camaleón: razonamiento de composición de plug-and-play con modelos de idiomas grandes
Pan Lu, Baolin Peng, Hao Cheng, Michel Galley, Kai-Wei Chang, Ying Nian Wu, Song-Chun Zhu, Jianfeng Gao. [ABS], 2023.4
Chemcrow: Aumento de modelos de gran idioma con herramientas de química
Andrés M Bran, Sam Cox, Andrew D White, Philippe Schwaller. [ABS], 2023.4
Talm: modelos de idiomas aumentados de herramientas
Aaron Parisi, Yao Zhao, Noah Fiedel. [ABS], 2022.5
CRÍTICO: Los modelos de idiomas grandes pueden autocorregarse con una crítica interactiva para herramientas
Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Minlie Huang, Nan Duan, Weizhu Chen. [ABS] [Código], 2023.5
Hacer modelos de idiomas mejores estudiantes de herramientas con comentarios de ejecución
Shuofei Qiao, Honghao Gui, Huajun Chen, Ningyu Zhang. [ABS], 2023.5
CHATCOT: razonamiento de la cadena de pensamiento de la herramienta en los modelos de idiomas grandes basados en chat
Zhipeng Chen, Kun Zhou, Beichen Zhang, Zheng Gong, Wayne Xin Zhao, Ji-Rong Wen. [ABS], 2023.5
Gorila: modelo de lenguaje grande conectado con API masivas
Shishir G. Patil, Tianjun Zhang, Xin Wang, Joseph E. González. [ABS], 2023.5
TOOLLLM: Facilitar modelos de idiomas grandes para dominar 16000+ API del mundo real
Yujia Qin, Shihao Liang, Yining Ye, Kunlun Zhu, Lan Yan, Yaxi Lu, Yankai Lin, Xin Cong, Xiangru Tang, Bill Qian, Sihan Zhao, Runchu Tian, Ruobing Xie, Jie Zhou, Mark Gerstein, Dahai Li, Zhiyuan Liu, Maosong, Maosong. [ABS], 2023.7
Gear: Aumento de modelos de lenguaje con resolución de herramientas generalizables y eficientes
Yining Lu, Haoping Yu, Daniel Khashabi. [ABS], 2023.7
Gentopia: una plataforma de colaboración para LLM acomodados en herramientas
Binfeng Xu, Xukun Liu, Hua Shen, Zeyu Han, Yuhan Li, Murong Yue, Zhiyuan Peng, Yuchen Liu, Ziyu Yao, Dongkuan Xu. [ABS], 2023.8
Identificar los riesgos de los agentes de LM con un Sandbox emulado de LM
Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy BA, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto. [ABS], 2023.9
Aprovechando modelos de lenguaje grandes pre-entrenados para construir y utilizar modelos mundiales para la planificación de tareas basadas en modelos
Lin Guan, Karthik Valmeekam, Sarath Sreedharan, Subbarao Kambhampati [ABS], 2023.5
Copiloto de datos: unir miles de millones de datos y humanos con flujo de trabajo autónomo
Wenqi Zhang, Yongliang Shen, Weiming Lu, Yueting Zhuang [ABS], 2023.6
Clova: un asistente visual de circuito cerrado con uso de herramientas y actualizaciones
Zhi Gao, Yuntao Du, Xingong Zhang, Xiaojian MA, Wenjuan Han, Song-Chun Zhu, Qing Li [ABS], 2023.12
GITAGENT: facilitando el agente autónomo con GitHub por extensión de la herramienta
Bohan Lyu, Xin Cong, Heyang Yu, Pan Yang, Yujia Qin, Yining Ye, Yaxi Lu, Zhong Zhang, Yukun Yan, Yankai Lin, Zhiyuan Liu, Maosong Sun. [ABS], 2023.12
EasyTool: Mejora de agentes basados en LLM con instrucción de herramienta concisa
Siyu Yuan, Kaitao Song, Jiangjie Chen, Xu Tan, Yongliang Shen, Kan Ren, Dongsheng Li, Deqing Yang. [ABS], 2024.1
Symbol-LLM: Hacia la interfaz centrada en el símbolo fundamental para modelos de idiomas grandes
Fangzhi Xu, Zhiyong Wu, Qiushi Sun, Siyu Ren, Fei Yuan, Shuai Yuan, Qika Lin, Yu Qiao, Jun Liu. [ABS], 2023.11
Tulip Agent: permite a los agentes basados en LLM para resolver tareas utilizando grandes bibliotecas de herramientas
Felix Ocker, Daniel Tanneberg, Julian Eggert, Michael Gienger. [ABS], 2024.07
OneGen: generación y recuperación unificadas de un paso eficiente para LLMS
Jintian Zhang, Cheng Peng, Mengshu Sun, Xiang Chen, Lei Liang, Zhiqiang Zhang, Jun Zhou, Huajun Chen, Ningyu Zhang. [ABS], 2024.09
Cascadas de modelos de idiomas
David Dohan, Winnie Xu, Aitor Lewkowycz, Jacob Austin, David Bieber, Raphael Gontijo Lopes, Yuhuai Wu, Henryk Michalewski, Rif A. Saurous, Jascha Sohl-Dickstein, Kevin Murphy, Charles Sutton. [ABS], 2022.7
Colaboración con modelos de idiomas para razonamiento incorporado
Ishita Dasgupta, Christine Kaeser-Chen, Kenneth Marino, Arun Ahuja, Sheila Babayan, Felix Hill, Rob Fergus. [ABS], 2023.2
Camel: agentes comunicativos para la exploración de "mente" de la sociedad de modelos de idiomas a gran escala
Guohao Li, Hasan Abed Al Kader Hammoud, Hani Itani, Dmitrii Khizbullin, Bernard Ghanem. [ABS], 2023.3
Chat de varias partes: agentes de conversación en entornos grupales con humanos y modelos
Jimmy Wei, Kurt Shuster, Arthur Szlam, Jason Weston, Jack Urbanek, Mojtaba Komeili. [ABS], 2023.4
Network Chatllm: más cerebros, más inteligencia
Rui Hao, Linmei Hu, Weijian Qi, Qingliu Wu, Yirui Zhang, Liqiang Nie. [ABS], 2023.4
Generación de códigos de autocolaboración a través de chatgpt
Yihong Dong, Xue Jiang, Zhi Jin, Ge Li. [ABS], 2023.4
Capacidades de investigación científica autónoma emergente de modelos de idiomas grandes
Daniil A. Boiko, Robert Macknight, Gabe Gomes. [ABS], 2023.4
CHATGPT/GPT-4 para la construcción y razonamiento del gráfico de conocimiento: capacidades recientes y oportunidades futuras
Yuqi Zhu, Xiaohan Wang, Jing Chen, Shuofei Qiao, Yixin Ou, Yunzhi Yao, Shumin Deng, Huajun Chen, Ningyu Zhang. [ABS], 2023.5
Modelos de idiomas grandes como fabricantes de herramientas
Tianle Cai, Xuezhi Wang, Tengyu MA, Xinyun Chen, Denny Zhou . [ABS], 2023.5
Inferir los objetivos de comunicar a los agentes de acciones e instrucciones
Lance Ying, Tan Zhi-Xuan, Vikash Mansinghka, Joshua B. Tenenbaum. [ABS], 2023.6
IA generativa inalámbrica de múltiples agentes: de inteligencia conectada a inteligencia colectiva
Hang Zou, Qiyang Zhao, Lina Bariah, Mehdi Bennis, Merouane Debbah. [ABS], 2023.7
ROCO: colaboración dialéctica de múltiples robots con modelos de idiomas grandes
Zhao Mandi, Shreeya Jain, Shuran Song. [ABS], 2023.7
Desatar la sinergia cognitiva en modelos de idiomas grandes: un agente de resolución de tareas a través de la autocolaboración multipersona
Zhenhailong Wang, Shaoguang Mao, Wenshan Wu, Tao GE, Furu Wei, Heng Ji. [ABS], 2023.7
Agentes comunicativos para el desarrollo de software
Chen Qian, Xin Cong, Cheng Yang, Weize Chen, Yusheng Su, Juyuan Xu, Zhiyuan Liu, Maosong Sun. [ABS], 2023.7
A Infinity and Beyond: Show-1 y Showrunner Agentes en simulaciones de múltiples agentes
Philipp Maas, Frank Carey, Chris Wheeler, Edward Saatchi, Pete Billington, Jessica Yaffa Shamash. [ABS], 2023.7
Metagpt: Meta Programming para marco colaborativo de múltiples agentes
Sirui Hong, Xiawu Zheng, Jonathan Chen, Yuheng Cheng, Ceyao Zhang, Zili Wang, Steven Ka Shing Yau, Zijuan Lin, Liyang Zhou, Chenyu Ran, Lingfeng Xiao, Chenglin Wu. [ABS], 2023.8
Mejora de la negociación del modelo de lenguaje con el aprendizaje de auto-juego y en contexto de la retroalimentación de la IA
Yao Fu, Hao Peng, Tushar Khot, Mirella lapata. [ABS], 2023.5
Colaboración de múltiples agentes: aprovechando el poder de los agentes inteligentes de LLM
Yashar Talebirad, Amirhossein Nadiri. [ABS], 2023.6
RESTGPT: Conectar modelos de idiomas grandes con aplicaciones del mundo real a través de API RESTful
Yifan Song, Weimin Xiong, Dawei Zhu, Cheng Li, Ke Wang, Ye Tian, Sujian Li . [ABS], 2023.6
Construir agentes cooperativos incorporados modularmente con modelos de idiomas grandes
Hongxin Zhang, Weihua du, Jiaming Shan, Qinhong Zhou, Yilun du, Joshua B. Tenenbaum, Tianmin Shu, Chuang Gan. [ABS], 2023.7
Interact: Explorar los potenciales de ChatGPT como agente cooperativo
Po-Lin Chen, Cheng-Shang Chang. [ABS], 2023.8
Autógeno: habilitando aplicaciones LLM de próxima generación a través del marco de conversación de múltiples agentes
Qingyun Wu, Gagan Bansal, Jieyu Zhang, Yiran Wu, Shaokun Zhang, Erkang Zhu, Beibin Li, Li Jiang, Xiaoyun Zhang, Chi Wang. [ABS], 2023.8
Explorando la intersección de modelos de idiomas grandes y modelado basado en agentes a través de ingeniería rápida
Edward Junprung. [ABS], 2023.8
Inferencia neural amortizada por razonamiento anidado de múltiples agentes
Kunal Jha, Tuan Anh LE, Chuanyang Jin, Yen-Ling Kuo, Joshua B. Tenenbaum, Tianmin Shu. [ABS], 2023.8
GPT-in-the-Loop: toma de decisiones adaptativas para sistemas multiagentes
Nathalia Nascimento, Paulo Alencar, Donald Cowan. [ABS], 2023.8
Proagent: construcción de IA cooperativa proactiva con modelos de idiomas grandes
Ceyao Zhang, Kaijie Yang, Siyi Hu, Zihao Wang, Guanghe Li, Yihang Sun, Cheng Zhang, Zhaowei Zhang, Anji Liu, Song-Chun Zhu, Xiaojun Chang, Junge Zhang, Feng Yin, Yitao Liang, Yaodong Yang. [ABS], 2023.8
MindAgent: Interacción de juegos emergentes
Ran Gong, Qiuyuan Huang, Xiaojian MA, Hoi Vo, Zane Durante Yusuke Noda, Zilong Zheng, Song-Chun Zhu Demetri Terzopoulos, Li Fei-Fei, Jianfeng Gao. [ABS], 2023.9
Explorando los mecanismos de colaboración para los agentes de LLM: una visión de psicología social
Jintian Zhang, Xin Xu, Shumin Deng. [ABS], 2023.10
Lumos: Agentes de aprendizaje con datos unificados, diseño modular y LLM de código abierto
Da Yin, Faeze Brahman, Abhilasha Ravichander, Khyathi Chandu, Kai-Wei Chang, Yejin Choi, Bill Yuchen Lin. [ABS], 2023.11
AutoAct: agente automático que aprende desde cero a través de la planificación automática
Shuofei Qiao, Ningyu Zhang, Runnan Fang, Yujie Luo, Wangchunshu Zhou, Yuchen Eleanor Jiang, Chengfei LV, Huajun Chen. [ABS], 2024.01
COREX: Empujando los límites del razonamiento complejo a través de la colaboración multimodelo
Qiushi Sun, Zhangyue Yin, Xiang Li, Zhiyong Wu, Xipeng Qiu, Lingpeng Kong. [ABS], 2023.10
Comm: asignación colaborativa de múltiples agentes, múltiples razonamiento para la resolución de problemas complejos
Pei Chen, Boran Han, Shuai Zhang. [ABS], 2024.4
En las incógnitas desconocidas: el aprendizaje humano comprometido a través de la participación en las conversaciones del agente del modelo de idioma
Yucheng Jiang, Yijia Shao, Dekun MA, Sina J. Semnani, Monica S. Lam. [ABS], 2024.8
Fomentar el pensamiento divergente en modelos de idiomas grandes a través del debate de múltiples agentes
Tian Liang, Zhiwei He, Wenxiang Jiao, Xing Wang, Yan Wang, Rui Wang, Yujiu Yang, Zhaopeng Tu, Shuming Shi. [ABS], 2023.5
Mejora de la fáctica y el razonamiento en los modelos de idiomas a través del debate multiagente
Yilun du, Shuang Li, Antonio Torralba, Joshua B. Tenenbaum, Igor Mordatch. [ABS], 2023.5
Mejora de la negociación del modelo de lenguaje con el aprendizaje de auto-juego y en contexto de la retroalimentación de la IA
Yao Fu, Hao Peng, Tushar Khot, Mirella lapata. [ABS], 2023.5
ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate
Chi-Min Chan, Weize Chen, Yusheng Su, Jianxuan Yu, Wei Xue, Shanghang Zhang, Jie Fu, Zhiyuan Liu. [abs], 2023.8
How susceptible are LLMs to Logical Fallacies?
Amirreza Payandeh, Dan Pluth, Jordan Hosier, Xuesu Xiao, Vijay K. Gurbani. [abs], 2023.8
Identifying the Risks of LM Agents with an LM-Emulated Sandbox
Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto. [abs], 2023.9
Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View
Jintian Zhang, Xin Xu, Shumin Deng. [abs], 2023.10
Generative Agents: Interactive Simulacra of Human Behavior
Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein. [abs], 2023.4
Training Socially Aligned Language Models in Simulated Human Society.
Ruibo Liu, Ruixin Yang, Chenyan Jia, Ge Zhang, Denny Zhou, Andrew M. Dai, Diyi Yang, Soroush Vosoughi. [abs], 2023.5
The Role of Summarization in Generative Agents: A Preliminary Perspective
Xiachong Feng, Xiaocheng Feng, Bing Qin. [abs], 2023.5
Epidemic Modeling with Generative Agents.
Ross Williams, Niyousha Hosseinichimeh, Aritra Majumdar, Navid Ghaffarzadegan. [abs], 2023.7
S^3: Social-network Simulation System with Large Language Model-Empowered Agents
Chen Gao, Xiaochong Lan, Zhihong Lu, Jinzhu Mao, Jinghua Piao, Huandong Wang, Depeng Jin, Yong Li. [abs],2023.7
AgentSims: An Open-Source Sandbox for Large Language Model Evaluation
Jiaju Lin, Haoran Zhao, Aochi Zhang, Yiting Wu, Huqiuyue Ping, Qin Chen . [abs], 2023.8
CGMI: Configurable General Multi-Agent Interaction Framework
Shi Jinxin, Zhao Jiabao, Wang Yilei, Wu Xingjiao, Li Jiawen, He Liang. [abs], 2023.8
EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education
Yuhao Dan, Zhikai Lei, Yiyang Gu, Yong Li, Jianghao Yin, Jiaju Lin, Linhao Ye, Zhiyan Tie, Yougen Zhou, Yilei Wang, Aimin Zhou, Ze Zhou, Qin Chen, Jie Zhou, Liang He, Xipeng Qiu. [abs], 2023.8
SuperAgent: A Customer Service Chatbot for E-commerce Websites
Lei Cui, Shaohan Huang, Furu Wei, Chuanqi Tan, Chaoqun Duan, Ming Zhou. [paper], 2017
WebArena: A Realistic Web Environment for Building Autonomous Agents
Shuyan Zhou, Frank F. Xu, Hao Zhu, Xuhui Zhou, Robert Lo, Abishek Sridhar, Xianyi Cheng, Yonatan Bisk, Daniel Fried, Uri Alon, Graham Neubig. [abs], 2023.7
LLM As DBA
Xuanhe Zhou, Guoliang Li, Zhiyuan Liu. [abs], 2023.8
RoboAgent: Generalization and Efficiency in Robot Manipulation via Semantic Augmentations and Action Chunking
Homanga Bharadhwaj, Jay Vakil, Mohit Sharma, Abhinav Gupta, Shubham Tulsiani, Vikash Kumar. [paper], 2023
Is There Any Social Principle for LLM-Based Agents?
Jitao Bai, Simiao Zhang, Zhonghao Chen. [abs], 2023.8
ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving
Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Minlie Huang, Nan Duan, Weizhu Chen. [abs] [code], 2023.9
Agentic Skill Discovery
Xufeng Zhao, Cornelius Weber, Stefan Wermter [abs] [code], 2024.5
Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models
Yijia Shao, Yucheng Jiang, Theodore A. Kanell, Peter Xu, Omar Khattab, Monica S. Lam. [abs], [code], 2024.4
Agents: An Open-source Framework for Autonomous Language Agents
Wangchunshu Zhou, Yuchen Eleanor Jiang, Long Li, Jialong Wu, Tiannan Wang, Shi Qiu, Jintian Zhang, Jing Chen, Ruipu Wu, Shuai Wang, Shiding Zhu, Jiyu Chen, Wentao Zhang, Ningyu Zhang, Huajun Chen, Peng Cui, Mrinmaya Sachan. [abs], 2023.9
Dynamic LLM-Agent Network: An LLM-agent Collaboration Framework with Agent Team Optimization
Zijun Liu, Yanzhe Zhang, Peng Li, Yang Liu, Diyi Yang. [abs], 2023.10
OpenAgents: An Open Platform for Language Agents in the Wild
Tianbao Xie, Fan Zhou, Zhoujun Cheng, Peng Shi, Luoxuan Weng, Yitao Liu, Toh Jing Hua, Junning Zhao, Qian Liu, Che Liu, Leo Z. Liu, Yiheng Xu, Hongjin Su, Dongchan Shin, Caiming Xiong, Tao Yu. [abs], 2023.10
AutoAct: Automatic Agent Learning from Scratch via Self-Planning
Shuofei Qiao, Ningyu Zhang, Runnan Fang, Yujie Luo, Wangchunshu Zhou, Yuchen Eleanor Jiang, Chengfei Lv, Huajun Chen. [abs], 2024.01
An Interactive Agent Foundation Model
Zane Durante, Bidipta Sarkar, Ran Gong, Rohan Taori, Yusuke Noda, Paul Tang, Ehsan Adeli, Shrinidhi Kowshika Lakshmikanth, Kevin Schulman, Arnold Milstein, Demetri Terzopoulos, Ade Famoti, Noboru Kuno, Ashley Llorens, Hoi Vo, Katsu Ikeuchi, Li Fei-Fei, Jianfeng Gao, Naoki Wake, Qiuyuan Huang. [abs], 2024.02
Emergence of Social Norms in Generative Agent Societies: Principles and Architecture
Siyue Ren, Zhiyao Cui, Ruiqi Song, Zhen Wang, Shuyue Hu. [abs], 2024.03
Interactive Evolution: A Neural-Symbolic Self-Training Framework For Large Language Models
Fangzhi Xu, Qiushi Sun, Kanzhi Cheng, Jun Liu, Yu Qiao, Zhiyong Wu. [abs], 2024.06
AgentSquare: Automatic LLM Agent Search in Modular Design Space
Yu Shang, Yu Li, Keyu Zhao, Likai Ma, Jiahe Liu, Fengli Xu, Yong Li [abs], 2024.10
Enhancing Trust in LLM-Based AI Automation Agents: New Considerations and Future Challenges
Sivan Schwartz, Avi Yaeli, Segev Shlomov. [abs], 2023.8
Mind2Web: Towards a Generalist Agent for the Web
Xiang Deng, Yu Gu, Boyuan Zheng, Shijie Chen, Samuel Stevens, Boshi Wang, Huan Sun, Yu Su. [abs], 2023.6
The Tong Test: Evaluating Artificial General Intelligence Through Dynamic Embodied Physical and Social Interactions
Yujia Peng , Jiaheng Han, Zhenliang Zhang , Lifeng Fan , Tengyu Liu, Siyuan Qi, Xue Feng, Yuxi Ma, Yizhou Wang, Song-Chun Zhu. [abs], 2023.7
AgentBench: Evaluating LLMs as Agents
Xiao Liu, Hao Yu, Hanchen Zhang, Yifan Xu, Xuanyu Lei, Hanyu Lai, Yu Gu, Hangliang Ding, Kaiwen Men, Kejuan Yang, Shudan Zhang, Xiang Deng, Aohan Zeng, Zhengxiao Du, Chenhui Zhang, Sheng Shen, Tianjun Zhang, Yu Su, Huan Sun, Minlie Huang, Yuxiao Dong, Jie Tang . [abs], 2023.8
BOLAA: Benchmarking and Orchestrating LLM-augmented Autonomous Agents.
Zhiwei Liu, Weiran Yao, Jianguo Zhang, Le Xue, Shelby Heinecke, Rithesh Murthy, Yihao Feng, Zeyuan Chen, Juan Carlos Niebles, Devansh Arpit, Ran Xu, Phil Mui, Huan Wang, Caiming Xiong, Silvio Savarese. [abs], 2023.8
Identifying the Risks of LM Agents with an LM-Emulated Sandbox
Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto. [abs], 2023.9
T-Eval: Evaluating the Tool Utilization Capability of Large Language Models Step by Step
Zehui Chen, Weihua Du, Wenwei Zhang, Kuikun Liu, Jiangning Liu, Miao Zheng, Jingming Zhuo, Songyang Zhang, Dahua Lin, Kai Chen, Feng Zhao. [abs], 2023.12
TravelPlanner: A Benchmark for Real-World Planning with Language Agents
Jian Xie, Kai Zhang, Jiangjie Chen, Tinghui Zhu, Renze Lou, Yuandong Tian, Yanghua Xiao, Yu Su. [abs], 2024.02
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents
Chang Ma, Junlei Zhang, Zhihao Zhu, Cheng Yang, Yujiu Yang, Yaohui Jin, Zhenzhong Lan, Lingpeng Kong, Junxian He. [abs], 2024.01
OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments
Tianbao Xie, Danyang Zhang, Jixuan Chen, Xiaochuan Li, Siheng Zhao, Ruisheng Cao, Toh Jing Hua, Zhoujun Cheng, Dongchan Shin, Fangyu Lei, Yitao Liu, Yiheng Xu, Shuyan Zhou, Silvio Savarese, Caiming Xiong, Victor Zhong, Tao Yu. [abs], 2024.04
TimeChara: Evaluating Point-in-Time Character Hallucination of Role-Playing Large Language Models
Jaewoo Ahn, Taehyun Lee, Junyoung Lim, Jin-Hwa Kim, Sangdoo Yun, Hwaran Lee, Gunhee Kim. [abs], 2024.05
AppWorld: A Controllable World of Apps and People for Benchmarking Interactive Coding Agents
Harsh Trivedi, Tushar Khot, Mareike Hartmann, Ruskin Manku, Vinty Dong, Edward Li, Shashank Gupta, Ashish Sabharwal, Niranjan Balasubramanian. [abs], 2024.07
Benchmarking Agentic Workflow Generation
Shuofei Qiao, Runnan Fang, Zhisong Qiu, Xiaobin Wang, Ningyu Zhang, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen . [abs], 2024.10
| Tipos | Herramientas |
|---|---|
| Agent with tool | AutoGPT、LangChain、Transformer Agents、WorkGPT、AutoChain 、Langroid、 WebArena、GPT Researcher、BMTools、ToolBench 、AgentGPT、xlang |
| Multi-Agent | CAMEL、GPTeam、AgentVerse、MetaGPT、Langroid、SocraticAI、AutoGen、Agents |
| Otros | AutoAgents 、GPT Engineer |
Auto-GPT. An experimental open-source attempt to make GPT-4 fully autonomous.
LangChain. Building applications with LLMs through composability.
CAMELLO. Communicative Agents for “Mind” Exploration of Large Scale Language Model Society.
GPTeam. GPTeam: An open-source multi-agent simulation.
Transformer Agents. In short, it provides a natural language API on top of transformers: we define a set of curated tools and design an agent to interpret natural language and to use these tools.
AgentVerse . A Framework for Multi-LLM Environment Simulation.
AutoAgents. Complex question answering in LLMs with enhanced reasoning and information-seeking capabilities.
GPT Engineer . Specify what you want it to build, the AI asks for clarification, and then builds it.
MetaGPT. The Multi-Agent Framework: Given one line Requirement, return PRD, Design, Tasks, Repo
WorkGPT. A GPT agent framework for invoking APIs.
AutoChain. Build lightweight, extensible, and testable LLM Agents.
Langroid. Harness LLMs with Multi-Agent Programming.
SocraticAI. Problem solving by engaging multiple AI agents in conversation with each other and the user.
WebArena. A Realistic Web Environment for Building Autonomous Agents.
GPT Researcher. GPT based autonomous agent that does online comprehensive research on any given topic.
BMTools. Tool Learning for Big Models, Open-Source Solutions of ChatGPT-Plugins
ToolBench. An open platform for training, serving, and evaluating large language model for tool learning.
AgentGPT. Assemble, configure, and deploy autonomous AI Agents in your browser.
xlang. An open-source framework for building and evaluating language model agents via executable language grounding
Agently. A fast way to build LLM Agent based Application ? A light weight framework helps developers to create amazing LLM based applications.
Lagent. A lightweight framework for building LLM-based agents.
ToolEmu An LLM-based emulation framework for testing and identifying the risks of LLM-based agents
storm A knowledge agent that researches a topic and generates a full-length report with citations.
" Join us in improving this repository! If you know of any important works we've missed, please contribute. Your efforts are highly valued! "