Impresionante agente con alimentación de LLM
Gracias a las impresionantes capacidades de planificación, razonamiento y llamadas de herramientas de modelos de idiomas grandes (LLM), las personas estudian y desarrollan activamente agentes con motor LLM. Estos agentes son posibles para resolver de forma autónoma (y colaborativamente) tareas complejas o simular interacciones humanas.
Nuestro objetivo con este proyecto es construir una colección exhaustiva de recursos increíbles relevantes para los agentes que funcionan con LLM que abarcan documentos, repositorios y más. Nos esforzamos por mantenerlos actualizados regularmente y continuamente. Apreciamos enormemente cualquier contribución a través de PRS, problemas, correos electrónicos u otros métodos.
Tenga en cuenta que este repositorio no está en mantenimiento activo. Contiene principalmente documentos que aparecen antes de octubre de 2023, con varios documentos adicionales. Si desea incluir su trabajo, no dude en iniciar una solicitud de extracción.
- Papeles
- Solucionador de tareas autónomos
- Razonamiento general y planificación y herramienta utilizando
- Cooperación de múltiples agentes
- Marco y código abierto
- Solicitud
- Agentes web
- Agentes RL
- Robótica y ai encarnada
- Juegos y juegos de roles
- Otras aplicaciones
- Confiable
- Simulación de interacción humana
- Interacción de agente humano
- LLMS de agentes
- Punto de referencia
- Encuesta y tutorial
- Proyectos de código abierto
- Proyectos autónomos de solucionadores de tareas
- Proyectos de simulación de múltiples agentes
- Perspectiva
- Otras fuentes relacionadas
- Reconocimiento
Papeles
Para documentos con> 50 citas o repositorios con> 200 estrellas.
Para documentos aceptados por conferencias/revistas de renombre.
Solucionador de tareas autónomos
Razonamiento general y planificación y herramienta utilizando
- [Mayo de 2024] "Entrenamiento fuera de línea de agentes del modelo de idioma con funciones como pesas aprendizables". Shaokun Zhang (PSU) et al. ICML 2024. [Documento] [Código]
- [Mar 2024] "Agente-flan: diseño de datos y métodos de ajuste de agente efectivo para modelos de idiomas grandes". Zehui Chen (USTC) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Dic 2023] "Clova: un asistente visual de circuito cerrado con uso y actualización de herramientas". Zhi Gao (BigAi) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Dic 2023] "Saycanpay: planificación heurística con modelos de idiomas grandes que utilizan el conocimiento de dominio aprendible". Rishi Hazra et al. AAAI 2024 [documento] [Código] [Página del proyecto]
- [Oct 2023] "La búsqueda del árbol de agentes de idiomas unifica el razonamiento de la actuación y la planificación en los modelos de idiomas". Andy Zhou (UIUC) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Oct 2023] "Los modelos de lenguaje grande aún no pueden autocorrigir el razonamiento". Jie Huang (UIUC) et al. ICLR 2024. [Documento]
- [Oct 2023] "Adaptando agentes LLM a través de la comunicación". Kuan Wang (Gatech y Microsoft) et al. arxiv. [papel]
- [Oct 2023] "Toolchain*: Navegación de espacio de acción eficiente en modelos de idiomas grandes con una* búsqueda" Yuchen Zhuang (Gatech & Adobe) et al. ICLR 2024. [Documento]
- [SEP 2023] "Avis: información visual autónoma que busca con modelos de idiomas grandes". Ziniu Hu (Google) et al. Neurips 2023. [Documento]
- [SEP 2023] "Razón para el futuro, ACT por ahora: un marco de principios para agentes autónomos de LLM con eficiencia de muestra comprobable". Zhihan Liu (Northwestern) et al. arxiv. [documento] [Código] [Página del proyecto]
- [SEP 2023] "Inmediada en autodenominación: agentes modelo de lenguaje grande con aprendizaje de habilidades automáticas alineadas en el lenguaje". Shaohui Peng (CAS) et al. arxiv. [papel]
- [Agosto de 2023] "Expel: los agentes de LLM son estudiantes experimentales". Andrew Zhao (Thu) et al. arxiv. [papel]
- [Agosto de 2023] "Integración sinérgica de grandes modelos de idiomas y arquitecturas cognitivas para AI robusta: un análisis exploratorio". Oscar J. Romero (CMU) et al. arxiv. [papel]
- [Agosto de 2023] "Planificación dinámica con un LLM". Gautier Dagan (U de Edimburgo) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Metformer: agentes retrospectivos de lenguaje grande con optimización de gradiente de políticas". Weiran Yao (Salesforce) et al. arxiv. [papel]
- [Mayo 2023] "Rewoo: razonamiento de desacoplamiento de observaciones para modelos de lenguaje aumentado eficientes". Binfeng Xu et al. arxiv. [documento] [código]
- [Mayo 2023] "Swiftsage: un agente generativo con un pensamiento rápido y lento para tareas interactivas complejas". Bill Yuchen Lin (AI2) et al. Neurips 2023. [Documento] [Código] [Página del proyecto]
- [Mayo de 2023] "Adaplanner: planificación adaptativa a partir de comentarios con modelos de idiomas". Haotian Sun (Gatech) et al. Neurips 2023. [Documento] [Código]
- [Mayo de 2022] "El razonamiento con el modelo de idioma es planificar con el modelo mundial". Shibo Hao (UCSD) et al. EMNLP 2023. [Documento] [Código] [Página del proyecto]
- [Mayo de 2023] "Aprovechando modelos de idiomas grandes pre-entrenados para construir y utilizar modelos mundiales para la planificación de tareas basadas en modelos". Lin Guan (ASU) et al. Neurips 2023. [Documento] [Código] [Página del proyecto]
- [Mayo de 2023] "ChatCot: razonamiento de la cadena de pensamiento de la herramienta en los modelos de idiomas grandes basados en chat". Zhipeng Chen (Ruc) et al. EMNLP 2023 Hallazgos. [documento] [código]
- [Mayo de 2023] "Critic: los modelos de idiomas grandes pueden autocorregarse con una crítica interactiva para herramientas". Zhibin Gou (Thu y Microsoft) et al. arxiv. [documento] [código]
- [Abr 2023] "LLM+P: Empoderar modelos de idiomas grandes con competencia de planificación óptima". Bo Liu (Ut Austin) et al. arxiv. [documento] [código]
- [Mar 2023] "Reflexión: agentes lingüísticos con aprendizaje de refuerzo verbal". Noah Shinn (noreste) et al. Neurips 2023. [Documento] [Código]
- [Dic 2022] "No genere, discrimine: una propuesta para modelos de lenguaje de base a entornos del mundo real" Yu Gu (OSU) et al. ACL 2023. [Documento] [Código]
- [Oct 2022] "Reaccionar: sinergizando razonamiento y actuación en modelos de idiomas". Shunyu Yao (Princeton y Google Brain) et al. ICLR 2023. [Paper] [Código] [Página del proyecto]
Cooperación de múltiples agentes
- [Agosto de 2024] "Megaagente: un marco práctico para la cooperación autónoma en los sistemas de agentes LLM a gran escala" Qian Wang (NUS) et al.* Arxiv. [papel]
- [Mayo de 2024] "Conformidad, confabulación e suplantación: inconstancia personal en la colaboración LLM de múltiples agentes". Razan Baltaji (UIUC) et al.* Arxiv. [documento] [código]
- [Abril de 2024] "Comm: colaboración múltiple agente, múltiple y racionalización, solicitando la resolución compleja de problemas". Pei Chen (Tamu) et al.* NAACL 2024. [Documento] [Código]
- [Enero de 2024] "L2MAC: computadora automática de modelo de lenguaje grande para una generación de código extensa". Samuel Holt (Cambridge) et al. ICLR 2024. [Documento] [Código] [Página del proyecto]
- [Oct 2023] "Evaluación de habilidades de coordinación de múltiples agentes en modelos de idiomas grandes". Saaket Agashe (UCSC) et al. arxiv. [papel]
- [Oct 2023] "Network Dynamic LLM-Agent: un marco de colaboración LLM-agente con optimización del equipo de agentes". Zijun Liu (Thu y Stanford) et al. arxiv. [documento] [código]
- [Oct 2023] "Explorando los mecanismos de colaboración para los agentes de LLM: una visión de psicología social". Jintian Zhang (ZJU) et al. arxiv. [documento] [código]
- [OCT 2023] "COREX: empujando los límites del razonamiento complejo a través de la colaboración multimodelo". Qiushi Sun (Shanghai Ai Lab & Nus) et al. arxiv. [documento] [código]
- [SEP 2023] "LLM-Deliberalation: Evaluación de LLM con juegos interactivos de negociación de múltiples agentes". Sahar Abdelnabi (CISPA) et al. arxiv. [documento] [código]
- [Sep 2023] "La colaboración multi-robot escalable con modelos de lenguaje grandes: ¿sistemas centralizados o descentralizados?" Yongchao Chen (MIT y Harvard) et al. arxiv. [documento] [Código] [Página del proyecto]
- [SEP 2023] "Concile: la conferencia de la mesa redonda mejora el razonamiento a través del consenso entre diversos LLM". Justin Chih-Yao Chen (UNC Chapel Hill) et al. arxiv. [documento] [código]
- [SEP 2023] "MindAgent: Interacción de juegos emergentes". Xiaojian MA (BigAi) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Agosto de 2023] "Proagent: construcción de IA cooperativa proactiva con modelos de idiomas grandes". Ceyao Zhang (Cuhk y Pku) et al. arxiv. [Documento] [Página del proyecto]
- [Agosto de 2023] "Agentverse: facilitar la colaboración de múltiples agentes y explorar comportamientos emergentes en los agentes". Weize Chen (Thu) et al. arxiv. [documento] [código]
- [Agosto de 2023] "GPT-in-the-Loop: toma de decisiones adaptativas para sistemas multiagentes". Nathalia Nascimento (U de Waterloo) et al. arxiv. [papel]
- [Agosto de 2023] "¿Qué tan susceptibles son los LLM a las falacias lógicas?" Amirreza Payandeh (GMU y Vail Systems) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Chateval: hacia mejores evaluadores basados en LLM a través del debate de múltiples agentes". Chi-min Chan (Thu) et al. arxiv. [documento] [código]
- [Agosto de 2023] "LLM como DBA". Xuanhe Zhou (Thu) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Gentopia: una plataforma de colaboración para LLM acomodados en herramientas". Binfeng Xu et al. arxiv. [documento] [Código] [Página del proyecto]
- [Agosto de 2023] "Metagpt: meta programación para el marco colaborativo de múltiples agentes". Sirui Hong (Deepwisdom) et al. arxiv. [documento] [código]
- [Jul 2023] "PRD: el rango y la discusión de pares mejoran las evaluaciones basadas en modelos de idiomas grandes". Ruosen Li (Ut Dallas) et al. arxiv. [documento] [Página del proyecto] [Código]
- [Jul 2023] "Desatar la sinergia cognitiva en modelos de idiomas grandes: un agente de resolución de tareas a través de la autocolaboración multipersona". Zhenhailong Wang (UIUC y MSRA) et al. arxiv. [documento] [código]
- [Jul 2023] "Roco: colaboración dialéctica de múltiples robots con modelos de idiomas grandes". Mandi Zhao (Columbia) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jul 2023] "IA generativa inalámbrica de múltiples agentes: de inteligencia conectada a inteligencia colectiva". Hang Zou (Technology Innovation Institute, EAU) et al. arxiv. [papel]
- [Jul 2023] "Construyendo agentes cooperativos incorporados modularmente con modelos de idiomas grandes". Hongxin Zhang (UMass) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jun 2023] "RESTGPT: Conectación de modelos de idiomas grandes con aplicaciones del mundo real a través de API RESTful". Yifan Song (PKU) et al. arxiv. [Documento] [Página del proyecto]
- [Jun 2023] "Colaboración de múltiples agentes: aprovechando el poder de los agentes inteligentes de LLM". Yashar Talebirad (Ualberta) et al. arxiv. [papel]
- [Mayo de 2023] "Fomentar el pensamiento divergente en modelos de idiomas grandes a través del debate de múltiples agentes". Tian Liang (Thu & Tencent) et al. arxiv. [documento] [código]
- [Mayo de 2023] "Modelos de idiomas grandes como creadores de herramientas". Tianle Cai (Deepmind y Princeton) et al. arxiv. [documento] [código]
- [Mayo de 2023] "Mejora de la fáctica y el razonamiento en los modelos de idiomas a través del debate multiagente". Yilun du (MIT) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Mayo de 2023] "Acuerdo y eficiencia estadística en los modelos de percepción bayesiana". Yash Deshpande (MIT) et al. arxiv. [papel]
- [Mayo de 2023] "Mejora de la negociación del modelo de idioma con el aprendizaje de auto-juego y en contexto de la retroalimentación de la IA". Yao Fu (U de Edimburgo) et al. arxiv. [documento] [código]
Marco y código abierto
- [Oct 2023] "OpenAgents: una plataforma abierta para agentes del idioma en la naturaleza". Tianbao Xie (HKU y Xlang Lab) et al. arxiv. [documento] [código]
- [SEP 2023] "Autoagentes: un marco para la generación de agentes automáticos". Guangyao Chen (PKU) et al. arxiv. [documento] [código]
- [SEP 2023] "Agentes: un marco de código abierto para agentes de idiomas autónomos". Wangchunshu Zhou (Ai Waves) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Sep 2023] "Arquitecturas cognitivas para agentes lingüísticos". Theodore Sumers (Princeton) et al. arxiv. [Documento] [Repo]
- [Agosto de 2023] "Autógeno: habilitando aplicaciones LLM de próxima generación a través del marco de conversación de múltiples agentes". Qingyun Wu et al. arxiv. [documento] [Código] [Página del proyecto]
- [Agosto de 2023] "Fastagency: la forma más rápida de llevar flujos de trabajo de múltiples agentes a la producción". Davor Runje et al. [Código] [Página del proyecto]
Solicitud
Agentes web
- [SEP 2023] "Solo miras las pantallas: agentes multimodales de la cadena de acción". Zhuosheng Zhang (SJTU) et al. arxiv. [documento] [código]
- [Sep 2023] "Láser: agente LLM con exploración del espacio de estado para la navegación web". Kaixin MA (Tencent) et al. arxiv. [documento] [código]
- [Jul 2023] "Webarena: un entorno web realista para construir agentes autónomos". Shuyan Zhou (CMU) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jul 2023] "Un webagent del mundo real con la planificación, la comprensión del contexto largo y la síntesis de programas". Izzeddin Gur (DeepMind) et al. arxiv. [papel]
- [Jun 2023] "Mind2Web: hacia un agente generalista para la web". Xiang Deng (OSU) et al. Neurips 2023. [Documento] [Código] [Página del proyecto]
- [Mayo de 2023] "Aumento de agentes autotélicos con modelos de idiomas grandes". Cédric Colas (MIT e Inria) et al. arxiv. [papel]
- [Mayo 2023] "Mobile-env: una plataforma de evaluación y un punto de referencia para agentes interactivos en la era de LLM". Danyang Zhang (SJTU) et al. arxiv. [documento] [código]
- [Abr 2023] "Capacidades de investigación científica autónoma emergente de modelos de idiomas grandes". Daniil A. Boiko (CMU) et al. arxiv. [papel]
- [Mar 2023] "Los modelos de idiomas pueden resolver tareas de computadora". Geunwoo Kim (UCI) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jul 2022] "Webshop: hacia la interacción web escalable del mundo real con agentes de lenguaje fundamentados". Shunyu Yao (Princeton) et al. Neurips 2022. [Documento] [Código] [Página del proyecto]
Agentes RL
- [Mayo de 2024] "Descubrimiento de habilidades de agente". Xufeng Zhao (UHH) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Mayo de 2024] "Explore inteligente de GO: de pie sobre los hombros de los modelos de la Fundación Gigante". Cong Lu (UBC) et al. arxiv. [papel]
- [Nov 2023] "LAFITE-RL:" Acelerando el aprendizaje de refuerzo de las manipulaciones robóticas a través de la retroalimentación de modelos de idiomas grandes " Kun Chu (Uhh) et al. CRL WS @ Corl 2023. [Documento]
- [Oct 2023] "Motivo: motivación intrínseca de la retroalimentación de inteligencia artificial". Martin Klissarov (Mila & Meta & McGill) et al. arxiv. [papel]
- [SEP 2023] "RladaPter: unir modelos de idiomas grandes para el aprendizaje de refuerzo en mundos abiertos". Wanpeng Zhang (PKU) et al. arxiv. [papel]
- [Agosto de 2023] "Lagr-seq: aprendizaje de refuerzo guiado por el idioma con consulta eficiente de muestra". Thommen George Karimpanal (Universidad de Deakin) et al. arxiv. [documento] [código]
- [Jul 2023] "Conformación del diálogo: empoderamiento de los agentes a través de la interacción NPC". Wei Zhou (Gatech) et al. arxiv. [papel]
- [Jul 2023] "Hacia un agente unificado con modelos de cimientos". Norman di Palo (ICL y Deepmind) et al. Reencarnating RL @ ICLR 2023. [Documento]
- [Jun 2023] "El modelo de lenguaje grande es el agente de aprendizaje de refuerzo semi-paramétrico". Danyang Zhang (SJTU) et al. Neurips 2023. [Documento]
- [Mayo de 2023] "La descomposición de la tarea alineada semánticamente en el aprendizaje de refuerzo de múltiples agentes". Wenhao Li (Cuhk) et al. arxiv. [papel]
Robótica y ai encarnada
- [Nov 2024] "Agente laboral: modelos de idiomas grandes para orquestar robots bimanuales" , Kun Chu (UHH) et al. Humanoides 2024. [Documento] [Sitio web], [Código]
- [Jul 2024] "Odyssey: Empoderando a los agentes con habilidades del mundo abierto". Shunyu Liu (Universidad de Zhejiang) et al. arxiv. [documento] [código]
- [Nov 2023] "Leo: un agente generalista encarnado en el mundo 3D". Xiaojian MA (BigAi) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Nov 2023] "Jarvis-1: agentes de tareas múltiples del mundo abierto con modelos de lenguaje multimodal acuático". Zihao Wang (PKU) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Oct 2023] "Hacia la toma de decisiones encarnadas de extremo a extremo a través del modelo de lenguaje grande multimodal: exploraciones con visión GPT4 y más allá". Liang Chen (PKU) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Oct 2023] "Lancar: Apalancamiento del lenguaje para la locomoción del robot con el contexto en entornos no estructurados". Chak Lam Shek (Umd) et al. arxiv. [Documento] [Página del proyecto]
- [SEP 2023] "LLM-Grounder: Vocabulario abierto 3D Visual Congsion con un modelo de lenguaje grande como agente". Jianing Yang (Umich) et al. arxiv. [documento] [Código] [Página del proyecto]
- [SEP 2023] "Smart-LLM: planificación de tareas de robot de múltiples agentes inteligentes utilizando modelos de idiomas grandes". Shyam Sundar Kannan (Purdue) et al. arxiv. [Documento] [Página del proyecto]
- [SEP 2023] "Conecte el chip de seguridad: restricciones de aplicación para agentes robots impulsados por LLM". Ziyi Yang et al. arxiv. [Paper] [Código y video]
- [Sep 2023] "Saynav: base en base a grandes modelos de idiomas para la planificación dinámica a la navegación en nuevos entornos". Abhinav Rajvanshi (SRI International) et al. arxiv. [papel]
- [SEP 2023] "andamios del desarrollo con grandes modelos de idiomas". M. Batuhan Celik (Universidad Bogazici) et al. arxiv. [papel]
- [Jul 2023] "March en el chat: indicación interactiva para la expresión de referencia encarnada remota". Yanyuan Qiao (Universidad de Adelaide) et al. arxiv. [documento] [código]
- [Agosto de 2023] "A^2NAV: ACCIÓN ADACTIVA La navegación de robots cero al explotar la capacidad de visión y lenguaje de los modelos de cimientos". Peihao Chen (Scut) et al. arxiv. [papel]
- [Jul 2023] "Planificación de tareas encarnadas con modelos de idiomas grandes". Zhenyu Wu (BUPT) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jun 2023] "Habilitar interacciones inteligentes entre un agente y un LLM: un enfoque de aprendizaje de refuerzo". Bin Hu (Zhejiang Lab) et al. arxiv. [documento] [código]
- [Mayo 2023] "Ghost in the Minecraft: agentes generalmente capaces para entornos de mundo abierto a través de modelos de lenguaje grandes con conocimiento y memoria basados en texto". Xizhou Zhu (Thu y Sensetim) et al. arxiv. [documento] [código]
- [Mayo de 2023] "Voyager: un agente incorporado abierto con modelos de idiomas grandes". Guanzhi Wang (Nvidia y Caltech) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Mayo de 2023] "Plan, eliminar y rastrear: los modelos de idiomas son buenos maestros para agentes encarnados". Yue Wu (CMU) et al. arxiv. [papel]
- [Febrero de 2023] "Describa, explique, planifique y seleccione: La planificación interactiva con modelos de idiomas grandes permite agentes de tareas múltiples del mundo abierto". Zihao Wang (PKU) et al. Neurips 2023. [Documento] [Código]
- [Febrero de 2023] "Colaborando con modelos de idiomas para el razonamiento incorporado". Ishita dasgupta (Deepmind) et al. Larel @ Neurips 2022. [Documento]
- [Enero de 2023] "Los agentes encarnados sueñan con ovejas pixeladas: toma de decisiones encarnadas utilizando el modelado mundial guiado por el idioma". Kolby Nottingham (UCI) et al. ICML 2023. [Paper] [Código] [Página del proyecto]
- [Dic 2022] "LLM-Planner: Planificación de pocos disparos para agentes encarnados con modelos de idiomas grandes". Chan Hee Song (OSU) et al. ICCV 2023. [Documento] [Página del proyecto]
Juegos y juegos de roles
- [Mayo de 2024] "Timecara: evaluación de la alucinación de personajes de punto en el tiempo de los modelos de idiomas grandes de rol". Jaewoo Ahn (SNU) et al. Hallazgos de ACL 2024. [Paper] [Código] [Página del proyecto]
- [Oct 2023] "De texto a táctica: evaluando LLM jugando el juego de Avalon". Jonathan Light (RPI) et al. arxiv. [documento] [código]
- [Oct 2023] "Ruffle & Riley: Hacia la inducción automatizada de los sistemas de tutoría de conversación". Robin Schmucker (CMU) et al. arxiv. [papel]
- [Oct 2023] "Juego de pensamientos de Avalon: batalla contra el engaño a través de la contemplación recursiva". Shenzhi Wang (Thu) et al. arxiv. [papel]
- [SEP 2023] "MindAgent: Interacción de juegos emergentes". Xiaojian MA (BigAi) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Sep 2023] "Sospecha-agente: jugar juegos de información imperfectos con la teoría de la mente consciente de GPT-4". Jiaxian Guo (U de Tokio) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Aventuras ambientales: enseñanza de chatgpt en el desarrollo de historias complejas". Zexin Chen (Gatech) et al. arxiv. [papel]
- [Jul 2023] "Tachikuma: entendiendo interacciones complejas con objetos multi-caracteres y novedosos por modelos de idiomas grandes". Yuanzhi Liang (UTS) et al. arxiv. [papel]
- [Mayo de 2023] "juego de roles con modelos de idiomas grandes". Murray Shanahan (DeepMind e ICL) et al. arxiv. [papel]
- [Mayo 2023] "Clembench: Uso del juego para evaluar modelos de lenguaje optimizados por chat como agentes de conversación". Kranti Chalamalasetti (Universidad de Potsdam) et al. arxiv. [documento] [código]
- [Abr 2023] "Hacia el sistema autónomo: sistema de producción modular flexible mejorado con grandes agentes de modelos de lenguaje". Yuchen Xia (Universidad de Stuttgart) et al. arxiv. [documento] [código]
- [Marzo de 2023] "Camel: agentes comunicativos para la exploración de" mente "de la sociedad de modelos de idiomas a gran escala". Guohao Li (Kaust) et al. Neurips 2023. [Documento] [Código] [Página del proyecto]
Otras aplicaciones
- [Mayo 2024] "AgentClinic: un punto de referencia de agente multimodal para evaluar la IA en entornos clínicos simulados" Samuel Schmidgall (Jhu y Stanford) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Abr 2024] "Clínicogente: ensayo clínico Sistema de múltiples agentes con razonamiento basado en modelos de lenguaje grande" Ling Yue (RPI) et al. arxiv. [documento] [código]
- [Enero de 2024] "Ehragent: Code empodera modelos de lenguaje grandes para un razonamiento tabular complejo de pocos disparos en registros de salud electrónicos". Wenqi Shi (Gatech) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Oct 2023] "Optimus: modelado de optimización con solucionadores MIP y modelos de lenguaje grandes". Ali Ahmaditeshnizi (Stanford) et al. arxiv. [documento] [código]
- [Oct 2023] "Un modelo evolutivo de rasgos de personalidad relacionados con el comportamiento cooperativo utilizando un modelo de lenguaje grande". Reiji Suzuki (Universidad de Nagoya) et al. arxiv. [papel]
- [Oct 2023] "Modelo de lenguaje grande (LLM) como un sistema de múltiples agentes expertos: un enfoque para resolver el desafío de abstracción y corpus de razonamiento (ARC)". John Chong Min Tan (NUS) et al. arxiv. [papel]
- [Oct 2023] "Un enfoque de agente de lenguaje para la provisión formal del teorema". Amitayush Thakur (UT Austin) et al. arxiv. [papel]
- [Oct 2023] "Agentes de salud conversacionales: un marco de agente personalizado con alimentación de LLM". Mahyar Abbasian (UCI) et al. arxiv. [papel]
- [Oct 2023] "OceanGPT: un modelo de lenguaje grande para las tareas de ciencias del océano". Zhen BI (ZJU y Donghai Lab) et al. arxiv. [Documento] [Página del proyecto]
- [Oct 2023] "Voice2Action: Language Models como agente para una interacción eficiente en tiempo real en la realidad virtual". Yang Su (Cornell Tech). arxiv. [papel]
- [Sep 2023] "Tora: un agente de razonamiento integrado en herramientas para la resolución de problemas matemáticos". Zhibin Gou (Thu y Microsoft) et al. arxiv. [documento] [Código] [Página del proyecto]
- [SEP 2023] "" Enseñe a AI cómo codificar ": el uso de modelos de idiomas grandes como agentes de enseñanza para programar la educación". Hyoungwook Jin (Kaist) et al. arxiv. [papel]
- [Sep 2023] "Surreajriver: Diseño del marco de simulación de agente de conductor generativo en contextos urbanos basados en un modelo de lenguaje grande". Ye Jin (Thu) et al. arxiv. [papel]
- [Sep 2023] "Modelos de idiomas grandes como agentes en la clínica". Nikita Mehandru (UC Berkeley) et al. arxiv. [papel]
- [SEP 2023] "Una arquitectura de la cadena de emoción basada en la evaluación para los agentes del juego de modelos de idiomas afectivos". Croissant Maximiliano (Uoy) et al. arxiv. [papel]
- [SEP 2023] "Desatar el poder del aprendizaje gráfico a través de agentes autónomos basados en LLM". Lanning Wei (CAS y 4Paradigm) et al. arxiv. [papel]
- [Sep 2023] "TradingGPT: sistema de agentes múltiples con memoria en capas y caracteres distintos para un mejor rendimiento del comercio financiero". Yang Li (Sit) et al. arxiv. [papel]
- [Sep 2023] "Modelscope-agent: construyendo su sistema de agentes personalizable con modelos de lenguaje grande de código abierto". Chenliang Li (Alibaba) et al. arxiv. [documento] [código] [demo]
- [Agosto de 2023] "Agente de IA de recomendación: integración de modelos de idiomas grandes para recomendaciones interactivas". Xu Huang (USTC) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Recomendado: agente de motor de lenguaje grande para recomendación". Yancheng Wang (ASU) et al. arxiv. [papel]
- [Agosto de 2023] "LLM alimentó la transferencia SIM a Real para el control de la señal de tráfico". Longchao DA (ASU) et al. arxiv. [papel]
- [Agosto de 2023] "Fuera de la jaula: cómo ganan los loros estocásticos en los entornos de seguridad cibernética". Maria Rigaki (Čvut) et al. arxiv. [documento] [código]
- [Agosto de 2023] "¿Hay algún principio social para los agentes basados en LLM?" Jitao Bai (TJU) et al. arxiv. [papel]
- [Agosto de 2023] "CHATATA: un agente autónomo impulsado por un modelo de lenguaje grande para EDA". Zhuolun He (Cuhk y Shanghai Ai Lab) et al. arxiv. [papel]
- [Agosto de 2023] "La Guía del Hitchhiker para el análisis del programa: un viaje con grandes modelos de idiomas". Haonan Li (UCR) et al. arxiv. [papel]
- [Jun 2023] "Hacia agentes de pruebas autónomas a través de modelos de lenguaje grande conversacional". Robert Feldt (Universidad Tecnológica de Chalmers) et al. arxiv. [papel]
- [Abr 2023] "Genegpt: Aumento de modelos de idiomas grandes con herramientas de dominio para mejorar el acceso a la información biomédica". Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu Arxiv. [documento] [código]
- [Mar 2023] "Hugginggpt: Resolver tareas de AI con ChatGPT y sus amigos en la cara abrazada". Yongliang Shen (ZJU y MSRA) et al. arxiv. [documento] [código]
Confiable
- [Febrero de 2024] "¿Pueden los agentes del modelo de lenguaje grande simular comportamientos de confianza humana?" Chengxing Xie (Kaust) et al. arxiv. [documento] [Código] [Página del proyecto]
- [SEP 2023] "Identificación de los riesgos de los agentes de LM con una caja de arena emulada por LM" Yangjun Ruan (Universidad de Toronto e Instituto Vector) et al. arxiv. [documento] [código] [demostración] [página del proyecto]
- [Agosto de 2023] "Mejora de la confianza en los agentes de automatización de IA basados en LLM: nuevas consideraciones y desafíos futuros". Sivan Schwartz (IBM Research) et al. Automatizar @ ijcai 2023. [Papel]
Simulación de interacción humana
- [Marzo de 2024] "Emergencia de las normas sociales en sociedades de agentes basados en modelos de grandes idiomas". Siyue Ren (NWPU) et al. arxiv. [documento] [código]
- [Enero de 2024] "Modelos abiertos, mentes cerradas? Sobre las capacidades de los agentes para imitar personalidades humanas a través de modelos abiertos de idiomas grandes". Lucio La Cava (Universidad de Calabria) et al. arxiv. [papel]
- [Oct 2023] "Sotopia: evaluación interactiva para la inteligencia social en los agentes del lenguaje" *Xuhui Zhou (CMU) et al. *ICLR [Paper]
- [Oct 2023] "Competeai: Comprender los comportamientos de la competencia en agentes basados en modelos de idiomas grandes". Qinlin Zhao (USTC) et al. arxiv. [papel]
- [Oct 2023] "Simulando las redes sociales utilizando modelos de idiomas grandes para evaluar los algoritmos alternativos de alimentación de noticias". Petter Törnberg (U de Amsterdam) et al. arxiv. [papel]
- [Oct 2023] "Ponga su dinero donde está su boca: Evaluación de la planificación estratégica y la ejecución de los agentes de LLM en un ámbito de la subasta". Jiangjie Chen (FDU y AI2) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Oct 2023] "Agentes de Lyfe: agentes generativos para interacciones sociales en tiempo real de bajo costo". Zhao Kaiya (MIT) et al. arxiv. [papel]
- [SEP 2023] "Identificación de los riesgos de los agentes de LM con una caja de arena emulada por LM" Yangjun Ruan (Universidad de Toronto e Instituto Vector) et al. arxiv. [documento] [código] [demostración] [página del proyecto]
- [SEP 2023] "Modelado generativo basado en agentes: presentación de dinámica del sistema social a través de modelos mecanicistas de acoplamiento con inteligencia artificial generativa". Navid Ghaffarzadegan (Virginia Tech) et al. arxiv. [papel]
- [Agosto de 2023] "CGMI: Marco de interacción general configurable de múltiples agentes". Jinxin Shi (ECNU) et al. arxiv. [papel]
- [Agosto de 2023] "Explorando la intersección de modelos de idiomas grandes y modelado basado en agentes a través de ingeniería rápida". Edward Junprung (UC Berkeley) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Agentsims: una caja de arena de código abierto para la evaluación del modelo de idioma grande". Jiaju Lin (PTA Studio y PSU) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Jul 2023] "S^3: Sistema de simulación de red social con grandes agentes empoderados con el modelo de lenguaje". Chen Gao (Thu) et al. arxiv. [papel]
- [Jul 2023] "¿Estás en una mascarada? Explorando el comportamiento y el impacto de los bots sociales impulsados por el modelo de lenguaje en las redes sociales en línea". Siyu Li (SCU) et al. arxiv. [Documento] [conjunto de datos]
- [Jul 2023] "Agentes comunicativos para el desarrollo de software". Chen Qian (Thu) et al. arxiv. [papel]
- [Jul 2023] "Modelado epidémico con agentes generativos". Ross Williams (Virginia Tech) et al. arxiv. [documento] [código]
- [Jul 2023] "A Infinity and Beyond: Show-1 y Showrunner Agentes en simulaciones de múltiples agentes". Philipp Maas (Fable Studio) et al. preimpresión. [Documento] [Página del proyecto]
- [Jun 2023] "Recagente: un nuevo paradigma de simulación para sistemas de recomendación". Lei Wang (Ruc) et al. arxiv. [documento] [código]
- [Mayo de 2023] "Jugando juegos repetidos con modelos de idiomas grandes". Elif akata (U de Tübingen) et al. arxiv. [papel]
- [Mayo de 2023] "El papel de la resumen en los agentes generativos: una perspectiva preliminar". Feng Xiachong (Hit) et al. arxiv. [papel]
- [Abril de 2023] "Chat múltiple: agentes de conversación en entornos grupales con humanos y modelos". Jimmy Wei (Cornell & Meta) et al. arxiv. [Paper] [DataSet] [código]
- [Abr 2023] "Agentes generativos: simulacros interactivos del comportamiento humano". Joon Sung Park (Stanford) et al. arxiv. [documento] [código]
Interacción de agente humano
- [Oct 2023] "Cómo el procesamiento de IA retrasa la creatividad: explorar la co-creación de preguntas de investigación con un agente basado en LLM". Yiren Liu (UIUC) et al. arxiv. [papel]
- [Agosto de 2023] "Cuantificar el impacto de los modelos de lenguaje grandes en la dinámica de la opinión colectiva". Chao Li (ZJU) et al. arxiv. [papel]
- [Agosto de 2023] "Sapien: agentes virtuales afectivos alimentados por modelos de idiomas grandes". Masum Hasan (U de Rochester) et al. arxiv. [papel]
- [Jul 2023] "Comprender los beneficios y desafíos del uso de agentes conversacionales basados en modelos de lenguaje para el apoyo de bienestar mental". Zilin MA (Harvard) et al. arxiv. [papel]
LLMS de agentes
- [Oct 2023] "El agente instruye a los modelos de idiomas grandes que sean razonadores generales de disparo cero". Nicholas Crispino (Washu) et al. arxiv. [documento] [código]
- [Oct 2023] "ßcoder: aprendizaje de refuerzo profundo basado en el valor para la síntesis del programa". Zishun Yu (UIC & Bytedance) et al. arxiv. [papel]
- [Mayo de 2023] "Capacitación de modelos de idiomas socialmente alineados en la sociedad humana simulada". Ruibo Liu (Dartmouth) et al. arxiv. [documento] [código]
- [Mayo 2023] "Los modelos de idiomas se encuentran con modelos mundiales: las experiencias encarnadas mejoran los modelos de idiomas". Jiannan Xiang (UCSD) et al. Neurips 2023. [Documento] [Código]
Punto de referencia
- [Jul 2024] "AppWorld: un mundo controlable de aplicaciones y personas para los agentes de codificación interactivos de la evaluación comparativa". Harsh Trivedi (Universidad Stony Brook) et al. ACL 2024. [Documento] [Código] [Página del proyecto]
- [Dic 2023] "T-Eval: Evaluación de la capacidad de utilización de la herramienta de modelos de idiomas grandes paso a paso". Zehui Chen (USTC, Shanghai Ai Lab) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Nov 2023] "Magia: Investigación del modelo de lenguaje grande impulsado por múltiples agentes en cognición, adaptabilidad, racionalidad y colaboración". * Lin Xu et al. (NUS, Bytedance, Stanford y UC Berkeley) * Arxiv. [Documento] [Página del proyecto]
- [Oct 2023] "Equilibrando la autonomía y la alineación: una taxonomía multidimensional para arquitecturas de múltiples agentes con alimentación de LLM". Thorsten Händler (Fernfh) et al. arxiv. [papel]
- [Oct 2023] "Benchmarking Language Models como agentes de investigación de IA". Qian Huang (Stanford) et al. arxiv. [documento] [código]
- [Oct 2023] "Metatool Benchmark para modelos de idiomas grandes: decidir si usar herramientas y cuáles usar". Yue Huang (Universidad de Lehigh) et al. arxiv. [Documento] [conjunto de datos]
- [Oct 2023] "SmartPlay: un punto de referencia para LLM como agentes inteligentes". Yue Wu (CMU y Microsoft) et al. arxiv. [documento] [código]
- [SEP 2023] "Identificación de los riesgos de los agentes de LM con una caja de arena emulada por LM" Yangjun Ruan (Universidad de Toronto e Instituto Vector) et al. arxiv. [documento] [código] [demostración] [página del proyecto]
- [Agosto de 2023] "Bolaa: benchmarking y orquestando agentes autónomos acuáticos de LLM". Zhiwei Liu (Salesforce) et al. arxiv. [documento] [código]
- [Agosto de 2023] "Agentbench: Evaluación de LLM como agentes". Xiao Liu (Thu) et al. arxiv. [documento] [Código] [Página del proyecto]
- [Agosto de 2023] "TPTU: planificación de tareas y uso de herramientas de agentes de IA basados en modelos de idiomas grandes". Jingqing Ruan (Sensretime) et al. arxiv. [papel]
- [Junio de 2023] "Toolqa: un conjunto de datos para la respuesta de las preguntas de LLM con herramientas externas". Yuchen Zhuang (Gatech) et al. Neurips 2023. [Documento] [Código]
Encuesta y tutorial
- [SEP 2023] "Modelado y razonamiento de contexto basado en el lenguaje natural con LLM: un tutorial". Haoyi Xiong (Baidu) et al. arxiv. [papel]
- [SEP 2023] "Una encuesta en profundidad de agentes de inteligencia artificial basados en modelos de idiomas grandes". Pengyu Zhao (BJTU) et al. arxiv. [papel]
- [SEP 2023] "El aumento y el potencial de los agentes basados en modelos de idiomas grandes: una encuesta". Zhiheng Xi (FDU) et al. arxiv. [Documento] [Github]
- [Agosto de 2023] "Una encuesta sobre agentes autónomos basados en modelos de idiomas grandes". Lei Wang (Ruc) et al. arxiv. [Documento] [Github]
- [Mar 2023] "Una encuesta de modelos de idiomas grandes (Sec. 6.3 - Planificación para la resolución de tareas complejas)". Wayne Xin Zhao (Ruc) et al. arxiv. [Documento] [Github]
Proyectos de código abierto
Proyectos autónomos de solucionadores de tareas
- Auto-GPT: un intento experimental de código abierto para que GPT-4 sea completamente autónomo.
- ? ️? Langchain: aplicaciones de construcción con LLM a través de la composibilidad.
- GPT Engineer: especifique lo que desea que construya, la IA solicita aclaraciones y luego lo construye.
- Metagpt -? El marco de múltiples agentes: dado un requisito de línea, retorno PRD, diseño, tareas, repositorio.
- Babyagi: un sistema de gestión de tareas con IA.
- L2MAC - El marco de computadora automático de LLM: L2MAC
- Yacana - ?? Powering OpenSource LLMS con chats de múltiples agentes y flujos de trabajo de bulliting.
Proyectos de simulación de múltiples agentes
- Ai Town ?? - Un kit de inicio desplegable para construir y personalizar su propia versión de Ai Town - una ciudad virtual donde los personajes de IA viven, chatan y socializan.
- GPTEAM: una simulación de agente múltiple de código abierto.
- ? Chatarena: entornos de juego de idiomas de múltiples agentes para LLM.
- ? Agentverse? - Un marco flexible que simplifica el proceso de construcción de entornos personalizados de múltiples agentes para modelos de idiomas grandes (LLM).
Perspectiva
- Agentes del lenguaje: un paso evolutivo crítico de la inteligencia artificial - Yu Su (OSU), 5 de septiembre de 2023.
- Introducción de Xlang: un marco de código abierto para construir agentes de modelos de idiomas a través de la puesta en marcha del lenguaje ejecutable - Xlang Lab, 9 de agosto de 2023.
- ¿Qué son los agentes GPT? A deep dive into the AI interface of the future - Learn why Agents are a core part of the future of AI, Logan Kilpatrick (OpenAI), Jul 25, 2023.
- Language Agents in the Digital World: Opportunities and Risks - Shunyu Yao (Princeton) et al., Jul 24, 2023.
- KokoMind: Can LLMs Understand Social Interactions? - Imagine an AI ? at a cocktail party ?, Weiyan Shi (Columbia) et al., Jul, 2023
- LLM Powered Autonomous Agents - Amazing blog by Lilian Weng (OpenAI), Jun 23, 2023.
Other Related Sources
- Personalized Generative AI @ CIKM'23
- LLM-Agents-Papers - A repo lists papers about LLM role playing, memory mechanism and LLM game playing.
- LLMAgentPapers - Must-read papers on multiagents of LLMs.
- awesome-llm-agents - A curated list of awesome LLM agents.
Reconocimiento
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).