A incrível agente movido a LLM
Graças aos impressionantes recursos de planejamento, raciocínio e chamadas de ferramentas de grandes modelos de idiomas (LLMs), as pessoas estão estudando e desenvolvendo ativamente agentes movidos a LLM. Esses agentes são possíveis de resolver autonomamente (e colaborativamente) tarefas complexas ou simular interações humanas.
Nosso objetivo com este projeto é criar uma coleção exaustiva de recursos impressionantes relevantes para agentes movidos a LLM, abrangendo papéis, repositórios e muito mais. Nós nos esforçamos para manter esses atualizados regularmente e continuamente. Agradecemos muito quaisquer contribuições via PRS, questões, e -mails ou outros métodos.
Observe que este repositório não está sob manutenção ativa. Ele contém principalmente documentos que aparecem antes de outubro de 2023, com vários artigos adicionais. Se você deseja incluir seu trabalho, sinta -se à vontade para iniciar uma solicitação de tração.
- Papéis
- Solucionador de tarefas autônomo
- Raciocínio e Planejamento Geral usando
- Cooperação multi-agente
- Framework e código aberto
- Aplicativo
- Agentes da Web
- Agentes RL
- Robótica e IA incorporada
- Jogos e interpretações
- Outras aplicações
- Confiável
- Simulação de interação humana
- Interação humano-agente
- LLMs movidos a agentes
- Benchmark
- Pesquisa e tutorial
- Projetos de código aberto
- Projetos autônomos de solucionador de tarefas
- Projetos de simulação multi-agente
- Perspectivas
- Outras fontes relacionadas
- Reconhecimento
Papéis
Para trabalhos com> 50 citações ou repositórios com> 200 estrelas.
Para artigos aceitos por conferências/periódicos de renome.
Solucionador de tarefas autônomo
Raciocínio e Planejamento Geral usando
- [Maio de 2024] "Treinamento offline de agentes de modelos de idiomas com funções como pesos aprendidos". Shaokun Zhang (PSU) et al. ICML 2024. [Paper] [Código]
- [Março de 2024] "Flan agente: projetando dados e métodos de ajuste eficaz de agentes para grandes modelos de idiomas". Zehui Chen (USTC) et al. arxiv. [Paper] [Código] [página do projeto]
- [Dezembro de 2023] "Clova: um assistente visual de circuito fechado com uso e atualização de ferramentas". Zhi Gao (Bigai) et al. arxiv. [Paper] [Código] [página do projeto]
- [Dezembro de 2023] "SayCanpay: planejamento heurístico com grandes modelos de idiomas usando conhecimento de domínio aprendida". Rishi Hazra et al. AAAI 2024 [Paper] [Código] [Página do projeto]
- [Outubro de 2023] "Pesquisa de árvore do agente do idioma unifica o raciocínio de atuação e planejamento em modelos de idiomas". Andy Zhou (Uiuc) et al. arxiv. [Paper] [Código] [página do projeto]
- [Outubro de 2023] "Os grandes modelos de idiomas ainda não conseguem se auto-corrigir o raciocínio". Jie Huang (Uiuc) et al. ICLR 2024. [Papel]
- [Outubro de 2023] "Adapting LLM Agents através da comunicação". Kuan Wang (Gatech & Microsoft) et al. arxiv. [papel]
- [Outubro de 2023] "Toolchain*: navegação eficiente no espaço de ação em grandes modelos de idiomas com uma* pesquisa" Yuchen Zhuang (Gatech & Adobe) et al. ICLR 2024. [Papel]
- [Setembro de 2023] "Avis: busca de informações visuais autônomas com grandes modelos de idiomas". Ziniu Hu (Google) et al. Neurips 2023. [Papel]
- [Setembro de 2023] "Razão para o futuro, aja por enquanto: uma estrutura de princípios para agentes autônomos LLM com eficiência de amostra provável". Zhihan Liu (noroeste) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "aterramento auto-orientado: grandes agentes de modelos de idiomas com aprendizado automático de habilidades alinhadas à linguagem". Shaohui Peng (Cas) et al. arxiv. [papel]
- [Agosto de 2023] "Expel: os agentes da LLM são alunos experienciais". Andrew Zhao (Thu) et al. arxiv. [papel]
- [Agosto de 2023] "Integração sinérgica de grandes modelos de linguagem e arquiteturas cognitivas para a IA robusta: uma análise exploratória". Oscar J. Romero (CMU) et al. arxiv. [papel]
- [Agosto de 2023] "Planejamento dinâmico com um LLM". Gautier Dagan (U de Edimburgo) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Retroformador: agentes de grandes idiomas retrospectivos com otimização de gradientes de políticas". Weiran Yao (Salesforce) et al. arxiv. [papel]
- [Maio de 2023] "Rewoo: desacoplando o raciocínio de observações para modelos de idiomas eficientes aumentados". Binfeng Xu et al. arxiv. [papel] [Código]
- [Maio de 2023] "SwiftSage: um agente generativo com pensamento rápido e lento para tarefas interativas complexas". Bill Yuchen Lin (AI2) et al. Neurips 2023. [Paper] [Código] [Página do projeto]
- [Maio de 2023] "Adaplanner: planejamento adaptativo do feedback com modelos de idiomas". Haotian Sun (Gatech) et al. Neurips 2023. [Paper] [Código]
- [Maio de 2022] "O raciocínio com o modelo de idioma está planejando com o Modelo Mundial". Shibo Hao (UCSD) et al. EMNLP 2023. [Paper] [Código] [página do projeto]
- [Maio de 2023] "Aproveitando modelos de grandes idiomas pré-treinados para construir e utilizar modelos mundiais para o planejamento de tarefas baseados em modelos". Lin Guan (ASU) et al. Neurips 2023. [Paper] [Código] [Página do projeto]
- [Maio de 2023] "Chatcot: raciocínio da cadeia de pensamento agente para ferramentas em modelos de grandes idiomas baseados em bate-papo". Zhipeng Chen (Ruc) et al. Descobertas do EMNLP 2023. [papel] [Código]
- [Maio de 2023] "Crítico: grandes modelos de idiomas podem se auto-corrigir com a crítica interativa da ferramenta". Zhibin Gou (Thu & Microsoft) et al. arxiv. [papel] [Código]
- [Abril de 2023] "LLM+P: capacitando grandes modelos de idiomas com proficiência de planejamento ideal". Bo Liu (Ut Austin) et al. arxiv. [papel] [Código]
- [Março de 2023] "Reflexão: agentes do idioma com aprendizado de reforço verbal". Noah Shinn (nordeste) et al. Neurips 2023. [Paper] [Código]
- [Dezembro de 2022] "Não gere, discrimine: uma proposta para modelos de linguagem de aterramento para ambientes do mundo real" Yu Gu (OSU) et al. ACL 2023. [Paper] [Código]
- [Outubro de 2022] "React: sinergizando o raciocínio e atuação em modelos de idiomas". Shunyu Yao (Princeton e Google Brain) et al. ICLR 2023. [Paper] [Código] [Página do projeto]
Cooperação multi-agente
- [Agosto de 2024] "Megaagent: uma estrutura prática para a cooperação autônoma em sistemas de agentes LLM em larga escala" Qian Wang (NUS) et al.* Arxiv. [papel]
- [Maio de 2024] "Conformidade, confabulação e representação: inconstância persona na colaboração de Multi-Agent LLM". Razan Baltaji (UIUC) et al.* Arxiv. [papel] [Código]
- [Abril de 2024] "Comm: colaborativo multi-agente e multi-raciocométrica, solicitando uma solução complexa de resolução de problemas". Pei Chen (Tamu) et al.* NAACL 2024. [Paper] [Código]
- [Janeiro de 2024] "L2MAC: Modelo de idioma grande Computador automático para uma extensa geração de código". Samuel Holt (Cambridge) et al. ICLR 2024. [Paper] [Código] [Página do projeto]
- [Outubro de 2023] "Avaliando habilidades de coordenação multi-agente em grandes modelos de idiomas". Saaket Agashe (UCSC) et al. arxiv. [papel]
- [Outubro de 2023] "Rede Dynamic LLM-Agent: uma estrutura de colaboração de agente LLM com otimização da equipe de agentes". Zijun Liu (Thu & Stanford) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Explorando mecanismos de colaboração para agentes LLM: uma visão de psicologia social". Jintian Zhang (Zju) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Corex: empurrando os limites do raciocínio complexo por meio da colaboração multimodelo". Qiushi Sun (Shanghai Ai Lab & nus) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Deliberância por LLM: Avaliando LLMs com jogos interativos de negociação multi-agente". Sahar Abdelnabi (Cispa) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Colaboração multi-robô escalável com grandes modelos de idiomas: sistemas centralizados ou descentralizados?" Yongchao Chen (MIT e Harvard) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "Reconcílio: a conferência redonda melhora o raciocínio via consenso entre diversos LLMs". Justin Chih-Yao Chen (Unc Chapel Hill) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Mindagent: interação emergente de jogos". Xiaojian Ma (Bigai) et al. arxiv. [Paper] [Código] [página do projeto]
- [Agosto de 2023] "ProAgent: construindo IA cooperativa proativa com grandes modelos de idiomas". Ceyao Zhang (Cuhk & Pku) et al. arxiv. [Papel] [Página do projeto]
- [Agosto de 2023] "Agentverse: facilitando a colaboração multi-agente e explorando comportamentos emergentes em agentes". Weize Chen (Thu) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Gpt-in-the-loop: tomada de decisão adaptativa para sistemas multiagentes". Nathalia Nascimento (U de Waterloo) et al. arxiv. [papel]
- [Agosto de 2023] "Quão suscetíveis são LLMs para falácias lógicas?" Amirreza Payandeh (GMU & Vail Systems) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Chateval: para melhores avaliadores baseados em LLM através de um debate multi-agente". Chi-min Chan (Thu) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "LLM como DBA". Xuanhe Zhou (Thu) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Gentopia: uma plataforma colaborativa para o LLMS com ferramentas agentadas". Binfeng Xu et al. arxiv. [Paper] [Código] [página do projeto]
- [Agosto de 2023] "Metagpt: meta-programação para estrutura colaborativa multi-agente". Sirui Hong (Deepwisdom) et al. arxiv. [papel] [Código]
- [Jul 2023] "PRD: classificação e discussão dos pares melhoram as grandes avaliações baseadas em modelos de linguagem". Ruosen Li (Ut Dallas) et al. arxiv. [Paper] [Página do projeto] [Código]
- [JUL 2023] "Liberando a sinergia cognitiva em grandes modelos de idiomas: um agente de solução de tarefas através da auto-colaboração de várias pessoas". Zhenhailong Wang (UIUC e MSRA) et al. arxiv. [papel] [Código]
- [JUL 2023] "ROCO: colaboração dialética de vários robôs com grandes modelos de idiomas". Mandi Zhao (Columbia) et al. arxiv. [Paper] [Código] [página do projeto]
- [Jul 2023] "IA generativa multi-agente sem fio: da inteligência conectada à inteligência coletiva". Hang Zou (Instituto de Inovação em Tecnologia, Emirados Árabes Unidos) et al. arxiv. [papel]
- [Jul 2023] "Construindo agentes incorporados cooperativos modularmente com grandes modelos de linguagem". Hongxin Zhang (Umass) et al. arxiv. [Paper] [Código] [página do projeto]
- [Jun 2023] "RestGPT: conectando grandes modelos de idiomas com aplicativos do mundo real por meio de APIs RESTful". Yifan Song (PKU) et al. arxiv. [Papel] [Página do projeto]
- [Jun 2023] "Colaboração multi-agente: aproveitando o poder dos agentes inteligentes da LLM". Yashar Talebirad (Ualberta) et al. arxiv. [papel]
- [Maio de 2023] "Incentivar o pensamento divergente em grandes modelos de idiomas por meio de debate multi-agente". Tian Liang (Thu & Tencent) et al. arxiv. [papel] [Código]
- [Maio de 2023] "grandes modelos de linguagem como fabricantes de ferramentas". Tianle Cai (Deepmind & Princeton) et al. arxiv. [papel] [Código]
- [Maio de 2023] "Melhorando a factualidade e o raciocínio em modelos de idiomas através do debate multiagente". Yilun Du (MIT) et al. arxiv. [Paper] [Código] [página do projeto]
- [Maio de 2023] "Acordo e eficiência estatística nos modelos de percepção bayesiana". Yash Deshpande (MIT) et al. arxiv. [papel]
- [Maio de 2023] "Melhorando a negociação do modelo de idioma com a auto-reprodução e o aprendizado no contexto com o feedback da IA". Yao Fu (U de Edimburgo) et al. arxiv. [papel] [Código]
Framework e código aberto
- [Outubro de 2023] "Openagents: uma plataforma aberta para agentes de idiomas na natureza". Tianbao Xie (HKU & Xlang Lab) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Autoagentes: uma estrutura para geração automática de agentes". Guangyao Chen (PKU) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Agentes: uma estrutura de código aberto para agentes de idiomas autônomos". Wangchunshu Zhou (ondas AI) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "Arquiteturas cognitivas para agentes de idiomas". Theodore Sumers (Princeton) et al. arxiv. [Papel] [Repo]
- [Agosto de 2023] "Autogen: Ativando aplicativos LLM de próxima geração por meio da estrutura de conversação multi-agente". Qingyun Wu et al. arxiv. [Paper] [Código] [página do projeto]
- [Agosto de 2023] "Fastagência: a maneira mais rápida de levar fluxos de trabalho com vários agentes à produção". Davor Runje et al. [Código] [Página do projeto]
Aplicativo
Agentes da Web
- [Setembro de 2023] "Você só olha para as telas: agentes multimodais de cadeia de ação". Zhuosheng Zhang (SJTU) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Laser: agente LLM com exploração de espaço de estado para navegação na web". Kaixin MA (Tencent) et al. arxiv. [papel] [Código]
- [Jul 2023] "Webarena: um ambiente realista da Web para a construção de agentes autônomos". Shuyan Zhou (CMU) et al. arxiv. [Paper] [Código] [página do projeto]
- [Jul 2023] "Um webagent do mundo real com planejamento, compreensão de longo contexto e síntese de programas". Izzeddin Gur (Deepmind) et al. arxiv. [papel]
- [Jun 2023] "Mind2Web: em direção a um agente generalista da Web". Xiang Deng (OSU) et al. Neurips 2023. [Paper] [Código] [Página do projeto]
- [Maio de 2023] "Aumentando agentes autotélicos com grandes modelos de idiomas". Cédric Colas (MIT & INRIA) et al. arxiv. [papel]
- [Maio de 2023] "Mobile-ENV: uma plataforma de avaliação e referência para agentes interativos na era LLM". Danyang Zhang (Sjtu) et al. arxiv. [papel] [Código]
- [Abril de 2023] "Capacidades de pesquisa científica autônoma emergentes de grandes modelos de idiomas". Daniil A. Boiko (CMU) et al. arxiv. [papel]
- [Março de 2023] "Modelos de idiomas podem resolver tarefas de computador". Geunwoo Kim (UCI) et al. arxiv. [Paper] [Código] [página do projeto]
- [JUL 2022] "WebShop: em direção à interação escalável da Web do mundo real com agentes de idiomas fundamentados". Shunyu Yao (Princeton) et al. Neurips 2022. [Paper] [Código] [Página do projeto]
Agentes RL
- [Maio de 2024] "Descoberta de habilidades agênticas". Xufeng Zhao (UHH) et al. arxiv. [Paper] [Código] [página do projeto]
- [Maio de 2024] "Explore inteligente: de pé nos ombros de modelos gigantes da fundação". Cong Lu (UBC) et al. arxiv. [papel]
- [Nov 2023] "Lafite-RL:" Acelerando o aprendizado de reforço de manipulações robóticas por meio de feedback de grandes modelos de idiomas " Kun Chu (UHH) et al. Crl WS @ corl 2023. [Papel]
- [Outubro de 2023] "Motif: Motivação intrínseca do feedback da inteligência artificial". Martin Klissarov (Mila & Meta & McGill) et al. arxiv. [papel]
- [Setembro de 2023] "Rladapter: preenchendo grandes modelos de idiomas para reforçar o aprendizado em mundos abertos". Wanpeng Zhang (PKU) et al. arxiv. [papel]
- [Agosto de 2023] "Lagr-seq: aprendizado de reforço guiado por idiomas com consulta com eficiência de amostra". Thommen George Karimpanal (Universidade Deakin) et al. arxiv. [papel] [Código]
- [JUL 2023] "Shapeamento de diálogo: agentes capacitados por meio da interação NPC". Wei Zhou (Gatech) et al. arxiv. [papel]
- [Jul 2023] "em direção a um agente unificado com modelos de fundação". Norman di Palo (ICL e Deepmind) et al. Reencarnando RL @ ICLR 2023. [Papel]
- [Jun 2023] "O modelo de grande idioma é o agente de aprendizado de reforço semi-paramétrico". Danyang Zhang (Sjtu) et al. Neurips 2023. [Papel]
- [Maio de 2023] "Decomposição de tarefas semanticamente alinhada no aprendizado de reforço de vários agentes". Wenhao Li (Cuhk) et al. arxiv. [papel]
Robótica e IA incorporada
- [Nov 2024] "Agente de trabalho: grandes modelos de idiomas para orquestrar robôs bimanuais" , Kun Chu (UHH) et al. Humanoids 2024. [Paper] [Site], [Código]
- [JUL 2024] "ODYSSEY: agentes capacitadores com habilidades de mundo aberto". Shunyu Liu (Universidade de Zhejiang) et al. arxiv. [papel] [Código]
- [Novembro de 2023] "Leo: um agente generalista incorporado no mundo 3D". Xiaojian Ma (Bigai) et al. arxiv. [Paper] [Código] [página do projeto]
- [Novembro de 2023] "Jarvis-1: agentes de várias tarefas do mundo aberto com modelos de linguagem multimodal com memória". Zihao Wang (PKU) et al. arxiv. [Paper] [Código] [página do projeto]
- [Outubro de 2023] "Para a tomada de decisão incorporada de ponta a ponta por meio de um modelo de linguagem grande multimodal: explorações com a visão GPT4 e além". Liang Chen (PKU) et al. arxiv. [Paper] [Código] [página do projeto]
- [Outubro de 2023] "Lancar: alavancando a linguagem para locomoção robô com reconhecimento de contexto em ambientes não estruturados". Chak Lam Shek (Umd) et al. arxiv. [Papel] [Página do projeto]
- [Setembro de 2023] "LLM-SCROMER: Aterramento visual 3D de vocabulário aberto com um grande modelo de linguagem como agente". Jianing Yang (Umich) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "Smart-llm: planejamento de tarefas de robôs com vários agentes inteligentes usando grandes modelos de idiomas". Shyam Sundar Kannan (Purdue) et al. arxiv. [Papel] [Página do projeto]
- [Setembro de 2023] "Conecte o chip de segurança: aplicar restrições para agentes de robôs orientados por LLM". Ziyi Yang et al. arxiv. [Papel] [Código e vídeo]
- [Setembro de 2023] "Saynav: fundição de grandes modelos de idiomas para planejamento dinâmico para a navegação em novos ambientes". Abhinav Rajvanshi (SRI International) et al. arxiv. [papel]
- [Setembro de 2023] "Andaimes de desenvolvimento com grandes modelos de idiomas". M. Batuhan Celik (Universidade de Bogazici) et al. arxiv. [papel]
- [Jul 2023] "Março no bate -papo: solicitação interativa para a expressão de referência incorporada remota". Yanyuan Qiao (Universidade de Adelaide) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "A^2NAV: Navegação de robôs zero tiro com reconhecimento de ação, explorando a capacidade de visão e linguagem dos modelos de fundação". Peihao Chen (Scut) et al. arxiv. [papel]
- [Jul 2023] "Planejamento de tarefas incorporado com grandes modelos de idiomas". Zhenyu Wu (Bupt) et al. arxiv. [Paper] [Código] [página do projeto]
- [JUN 2023] "Ativando interações inteligentes entre um agente e um LLM: uma abordagem de aprendizado de reforço". Bin Hu (Zhejiang Lab) et al. arxiv. [papel] [Código]
- [Maio de 2023] "Fantasma no Minecraft: agentes geralmente capazes de ambientes de mundo aberto por meio de grandes modelos de linguagem com conhecimento e memória baseados em texto". Xizhou Zhu (Thu & Sensetim) et al. arxiv. [papel] [Código]
- [Maio de 2023] "Voyager: um agente incorporado aberto com grandes modelos de idiomas". Guanzhi Wang (Nvidia & Caltech) et al. arxiv. [Paper] [Código] [página do projeto]
- [Maio de 2023] "Planeje, eliminar e acompanhar - modelos de idiomas são bons professores para agentes incorporados". Yue Wu (CMU) et al. arxiv. [papel]
- [Fev 2023] "Descreva, explique, planeje e selecione: Planejamento interativo com grandes modelos de idiomas permite agentes de várias tarefas do mundo aberto". Zihao Wang (PKU) et al. Neurips 2023. [Paper] [Código]
- [Fevereiro de 2023] "Colaborando com modelos de idiomas para o raciocínio incorporado". Ishita Dasgupta (Deepmind) et al. Larel @ Neurips 2022. [Papel]
- [Jan 2023] "Os agentes incorporados sonham com ovelhas pixeladas: tomada de decisão incorporada usando modelagem mundial guiada por idiomas". Kolby Nottingham (UCI) et al. ICML 2023. [Paper] [Código] [Página do projeto]
- [Dezembro de 2022] "LLM-Planner: Planejamento fundamentado de poucos tiros para agentes incorporados com grandes modelos de idiomas". Chan Hee Song (OSU) et al. ICCV 2023. [Paper] [Página do projeto]
Jogos e interpretações
- [Maio de 2024] "Timechara: avaliando a alucinação de personagens pontuais de grandes modelos de idiomas". Jaewoo Ahn (Snu) et al. Achados da ACL 2024. [Paper] [Código] [Página do projeto]
- [Outubro de 2023] "Do texto à tática: avaliando os LLMs jogando o jogo de Avalon". Jonathan Light (RPI) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Ruffle & Riley: em direção à indução automatizada de sistemas de tutoria de conversação". Robin Schmucker (CMU) et al. arxiv. [papel]
- [Outubro de 2023] "O jogo de pensamentos de Avalon: luta contra o engano através da contemplação recursiva". Shenzhi Wang (Thu) et al. arxiv. [papel]
- [Setembro de 2023] "Mindagent: interação emergente de jogos". Xiaojian Ma (Bigai) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "Suspeita-agente: jogando jogos de informação imperfeita com a teoria do Mind Sconom GPT-4". Jiaxian Guo (U de Tóquio) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Aventuras ambientais: ensinando chatgpt no desenvolvimento de histórias complexas". Zexin Chen (Gatech) et al. arxiv. [papel]
- [Jul 2023] "Tachikuma: interações complexas do subestimamento com objetos multi-caracteres e novos por grandes modelos de linguagem". Yuanzhi Liang (UTS) et al. arxiv. [papel]
- [Maio de 2023] "Role-play com grandes modelos de idiomas". Murray Shanahan (Deepmind & ICL) et al. arxiv. [papel]
- [Maio de 2023] "Clembench: Usando o jogo para avaliar os modelos de idiomas otimizados em bate-papo como agentes de conversação". Kranti Chalamalasetti (Universidade de Potsdam) et al. arxiv. [papel] [Código]
- [Abril de 2023] "Rumo ao sistema autônomo: sistema de produção modular flexível aprimorado com grandes agentes de modelos de idiomas". Yuchen Xia (Universidade de Stuttgart) et al. arxiv. [papel] [Código]
- [Março de 2023] "Camel: agentes comunicativos para a exploração" mente "da sociedade de modelos de linguagem em larga escala". Guohao Li (Kaust) et al. Neurips 2023. [Paper] [Código] [Página do projeto]
Outras aplicações
- [Maio de 2024] "AgentClinic: uma referência de agente multimodal para avaliar a IA em ambientes clínicos simulados" Samuel Schmidgall (Jhu & Stanford) et al. arxiv. [Paper] [Código] [página do projeto]
- [Abril de 2024] "ClinClagent: Sistema multi-agente de ensaio clínico com grande raciocínio baseado em modelos de linguagem" Ling Yue (RPI) et al. arxiv. [papel] [Código]
- [Janeiro de 2024] "Ehragent: o código capacita grandes modelos de idiomas para um raciocínio tabular complexo de poucos tiros em registros eletrônicos de saúde". Wenqi Shi (Gatech) et al. arxiv. [Paper] [Código] [página do projeto]
- [Outubro de 2023] "Optimus: modelagem de otimização usando solucionadores de MIP e modelos de idiomas grandes". Ali Ahmaditeshnizi (Stanford) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Um modelo evolutivo de traços de personalidade relacionado ao comportamento cooperativo usando um grande modelo de linguagem". Reiji Suzuki (Universidade de Nagoya) et al. arxiv. [papel]
- [Outubro de 2023] "Modelo de grande linguagem (LLM) como um sistema de vários agentes especialistas: uma abordagem para resolver o desafio de abstração e corpus (ARC)". John Chong Min Tan (NUS) et al. arxiv. [papel]
- [Outubro de 2023] "Uma abordagem de agente de idioma do teorema formal". Amitayush Thakur (Ut Austin) et al. arxiv. [papel]
- [Outubro de 2023] "Agentes de saúde de conversação: uma estrutura de agente personalizada para LLM". Mahyar Abbasian (UCI) et al. arxiv. [papel]
- [Outubro de 2023] "OceanGPT: um grande modelo de idioma para tarefas de ciências do oceano". Zhen BI (Zju & Donghai Lab) et al. arxiv. [Papel] [Página do projeto]
- [Outubro de 2023] "Voice2Action: Modelos de idiomas como agente para interação eficiente em tempo real na realidade virtual". Yang Su (Cornell Tech). arxiv. [papel]
- [Setembro de 2023] "Tora: um agente de raciocínio integrado à ferramenta para a solução de problemas matemáticos". Zhibin Gou (Thu & Microsoft) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "" Ensine ai como codificar ": usando grandes modelos de idiomas como agentes de ensino para a programação da educação". Hyoungwook Jin (Kaist) et al. arxiv. [papel]
- [Set 2023] "SurrealDriver: Projetando estrutura de simulação de agentes de motorista generativa em contextos urbanos com base no modelo de linguagem grande". Ye Jin (Thu) et al. arxiv. [papel]
- [Setembro de 2023] "grandes modelos de idiomas como agentes da clínica". Nikita Mehandru (UC Berkeley) et al. arxiv. [papel]
- [Setembro de 2023] "Uma arquitetura de cadeia de emoção baseada em avaliação para agentes de jogos de modelos de linguagem afetiva". Croissant Maximilian (Uoy) et al. arxiv. [papel]
- [Setembro de 2023] "Liberando o poder do aprendizado de gráficos por meio de agentes autônomos baseados em LLM". Lanning Wei (CAS & 4Paradigm) et al. arxiv. [papel]
- [Setembro de 2023] "TRADINGGPT: sistema multi-agente com memória em camadas e caracteres distintos para um desempenho de negociação financeira aprimorada". Yang Li (Sit) et al. arxiv. [papel]
- [Setembro de 2023] "Modelscope-Agent: Construindo seu sistema de agentes personalizáveis com modelos de idiomas grandes de código aberto". Chenliang Li (Alibaba) et al. arxiv. [Paper] [Código] [Demo]
- [Agosto de 2023] "Agente de IA recomendado: integrando grandes modelos de idiomas para recomendações interativas". Xu Huang (USTC) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Recmind: grande agente alimentado por modelo de linguagem para recomendação". Yancheng Wang (ASU) et al. arxiv. [papel]
- [Agosto de 2023] "LLM alimentou a transferência SIM-para-real para controle de sinal de trânsito". Longchao da (ASU) et al. arxiv. [papel]
- [Agosto de 2023] "Fora da gaiola: como os papagaios estocásticos vencem em ambientes de segurança cibernética". Maria Rigaki (Čvut) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Existe algum princípio social para agentes baseados em LLM?" Jitao Bai (Tju) et al. arxiv. [papel]
- [Agosto de 2023] "Chateda: um grande agente autônomo alimentado por um modelo de linguagem para EDA". Zhuolun He (Cuhk & Shanghai Ai Lab) et al. arxiv. [papel]
- [Agosto de 2023] "O Guia do Macho -Hitchhiker para Análise do Programa: Uma Jornada com grandes modelos de idiomas". Haonan Li (UCR) et al. arxiv. [papel]
- [Jun 2023] "Para agentes de testes autônomos por meio de grandes modelos de idiomas de conversação". Robert Feldt (Universidade de Tecnologia de Chalmers) et al. arxiv. [papel]
- [Abril de 2023] "Genegpt: Aumentando grandes modelos de idiomas com ferramentas de domínio para melhorar o acesso a informações biomédicas". Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu Arxiv. [papel] [Código]
- [Março de 2023] "HuggingGPT: resolver as tarefas da IA com o ChatGPT e seus amigos em abraçar o rosto". Yongliang Shen (Zju & Msra) et al. arxiv. [papel] [Código]
Confiável
- [Fev 2024] "Os grandes agentes de modelos de idiomas podem simular comportamentos de confiança humana?" Chengxing Xie (Kaust) et al. arxiv. [Paper] [Código] [página do projeto]
- [Setembro de 2023] "Identificando os riscos de agentes de LM com uma caixa de areia em forma de LM" Yangjun Ruan (Universidade de Toronto & Vector Institute) et al. arxiv. [Paper] [Código] [Demo] [Página do Projeto]
- [Agosto de 2023] "Aprimorando a confiança nos agentes de automação de AI baseados em LLM: novas considerações e desafios futuros". Sivan Schwartz (IBM Research) et al. Automatizar @ ijcai 2023. [papel]
Simulação de interação humana
- [Março de 2024] "Emergência de normas sociais em grandes sociedades de agentes baseados em modelos de idiomas". Siyue Ren (NWPU) et al. arxiv. [papel] [Código]
- [Janeiro de 2024] "Modelos abertos, mentes fechadas? Sobre as capacidades dos agentes em imitar personalidades humanas por meio de grandes modelos de idiomas abertos". Lucio La Cava (Universidade de Calabria) et al. arxiv. [papel]
- [Outubro de 2023] "Sotopia: avaliação interativa para inteligência social em agentes de idiomas" *Xuhui Zhou (CMU) et al. *ICLR [Paper]
- [Outubro de 2023] "Competai: Compreendendo os comportamentos de concorrência em grandes agentes baseados em modelos de idiomas". Qinlin Zhao (USTC) et al. arxiv. [papel]
- [Outubro de 2023] "Simulando as mídias sociais usando grandes modelos de idiomas para avaliar algoritmos alternativos de feed de notícias". Petter Törnberg (U de Amsterdã) et al. arxiv. [papel]
- [Outubro de 2023] "Coloque seu dinheiro onde está sua boca: avaliando o planejamento estratégico e a execução de agentes LLM em uma arena de leilão". Jiangjie Chen (FDU & AI2) et al. arxiv. [Paper] [Código] [página do projeto]
- [Outubro de 2023] "Agentes da LYFE: agentes generativos para interações sociais em tempo real de baixo custo". Zhao Kaiya (MIT) et al. arxiv. [papel]
- [Setembro de 2023] "Identificando os riscos de agentes de LM com uma caixa de areia em forma de LM" Yangjun Ruan (Universidade de Toronto & Vector Institute) et al. arxiv. [Paper] [Código] [Demo] [Página do Projeto]
- [Set 2023] "Modelagem generativa baseada em agentes: revelando a dinâmica do sistema social através de modelos mecanicistas de acoplamento com inteligência artificial generativa". Navid Ghaffarzadegan (Virginia Tech) et al. arxiv. [papel]
- [Agosto de 2023] "CGMI: estrutura geral de interação multi-agente configurável". Jinxin Shi (Ecnu) et al. arxiv. [papel]
- [Agosto de 2023] "Explorando a interseção de grandes modelos de idiomas e modelagem baseada em agentes por meio de engenharia imediata". Edward Junprung (UC Berkeley) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "AgentsIms: uma caixa de areia de código aberto para uma grande avaliação de modelos de idiomas". Jiaju Lin (PTA Studio e PSU) et al. arxiv. [Paper] [Código] [página do projeto]
- [JUL 2023] "S^3: Sistema de simulação de rede social com grandes agentes com modelos de linguagem". Chen Gao (Thu) et al. arxiv. [papel]
- [JUL 2023] "Você está em um baile de máscaras? Explorando o comportamento e o impacto de grandes bots sociais direcionados ao modelo de linguagem nas redes sociais on -line". Siyu Li (Scu) et al. arxiv. [Paper] [DataSet]
- [Jul 2023] "Agentes comunicativos para o desenvolvimento de software". Chen Qian (Thu) et al. arxiv. [papel]
- [Jul 2023] "Modelagem epidêmica com agentes generativos". Ross Williams (Virginia Tech) et al. arxiv. [papel] [Código]
- [JUL 2023] "para o Infinity e além: Show-1 e agentes do showrunner em simulações multi-agentes". Philipp Maas (Fable Studio) et al. pré -impressão. [Papel] [Página do projeto]
- [Jun 2023] "Recagente: um novo paradigma de simulação para sistemas de recomendação". Lei Wang (Ruc) et al. arxiv. [papel] [Código]
- [Maio de 2023] "Jogando jogos repetidos com grandes modelos de idiomas". Elif Akata (U de Tübingen) et al. arxiv. [papel]
- [Maio de 2023] "O papel do resumo em agentes generativos: uma perspectiva preliminar". Xiachong Feng (Hit) et al. arxiv. [papel]
- [Abril de 2023] "Bate-papo multipartidário: agentes de conversação em ambientes de grupo com seres humanos e modelos". Jimmy Wei (Cornell & Meta) et al. arxiv. [Paper] [DataSet] [Código]
- [Abril de 2023] "Agentes generativos: simulacra interativo do comportamento humano". Joon Sung Park (Stanford) et al. arxiv. [papel] [Código]
Interação humano-agente
- [Outubro de 2023] "Como os atrasos no processamento da IA promovem a criatividade: explorando a co-criação de perguntas de pesquisa com um agente baseado em LLM". Yiren Liu (Uiuc) et al. arxiv. [papel]
- [Agosto de 2023] "Quantificando o impacto de grandes modelos de linguagem na dinâmica de opinião coletiva". Chao Li (Zju) et al. arxiv. [papel]
- [Agosto de 2023] "Sapien: agentes virtuais afetivos alimentados por grandes modelos de idiomas". Masum Hasan (U de Rochester) et al. arxiv. [papel]
- [JUL 2023] "Compreendendo os benefícios e desafios do uso de grandes agentes de conversação baseados em modelos de idiomas para o apoio mental do bem-estar". Zilin Ma (Harvard) et al. arxiv. [papel]
LLMs movidos a agentes
- [Outubro de 2023] "O agente instrui os grandes modelos de linguagem a serem motivos gerais de tiro zero". Nicholas Crispino (Washu) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Coder ß: aprendizado de reforço profundo baseado em valor para a síntese do programa". Zishun Yu (UIC & Bytedance) et al. arxiv. [papel]
- [Maio de 2023] "Treinando modelos de linguagem socialmente alinhados na sociedade humana simulada". Ruibo Liu (Dartmouth) et al. arxiv. [papel] [Código]
- [Maio de 2023] "Modelos de idiomas atendem aos modelos mundiais: as experiências incorporadas aprimoram os modelos de linguagem". Jiannan Xiang (UCSD) et al. Neurips 2023. [Paper] [Código]
Benchmark
- [JUL 2024] "AppWorld: um mundo controlável de aplicativos e pessoas para realizar agentes de codificação interativa". Harsh Trivedi (Stony Brook University) et al. ACL 2024. [Paper] [Código] [Página do projeto]
- [Dezembro de 2023] "T-EVAL: Avaliando a capacidade de utilização da ferramenta de grandes modelos de idiomas passo a passo". Zehui Chen (USTC, Shanghai Ai Lab) et al. arxiv. [Paper] [Código] [página do projeto]
- [Novembro de 2023] "Magic: Investigação de um modelo de grande linguagem alimentado por multi-agente em cognição, adaptabilidade, racionalidade e colaboração". * Lin Xu et al. (NUS, Bytedance, Stanford e UC Berkeley) * Arxiv. [Papel] [Página do projeto]
- [Outubro de 2023] "Equilibrando a autonomia e o alinhamento: uma taxonomia multidimensional para arquiteturas multi-agentes de LLM autônomas". Thorsten Händler (Fernfh) et al. arxiv. [papel]
- [Outubro de 2023] "Benchmarking Language Models como agentes de pesquisa de IA". Qian Huang (Stanford) et al. arxiv. [papel] [Código]
- [Outubro de 2023] "Benchmark de Metatool para modelos de idiomas grandes: decidindo usar as ferramentas e quais usar". Yue Huang (Universidade de Lehigh) et al. arxiv. [Paper] [DataSet]
- [Outubro de 2023] "SmartPlay: uma referência para o LLMS como agentes inteligentes". Yue Wu (CMU e Microsoft) et al. arxiv. [papel] [Código]
- [Setembro de 2023] "Identificando os riscos de agentes de LM com uma caixa de areia em forma de LM" Yangjun Ruan (Universidade de Toronto & Vector Institute) et al. arxiv. [Paper] [Código] [Demo] [Página do Projeto]
- [Agosto de 2023] "Bolaa: Benchmarking e Orquestrating LLM agentes autônomos agrupados". Zhiwei Liu (Salesforce) et al. arxiv. [papel] [Código]
- [Agosto de 2023] "Agentbench: avaliando LLMs como agentes". Xiao Liu (Thu) et al. arxiv. [Paper] [Código] [página do projeto]
- [Agosto de 2023] "TPTU: planejamento de tarefas e uso de ferramentas de grandes agentes de IA baseados em modelos de idiomas". Jingqing Ruan (SenseTime) et al. arxiv. [papel]
- [Junho de 2023] "Toolqa: um conjunto de dados para respostas de perguntas LLM com ferramentas externas". Yuchen Zhuang (Gatech) et al. Neurips 2023. [Paper] [Código]
Pesquisa e tutorial
- [Setembro de 2023] "Modelagem e raciocínio de contexto baseados em linguagem natural com LLMS: um tutorial". Haoyi Xiong (Baidu) et al. arxiv. [papel]
- [Setembro de 2023] "Uma pesquisa aprofundada de grandes agentes de inteligência artificial baseados em modelos de idiomas". Pengyu Zhao (BJTU) et al. arxiv. [papel]
- [Setembro de 2023] "A ascensão e o potencial de grandes agentes baseados em modelos de linguagem: uma pesquisa". Zhiheng Xi (FDU) et al. arxiv. [Papel] [Github]
- [Agosto de 2023] "Uma pesquisa sobre agentes autônomos baseados em modelos de idiomas". Lei Wang (Ruc) et al. arxiv. [Papel] [Github]
- [Março de 2023] "Uma pesquisa de grandes modelos de idiomas (Seção 6.3 - Planejamento para a solução de tarefas complexas)". Wayne Xin Zhao (Ruc) et al. arxiv. [Papel] [Github]
Projetos de código aberto
Projetos autônomos de solucionador de tarefas
- Auto-GPT-Uma tentativa experimental de código aberto para tornar o GPT-4 totalmente autônomo.
- ? ️? Langchain - Construindo aplicações com LLMs através da composibilidade.
- Engenheiro GPT - Especifique o que você deseja construir, a IA pede esclarecimentos e depois a constrói.
- Metagpt -? A estrutura multi-agente: dado uma requisito de linha, retorna PRD, design, tarefas, repo.
- Babyagi - Um sistema de gerenciamento de tarefas movido a IA.
- L2MAC - A estrutura automática de computador LLM: L2MAC
- Yacana - ?? Powering OpenSource LLMs com bate-papos multi-agentes e fluxos de trabalho em builing.
Projetos de simulação multi-agente
- Ai Town ?? - Um kit iniciante implantável para construir e personalizar sua própria versão da cidade de Ai - uma cidade virtual onde os personagens da IA vivem, conversam e socializam.
- GPTEAM-Uma simulação multi-agente de código aberto.
- ? CHARTARENA - Ambientes de jogos de idiomas com vários agentes para LLMS.
- ? Agenteverse? - Uma estrutura flexível que simplifica o processo de criação de ambientes multi-agentes personalizados para grandes modelos de idiomas (LLMS).
Perspectivas
- Agentes do idioma: uma etapa evolutiva crítica da inteligência artificial - Yu SU (OSU), 5 de setembro de 2023.
- Apresentando o Xlang: Uma estrutura de código aberto para a construção de agentes de modelos de idiomas por meio de aterramento de idiomas executáveis - Xlang Lab, 9 de agosto de 2023.
- What are GPT Agents? A deep dive into the AI interface of the future - Learn why Agents are a core part of the future of AI, Logan Kilpatrick (OpenAI), Jul 25, 2023.
- Language Agents in the Digital World: Opportunities and Risks - Shunyu Yao (Princeton) et al., Jul 24, 2023.
- KokoMind: Can LLMs Understand Social Interactions? - Imagine an AI ? at a cocktail party ?, Weiyan Shi (Columbia) et al., Jul, 2023
- LLM Powered Autonomous Agents - Amazing blog by Lilian Weng (OpenAI), Jun 23, 2023.
Other Related Sources
- Personalized Generative AI @ CIKM'23
- LLM-Agents-Papers - A repo lists papers about LLM role playing, memory mechanism and LLM game playing.
- LLMAgentPapers - Must-read papers on multiagents of LLMs.
- awesome-llm-agents - A curated list of awesome LLM agents.
Reconhecimento
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).