? Coala: agentes de idiomas incríveis

Uma compilação de agentes de idiomas usando a estrutura de arquiteturas cognitivas para agentes de idiomas (? Coala) .
- Papel Coala (16 páginas do conteúdo principal): https://arxiv.org/abs/2309.02427
- Coala Tweet (6 tópicos): https://twitter.com/shunyuyao12/status/1699396834983362690
- Arquivo Coala Bibtex com mais de 300 citações relacionadas: coala.bib
- Citação Coala Bibtex Se você achar útil nosso trabalho/recursos:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}Visão geral da Coala
Coala especifica perfeitamente um agente de idiomas que começa com seu espaço de ação , que possui 2 partes:
- Ações externas para interagir com ambientes externos ( aterramento )
- Ações internas para interagir com memórias internas ( raciocínio , recuperação , aprendizado )
- Um agente de idiomas tem uma memória de trabalho de curto prazo e várias memórias (opcionais) de longo prazo (episódios para a experiência, semântica para conhecimento, processual para o código/LLM)
- Raciocínio = Atualizar memória de trabalho (com LLM)
- Recuperação = Leia a memória de longo prazo
- Aprendizagem = Escreva memória de longo prazo

Então, como um agente do idioma escolhe qual ação tomar? Suas ações são estruturadas nos ciclos de tomada de decisão , e cada ciclo tem duas etapas:
- Planejamento : O agente aplica ações de raciocínio/recuperação a (iterativamente) propõe e avalia ações e selecione uma ação de aprendizado/aterramento.
- Execução : A ação de aprendizado/aterramento selecionada é executada para afetar a memória interna ou o mundo externo.

Para entender mais, leia a seção 4 do nosso artigo.
Papéis
Abaixo está apenas um subconjunto de documentos raspados do coala.bib e solicitações puxadas, com rótulos de espaço de ação potencialmente incorretos. A data é baseada no ARXIV v1. Eles não representam todo o trabalho do agente de idiomas e planejamos adicionar mais trabalho em breve (recebem solicitações bem -vindas) e temos rótulos para um trabalho altamente citado.
- (2021-10) Cadeias de IA: interação transparente e controlável de Human-AI, encadeando grandes prompts de modelo de linguagem (raciocínio)
- (2021-10) SILG: O referência de aterramento de linguagem interativa simbólica de vários ambientes (ambiente)
- (2022-01) Modelos de idiomas como planejadores de tiro zero: extraindo conhecimento acionável para agentes incorporados (aterramento)
- (2022-03) PromptChainer: encadear um modelo de linguagem grande solicita a programação visual (aterramento)
- (2022-03) ScienceWorld: Seu agente é mais inteligente que um aluno da 5ª série? (ambiente)
- (2022-04) Faça o que eu puder, não como eu digo: linguagem de aterramento em preços robóticos (aterramento)
- (2022-04) Modelos socráticos: compondo raciocínio multimodal com tiro zero com a linguagem (aterramento)
- (2022-07) WebShop: Rumo à interação escalável da Web do mundo real com agentes de idiomas fundamentados (ambiente)
- (2022-09) Progprompt: Gerando planos de tarefas de robôs situados usando grandes modelos de idiomas (aterramento)
- (2022-10) Decomposição de promoção: uma abordagem modular para resolver tarefas complexas (raciocínio)
- (2022-10) Olhos da mente: Raciocínio do modelo de linguagem aterrado por meio de simulação (aterramento)
- (2022-10) React: sinergizando o raciocínio e atuação em modelos de idiomas (aterramento, raciocínio)
- (2022-11) Os grandes modelos de linguagem são engenheiros de prompt em nível humano (raciocínio)
- (2022-12) LLM-Planner: Planejamento fundamentado de poucas fotos para agentes incorporados com grandes modelos de linguagem (aterramento)
- (2022-12) Não gerar, discriminar: uma proposta para modelos de linguagem de aterramento para ambientes do mundo real (aterramento)
- (2023-02) Cadeia de retrospectiva alinha modelos de linguagem com feedback (aprendizado)
- (2023-02) Descreva, explique, planeje e selecione: Planejamento interativo com grandes modelos de linguagem permite agentes de várias tarefas do mundo aberto (aterramento, raciocínio)
- (2023-02) Ferramentas de ferramentas: os modelos de idiomas podem se ensinar a usar ferramentas (aterramento)
- (2023-03) Modelos de fundação para tomada de decisão: problemas, métodos e oportunidades (pesquisa)
- (2023-03) HuggingGPT: resolvendo tarefas de IA com ChatGPT e seus amigos em abraçar o rosto (aterramento)
- (2023-03) Palm-E: um modelo de linguagem multimodal incorporado (aterramento)
- (2023-03) Reflexão: agentes de idiomas com aprendizado de reforço verbal (fundamento, raciocínio, aprendizado)
- (2023-03) Auto-refinado: refinamento iterativo com auto-feedback (raciocínio)
- (2023-03) Geração de código de auto-planejamento com grandes modelos de idiomas (raciocínio)
- (2023-04) Agentes generativos: simulacra interativo do comportamento humano (aterramento, raciocínio, recuperação, aprendizado)
- (2023-04) Capacidades de pesquisa científica autônoma emergente de grandes modelos de linguagem (aterramento, raciocínio)
- (2023-04) LLM+P: Empoderando grandes modelos de idiomas com proficiência de planejamento ideal (aterramento, raciocínio)
- (2023-04) Refiner: Feedback de raciocínio sobre representações intermediárias (raciocínio)
- (2023-04) Ensinando grandes modelos de idiomas a auto-estreia (raciocínio)
- (2023-04) Genegpt: Aumentando grandes modelos de idiomas com ferramentas de domínio para melhorar o acesso a informações biomédicas (aterramento, raciocínio)
- (2023-05) Crítico: grandes modelos de idiomas podem se auto-corrigir com a crítica interativa da ferramenta (aterramento, raciocínio, recuperação)
- (2023-05) Aumentando agentes autotélicos com grandes modelos de linguagem (aterramento, raciocínio, recuperação, aprendizado)
- (2023-05) Chatcot: Raciocínio de cadeia de pensamento agente para ferramentas em grandes modelos de idiomas baseados em bate-papo (aterramento, raciocínio)
- (2023-05) Toolkengpt: Aumentando modelos de idiomas congelados com ferramentas massivas por meio de incorporações de ferramentas (aterramento, raciocínio)
- (2023-05) A decomposição aumenta o raciocínio por meio de decodificação guiada por auto-avaliação (raciocínio)
- (2023-05) Incentivar o pensamento divergente em grandes modelos de idiomas por meio de debate multi-agente (fundamento, raciocínio)
- (2023-05) Melhorando a factualidade e o raciocínio em modelos de idiomas por meio de debate multiagente (fundamento, raciocínio)
- (2023-05) Adaplanner: planejamento adaptativo do feedback com modelos de idiomas (aterramento, recuperação, aprendizado)
- (2023-05) Promoção de plano e solução: Melhorando o raciocínio da cadeia de pensamento zero por grandes modelos de idiomas (raciocínio)
- (2023-05) Rewoo: Desaparelhar o raciocínio de observações para modelos de linguagem aumentados eficientes (aterramento, raciocínio)
- (2023-05) SwiftSage: um agente generativo com pensamento rápido e lento para tarefas interativas complexas (aterramento, raciocínio)
- (2023-05) Árvore dos pensamentos: resolução deliberada de problemas com grandes modelos de idiomas (raciocínio)
- (2023-05) Voyager: um agente incorporado aberto com grandes modelos de idiomas (aterramento, raciocínio, recuperação, aprendizado)
- (2023-06) Intercode: padronização e benchmarking codificação interativa com feedback de execução (aterramento, raciocínio)
- (2023-06) Toolqa: um conjunto de dados para respostas de perguntas LLM com ferramentas externas (aterramento)
- (2023-06) Mind2Web: em direção a um agente generalista para a web (ambiente)
- (2023-06) RESTGPT: Conectando grandes modelos de linguagem com APIs repousantes do mundo real (aterramento, raciocínio)
- (2023-06) Ferramentas: aprendizado de ferramentas generalizado para modelos de idiomas com 3000 casos simulados (aterramento, raciocínio)
- (2023-07) Um webagent do mundo real com planejamento, compreensão de longo contexto e síntese de programas (aterramento, raciocínio)
- (2023-07) RT-2: Modelos de ação de visão de visão transferem conhecimento da web para controle robótico (aterramento)
- (2023-07) ROCO: colaboração dialética de vários robôs com grandes modelos de idiomas (aterramento)
- (2023-07) Robôs que pedem ajuda: alinhamento da incerteza para grandes planejadores de modelos de idiomas (aterramento)
- (2023-07) S $^3 $: Sistema de simulação de rede social com grandes agentes de modelos de linguagem (aterramento, raciocínio)
- (2023-07) Toolllm: Facilitando grandes modelos de idiomas para dominar mais de 16000 APIs do mundo real (aterramento, raciocínio, recuperação)
- (2023-07) Compreendendo os benefícios e desafios do uso de grandes agentes de conversação baseados em modelos de idiomas para suporte de bem-estar mental (aterramento)
- (2023-07) Liberando a sinergia cognitiva em grandes modelos de idiomas: um agente de solução de tarefas através da auto-colaboração de várias pessoas (aterramento, raciocínio)
- (2023-07) Webarena: um ambiente da web realista para a construção de agentes autônomos (ambiente)
- (2023-08) Agentbench: Avaliando LLMs como agentes (ambiente)
- (2023-08) Agentverse: Facilitando a colaboração multi-agente e explorando comportamentos emergentes em agentes (meio ambiente)
- (2023-08) Autogênio: Ativando aplicativos LLM de próxima geração por meio da estrutura de conversação multi-agente (aterramento, raciocínio)
- (2023-08) CGMI: estrutura de interação multi-agente configurável (aterramento, raciocínio)
- (2023-08) ChateVal: para melhores avaliadores baseados em LLM por meio de um debate multi-agente (aterramento, raciocínio)
- (2023-08) Raciocínio cumulativo com grandes modelos de linguagem (raciocínio)
- (2023-08) Expel: os agentes da LLM são alunos experienciais (aterramento, raciocínio, recuperação, aprendizado)
- (2023-08) GPT-in-the-loop: tomada de decisão adaptativa para sistemas multiagentes (aterramento, raciocínio)
- (2023-08) Gentopia: uma plataforma colaborativa para LLMs agmentados por ferramentas (ambiente)
- (2023-08) Metagpt: meta-programação para estrutura colaborativa multi-agente (aterramento, raciocínio)
- (2023-08) ProAgent: Construindo IA cooperativa proativa com grandes modelos de linguagem (aterramento, raciocínio)
- (2023-08) Retroformer: agentes de grandes idiomas retrospectivos com otimização de gradientes de políticas (aterramento, raciocínio, aprendizado)
- (2023-08) SAPIEN: Agentes virtuais afetivos alimentados por grandes modelos de linguagem (aterramento, raciocínio)
- (2023-08) Integração sinérgica de grandes modelos de idiomas e arquiteturas cognitivas para IA robusta: uma análise exploratória (aterramento, raciocínio, recuperação, aprendizado)
- (2023-09) TORA: Um agente de raciocínio integrado à ferramenta para resolução de problemas matemáticos (aterramento, raciocínio, aprendizado)
- (2023-09) Identificando os riscos de agentes de LM com uma caixa de areia em forma de LM (ambiente)
- (2023-09) Agente de suspeitas: jogando jogos de informação imperfeita com a teoria do Mind Sconke GPT-4 (aterramento, raciocínio)
- (2024-01) Autocontraste: melhor reflexão por meio de perspectivas de solução inconsistente (raciocínio, reflexão)
- (2024-02) Agente-Pro: Aprendendo a evoluir por meio de reflexão e otimização em nível de política (raciocínio, reflexão, aprendizado)
- (2024-03) LLM3: Planejamento de tarefas e movimento baseado em modelos de linguagem grande com o raciocínio de falhas de movimento. (planejamento, raciocínio)
- (2024-04) Capacitar a descoberta biomédica com agentes de IA (cientista da IA, pesquisa biomédica)
- (2024-05) Timechara: Avaliando a alucinação de caráter de ponto de pontual
(Mais a ser adicionado em breve. Pull Pedido de boas -vindas.)
Recursos
- Agentes autônomos alimentados por LLM (Lil'log)
- Llm-agents-papers
- LLMAGENTPAPERS
- AGENTE DE AMPRENHO-LLM
(Mais a ser adicionado em breve. Pull Pedido de boas -vindas.)