Uma pesquisa sobre agentes de jogo e modelos grandes: métodos, aplicativos e desafios
? Em breve : adicione uma introdução de uma frase a cada artigo.
? Notícias
[2024/02/06] Criação deste repositório para manter a lista de artigos sobre agentes baseados em LLM para jogar. Mais documentos estão chegando em breve!
2024/08
- [2024/08/07] Optimus-1: Os agentes híbridos de memória multimodal capacitaram se destacam em tarefas de longo horizonte. [papel] [Código]
2024/07
- [2024/07/21] VideogameBunny: para assistentes de visão para videogames. [papel] [Código]
- [2024/07/05] Auto -overoverse: uma linguagem de jogo evoluído para aprender agentes incorporados robustos. [papel]
- [2024/07/02] BONDLE: Empoderando os agentes da fundação para o controle geral do computador. [Papel] [Projeto]
2024/06
- [2024/06/20] Duas girafas em um campo de terra: usando jogo para investigar a modelagem de situações em grandes modelos multimodais. [papel]
2024/05
- [2024/05/23] Para aterramento eficiente de LLM para colaboração multi-agente incorporada. [Papel] [Projeto]
- [2024/05/11] Prompt-Gaming: Um estudo piloto sobre agente de avaliação de LLM em um jogo de energia significativo. [papel]
2024/04
- [2024/04/17] Agentkit: engenharia de fluxo com gráficos, não codificação. [papel] [Código]
- [2024/04/16] O jogo de idiomas adversários auto-jogadores aprimora o raciocínio LLM. [papel] [Código]
2024/03
- [2024/03/23] Avalie o LLMS em tempo real com o Street Fighter III. [código]
- [2024/03/19] Os agentes incorporados da LLM aprendem a cooperar em equipes organizadas. [papel]
- [2024/03/18] Os agentes autônomos llm-augmentados podem cooperar?, Uma avaliação de suas capacidades cooperativas através do caldeirão. [papel]
- [2024/03/18] EnvGen: Gerando e adaptando ambientes via LLMS para o treinamento de agentes incorporados. [papel]
- [2024/03/18] MinedReamer: Aprendendo a seguir as instruções por meio de magia para controle do mundo simulado. [papel] [Código]
- [2024/03/14] Escalando agentes instrutíveis em muitos mundos simulados. [papel]
- [2024/03/13] Sistema de organização automática hierárquica para navegação multi-agente aberta. [papel]
- [2024/03/13] Sotopia-$ PI $: Aprendizagem interativa de agentes de idiomas socialmente inteligentes. [papel] [Código]
- [2024/03/08] O GPT-4 correr Doom? [papel] [Código]
- [2024/03/05] em direção ao controle geral do computador: um agente multimodal para Red Dead Redemption II como um estudo de caso. [Papel] [Projeto]
- [2024/03/01] Jogando NETHACK com LLMS: potencial e limitações como agentes zero shot. [papel] [Código]
2024/02
- [2024/02/29] RL-GPT: Integrando o aprendizado de reforço e o código-as-política. [papel]
- [2024/02/27] Agente-Pro: Aprendendo a evoluir por meio de reflexão e otimização no nível da política. [papel] [Código]
- [2024/02/21] PCA-Bench: Avaliando modelos de linguagem grande multimodal em cadeia de percepção-cognição-ação. [papel] [Código]
- [2024/02/20] E se os LLMs tivessem diferentes visões de mundo: simulando civilizações alienígenas com agentes baseados em LLM. [papel] [Código]
- [2024/02/07] S-Agents: agentes auto-organizados em ambientes abertos. [papel]
- [2024/02/04] Aumente o raciocínio para grandes modelos de idiomas no lobisomem do jogo. [papel]
- [2024/02/02] POKÉLLMON: Um agente de paridade humana para batalhas de Pokemon com grandes modelos de linguagem. [papel] [Código]
2024/01
- [2024/01/31] Swarmbrain: Agente incorporado para o jogo de estratégia em tempo real Starcraft II por meio de grandes modelos de idiomas. [papel]
- [2024/01/19] Civrealm: uma odisseia de aprendizado e raciocínio na civilização para agentes de tomada de decisão. [papel] [Código]
- [2024/01/17] Pesquisando instâncias de bug nos repositórios de vídeo de jogo. [Paper] [Dados]
- [2024/01/04] POKERGPT: um solucionador leve de ponta a ponta para o Texas Hold'em de vários jogadores por meio de um modelo de idioma grande. [papel]
2023/12
- [2023/12/29] Cooperação em tempo real: Explorando agentes de idiomas para o trabalho em equipe ad hoc no jogo Avalon. [papel]
- [2023/12/23] Agente de Linguagem Hierárquica de LLM para coordenação humana-AI em tempo real. [Papel] [Projeto]
- [2023/12/19] Modelos de idiomas grandes jogam Starcraft II: Benchmarks e uma abordagem de cadeia de resumo. [papel]
- [2023/12/14] MC-RECWARD AUTOMENTE: Design de recompensa densa automatizada com grandes modelos de idiomas para o Minecraft. [papel]
- [2023/12/12] MP5: Um sistema incorporado de ponta aberta multimodal no Minecraft por meio da percepção ativa. [papel] [Código]
- [2023/12/08] Oráculo da Apollo: Raciocínio de Recuperação em Debates Multi-Agentes. [papel] [Código]
- [2023/12/08] Glitchbench: Os grandes modelos multimodais podem detectar falhas de videogame? [papel] [Código]
- [2023/12/07] Uma estrutura para explorar as percepções do jogador sobre o diálogo gerado por LLM em videogames comerciais. [Papel] [Site]
- [2023/12/05] Agentes criativos: capacitando agentes com imaginação para tarefas criativas. [papel] [Código]
- [2023/12/04] Codificadores visuais para aprendizado de imitação com eficiência de dados em videogames modernos. [papel]
- [2023/12/02] Construindo um agente incorporado aberto através da adaptação bidirecional de políticas de linguagem. [papel]
- [2023/12/01] Decifrar os detetives digitais: Compreendendo comportamentos e recursos de LLM em jogos de mistério multi-agentes. [papel]
2023/11
- [2023/11/28] Guerra e Paz (Waragent): Grande simulação multi-agente baseada em modelos de idiomas das guerras mundiais. [papel] [Código]
- [2023/11/26] Veja e pense: agente incorporado em ambiente virtual. [papel] [Código]
- [2023/11/20] DesignGPT: colaboração multi-agente em design. [papel]
- [2023/11/14] Magic: Investigação de um modelo de grande linguagem, multi-agente em cognição, adaptabilidade, racionalidade e colaboração. [papel] [Código]
- [2023/11/10] JARVIS-1: Agentes multitarefa de mundo aberto com modelos de linguagem multimodal com memória. [papel] [Código]
- [2023/11/08] Adapt: Decomposição e planejamento necessários com modelos de idiomas. [papel] [Código]
2023/10
- [2023/10/31] Aproveitando jogos de adivinhação de palavras para avaliar a inteligência de grandes modelos de idiomas. [papel] [Código]
- [2023/10/29] Agentes de idiomas com aprendizado de reforço para brincar estratégico no jogo de lobisomem. [papel]
- [2023/10/23] Investigação da Sociedade de Agentes baseados em LLM: colaboração e confronto na jogabilidade de Avalon. [papel]
- [2023/10/20] Steve-Eye: Equipando agentes incorporados à base de LLM com percepção visual em mundos abertos. [papel] [Código]
- [2023/10/18] Sotopia: avaliação interativa para inteligência social em agentes de idiomas. [papel] [Código]
- [2023/10/16] Caracter-Llm: um agente treinável para interpretar papéis. [papel] [Código]
- [2023/10/13] Rider de Llama: Spurring Great Language Models para explorar o mundo aberto. [papel]
- [2023/10/12] GameGPT: estrutura colaborativa multi-agente para o desenvolvimento de jogos. [papel]
- [2023/10/12] Groot: Aprendendo a seguir as instruções assistindo a vídeos de jogabilidade. [papel] [Código]
- [2023/10/12] Octopus: Programador incorporado da Vision-Language do feedback ambiental. [papel] [Código]
- [2023/10/10] Metaagentes: simulando interações de comportamentos humanos para a coordenação orientada para a tarefa baseada em LLM por meio de agentes generativos colaborativos. [papel]
- [2023/10/09] Agentes humanóides: plataforma para simular agentes generativos semelhantes a humanos. [papel] [Código]
- [2023/10/08] Avalonbench: Avaliando o LLMS jogando o jogo de Avalon. [papel] [Código]
- [2023/10/06] Curiosidade cautelosa: uma nova abordagem para um agente de jogabilidade do tipo humano. [papel] [Código]
- [2023/10/05] LLM-Coordenation: Avaliando e analisando habilidades de coordenação multi-agente em grandes modelos de linguagem. [papel] [Código]
- [2023/10/03] Agentes da LYFE: agentes generativos para interações sociais em tempo real de baixo custo. [papel]
- [2023/10/03] Para a tomada de decisão incorporada de ponta a extremidade, por meio de um modelo de linguagem grande multimodal: explorações com GPT4-Vision e além. [papel] [Código]
- [2023/10/02] SmartPlay: uma referência para o LLMS como agentes inteligentes. [papel] [Código]
- [2023/10/02] O jogo de pensamentos de Avalon: luta contra o engano através da contemplação recursiva. [papel]
- [2023/10/01] ROLELLM: Benchmarking, provocando e aprimorando as habilidades de interpretação de papéis de grandes modelos de linguagem. [papel] [Código]
2023/09
- [2023/09/29] Adarefiner: Refinando decisões de modelos de idiomas com feedback adaptativo. [papel] [Código]
- [2023/09/29] Motivo: motivação intrínseca do feedback da inteligência artificial. [papel] [Código]
- [2023/09/29] LLM-Deliberação: Avaliando LLMs com jogos interativos de negociação multi-agente. [papel] [Código]
- [2023/09/29] suspeita-agente: jogando jogos de informação imperfeita com a teoria do Mind Sconom GPT-4. [papel] [Código]
- [2023/09/29] Autoagentes: uma estrutura para a geração automática de agentes. [papel] [Código]
- [2023/09/21] O conhecimento verdadeiro vem da prática: alinhar grandes modelos de linguagem com ambientes incorporados por meio de aprendizado de reforço. [papel] [Código]
- [2023/09/18] MINDAGENT: interação emergente de jogos. [papel] [Código]
- [2023/09/14] Agentes: uma estrutura de código aberto para agentes de idiomas autônomos. [papel] [Código]
- [2023/09/09] Explorando grandes modelos de idiomas para jogos de comunicação: um estudo empírico sobre lobisomem. [papel]
2023/08
- [2023/08/23] Os jogadores ChatGPT e GPT-4 são bons de poker?-uma análise pré-flop. [papel]
- [2023/08/22] ProAgent: Construindo IA cooperativa proativa usando modelos de linguagem grandes. [papel] [Código]
- [2023/08/21] Agentverse: facilitando a colaboração multi-agente e explorando comportamentos emergentes em agentes. [papel] [Código]
- [2023/08/19] GameEval: Avaliando o LLMS em jogos de conversação. [papel] [Código]
- [2023/08/16] Autogen: Ativando aplicativos LLM Next-Gen por meio de uma estrutura de conversação multi-agente. [papel]
- [2023/08/15] Calypso: LLMS como Assistentes de Mestrado em Dungeon. [papel]
- [2023/08/08] AgentsIms: uma caixa de areia de código aberto para uma grande avaliação de modelos de idiomas. [papel]
- [2023/08/01] Metagpt: meta-programação para uma estrutura colaborativa multi-agente. [papel] [Código]
2023/07
- [2023/07/24] Tachikuma: Entendendo interações complexas com objetos multi-caracteres e novos por grandes modelos de linguagem. [papel]
- [2023/07/21] Percepção seletiva: otimizando as descrições do estado com aprendizado de reforço para atores de modelos de idiomas. [Papel] [Projeto]
- [2023/07/12] SAYPLAN: Aumentando modelos de idiomas grandes usando gráficos de cena 3D para planejamento de tarefas escaláveis. [papel]
- [2023/07/05] Construindo agentes incorporados cooperativos modularmente com grandes modelos de linguagem. [papel] [Código]
- [2023/07/04] Tapa: Planejamento de tarefas incorporado com grandes modelos de idiomas. [papel] [Código]
2023/06
- [2023/06/20] Sprint: Política escalável pré-treinamento por meio de reabastecimento de instrução de idiomas. [papel] [Código]
- [2023/06/15] Chessgpt: Aprendizagem de políticas de ponte e modelagem de idiomas. [papel] [Código]
- [2023/06/02] OMNI: Abertura através de modelos de noções humanas de interessante. [papel] [Código]
- [2023/06/01] Steve-1: Um modelo generativo para texto para comportamento no Minecraft. [papel] [Código]
2023/05
- [Maio-23] Cottage: geração coerente de jogos de aventura de texto. [papel] [Código]
- [2023/05/30] Alphablock: Finetuning incorporado para o raciocínio da linguagem da visão na manipulação do robô. [papel]
- [2023/05/26] Jogando jogos repetidos com grandes modelos de idiomas. [papel]
- [2023/05/25] Voyager: um agente incorporado aberto com grandes modelos de idiomas. [papel] [Código]
- [2023/05/25] Fantasma no Minecraft: agentes geralmente capazes para ambientes de mundo aberto por meio de grandes modelos de linguagem com conhecimento e memória baseados em texto. [papel] [Código]
- [2023/05/24] Primavera: estudando papéis e raciocínio para jogar. [papel] [Código]
- [2023/05/23] Melhorando a factualidade e o raciocínio em modelos de idiomas através do debate multiagente. [papel] [Código]
- [2023/05/17] Melhorando a negociação do modelo de idioma com o auto-jogo e o aprendizado no contexto do feedback da IA. [papel] [Código]
- [2023/05/09] Tidybot: Assistência personalizada do robô com grandes modelos de idiomas. [papel] [Código]
- [2023/05/01] ARK: Realidade aumentada com conhecimento emergente interativo do conhecimento. [papel]
2023/04
- [2023/04/07] Agentes generativos: simulacra interativo do comportamento humano. [papel] [Código]
- [2023/04/06] Os grandes modelos de idiomas podem jogar bem jogos de texto? Perguntas atuais de última geração e abertas. [papel] [Código]
- [APR-23] Messão personalizada e geração de diálogo em jogos de interpretação de papéis: uma abordagem baseada em gráficos e modelos de linguagem. [papel] [Código]
2023/03
- [2023/03/31] Camel: agentes comunicativos para a exploração da 'mente' 'da grande sociedade de modelos de idiomas. [papel] [Código]
- [2023/03/29] Aprendizagem e planejamento de reforço de habilidades para tarefas de longo horizonte de mundo aberto. [papel] [Código]
- [2023/03/06] PALM-E: Um modelo de linguagem multimodal incorporado. [papel]
2023/02
- [2023/02/13] Orientar a pré -treinamento no aprendizado de reforço com grandes modelos de idiomas. [papel] [Código]
- [2023/02/12] Mariogpt: geração de text2level de forma aberta através de grandes modelos de idiomas. [papel] [Código]
- [2023/02/03] Descreva, explique, planeje e selecione: Planejamento interativo com LLMS permite agentes de várias tarefas do mundo aberto. [papel] [Código]
2023/01
- [2023/01/28] Os agentes incorporados sonham com ovelhas pixeladas: tomada de decisão incorporada usando a modelagem mundial guiada por idiomas. [papel]
- [2023/01/21] Controle de multitarefa de mundo aberto através da representação com reconhecimento de gols e previsão adaptativa do horizonte. [papel] [Código]
2022
- [2022/11/22] Jogo de nível humano no jogo de diplomacia combinando modelos de linguagem com raciocínio estratégico. [papel]
- [2022/11/21] Aquisição de habilidades robóticas por meio de aumento de instruções com modelos de visão de visão. [papel]
- [2022/10/24] Representações mundiais emergentes: explorando um modelo de sequência treinado em uma tarefa sintética. [papel] [Código]
- [2022/10/05] Modelos de idiomas grandes são muito bons detectores de bugs de videogame zero-shot. [papel] [Código]
- [2022/08/08] SIMULACRA SOCIAL: Criando protótipos povoados para sistemas de computação social. [papel]
- [2022/07/12] Monólogo interno: raciocínio incorporado através do planejamento com modelos de idiomas. [papel]
- [2022/06/23] Pré -treinamento de vídeo (VPT): Aprendendo a agir assistindo a vídeos on -line não marcados. [papel]
- [2022/06/07] Minedojo: Construindo agentes incorporados abertos com conhecimento em escala da Internet. [papel] [Código]
Citação
Se você achar esse repositório útil, cite nosso artigo:
@misc{xu2024survey,
title={A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges},
author={Xinrun Xu, Yuxin Wang, Chaoyi Xu, Ziluo Ding, Jiechuan Jiang, Zhiming Ding, Börje F. Karlsson},
year={2024},
eprint={2403.10249},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
Contato