Una encuesta sobre agentes de juego y modelos grandes: métodos, aplicaciones y desafíos
? Próximamente : agregue una introducción de una oración a cada papel.
? Noticias
[2024/02/06] Creación de este repositorio para mantener la lista de documentos en agentes basados en LLM para el juego. ¡Más documentos llegarán pronto!
2024/08
- [2024/08/07] Optimus-1: La memoria multimodal híbrida empoderó a los agentes de sobresalientes en tareas de horizonte largo. [documento] [código]
2024/07
- [2024/07/21] VideoGamebunny: Hacia los asistentes de visión para videojuegos. [documento] [código]
- [2024/07/05] Autococutación: un lenguaje de juego evolvible para aprender agentes sólidos encarnados. [papel]
- [2024/07/02] Cuna: Empoderar a los agentes de la Fundación hacia el control general de la computadora. [Documento] [Proyecto]
2024/06
- [2024/06/20] Dos jirafas en un campo de tierra: usar el juego para investigar el modelado de situación en grandes modelos multimodales. [papel]
2024/05
- [2024/05/23] Hacia una conexión a tierra de LLM eficiente para la colaboración de agentes múltiples incorporados. [Documento] [Proyecto]
- [2024/05/11] Gaming de inmediato: un estudio piloto sobre agente de evaluación LLM en un juego de energía significativo. [papel]
2024/04
- [2024/04/17] Agente: Ingeniería de flujo con gráficos, no codificación. [documento] [código]
- [2024/04/16] El juego de lenguaje adversario autónomo mejora el razonamiento de LLM. [documento] [código]
2024/03
- [2024/03/23] Evalúe LLM en tiempo real con Street Fighter III. [código]
- [2024/03/19] Los agentes de LLM encarnados aprenden a cooperar en equipos organizados. [papel]
- [2024/03/18] ¿Pueden cooperar los agentes autónomos acuáticos de LLM?, Una evaluación de sus capacidades cooperativas a través del crisol. [papel]
- [2024/03/18] Envgen: Generación y adaptación de entornos a través de LLM para agentes incorporados de capacitación. [papel]
- [2024/03/18] MinedReamer: aprender a seguir las instrucciones a través de la cadena de imaginación para el control del mundo simulado. [documento] [código]
- [2024/03/14] Escala de agentes instructables en muchos mundos simulados. [papel]
- [2024/03/13] Sistema de organización automática jerárquica para navegación de agentes múltiples abiertos. [papel]
- [2024/03/13] Sotopia-$ pi $: aprendizaje interactivo de agentes lingüísticos socialmente inteligentes. [documento] [código]
- [2024/03/08] ¿GPT-4 ejecutará Doom? [documento] [código]
- [2024/03/05] Hacia el control general de la computadora: un agente multimodal para Red Dead Redemption II como estudio de caso. [Documento] [Proyecto]
- [2024/03/01] Jugando nethack con LLM: potencial y limitaciones como agentes de disparo cero. [documento] [código]
2024/02
- [2024/02/29] RL-GPT: integrando el aprendizaje de refuerzo y el código como la política. [papel]
- [2024/02/27] Agente-Pro: Aprender a evolucionar a través de la reflexión y optimización a nivel de política. [documento] [código]
- [2024/02/21] PCA Bench: Evaluación de modelos de lenguaje grande multimodal en la cadena de percepción-cognición-acción. [documento] [código]
- [2024/02/20] ¿Qué pasa si los LLM tienen diferentes puntos de vista del mundo: simulando civilizaciones alienígenas con agentes con sede en LLM? [documento] [código]
- [2024/02/07] S-agentes: agentes autoorganizados en entornos abiertos. [papel]
- [2024/02/04] Mejore el razonamiento para modelos de idiomas grandes en el juego Werewolf. [papel]
- [2024/02/02] Pokélmon: un agente de paridad humana para batallas de Pokémon con modelos de idiomas grandes. [documento] [código]
2024/01
- [2024/01/31] Swarmbrain: agente incorporado para el juego de estrategia en tiempo real Starcraft II a través de modelos de idiomas grandes. [papel]
- [2024/01/19] Civrealm: una odisea de aprendizaje y razonamiento en la civilización para los agentes de toma de decisiones. [documento] [código]
- [2024/01/17] Buscando instancias de errores en repositorios de video de juego. [documento] [datos]
- [2024/01/04] PokergPT: un solucionador liviano de extremo a extremo para Texas Hold'em de MultiPrayer a través de un modelo de lenguaje grande. [papel]
2023/12
- [2023/12/29] Cooperación sobre la marcha: explorar agentes de idiomas para el trabajo en equipo ad hoc en el juego de Avalon. [papel]
- [2023/12/23] Agente de lenguaje jerárquico con motor LLM para la coordinación Human-AI en tiempo real. [Documento] [Proyecto]
- [2023/12/19] Los modelos de idiomas grandes juegan Starcraft II: puntos de referencia y un enfoque de cadena de resumen. [papel]
- [2023/12/14] Auto MC-Reward: diseño de recompensa denso automatizado con grandes modelos de lenguaje para Minecraft. [papel]
- [2023/12/12] MP5: un sistema incorporado abierto multimodal en Minecraft a través de la percepción activa. [documento] [código]
- [2023/12/08] Oracle de Apolo: razonamiento acuático de recuperación en debates de múltiples agentes. [documento] [código]
- [2023/12/08] Glitchbench: ¿pueden los modelos multimodales grandes detectar fallas de videojuegos? [documento] [código]
- [2023/12/07] Un marco para explorar las percepciones de los jugadores del diálogo generado por LLM en videojuegos comerciales. [documento] [Sitio web]
- [2023/12/05] Agentes creativos: empoderamiento de agentes con imaginación para tareas creativas. [documento] [código]
- [2023/12/04] Codificadores visuales para el aprendizaje de imitación eficiente en datos en videojuegos modernos. [papel]
- [2023/12/02] Construyendo agente incorporado abierto a través de la adaptación bidireccional de la política de lenguaje. [papel]
- [2023/12/01] Descipitar detectives digitales: comprensión de los comportamientos y capacidades de LLM en juegos misteriosos de múltiples agentes. [papel]
2023/11
- [2023/11/28] Guerra y paz (Waragent): Simulación de las Guerras Mundiales basadas en modelos de grandes idiomas de las Guerras Mundiales. [documento] [código]
- [2023/11/26] Véase y piense: Agente incorporado en entorno virtual. [documento] [código]
- [2023/11/20] DesignGPT: colaboración de múltiples agentes en diseño. [papel]
- [2023/11/14] Magia: Investigación del modelo de lenguaje grande alimentado con múltiples agentes en cognición, adaptabilidad, racionalidad y colaboración. [documento] [código]
- [2023/11/10] JARVIS-1: Agentes de tareas múltiples de mundo abierto con modelos de lenguaje multimodal acuático. [documento] [código]
- [2023/11/08] Adaptar: descomposición y planificación según los modelos de idiomas. [documento] [código]
2023/10
- [2023/10/31] Aprovechando los juegos de adivinanzas de palabras para evaluar la inteligencia de modelos de idiomas grandes. [documento] [código]
- [2023/10/29] Agentes del idioma con aprendizaje de refuerzo para el juego estratégico en el juego de hombres lobo. [papel]
- [2023/10/23] Investigación de la Sociedad de Agentes con sede en LLM: colaboración y confrontación en el juego Avalon. [papel]
- [2023/10/20] Steve-Eye: Equipando agentes encarnados basados en LLM con percepción visual en mundos abiertos. [documento] [código]
- [2023/10/18] Sotopia: evaluación interactiva para la inteligencia social en los agentes del lenguaje. [documento] [código]
- [2023/10/16] Caracter-LLM: un agente entrenable para el juego de roles. [documento] [código]
- [2023/10/13] Llama Rider: estimulando modelos de idiomas grandes para explorar el mundo abierto. [papel]
- [2023/10/12] GameGPT: Marco colaborativo de múltiples agentes para el desarrollo de juegos. [papel]
- [2023/10/12] Groot: aprender a seguir las instrucciones viendo videos de juego. [documento] [código]
- [2023/10/12] Octopus: programador de lenguaje de visión incorporado a partir de la retroalimentación ambiental. [documento] [código]
- [2023/10/10] Metaagentes: simulación de interacciones de comportamientos humanos para la coordinación orientada a tareas basadas en LLM a través de agentes generativos colaborativos. [papel]
- [2023/10/09] Agentes humanoides: plataforma para simular agentes generativos similares a los humanos. [documento] [código]
- [2023/10/08] Avalonbench: Evaluación de LLM jugando el juego de Avalon. [documento] [código]
- [2023/10/06] Curiosidad cautelosa: un enfoque novedoso para un agente de juego humano. [documento] [código]
- [2023/10/05] Coordinación LLM: evaluación y analización de habilidades de coordinación de múltiples agentes en modelos de idiomas grandes. [documento] [código]
- [2023/10/03] Agentes de Lyfe: Agentes generativos para interacciones sociales en tiempo real de bajo costo. [papel]
- [2023/10/03] Hacia la toma de decisiones incorporadas de extremo a extremo a través de un modelo de lenguaje grande multimodal: exploraciones con visión GPT4 y más allá. [documento] [código]
- [2023/10/02] SmartPlay: un punto de referencia para LLM como agentes inteligentes. [documento] [código]
- [2023/10/02] Juego de pensamientos de Avalon: batalla contra el engaño a través de la contemplación recursiva. [papel]
- [2023/10/01] Rolellm: evaluación comparativa, obtención y mejora de las habilidades de juego de roles de modelos de idiomas grandes. [documento] [código]
2023/09
- [2023/09/29] ADARefiner: Decisiones de refinación de modelos de idiomas con comentarios adaptativos. [documento] [código]
- [2023/09/29] Motivo: motivación intrínseca de la retroalimentación de inteligencia artificial. [documento] [código]
- [2023/09/29] LLM-Deliberation: Evaluación de LLM con juegos interactivos de negociación de múltiples agentes. [documento] [código]
- [2023/09/29] Sospechion-agent: jugar juegos de información imperfectos con teoría de la mente consciente de GPT-4. [documento] [código]
- [2023/09/29] Autoagentes: un marco para la generación de agentes automáticos. [documento] [código]
- [2023/09/21] El verdadero conocimiento proviene de la práctica: alinear modelos de idiomas grandes con entornos incorporados a través del aprendizaje de refuerzo. [documento] [código]
- [2023/09/18] MindAgent: Interacción de juegos emergentes. [documento] [código]
- [2023/09/14] Agentes: un marco de código abierto para agentes de idiomas autónomos. [documento] [código]
- [2023/09/09] Explorando grandes modelos de idiomas para los juegos de comunicación: un estudio empírico sobre el hombre lobo. [papel]
2023/08
- [2023/08/23] ¿Son ChatGPT y GPT-4 buenos jugadores de póker? [papel]
- [2023/08/22] ProAgent: construcción de IA cooperativa proactiva utilizando modelos de lenguaje grandes. [documento] [código]
- [2023/08/21] Agentverse: facilitar la colaboración de múltiples agentes y explorar comportamientos emergentes en los agentes. [documento] [código]
- [2023/08/19] Gameeval: Evaluación de LLM en juegos de conversación. [documento] [código]
- [2023/08/16] Autógeno: habilitando aplicaciones LLM de próxima generación a través del marco de conversación de múltiples agentes. [papel]
- [2023/08/15] Calypso: LLMS como asistentes de Dungeon Master. [papel]
- [2023/08/08] Agentsims: una caja de arena de código abierto para la evaluación del modelo de lenguaje grande. [papel]
- [2023/08/01] Metagpt: Meta Programming para un marco colaborativo de múltiples agentes. [documento] [código]
2023/07
- [2023/07/24] Tachikuma: Comprensión de las interacciones complejas con objetos multi-caracteres y novedosos por modelos de idiomas grandes. [papel]
- [2023/07/21] Percepción selectiva: optimización de descripciones estatales con aprendizaje de refuerzo para actores del modelo de idioma. [Documento] [Proyecto]
- [2023/07/12] Sayplan: base en base a modelos de idiomas grandes utilizando gráficos de escena 3D para planificación de tareas escalables. [papel]
- [2023/07/05] Construyendo agentes cooperativos incorporados modularmente con grandes modelos de idiomas. [documento] [código]
- [2023/07/04] Tapa: planificación de tareas encarnadas con modelos de idiomas grandes. [documento] [código]
2023/06
- [2023/06/20] Sprint: pre-entrenamiento de política escalable a través de la relabinación de instrucciones del lenguaje. [documento] [código]
- [2023/06/15] CHESSGPT: puente de aprendizaje de políticas y modelado de idiomas. [documento] [código]
- [2023/06/02] Omni: abierta a través de modelos de nociones humanas de interesante. [documento] [código]
- [2023/06/01] Steve-1: un modelo generativo para texto a behavior en Minecraft. [documento] [código]
2023/05
- [May-23] Cottage: Generación de juegos de aventura de texto coherente. [documento] [código]
- [2023/05/30] Alphablock: Finetuning incorporado para el razonamiento del lenguaje de la visión en la manipulación de robots. [papel]
- [2023/05/26] Jugando juegos repetidos con modelos de idiomas grandes. [papel]
- [2023/05/25] Voyager: un agente incorporado abierto con modelos de idiomas grandes. [documento] [código]
- [2023/05/25] Ghost en el Minecraft: agentes generalmente capaces para entornos de mundo abierto a través de modelos de lenguaje grandes con conocimiento y memoria basados en texto. [documento] [código]
- [2023/05/24] Primavera: estudiar papeles y razonamiento para jugar. [documento] [código]
- [2023/05/23] Mejora de la fáctica y el razonamiento en los modelos de idiomas a través del debate multiagente. [documento] [código]
- [2023/05/17] Mejora de la negociación del modelo de lenguaje con el aprendizaje de auto-juego y en contexto de la retroalimentación de la IA. [documento] [código]
- [2023/05/09] Tidybot: Asistencia de robot personalizada con modelos de idiomas grandes. [documento] [código]
- [2023/05/01] Arca: realidad aumentada con capacidad emergente interactiva del conocimiento. [papel]
2023/04
- [2023/04/07] Agentes generativos: simulacros interactivos del comportamiento humano. [documento] [código]
- [2023/04/06] ¿Pueden los modelos de idiomas grandes jugar bien los juegos de texto? Preguntas actuales de última generación y abiertos. [documento] [código]
- [ABR-23] Generación personalizada de misiones y diálogo en juegos de juego de roles: un enfoque basado en el modelo de gráfico de conocimiento y modelos de idiomas. [documento] [código]
2023/03
- [2023/03/31] Camel: agentes comunicativos para la exploración de "mente" de la sociedad de modelos de idiomas grandes. [documento] [código]
- [2023/03/29] Aprendizaje de refuerzo de habilidades y planificación para tareas de horizonte de larga duración. [documento] [código]
- [2023/03/06] Palm-E: un modelo de lenguaje multimodal incorporado. [papel]
2023/02
- [2023/02/13] guiando el pretrénselo en el aprendizaje de refuerzo con modelos de idiomas grandes. [documento] [código]
- [2023/02/12] Mariogpt: Generación de niveles de texto abierto a través de modelos de idiomas grandes. [documento] [código]
- [2023/02/03] Describa, explique, planifique y seleccione: La planificación interactiva con LLM permite agentes de tareas múltiples del mundo abierto. [documento] [código]
2023/01
- [2023/01/28] Los agentes encarnados sueñan con ovejas pixeladas: toma de decisiones encarnadas utilizando modelado mundial guiado por el idioma. [papel]
- [2023/01/21] Control de tareas múltiples del mundo abierto a través del aprendizaje de la representación de objetivos y la predicción adaptativa del horizonte. [documento] [código]
2022
- [2022/11/22] Juego de nivel humano en el juego de la diplomacia mediante la combinación de modelos de idiomas con razonamiento estratégico. [papel]
- [2022/11/21] Adquisición de habilidades robóticas a través del aumento de instrucciones con modelos en idioma de visión. [papel]
- [2022/10/24] Representaciones mundiales emergentes: explorar un modelo de secuencia entrenado en una tarea sintética. [documento] [código]
- [2022/10/05] Los modelos de idiomas grandes son detectores de errores de videojuegos de cero tiros. [documento] [código]
- [2022/08/08] Simulacros sociales: creación de prototipos poblados para sistemas de computación social. [papel]
- [2022/07/12] Monólogo interno: razonamiento encarnado a través de la planificación con modelos de idiomas. [papel]
- [2022/06/23] Video Pretratining (VPT): Aprendiendo a actuar viendo videos en línea sin etiqueta. [papel]
- [2022/06/07] Minedojo: Construcción de agentes encarnados abiertos con conocimiento a escala de Internet. [documento] [código]
Citación
Si encuentra útil este repositorio, cite nuestro documento:
@misc{xu2024survey,
title={A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges},
author={Xinrun Xu, Yuxin Wang, Chaoyi Xu, Ziluo Ding, Jiechuan Jiang, Zhiming Ding, Börje F. Karlsson},
year={2024},
eprint={2403.10249},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
Contacto