Eine Umfrage zu Spielen von Spielen und großen Modellen: Methoden, Anwendungen und Herausforderungen
? In Kürze kommen : Fügen Sie jedem Papier Ein-Sentenz-Intro hinzu.
? Nachricht
[2024/02/06] Erstellung dieses Repositorys zur Aufrechterhaltung der Liste der Papiere zu LLM-basierten Agenten für Spielspiele. Weitere Papiere kommen bald!
2024/08
- [2024/08/07] Optimus-1: Hybrid Multimodal Memory Empowered Agents Excel in Long-Horizon-Aufgaben. [Papier] [Code]
2024/07
- [2024/07/21] Videoambunny: Auf dem Weg zu Visionsassistenten für Videospiele. [Papier] [Code]
- [2024/07/05] AUTOVERSE: Eine sich entwickelbare Spielsprache zum Lernen robuster verkörperter Agenten. [Papier]
- [2024/07/02] Cradle: Stärkung der Stiftungsagenten für die allgemeine Computersteuerung. [Papier] [Projekt]
2024/06
- [2024/06/20] Zwei Giraffen in einem Dirt -Feld: Verwenden Sie das Spiel mit Spiel, um die Situationsmodellierung in großen multimodalen Modellen zu untersuchen. [Papier]
2024/05
- [2024/05/23] In Richtung einer effizienten LLM-Erdung für eine verkörperte Zusammenarbeit mit mehreren Agenten. [Papier] [Projekt]
- [2024/05/11] prompt-gaming: Eine Pilotstudie zum LLM-Evaluating Agent in einem sinnvollen Energiespiel. [Papier]
2024/04
- [2024/04/17] AgentKit: Flow Engineering mit Grafiken, nicht Codierung. [Papier] [Code]
- [2024/04/16] Selbstvertretendes kontroverses Sprachspiel verbessert die LLM-Argumentation. [Papier] [Code]
2024/03
- [2024/03/23] Bewerten Sie LLMs in Echtzeit mit Street Fighter III. [Code]
- [2024/03/19] verkörperte LLM -Agenten lernen, in organisierten Teams zusammenzuarbeiten. [Papier]
- [2024/03/18] Kann LLM-Augmented Autonomous Agents zusammenarbeiten?, Eine Bewertung ihrer kooperativen Fähigkeiten durch Schmelztiegel. [Papier]
- [2024/03/18] Envgen: Generieren und Anpassung von Umgebungen über LLMs für Trainingsbeschreibungen. [Papier]
- [2024/03/18] Minedreamer: Lernen, Anweisungen über die Kette der Imagination für die Kontrolle der simulierten Welt zu befolgen. [Papier] [Code]
- [2024/03/14] Skalierung anrichtbare Wirkstoffe in vielen simulierten Welten. [Papier]
- [2024/03/13] Hierarchisches Auto-Organisierungssystem zur Open-End-Multi-Agent-Navigation. [Papier]
- [2024/03/13] Sotopia-$ pi $: Interaktives Lernen von sozial intelligenten Sprachagenten. [Papier] [Code]
- [2024/03/08] Wird GPT-4 Doom ausführen? [Papier] [Code]
- [2024/03/05] In Richtung allgemeiner Computersteuerung: Ein multimodaler Agent für Red Dead Redemption II als Fallstudie. [Papier] [Projekt]
- [2024/03/01] Nethack mit LLMs spielen: Potential & Einschränkungen als Null-Shot-Agenten. [Papier] [Code]
2024/02
- [2024/02/29] RL-GPT: Integration von Verstärkungslernen und Code-as-Policy. [Papier]
- [2024/02/27] Agent-pro: Lernen, sich über die Reflexion und Optimierung der Politikebene zu entwickeln. [Papier] [Code]
- [2024/02/21] PCA-Bench: Bewertung multimodaler Großsprachenmodelle in der Wahrnehmungskognitionskette. [Papier] [Code]
- [2024/02/20] Was ist, wenn LLMs unterschiedliche Weltansichten haben: Simulation von außerirdischen Zivilisationen mit LLM-basierten Agenten? [Papier] [Code]
- [2024/02/07] S-Agents: Selbstorganisierende Agenten in offenen Umgebungen. [Papier]
- [2024/02/04] Verbessern Sie die Argumentation für große Sprachmodelle im Spiel -Werwolf. [Papier]
- [2024/02/02] Pokéllmon: Ein Agent für menschliche Eltern für Pokemon-Schlachten mit großartigen Modellen. [Papier] [Code]
2024/01
- [2024/01/31] Swarmbrain: Verkörperter Agent für Echtzeit-Strategiespiele Starcraft II über große Sprachmodelle. [Papier]
- [2024/01/19] Civrealm: Ein Lern- und Argumentations-Odyssey in der Zivilisation für Entscheidungsmakler. [Papier] [Code]
- [2024/01/17] Durchsuchen von Fehlerinstanzen in Video -Repositories für Gameplay. [Papier] [Daten]
- [2024/01/04] Pokergpt: Ein leichter Löser mit dem End-zu-End für Multi-Player Texas Hold'em über großes Sprachmodell. [Papier]
2023/12
- [2023/12/29] Zusammenarbeit im laufenden Fliegen: Erforschung von Sprachagenten für Ad -hoc -Teamwork im Avalon -Spiel. [Papier]
- [2023/12/23] LLM-gestützte hierarchische Sprachagent für Echtzeit-Human-AI-Koordination. [Papier] [Projekt]
- [2023/12/19] Großsprachige Modelle spielen Starcraft II: Benchmarks und eine Kette des Zusammenfassungsansatzes. [Papier]
- [2023/12/14] Auto MC-Reward: automatisiertes dichtes Belohnungsdesign mit großen Sprachmodellen für Minecraft. [Papier]
- [2023/12/12] MP5: Ein multi-modales offenes verkörpertes System in Minecraft über aktive Wahrnehmung. [Papier] [Code]
- [2023/12/08] Apollo's Oracle: Retrieval-Augmented Begründung in Multi-Agent-Debatten. [Papier] [Code]
- [2023/12/08] Glitchbench: Können große multimodale Modelle Videospiel -Pannen erkennen? [Papier] [Code]
- [2023/12/07] Ein Rahmen zur Erforschung der Wahrnehmung des LLM-generierten Dialogs in kommerziellen Videospielen. [Papier] [Website]
- [2023/12/05] Kreative Agenten: Ermächtigung von Agenten mit Vorstellungskraft für kreative Aufgaben. [Papier] [Code]
- [2023/12/04] Visuelle Encoder für dateneffizientes Nachahmungslernen in modernen Videospielen. [Papier]
- [2023/12/02] Erstellen von Open-End-Anpassungsmittel über die bidirektionale Anpassung der Sprachpolitik. [Papier]
- [2023/12/01] Entschlüsselung digitaler Detectives: Verhalten von LLM-Verhaltensweisen und -funktionen bei Multi-Agent-Mystery-Spielen. [Papier]
2023/11
- [2023/11/28] Krieg und Frieden (Waragent): Multi-Agent-Simulation von Weltkriegen mit großer Sprache. [Papier] [Code]
- [2023/11/26] Siehe und denke: verkörpertes Agent in virtueller Umgebung. [Papier] [Code]
- [2023/11/20] Designgpt: Multi-Agent-Zusammenarbeit im Design. [Papier]
- [2023/11/14] Magie: Untersuchung des großen Sprachmodells mit Multi-Agent in Kognition, Anpassungsfähigkeit, Rationalität und Zusammenarbeit. [Papier] [Code]
- [2023/11/10] JARVIS-1: Multitask-Agenten mit offener Welt mit maßstabsgeräten multimodalen Sprachmodellen. [Papier] [Code]
- [2023/11/08] Anpassung: AS-NEEDED-Zersetzung und Planung mit Sprachmodellen. [Papier] [Code]
2023/10
- [2023/10/31] Nutzung von Word -Erraten -Spielen, um die Intelligenz großer Sprachmodelle zu bewerten. [Papier] [Code]
- [2023/10/29] Sprachagenten mit Verstärkungslernen für strategisches Spiel im Werwolfspiel. [Papier]
- [2023/10/23] LLM-basierte Agent Society-Untersuchung: Zusammenarbeit und Konfrontation im Avalon-Gameplay. [Papier]
- [2023/10/20] Steve-Eye: Ausrüsten von LLM-basierten verkörperten Wirkstoffen mit visueller Wahrnehmung in offenen Welten. [Papier] [Code]
- [2023/10/18] Sotopie: Interaktive Bewertung der sozialen Intelligenz in Sprachagenten. [Papier] [Code]
- [2023/10/16] Charakter-LlM: Ein trainierbarer Agent für das Rollenspiel. [Papier] [Code]
- [2023/10/13] LLAMA Rider: Spurring Großsprachenmodelle, um die offene Welt zu erkunden. [Papier]
- [2023/10/12] GAMEGPT: Multi-Agent Collaborative Framework für die Spielentwicklung. [Papier]
- [2023/10/12] Groot: Lernen, Anweisungen zu befolgen, indem Sie Gameplay -Videos ansehen. [Papier] [Code]
- [2023/10/12] Octopus: Verkörperter Programmierer für Visionsprachen aus Umweltfeedback. [Papier] [Code]
- [2023/10/10] Metaagents: Simulation der Interaktionen menschlicher Verhaltensweisen für LLM-basierte aufgabenorientierte Koordination durch kollaborative Generative. [Papier]
- [2023/10/09] Humanoide Wirkstoffe: Plattform zur Simulation menschlicher Generativmittel. [Papier] [Code]
- [2023/10/08] Avalonbench: Bewertung von LLMs, die das Spiel von Avalon spielen. [Papier] [Code]
- [2023/10/06] Vorsichtliche Neugier: Ein neuartiger Ansatz für einen menschlichen Gameplay-Agenten. [Papier] [Code]
- [2023/10/05] LLM-Coordination: Bewertung und Analyse von Koordinationsfähigkeiten in Großer Agenten in großen Sprachmodellen. [Papier] [Code]
- [2023/10/03] Lyfe-Agenten: Generative Agents für kostengünstige soziale Echtzeit-Interaktionen. [Papier]
- [2023/10/03] In Richtung end-zu-end-verkörperter Entscheidungsfindung über multi-modales Großsprachmodell: Erkundungen mit GPT4-Vision und darüber hinaus. [Papier] [Code]
- [2023/10/02] SmartPlay: Ein Maßstab für LLMs als intelligente Agenten. [Papier] [Code]
- [2023/10/02] Avalons Gedankenspiel: Kampf gegen Täuschung durch rekursive Kontemplation. [Papier]
- [2023/10/01] RolellM: Benchmarking, Auslösen und Verbesserung der Rollenspielfähigkeiten großer Sprachmodelle. [Papier] [Code]
2023/09
- [2023/09/29] Adarefiner: Verfeinerungsentscheidungen von Sprachmodellen mit adaptivem Feedback. [Papier] [Code]
- [2023/09/29] Motiv: Intrinsische Motivation aus Feedback für künstliche Intelligenz. [Papier] [Code]
- [2023/09/29] LLM-Deliberation: Bewertung von LLMs mit interaktiven Multi-Agent-Verhandlungsspielen. [Papier] [Code]
- [2023/09/29] Misstrauen-Agent: Unvollkommene Informationsspiele mit Theory of Mind Aware GPT-4 spielen. [Papier] [Code]
- [2023/09/29] Autoagents: Ein Framework für die automatische Erzeugung von Agenten. [Papier] [Code]
- [2023/09/21] Das wahre Wissen kommt aus der Praxis: Ausrichtung von Großsprachenmodellen mit verkörperten Umgebungen durch Verstärkungslernen. [Papier] [Code]
- [2023/09/18] Mindagent: Emergent Gaming -Interaktion. [Papier] [Code]
- [2023/09/14] Agenten: Ein Open-Source-Rahmen für autonome Sprachagenten. [Papier] [Code]
- [2023/09/09] Erforschung großer Sprachmodelle für Kommunikationsspiele: Eine empirische Studie über Werwolf. [Papier]
2023/08
- [2023/08/23] Sind Chatgpt- und GPT-4 gute Pokerspieler?-Eine Vor-Flop-Analyse. [Papier]
- [2023/08/22] Proagent: Erstellung proaktiver kooperativer KI mit großer Sprachmodellen. [Papier] [Code]
- [2023/08/21] Agentverse: Erleichterung der Zusammenarbeit mit mehreren Agenten und Erforschung neuer Verhaltensweisen in Agenten. [Papier] [Code]
- [2023/08/19] GameVal: Bewertung von LLMs bei Konversationsspielen. [Papier] [Code]
- [2023/08/16] Autogen: Aktivieren von LLM-Anwendungen der nächsten Generation über ein Multi-Agent-Konversationsrahmen. [Papier]
- [2023/08/15] Calypso: LLMs als Assistenten des Dungeon -Meisters. [Papier]
- [2023/08/08] Agenten: Ein Open-Source-Sandkasten für die Bewertung des großsprachigen Modells. [Papier]
- [2023/08/01] Metagpt: Meta-Programmierung für ein kollaboratives Multi-Agent-Rahmen. [Papier] [Code]
2023/07
- [2023/07/24] Tachikuma: Verständnis komplexer Wechselwirkungen mit Multi-Charakter- und neuartigen Objekten durch große Sprachmodelle. [Papier]
- [2023/07/21] Selektive Wahrnehmung: Optimierung der Zustandsbeschreibungen mit Verstärkungslernen für Sprachmodellakteure. [Papier] [Projekt]
- [2023/07/12] SayPlan: Erde große Sprachmodelle mithilfe von 3D -Szenengrafiken für skalierbare Aufgabenplanung. [Papier]
- [2023/07/05] Aufbau kooperativer Wirkstoffe modular mit großen Sprachmodellen. [Papier] [Code]
- [2023/07/04] TAPA: Verkörperte Aufgabenplanung mit großen Sprachmodellen. [Papier] [Code]
2023/06
- [2023/06/20] Sprint: Skalierbares Richtlinien vor dem Training über Sprachanweisung Relabeling. [Papier] [Code]
- [2023/06/15] CHESSGPT: Überbrückungspolitiklernen und Sprachmodellierung. [Papier] [Code]
- [2023/06/02] Omni: Open-Endness über Modelle menschlicher Vorstellungen von Interessantheit. [Papier] [Code]
- [2023/06/01] Steve-1: Ein generatives Modell für Text-to-Behavior in Minecraft. [Papier] [Code]
2023/05
- [Mai-23] Cottage: Kohärente Textabenteuerspiel-Generation. [Papier] [Code]
- [2023/05/30] Alphablock: Verkörperte Finetuning für das Sehvermögen in der Manipulation von Roboter. [Papier]
- [2023/05/26] Wiederholte Spiele mit großsprachigen Modellen spielen. [Papier]
- [2023/05/25] Voyager: Ein offenes verkörpertes Wirkstoff mit großen Sprachmodellen. [Papier] [Code]
- [2023/05/25] Geister im Minecraft: Im Allgemeinen fähige Agenten für Umgebungen mit offener Welt über Großsprachenmodelle mit textbasiertem Wissen und Gedächtnis. [Papier] [Code]
- [2023/05/24] Frühling: Untersuchung von Papieren und Argumentation, um Spiele zu spielen. [Papier] [Code]
- [2023/05/23] Verbesserung der Tatsache und des Arguments in Sprachmodellen durch Multiagent -Debatte. [Papier] [Code]
- [2023/05/17] Verbesserung der Sprachmodellverhandlung mit Selbsteinstellung und Kontext-Lernen aus KI-Feedback. [Papier] [Code]
- [2023/05/09] TidyBot: Personalisierte Roboterunterstützung bei großen Sprachmodellen. [Papier] [Code]
- [2023/05/01] ARK: Augmented Reality mit Wissen interaktiver aufstrebender Fähigkeiten. [Papier]
2023/04
- [2023/04/07] Generative Agents: Interaktive Simulacra des menschlichen Verhaltens. [Papier] [Code]
- [2023/04/06] Können große Sprachmodelle Textspiele gut spielen? Aktuelle Stand der Technik und offene Fragen. [Papier] [Code]
- [Apr.-23] Personalisierte Quest- und Dialoggenerierung in Rollenspielspielen: Ein modellbasierter Ansatz von Wissensgraf- und Sprach. [Papier] [Code]
2023/03
- [2023/03/31] Kamel: Kommunikationsmittel für die Erforschung der Gesellschaft mit großer Sprache. [Papier] [Code]
- [2023/03/29] Lernen und Planung von Long-Horizon-Aufgaben mit offener Welt. [Papier] [Code]
- [2023/03/06] Palm-e: Ein verkörpertes multimodales Sprachmodell. [Papier]
2023/02
- [2023/02/13] Führung des Vorbaues im Verstärkungslernen mit großsprachigen Modellen. [Papier] [Code]
- [2023/02/12] Mariogpt: Open-End-Text2Level-Generation durch große Sprachmodelle. [Papier] [Code]
- [2023/02/03] Beschreiben, erklären, planen und auswählen: Interaktive Planung mit LLMs ermöglicht Open-World Multitask-Agenten. [Papier] [Code]
2023/01
- [2023/01/28] Den verkörperten Agenten träumen von pixelierten Schafen: verkörperte Entscheidungsfindung unter Verwendung einer sprachgeführten Weltmodellierung. [Papier]
- [2023/01/21] Open-World Multi-Task-Kontrolle durch Ziel-Kenntnis-Repräsentationslernen und adaptive Horizontvorhersage. [Papier] [Code]
2022
- [2022/11/22] Human-Level-Spiel im Spiel der Diplomatie durch Kombination von Sprachmodellen mit strategischem Denken. [Papier]
- [2022/11/21] Roboter-Fähigkeiten erfasst über Anweisungen mit Sehversprachmodellen. [Papier]
- [2022/10/24] Emergent World Repräsentationen: Erforschung eines Sequenzmodells, das auf einer synthetischen Aufgabe trainiert wurde. [Papier] [Code]
- [2022/10/05] Große Sprachmodelle sind ziemlich gute Null-Shot-Videospiel-Fehlerdetektoren. [Papier] [Code]
- [2022/08/08] Soziales Simulacra: Erstellen besiedelter Prototypen für Social Computing -Systeme. [Papier]
- [2022/07/12] innerer Monolog: Verkörperte Argumentation durch Planung mit Sprachmodellen. [Papier]
- [2022/06/23] Video Pretraining (VPT): Lernen, durch unbelebte Online -Videos zu handeln. [Papier]
- [2022/06/07] Minedojo: Aufbau offener verkörperter Wirkstoffe mit Internet-Skale-Kenntnissen. [Papier] [Code]
Zitat
Wenn Sie dieses Repository nützlich finden, zitieren Sie bitte unser Papier:
@misc{xu2024survey,
title={A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges},
author={Xinrun Xu, Yuxin Wang, Chaoyi Xu, Ziluo Ding, Jiechuan Jiang, Zhiming Ding, Börje F. Karlsson},
year={2024},
eprint={2403.10249},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
Kontakt