게임 재생 에이전트 및 대규모 모델에 대한 설문 조사 : 방법, 응용 프로그램 및 과제
? 곧 출시 예정 : 각 용지에 한 문장 소개를 추가하십시오.
? 소식
[2024/02/06]이 저장소 제작 LLM 기반 에이전트에 대한 논문 목록을 게임 재생. 더 많은 서류가 곧 올 것입니다!
2024/08
- [2024/08/07] OPTIMUS-1 : 하이브리드 멀티 모달 메모리 강화제 에이전트는 장기 고리온 작업에서 탁월합니다. [종이] [코드]
2024/07
- [2024/07/21] VideogameBunny : 비디오 게임의 비전 보조원을 향해. [종이] [코드]
- [2024/07/05] Autoverse : 강력한 구체화 된 에이전트를 배우기위한 진화 가능한 게임 언어. [종이]
- [2024/07/02] 크래들 : 일반적인 컴퓨터 제어를 향한 재단 에이전트를 강화합니다. [종이] [프로젝트]
2024/06
- [2024/06/20] 흙 필드의 기린 2 개 : 게임 플레이를 사용하여 대규모 멀티 모달 모델의 상황 모델링을 조사합니다. [종이]
2024/05
- [2024/05/23] 구체화 된 다중 에이전트 협력을위한 효율적인 LLM 접지를 향해. [종이] [프로젝트]
- [2024/05/11] 프롬프트 게임 : 의미있는 에너지 게임에서 LLM- 평가 에이전트에 대한 파일럿 연구. [종이]
2024/04
- [2024/04/17] Agentkit : 코딩이 아닌 그래프가있는 흐름 엔지니어링. [종이] [코드]
- [2024/04/16] 자체 연기 적대 언어 게임은 LLM 추론을 향상시킵니다. [종이] [코드]
2024/03
- [2024/03/23] Street Fighter III에서 LLMS를 실시간으로 평가합니다. [암호]
- [2024/03/19] 구체화 된 LLM 요원은 조직화 된 팀에서 협력하는 법을 배웁니다. [종이]
- [2024/03/18] LLM-Augmented Autonomous Agents는 용융 냄비를 통한 협력 능력의 평가 인 협력 할 수 있습니까? [종이]
- [2024/03/18] ENVGEN : 구체화 된 제제를 위해 LLM을 통해 환경을 생성하고 적응시키는 것. [종이]
- [2024/03/18] MinedReamer : 시뮬레이션 세계 제어를위한 상상 체인을 통해 지시를 따르는 법을 배우기. [종이] [코드]
- [2024/03/14] 많은 시뮬레이션 된 세계에서 지시 가능한 에이전트 스케일링. [종이]
- [2024/03/13] 개방형 다중 에이전트 내비게이션을위한 계층 적 자동 조직 시스템. [종이]
- [2024/03/13] Sotopia- $ pi $ : 사회적 지능형 언어 에이전트의 대화식 학습. [종이] [코드]
- [2024/03/08] GPT-4가 Doom을 운영할까요? [종이] [코드]
- [2024/03/05] 일반 컴퓨터 제어를 향한 : 사례 연구로서 Red Dead Redemption II의 다중 모드 에이전트. [종이] [프로젝트]
- [2024/03/01] LLMS로 Nethack을 연주합니다 : 제로 샷 에이전트로서의 잠재력 및 제한. [종이] [코드]
2024/02
- [2024/02/29] RL-GPT : 강화 학습 및 정책 코드 통합. [종이]
- [2024/02/27] Agent-Pro : 정책 수준의 반영 및 최적화를 통해 진화하는 법을 배우기. [종이] [코드]
- [2024/02/21] PCA-Bench : 인식 인식 행동 체인에서 다중 모드 대형 언어 모델 평가. [종이] [코드]
- [2024/02/20] LLM이 다른 세계관을 가지고 있다면 어떻게해야합니까? LLM 기반 요원과 외계인 문명을 시뮬레이션합니다. [종이] [코드]
- [2024/02/07] S-Agents : 개방형 환경에서 자체 조직제. [종이]
- [2024/02/04] 게임 늑대 인간의 대형 언어 모델에 대한 추론을 향상시킵니다. [종이]
- [2024/02/02] Pokéllmon : 대형 언어 모델과의 포켓몬 전투를위한 인간 부문 에이전트. [종이] [코드]
2024/01
- [2024/01/31] Swarmbrain : 대형 언어 모델을 통한 실시간 전략 게임 스타 크래프트 II의 구체화 된 에이전트. [종이]
- [2024/01/19] Civrealm : 의사 결정 요원을위한 문명의 학습과 추론 오디세이. [종이] [코드]
- [2024/01/17] 게임 플레이 비디오 저장소에서 버그 인스턴스 검색. [종이] [데이터]
- [2024/01/04] Pokergpt : 대형 언어 모델을 통해 멀티 플레이어 Texas Hold'em을위한 엔드 투 엔드 경량 솔버. [종이]
2023/12
- [2023/12/29] 즉석 협력 : Avalon 게임에서 임시 팀워크를위한 언어 에이전트 탐색. [종이]
- [2023/12/23] 실시간 인간 -AI 조정을위한 LLM 구동 계층 언어 에이전트. [종이] [프로젝트]
- [2023/12/19] 대형 언어 모델은 Starcraft II : 벤치 마크 및 요약 접근 방식을 재생합니다. [종이]
- [2023/12/14] Auto MC-Reward : Minecraft를위한 대형 언어 모델을 갖춘 자동 조밀 한 보상 디자인. [종이]
- [2023/12/12] MP5 : 활성 인식을 통해 마인 크래프트에서 다중 모달 개방형 구체화 시스템. [종이] [코드]
- [2023/12/08] Apollo의 Oracle : 다중 에이전트 토론에서 검색된 추론. [종이] [코드]
- [2023/12/08] Glitchbench : 대형 멀티 모달 모델이 비디오 게임 결함을 감지 할 수 있습니까? [종이] [코드]
- [2023/12/07] 상업용 비디오 게임에서 LLM 생성 대화에 대한 플레이어 인식을 탐색하기위한 프레임 워크. [종이] [웹 사이트]
- [2023/12/05] 크리에이티브 에이전트 : 창조적 인 작업에 대한 상상력을 가진 에이전트에 힘을 실어줍니다. [종이] [코드]
- [2023/12/04] 현대 비디오 게임에서 데이터 효율적인 모방 학습을위한 시각적 인코더. [종이]
- [2023/12/02] 언어 정책 양방향 적응을 통한 개방형 구체화제 구축. [종이]
- [2023/12/01] 디지털 형사 해독 : 다중 에이전트 미스터리 게임에서 LLM 행동 및 기능 이해. [종이]
2023/11
- [2023/11/28] 전쟁과 평화 (Waragent) : 세계 대전의 대형 언어 모델 기반의 다중 에이전트 시뮬레이션. [종이] [코드]
- [2023/11/26] 가상 환경에서 구체화 된 에이전트를 참조하고 생각합니다. [종이] [코드]
- [2023/11/20] DesignGpt : 디자인의 다중 에이전트 협력. [종이]
- [2023/11/14] Magic : 인식, 적응성, 합리성 및 협력에서 다중 에이전트에 걸쳐 큰 언어 모델의 조사. [종이] [코드]
- [2023/11/10] JARVIS-1 : 메모리-구분 다중 모드 언어 모델을 갖춘 오픈 월드 멀티 태스킹 에이전트. [종이] [코드]
- [2023/11/08] 적응 : 언어 모델을 사용한 분해 및 계획. [종이] [코드]
2023/10
- [2023/10/31] 대형 언어 모델의 지능을 평가하기 위해 단어 추측 게임을 활용합니다. [종이] [코드]
- [2023/10/29] 늑대 인간 게임에서 전략적 놀이를위한 강화 학습을 가진 언어 에이전트. [종이]
- [2023/10/23] LLM 기반 에이전트 사회 조사 : Avalon 게임 플레이의 협력 및 대립. [종이]
- [2023/10/20] Steve-Eye : 개방형 세계에서 시각적 인식을 갖는 LLM 기반 구현제를 장착합니다. [종이] [코드]
- [2023/10/18] 소토피아 : 언어 에이전트의 사회적 지능에 대한 대화식 평가. [종이] [코드]
- [2023/10/16] 문자 -lm : 롤 플레잉을위한 훈련 가능한 에이전트. [종이] [코드]
- [2023/10/13] Llama Rider : 열린 세계를 탐험하기 위해 큰 언어 모델을 유발합니다. [종이]
- [2023/10/12] GameGpt : 게임 개발을위한 다중 에이전트 협업 프레임 워크. [종이]
- [2023/10/12] Groot : 게임 플레이 비디오를 보면서 지침을 따르는 법을 배우십시오. [종이] [코드]
- [2023/10/12] 옥토퍼스 : 환경 피드백에서 구체화 된 비전 언어 프로그래머. [종이] [코드]
- [2023/10/10] Metaagents : 공동 생성 에이전트를 통한 LLM 기반 작업 중심 조정에 대한 인간 행동의 상호 작용을 시뮬레이션합니다. [종이]
- [2023/10/09] 휴머노이드 제제 : 인간과 유사한 생성 제를 시뮬레이션하기위한 플랫폼. [종이] [코드]
- [2023/10/08] Avalonbench : Avalon 게임을하는 LLM 평가. [종이] [코드]
- [2023/10/06] 신중한 호기심 : 인간과 같은 게임 플레이 에이전트에 대한 새로운 접근. [종이] [코드]
- [2023/10/05] LLM- 조정 : 대형 언어 모델에서 다중 에이전트 조정 능력 평가 및 분석. [종이] [코드]
- [2023/10/03] Lyfe 에이전트 : 저렴한 실시간 소셜 상호 작용을위한 생성 에이전트. [종이]
- [2023/10/03] 다중 모달 대형 언어 모델을 통한 엔드 투 엔드 구체화 의사 결정을 향한 것 : GPT4 vision 및 그 너머의 탐색. [종이] [코드]
- [2023/10/02] SmartPlay : 지능형 에이전트로서 LLM의 벤치 마크. [종이] [코드]
- [2023/10/02] Avalon의 생각 게임 : 재귀 적 묵상을 통한 속임수와의 싸움. [종이]
- [2023/10/01] Rolellm : 대형 언어 모델의 롤 플레잉 능력 향상, 벤치마킹, 유도 및 향상. [종이] [코드]
2023/09
- [2023/09/29] Adarefiner : 적응 형 피드백을 가진 언어 모델의 정제 결정. [종이] [코드]
- [2023/09/29] 주제 : 인공 지능 피드백의 고유 동기. [종이] [코드]
- [2023/09/29] LLM 변형 : 대화식 다중 에이전트 협상 게임을 사용한 LLM 평가. [종이] [코드]
- [2023/09/29] 의심 에이전트 : 마음의 이론 인식 GPT-4를 가진 불완전한 정보 게임을 재생합니다. [종이] [코드]
- [2023/09/29] Autoagents : 자동 에이전트 생성을위한 프레임 워크. [종이] [코드]
- [2023/09/21] 진정한 지식은 실습에서 비롯됩니다 : 대형 언어 모델을 강화 학습을 통해 구체화 된 환경과 정렬합니다. [종이] [코드]
- [2023/09/18] Mindagent : 출현 게임 상호 작용. [종이] [코드]
- [2023/09/14] 에이전트 : 자율 언어 에이전트를위한 오픈 소스 프레임 워크. [종이] [코드]
- [2023/09/09] 커뮤니케이션 게임을위한 큰 언어 모델 탐색 : 늑대 인간에 대한 경험적 연구. [종이]
2023/08
- [2023/08/23] Chatgpt 및 GPT-4 Good Poker 플레이어는?-프리 플롭 분석입니다. [종이]
- [2023/08/22] Proagent : 대형 언어 모델을 사용하여 사전 협력 AI 구성. [종이] [코드]
- [2023/08/21] Agentverse : 다중 에이전트 협력 촉진 및 에이전트의 출현 행동 탐색. [종이] [코드]
- [2023/08/19] GameEval : 대화 게임에 대한 LLM 평가. [종이] [코드]
- [2023/08/16] Autogen : 다중 에이전트 대화 프레임 워크를 통해 차세대 LLM 응용 프로그램 활성화. [종이]
- [2023/08/15] Calypso : Dungeon Master 's Assistants로서의 LLM. [종이]
- [2023/08/08] 에이전트 : 대형 언어 모델 평가를위한 오픈 소스 샌드 박스. [종이]
- [2023/08/01] Metagpt : 다중 에이전트 공동 작업 프레임 워크를위한 메타 프로그래밍. [종이] [코드]
2023/07
- [2023/07/24] Tachikuma : 대형 언어 모델에 의한 다중 문자 및 새로운 대상과의 복잡한 상호 작용 이해. [종이]
- [2023/07/21] 선택적 인식 : 언어 모델 행위자에 대한 강화 학습을 통해 상태 설명 최적화. [종이] [프로젝트]
- [2023/07/12] SayPlan : 확장 가능한 작업 계획을위한 3D 장면 그래프를 사용하여 대형 언어 모델 접지. [종이]
- [2023/07/05] 대형 언어 모델로 모듈 식에있는 협동 조합 구체 에이전트 구축. [종이] [코드]
- [2023/07/04] Tapa : 대형 언어 모델을 사용한 구체화 된 작업 계획. [종이] [코드]
2023/06
- [2023/06/20] 스프린트 : 언어 명령을 통한 확장 가능한 정책 사전 훈련. [종이] [코드]
- [2023/06/15] Chessgpt : 정책 학습 및 언어 모델링 브리징. [종이] [코드]
- [2023/06/02] Omni : 인간의 흥미로운 개념 모델을 통한 개방형. [종이] [코드]
- [2023/06/01] Steve-1 : Minecraft의 텍스트 간 행동을위한 생성 모델. [종이] [코드]
2023/05
- [5 월 23 일] 코티지 : 일관된 텍스트 어드벤처 게임 세대. [종이] [코드]
- [2023/05/30] Alphablock : 로봇 조작에서 시력 언어 추론을위한 구체화 된 양조. [종이]
- [2023/05/26] 큰 언어 모델로 반복 게임을 재생합니다. [종이]
- [2023/05/25] Voyager : 대형 언어 모델을 가진 개방형 구현제. [종이] [코드]
- [2023/05/25] Minecraft의 유령 : 일반적으로 텍스트 기반 지식과 기억을 가진 대형 언어 모델을 통해 오픈 월드 환경을위한 유능한 에이전트. [종이] [코드]
- [2023/05/24] 봄 : 논문 연구와 게임을하는 추론. [종이] [코드]
- [2023/05/23] 다중 기관 토론을 통해 언어 모델의 사실과 추론 개선. [종이] [코드]
- [2023/05/17] AI 피드백에서 자체 플레이 및 컨텍스트 학습과의 언어 모델 협상 향상. [종이] [코드]
- [2023/05/09] TIDYBOT : 대형 언어 모델에 대한 개인화 된 로봇 지원. [종이] [코드]
- [2023/05/01] ARK : 지식 대화식 출현 능력을 가진 증강 현실. [종이]
2023/04
- [2023/04/07] 생성제 : 인간 행동의 대화식 시뮬라 크라. [종이] [코드]
- [2023/04/06] 대형 언어 모델이 텍스트 게임을 잘 할 수 있습니까? 현재 최신 및 개방형 질문. [종이] [코드]
- 롤 플레잉 게임에서 개인화 된 퀘스트 및 대화 생성 : 지식 그래프 및 언어 모델 기반 접근법. [종이] [코드]
2023/03
- [2023/03/31] 낙타 : 대형 언어 모델 사회의``마음 ''탐사를위한 의사 소통 요원. [종이] [코드]
- [2023/03/29] 기술 강화 학습 및 오픈 월드 장거리 호라이즌 작업에 대한 계획. [종이] [코드]
- [2023/03/06] Palm-E : 구현 된 다중 모드 언어 모델. [종이]
2023/02
- [2023/02/13] 대형 언어 모델로 강화 학습의 사전 여지가 안내. [종이] [코드]
- [2023/02/12] Mariogpt : 대형 언어 모델을 통한 개방형 텍스트 2 레벨 생성. [종이] [코드]
- [2023/02/03] 설명, 설명, 계획 및 선택 : LLM을 사용한 대화식 계획을 사용하면 오픈 월드 멀티 태스킹 에이전트가 가능합니다. [종이] [코드]
2023/01
- [2023/01/28] 구체화 된 요원은 픽셀 화 된 양의 꿈 : 언어 가이드 세계 모델링을 사용한 구체화 된 의사 결정. [종이]
- [2023/01/21] 목표 인식 표현 학습 및 적응 지평 예측을 통한 오픈 월드 멀티 태스킹 제어. [종이] [코드]
2022
- [2022/11/22] 언어 모델을 전략적 추론과 결합하여 외교 게임에서 인간 차원의 플레이. [종이]
- [2022/11/21] 비전 언어 모델을 사용한 교육 확대를 통한 로봇 기술 획득. [종이]
- [2022/10/24] 출현 세계 표현 : 합성 작업에 대한 훈련 된 시퀀스 모델 탐색. [종이] [코드]
- [2022/10/05] 대형 언어 모델은 꽤 좋은 제로 샷 비디오 게임 버그 탐지기입니다. [종이] [코드]
- [2022/08/08] Social Simulacra : 소셜 컴퓨팅 시스템을위한 인구의 프로토 타입 생성. [종이]
- [2022/07/12] 내부 독백 : 언어 모델로 계획을 통한 구체화 된 추론. [종이]
- [2022/06/23] 비디오 프리 트레인 (VPT) : 표지되지 않은 온라인 비디오를 보면서 행동하는 법을 배우십시오. [종이]
- [2022/06/07] Minedojo : 인터넷 규모 지식을 가진 개방형 구체 에이전트 구축. [종이] [코드]
소환
이 저장소가 유용하다고 생각되면 우리 논문을 인용하십시오.
@misc{xu2024survey,
title={A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges},
author={Xinrun Xu, Yuxin Wang, Chaoyi Xu, Ziluo Ding, Jiechuan Jiang, Zhiming Ding, Börje F. Karlsson},
year={2024},
eprint={2403.10249},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
연락하다