Agent Awesome LLM propulsé
Grâce aux capacités impressionnantes de planification, de raisonnement et d'appel d'outils des modèles de grande langue (LLM), les gens étudient activement et développent des agents alimentés par LLM. Ces agents sont possibles à résoudre de manière autonome (et en collaboration) des tâches complexes ou simuler les interactions humaines.
Notre objectif avec ce projet est de construire une collection exhaustive de ressources impressionnantes pertinentes pour les agents alimentés par LLM englobant des papiers, des référentiels, etc. Nous nous efforçons de les tenir à jour régulièrement et en continu. Nous apprécions grandement toute contribution via PRS, problèmes, e-mails ou autres méthodes.
Notez que ce référentiel n'est pas sous maintenance active. Il contient principalement des articles qui apparaissent avant octobre 2023, avec plusieurs autres articles. Si vous souhaitez que votre papier soit inclus, n'hésitez pas à initier une demande de traction.
- Papiers
- Solveur de tâches autonomes
- Raisonnement général et planification et outil utilisant
- Coopération multi-agents
- Framework et open-source
- Application
- Agents Web
- Agents RL
- Robotique et IA incarnée
- Jeu et jeu de rôle
- Autres applications
- Digne de confiance
- Simulation d'interaction humaine
- Interaction humaine-agent
- LLMS alimentés aux agents
- Référence
- Enquête et tutoriel
- Projets open source
- Projets de solveur de tâches autonomes
- Projets de simulation multi-agents
- Perspectives
- Autres sources connexes
- Reconnaissance
Papiers
pour les papiers avec> 50 citations ou référentiels avec> 200 étoiles.
pour les articles acceptés par des conférences / revues réputées.
Solveur de tâches autonomes
Raisonnement général et planification et outil utilisant
- [Mai 2024] «Formation hors ligne des agents du modèle de langue avec des fonctions comme des poids apprenables». Shaokun Zhang (PSU) et al. ICML 2024. [Paper] [Code]
- [MAR 2024] "Agent-Flan: Concevoir des données et des méthodes de réglage efficace des agents pour les modèles de gros langues." Zehui Chen (USTC) et al. arXiv. [Paper] [Code] [Page du projet]
- [Déc. 2023] "CLOVA: un assistant visuel en boucle fermée avec utilisation et mise à jour de l'outil." Zhi Gao (Bigai) et al. arXiv. [Paper] [Code] [Page du projet]
- [Décembre 2023] "SayCanpay: planification heuristique avec des modèles de gros langues en utilisant des connaissances du domaine apprenables." Rishi Hazra et al. AAAI 2024 [PAPIER] [CODE] [PAGE DE PROJET]
- [Octobre 2023] "La recherche d'arbre d'agent linguistique unifie le raisonnement et la planification dans les modèles de langue." Andy Zhou (UIUC) et al. arXiv. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Les modèles de grands langues ne peuvent pas encore corriger le raisonnement auto-corrigé." Jie Huang (UIUC) et al. ICLR 2024. [Papier]
- [Octobre 2023] "Adapter les agents LLM par la communication". Kuan Wang (Gatech et Microsoft) et al. arXiv. [papier]
- [Octobre 2023] "Chain d'outils *: Navigation d'espace d'action efficace dans les modèles de grande langue avec une * recherche" Yuchen Zhuang (Gatech & Adobe) et al. ICLR 2024. [Papier]
- [Sept. 2023] "Avis: Informations visuelles autonomes recherche avec de grands modèles de langue." Ziniu Hu (Google) et al. Neirips 2023. [Papier]
- [Sept. 2023] "Raison de l'avenir, agir pour l'instant: un cadre de principe pour les agents LLM autonomes avec une efficacité d'échantillon prouvable." Zhihan Liu (Nord-Ouest) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sept. 2023] "La mise à la terre autonome: grands agents du modèle de langue avec un apprentissage des compétences aligné par le langage." Shaohii Peng (Cas) et al. arXiv. [papier]
- [Août 2023] "Expulsion: les agents LLM sont des apprenants expérientiels." Andrew Zhao (Thu) et al. arXiv. [papier]
- [Août 2023] "Intégration synergique des modèles de grands langues et des architectures cognitives pour une IA robuste: une analyse exploratoire." Oscar J. Romero (CMU) et al. arXiv. [papier]
- [Août 2023] "Planification dynamique avec un LLM". Gautier Dagan (U d'Édimbourg) et al. arXiv. [papier] [Code]
- [Août 2023] "Retro-orroformer: agents rétrospectifs de grande langue avec optimisation du gradient de politique." Weiran Yao (Salesforce) et al. arXiv. [papier]
- [Mai 2023] "Rewoo: Découplage du raisonnement des observations pour des modèles de langage augmentés efficaces." Binfeng Xu et al. arXiv. [papier] [Code]
- [Mai 2023] "Swiftsage: un agent génératif avec une réflexion rapide et lente pour les tâches interactives complexes." Bill Yuchen Lin (AI2) et al. Neirips 2023. [Papier] [Code] [Page du projet]
- [Mai 2023] "Adaplanner: planification adaptative à partir de commentaires avec les modèles de langue." Haotian Sun (Gatech) et al. NIRIPS 2023. [Paper] [Code]
- [Mai 2022] "Le raisonnement avec le modèle de langue est la planification avec le modèle mondial." Shibo Hao (UCSD) et al. EMNLP 2023. [Paper] [Code] [Page du projet]
- [Mai 2023] "Tirer parti des modèles de grands langues pré-formés pour construire et utiliser des modèles mondiaux pour la planification des tâches basée sur des modèles". Lin Guan (ASU) et al. Neirips 2023. [Papier] [Code] [Page du projet]
- [Mai 2023] "Chatcot: raisonnement en chaîne de pensées auprès d'outils sur les modèles de grande langue basés sur le chat." Zhiceng Chen (RUC) et al. Résultats EMNLP 2023. [papier] [Code]
- [Mai 2023] "Critique: les modèles de grands langues peuvent s'auto-corriger avec une critique interactive-outil." Zhibin Gou (Thu & Microsoft) et al. arXiv. [papier] [Code]
- [Avr 2023] "LLM + P: autonomiser les modèles de gros langues avec une compétence optimale de planification." Bo Liu (UT Austin) et al. arXiv. [papier] [Code]
- [Mars 2023] "Réflexion: agents linguistiques avec apprentissage par renforcement verbal." Noah Shinn (Nord-Est) et al. NIRIPS 2023. [Paper] [Code]
- [Décembre 2022] "Ne générez pas, discriminez: une proposition de mise à la terre des modèles de langage dans des environnements réels" Yu Gu (OSU) et al. ACL 2023. [Paper] [Code]
- [Octobre 2022] "React: Synergising Reasoning and Agting in Language Models." Shunyu Yao (Princeton & Google Brain) et al. ICLR 2023. [Paper] [Code] [Page du projet]
Coopération multi-agents
- [Août 2024] "Megaagent: un cadre pratique pour la coopération autonome dans les systèmes d'agent LLM à grande échelle" Qian Wang (NUS) et al. * Arxiv. [papier]
- [Mai 2024] "Conformité, confabulation et imitation: Persona Inconnceance dans la collaboration multi-agents LLM." Razan Baltaji (UIUC) et al. * Arxiv. [papier] [Code]
- [Avril 2024] "Comm: Collaborative Multi-Agent, Multi-Reasoning Chemin, invitation pour la résolution de problèmes complexes." Pei Chen (Tamu) et al. * Naacl 2024. [Paper] [Code]
- [Janvier 2024] "L2MAC: ordinateur automatique du modèle grand langage pour une génération de code approfondie." Samuel Holt (Cambridge) et al. ICLR 2024. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Évaluation des capacités de coordination multi-agents dans les modèles de grande langue." Saaket Agashe (UCSC) et al. arXiv. [papier]
- [Oct 2023] "Dynamic LLM-Agent Network: un cadre de collaboration LLM-Agent avec l'optimisation de l'équipe d'agent." Zijun Liu (Thu & Stanford) et al. arXiv. [papier] [Code]
- [Octobre 2023] "Explorer les mécanismes de collaboration pour les agents LLM: une vision de la psychologie sociale." Jintian Zhang (Zju) et al. arXiv. [papier] [Code]
- [Octobre 2023] "Corex: repousser les limites du raisonnement complexe grâce à la collaboration multi-modes." Qiushi Sun (Shanghai Ai Lab & Nus) et al. arXiv. [papier] [Code]
- [Sept. 2023] "LLM-Delibération: Évaluation des LLM avec des jeux de négociation multi-agents interactifs." Sahar Abdelnabi (Cispa) et al. arXiv. [papier] [Code]
- [Sep 2023] "Collaboration multi-robot évolutive avec des modèles de gros langues: systèmes centralisés ou décentralisés?" Yongchao Chen (Mit et Harvard) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] "Réconciliez: la conférence de la table ronde améliore le raisonnement via un consensus entre diverses LLM". Justin Chih-Yao Chen (UNC Chapel Hill) et al. arXiv. [papier] [Code]
- [Sep 2023] "Mindagent: interaction de jeu émergente." Xiaojian Ma (Bigai) et al. arXiv. [Paper] [Code] [Page du projet]
- [Août 2023] "Proagent: construire une IA coopérative proactive avec des modèles de gros langues." Ceyao Zhang (Cuhk & Pku) et al. arXiv. [Paper] [Page du projet]
- [Août 2023] "Agentverse: faciliter la collaboration multi-agents et explorer les comportements émergents chez les agents." Weize Chen (Thu) et al. arXiv. [papier] [Code]
- [Août 2023] "GPT-in-the-boucle: prise de décision adaptative pour les systèmes multi-agents." Nathalia Nascimento (U of Waterloo) et al. arXiv. [papier]
- [Août 2023] "Dans quelle mesure les LLM sont-ils sensibles aux erreurs logiques?" Amirreza Payandeh (GMU & Vail Systems) et al. arXiv. [papier] [Code]
- [Août 2023] "Chateval: vers de meilleurs évaluateurs basés sur LLM par le biais d'un débat multi-agents." Chi-min Chan (Thu) et al. arXiv. [papier] [Code]
- [Août 2023] "LLM as DBA". Xuanhe Zhou (Thu) et al. arXiv. [papier] [Code]
- [Août 2023] "Gentopia: une plate-forme collaborative pour les LLMs à outils." Binfeng Xu et al. arXiv. [Paper] [Code] [Page du projet]
- [Août 2023] "MetAgpt: Meta Programming for Multi-Agent Collaborative Framework." Sirui Hong (Deepwisdom) et al. arXiv. [papier] [Code]
- [Juil 2023] "PRD: le rang et la discussion des pairs améliorent les évaluations basées sur les modèles de langues." Ruosen Li (Ut Dallas) et al. arXiv. [Paper] [Page du projet] [Code]
- [Juil 2023] "Luter la synergie cognitive dans les modèles de gros langues: un agent de résolution de tâches par le biais de l'auto-collaboration multi-Personnes." Zhenhailong Wang (UIUC & MSRA) et al. arXiv. [papier] [Code]
- [Juil 2023] "ROCO: collaboration dialectique multi-robot avec des modèles de grande langue." Mandi Zhao (Columbia) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juil 2023] "AI génératif multi-agent sans fil: de l'intelligence connectée à l'intelligence collective." Hang Zou (Technology Innovation Institute, Émirats arabes unis) et al. arXiv. [papier]
- [Juil 2023] "Construire des agents incarnés coopératifs modulaires avec de grands modèles de langage." Hongxin Zhang (UMass) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juin 2023] "RESTGPT: connexion de grands modèles de langue avec des applications réelles via des API RESTful." Yifan Song (PKU) et al. arXiv. [Paper] [Page du projet]
- [Juin 2023] "Collaboration multi-agents: exploiter le pouvoir des agents de LLM intelligents." Yashar Talebirad (Ualberta) et al. arXiv. [papier]
- [Mai 2023] "Encourager la pensée divergente dans les modèles de grande langue à travers un débat multi-agents." Tian Liang (Thu & Tencent) et al. arXiv. [papier] [Code]
- [Mai 2023] «Modèles de grande langue comme fabricants d'outils». Tianle Cai (Deepmind & Princeton) et al. arXiv. [papier] [Code]
- [Mai 2023] "Amélioration de la factualité et du raisonnement dans les modèles de langage grâce à un débat multi-agents." Yilun Du (MIT) et al. arXiv. [Paper] [Code] [Page du projet]
- [Mai 2023] "ACCORD ET EFFICACTION STATISTIQUE DANS LES MODÈLES DE PERCECTION BAYÉSIAN". Yash Deshpande (MIT) et al. arXiv. [papier]
- [Mai 2023] "Améliorer la négociation du modèle de langue avec l'apprentissage de l'auto-play et le contexte à partir des commentaires de l'IA." Yao Fu (U of Edimbourg) et al. arXiv. [papier] [Code]
Framework et open-source
- [Octobre 2023] "OpenAgents: une plate-forme ouverte pour les agents linguistiques dans la nature." Tianbao Xie (HKU & XLANG LAB) et al. arXiv. [papier] [Code]
- [Sep 2023] "Autoagents: un cadre pour la génération automatique d'agent". Guangyao Chen (PKU) et al. arXiv. [papier] [Code]
- [Sept. 2023] "Agents: un cadre open source pour les agents en langue autonome." Wangchunshu Zhou (Ai Waves) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] «Architectures cognitives pour les agents linguistiques». Theodore Sumers (Princeton) et al. arXiv. [papier] [Repo]
- [Août 2023] "Autogen: activer les applications LLM de nouvelle génération via le cadre de conversation multi-agents." Qingyun Wu et al. arXiv. [Paper] [Code] [Page du projet]
- [Août 2023] "FastAnAngence: le moyen le plus rapide de mettre en production des flux de travail multi-agents." Davor Runje et al. [Code] [Page du projet]
Application
Agents Web
- [Sep 2023] "Vous ne regardez que les écrans: agents multimodaux de la chaîne d'action." ZhuoSheng Zhang (SJTU) et al. arXiv. [papier] [Code]
- [Sep 2023] "Laser: Agent LLM avec exploration de l'espace d'état pour la navigation Web." Kaixin Ma (Tencent) et al. arXiv. [papier] [Code]
- [Juil 2023] "Webarena: un environnement Web réaliste pour créer des agents autonomes." Shuyan Zhou (CMU) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juil 2023] "Un webagent réel avec la planification, la compréhension du contexte long et la synthèse du programme." Izzeddin Gur (Deepmind) et al. arXiv. [papier]
- [Juin 2023] "Mind2Web: vers un agent généraliste pour le Web." Xiang Deng (OSU) et al. Neirips 2023. [Papier] [Code] [Page du projet]
- [Mai 2023] "Augmentant les agents autotéliques avec des modèles de gros langues." Cédric Colas (Mit & Inria) et al. arXiv. [papier]
- [Mai 2023] "Mobile-ENV: une plate-forme d'évaluation et une référence pour les agents interactifs à l'ère LLM." Danyang Zhang (SJTU) et al. arXiv. [papier] [Code]
- [Avril 2023] "Capacités de recherche scientifique autonomes émergents des modèles de grands langues." Daniil A. Boiko (CMU) et al. arXiv. [papier]
- [MAR 2023] "Les modèles de langage peuvent résoudre les tâches informatiques." Geunwoo Kim (UCI) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juil 2022] "Webshop: vers une interaction Web réelle évolutive avec des agents linguistiques fondés." Shunyu Yao (Princeton) et al. NEIRIPS 2022. [Papier] [Code] [Page du projet]
Agents RL
- [Mai 2024] «Découverte des compétences agentiques». Xufeng Zhao (Uhh) et al. arXiv. [Paper] [Code] [Page du projet]
- [Mai 2024] "GO-EXPLORE Intelligent: se tenir sur les épaules des modèles de fondation géants". Cong Lu (UBC) et al. arXiv. [papier]
- [Nov 2023] "Lafite-RL:" Accélérer l'apprentissage du renforcement des manipulations robotiques via les commentaires de modèles de grande langue " Kun Chu (UHH) et al. CRL WS @ Corl 2023. [Paper]
- [Octobre 2023] "Motif: motivation intrinsèque de la rétroaction de l'intelligence artificielle." Martin Klissarov (Mila & Meta & McGill) et al. arXiv. [papier]
- [Sep 2023] "Rladapter: pontant les modèles de gros langues à l'apprentissage du renforcement dans les mondes ouverts." Wanpeng Zhang (PKU) et al. arXiv. [papier]
- [Août 2023] "LAGR-Seq: apprentissage par renforcement guidé par la langue avec interrogatoire économe en échantillons." Thommen George Karimpanal (Université Deakin) et al. arXiv. [papier] [Code]
- [Juil 2023] "Façon de dialogue: autonomisation des agents par l'interaction PNJ." Wei Zhou (Gatech) et al. arXiv. [papier]
- [Juil 2023] "Vers un agent unifié avec des modèles de fondation". Norman di Palo (ICL et DeepMind) et al. Réincarner RL @ ICLR 2023. [Papier]
- [Juin 2023] "Le modèle de grande langue est un agent d'apprentissage par renforcement semi-paramétrique." Danyang Zhang (SJTU) et al. Neirips 2023. [Papier]
- [Mai 2023] "Décomposition sémantiquement alignée sur les tâches dans l'apprentissage du renforcement multi-agents". Wenhao Li (Cuhk) et al. arXiv. [papier]
Robotique et IA incarnée
- [Nov 2024] "Agent de travail: modèles de grande langue pour orchestrer les robots bimanuels" , Kun Chu (Uhh) et al. Humanoids 2024. [Paper] [Site Web], [Code]
- [Juil 2024] "Odyssey: autonomisation des agents ayant des compétences en monde ouvert." Shunyu Liu (Université de Zhejiang) et al. arXiv. [papier] [Code]
- [Nov 2023] "Leo: un agent généraliste incarné dans le monde 3D." Xiaojian Ma (Bigai) et al. arXiv. [Paper] [Code] [Page du projet]
- [Nov 2023] "Jarvis-1: agents multi-tâches du monde ouvert avec des modèles de langage multimodal auprès de la mémoire." Zihao Wang (PKU) et al. arXiv. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Vers la prise de décision incarnée de bout en bout via un modèle de langue grande multimodale: explorations avec gpt4-vision et au-delà." Liang Chen (PKU) et al. arXiv. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Lancar: Tire de la langue pour la locomotion du robot au contexte dans des environnements non structurés." Chak Lam Shek (UMD) et al. arXiv. [Paper] [Page du projet]
- [Sep 2023] "LLM-Grouner: Open-Vocabulary 3D Visual Forming with Large Language Model en tant qu'agent." Jianing Yang (Umich) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] "Smart-llm: planification de tâches de robot multi-agents intelligentes à l'aide de modèles de langage grand." Shyam Sundar Kannan (Purdue) et al. arXiv. [Paper] [Page du projet]
- [Sep 2023] "Branchez la puce de sécurité: appliquant les contraintes pour les agents de robot basés sur LLM." Ziyi Yang et al. arXiv. [Paper] [Code et vidéo]
- [Sep 2023] "Saynav: mise à la terre des modèles de grande langue pour la planification dynamique de la navigation dans de nouveaux environnements." Abhinav Rajvanshi (SRI International) et al. arXiv. [papier]
- [Sept. 2023] "Échafaudage de développement avec de grands modèles de langage". M. Batuhan Celik (Bogazici University) et al. arXiv. [papier]
- [Juil 2023] "March en chat: Invite interactive pour une expression de référence à distance incarnée." Yanyuan Qiao (Université d'Adelaide) et al. arXiv. [papier] [Code]
- [Août 2023] "A ^ 2NAV: Navigation de robot zéro-shot en action en exploitant la capacité de vision et de langue des modèles de fondation." Peihao Chen (Scut) et al. arXiv. [papier]
- [Juillet 2023] "Planification des tâches incarnée avec des modèles de gros langues". Zhenyu Wu (Bupt) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juin 2023] "Activer des interactions intelligentes entre un agent et un LLM: une approche d'apprentissage de renforcement". Bin Hu (Zhejiang Lab) et al. arXiv. [papier] [Code]
- [Mai 2023] "Ghost in the Minecraft: Généralement des agents capables pour les environnements en monde ouvert via des modèles de grands langues avec des connaissances et une mémoire basées sur le texte." Xizhou Zhu (Thu & Snesetim) et al. arXiv. [papier] [Code]
- [Mai 2023] "Voyager: un agent incarné à extrémité ouverte avec de grands modèles de langage." Guanzhi Wang (Nvidia et Caltech) et al. arXiv. [Paper] [Code] [Page du projet]
- [Mai 2023] "Planifier, éliminer et suivre les modèles de langue sont de bons enseignants pour les agents incarnés." Yue Wu (CMU) et al. arXiv. [papier]
- [Février 2023] "Décrire, expliquer, planifier et sélectionner: la planification interactive avec de grands modèles de langue permet aux agents multi-tâches en monde ouvert." Zihao Wang (PKU) et al. NIRIPS 2023. [Paper] [Code]
- [Février 2023] "Collaborant avec des modèles de langue pour le raisonnement incarné". Ishita Dasgupta (Deepmind) et al. Larel @ neirips 2022. [Papier]
- [Janvier 2023] "Les agents incarnés rêvent-ils de moutons pixéliens: prise de décision incarnée en utilisant la modélisation mondiale guidée par le langage." Kolby Nottingham (UCI) et al. ICML 2023. [Paper] [Code] [Page du projet]
- [Décembre 2022] "LLM-Planner: Planification à quelques coups fondée sur des agents incarnés avec des modèles de grands langues." Chan Hee Song (OSU) et al. ICCV 2023. [Papier] [Page du projet]
Jeu et jeu de rôle
- [Mai 2024] "Timechara: évaluation de l'hallucination ponctuelle des personnages des modèles de grande langue." Jaewoo Ahn (SNU) et al. Résultats de l'ACL 2024. [Papier] [Code] [Page du projet]
- [Octobre 2023] "Du texte à la tactique: évaluation des LLM jouant au jeu d'Avalon." Jonathan Light (RPI) et al. arXiv. [papier] [Code]
- [Octobre 2023] "Ruffle & Riley: vers l'induction automatisée des systèmes de tutorat conversationnels." Robin Schmucker (CMU) et al. arXiv. [papier]
- [Octobre 2023] "Jeu de pensées d'Avalon: Bataille contre la tromperie à travers une contemplation récursive." Shenzhi Wang (Thu) et al. arXiv. [papier]
- [Sep 2023] "Mindagent: interaction de jeu émergente." Xiaojian Ma (Bigai) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] "Suspion-Agent: jouer à des jeux d'information imparfaits avec la théorie de l'esprit GPT-4." Jiaxian Guo (U de Tokyo) et al. arXiv. [papier] [Code]
- [Août 2023] "Adventures ambiantes: enseigner le chatppt sur le développement d'histoires complexes." Zexin Chen (Gatech) et al. arXiv. [papier]
- [Juil 2023] "Tachikuma: sous-estimant les interactions complexes avec des objets multi-caractères et nouveaux par de grands modèles de langue." Yuanzhi Liang (UTS) et al. arXiv. [papier]
- [Mai 2023] "Play-play avec de grands modèles de langue". Murray Shanahan (Deepmind & ICL) et al. arXiv. [papier]
- [Mai 2023] "Clembench: Utilisation du jeu pour évaluer les modèles de langage optimisés au chat comme agents conversationnels." Kranti Chalamalasetti (Université de Potsdam) et al. arXiv. [papier] [Code]
- [Avr 2023] "Vers le système autonome: système de production modulaire flexible amélioré avec des agents de modèle de langue importants." Yuchen Xia (Université de Stuttgart) et al. arXiv. [papier] [Code]
- [Mars 2023] "Camel: agents communicatifs pour" l'esprit "exploration de la société du modèle de langue à grande échelle." Guohao Li (Kaust) et al. Neirips 2023. [Papier] [Code] [Page du projet]
Autres applications
- [Mai 2024] "AgentClinic: une référence d'agent multimodal pour évaluer l'IA dans des environnements cliniques simulés" Samuel Schmidgall (Jhu & Stanford) et al. arXiv. [Paper] [Code] [Page du projet]
- [Avril 2024] "ClinicalAgent: Système multi-agent d'essai cliniques avec un raisonnement basé sur un modèle grand langage" Ling Yue (RPI) et al. arXiv. [papier] [Code]
- [Janvier 2024] "Ehragent: le code habilite les grands modèles de langage pour un raisonnement tabulaire complexe à quelques coups sur les dossiers de santé électroniques." Wenqi Shi (Gatech) et al. arXiv. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Optimus: modélisation d'optimisation à l'aide de solveurs MIP et de grands modèles de langage." Ali Ahmaditehnizi (Stanford) et al. arXiv. [papier] [Code]
- [Octobre 2023] "Un modèle évolutif de traits de personnalité liés à un comportement coopératif à l'aide d'un modèle grand langage." Reiji Suzuki (Université Nagoya) et al. arXiv. [papier]
- [Octobre 2023] "Modèle de grand langage (LLM) en tant que système de plusieurs agents experts: une approche pour résoudre le défi d'abstraction et de raisonnement du corpus (ARC)." John Chong Min Tan (NUS) et al. arXiv. [papier]
- [Octobre 2023] «Une approche d'agent linguistique de la fourniture formelle du théorème». Amitayush Thakur (UT Austin) et al. arXiv. [papier]
- [Octobre 2023] "Agents de santé conversationnels: un cadre d'agent propulsé par LLM personnalisé." MAHYAR ABBASIAN (UCI) et al. arXiv. [papier]
- [Octobre 2023] "OceanGpt: un modèle grand langage pour les tâches scientifiques océaniques." Zhen Bi (Zju & Donghai Lab) et al. arXiv. [Paper] [Page du projet]
- [Octobre 2023] "Voice2action: Modèles de langue comme agent pour une interaction efficace en temps réel dans la réalité virtuelle." Yang Su (Cornell Tech). arXiv. [papier]
- [Sep 2023] "Tora: un agent de raisonnement intégré à l'outil pour la résolution de problèmes mathématiques." Zhibin Gou (Thu & Microsoft) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] "" Enseigner à l'IA comment coder ": utiliser de grands modèles de langue comme agents enseignables pour l'éducation en programmation." Hyoungwook Jin (Kaist) et al. arXiv. [papier]
- [Sep 2023] "Surrealdriver: Concevoir un cadre de simulation d'agent de pilote génératif dans des contextes urbains basés sur un modèle grand langage." Ye Jin (Thu) et al. arXiv. [papier]
- [Sep 2023] "Modèles de grande langue en tant qu'agents de la clinique." Nikita Mehandru (UC Berkeley) et al. arXiv. [papier]
- [Sep 2023] "Une architecture de chaîne d'émotion basée sur l'évaluation pour les agents de jeu de modèle de langue affective". Croissant Maximilian (Uoy) et al. arXiv. [papier]
- [Sept. 2023] "Débartière de la puissance de l'apprentissage des graphiques par le biais d'agents autonomes basés sur LLM." Lanning Wei (Cas et 4paradigm) et al. arXiv. [papier]
- [Sep 2023] "TradingGPT: système multi-agent avec mémoire en couches et caractères distincts pour des performances de trading financier améliorées." Yang Li (Sit) et al. arXiv. [papier]
- [Sep 2023] "ModelScope-Agent: Construire votre système d'agent personnalisable avec des modèles de grande langue open source." Chenliang Li (Alibaba) et al. arXiv. [papier] [code] [démo]
- [Août 2023] "Recomderder AI Agent: intégration de modèles de langue importants pour les recommandations interactives." Xu Huang (USTC) et al. arXiv. [papier] [Code]
- [Août 2023] "Recmind: Agent alimenté par modèle de langage pour recommandation." Yancheng Wang (ASU) et al. arXiv. [papier]
- [Août 2023] "Transfert SIM à réel LLM pour le contrôle du signal de la circulation." Longchao DA (ASU) et al. arXiv. [papier]
- [Août 2023] "Hors de la cage: comment les perroquets stochastiques gagnent dans les environnements de cybersécurité." Maria Rigaki (čvut) et al. arXiv. [papier] [Code]
- [Août 2023] "Y a-t-il un principe social pour les agents basés sur LLM?" Jitao Bai (Tju) et al. arXiv. [papier]
- [Août 2023] "Chateda: un agent autonome propulsé par un modèle grand langage pour EDA." Zhuolun He (Cuhk & Shanghai Ai Lab) et al. arXiv. [papier]
- [Août 2023] "Le guide de l'auto-stoppeur pour l'analyse du programme: un voyage avec des modèles de gros langues." Haonan Li (UCR) et al. arXiv. [papier]
- [Juin 2023] "Vers les agents de test autonomes via des modèles de grande langue conversationnels." Robert Feldt (Chalmers University of Technology) et al. arXiv. [papier]
- [Avr 2023] "Genegpt: augmenter les modèles de grands langues avec des outils de domaine pour améliorer l'accès aux informations biomédicales." Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu Arxiv. [papier] [Code]
- [Mars 2023] "Hugginggpt: résoudre des tâches AI avec Chatgpt et ses amis dans l'étreinte." Yongliang Shen (Zju & Msra) et al. arXiv. [papier] [Code]
Digne de confiance
- [Février 2024] "Les agents de grande langue des grands langues peuvent-ils simuler les comportements de confiance humaine?" Chengxing Xie (Kaust) et al. arXiv. [Paper] [Code] [Page du projet]
- [Sep 2023] "Identification des risques des agents LM avec un sable émuré LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arXiv. [Paper] [Code] [Demo] [Page du projet]
- [Août 2023] "Améliorer la confiance dans les agents d'automatisation d'IA basés sur LLM: nouvelles considérations et défis futurs". Sivan Schwartz (IBM Research) et al. Automatiser @ ijcai 2023. [Papier]
Simulation d'interaction humaine
- [Mars 2024] «Émergence de normes sociales dans les sociétés d'agent basées sur des modèles de langues». Siyue Ren (NWPU) et al. arXiv. [papier] [Code]
- [Janvier 2024] "Modèles ouverts, esprits fermés? Sur les capacités des agents pour imiter les personnalités humaines à travers des modèles de grande langue ouverts." Lucio la Cava (Université de Calabre) et al. arXiv. [papier]
- [Octobre 2023] "Sotopia: Évaluation interactive de l'intelligence sociale dans les agents linguistiques" * Xuhui Zhou (CMU) et al. * ICLR [Paper]
- [Octobre 2023] «Competerei: Comprendre les comportements de compétition dans les agents basés sur un modèle de langue en grande langue». Qinlin Zhao (USTC) et al. arXiv. [papier]
- [Octobre 2023] "Simulation des médias sociaux à l'aide de modèles de gros langues pour évaluer les algorithmes de flux d'actualités alternatifs." Petter Törnberg (U of Amsterdam) et al. arXiv. [papier]
- [Octobre 2023] "Mettez votre argent là où est votre bouche: évaluer la planification stratégique et l'exécution des agents LLM dans une arène d'enchères." Jiangjie Chen (FDU & AI2) et al. arXiv. [Paper] [Code] [Page du projet]
- [Octobre 2023] "Agents Lyfe: Agents génératifs pour les interactions sociales en temps réel à faible coût." Zhao Kaiya (MIT) et al. arXiv. [papier]
- [Sep 2023] "Identification des risques des agents LM avec un sable émuré LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arXiv. [Paper] [Code] [Demo] [Page du projet]
- [Sep 2023] "Modélisation générative basée sur des agents: dévoiler la dynamique du système social à travers le couplage des modèles mécanistes avec l'intelligence artificielle générative." Navid Ghaffarzadegan (Virginia Tech) et al. arXiv. [papier]
- [Août 2023] "CGMI: Framework d'interaction multi-agents configurable." Jinxin Shi (Ecnu) et al. arXiv. [papier]
- [Août 2023] "Exploration de l'intersection de modèles de grande langue et de modélisation basée sur des agents via l'ingénierie rapide." Edward Junprung (UC Berkeley) et al. arXiv. [papier] [Code]
- [Août 2023] "Agentssims: un bac à sable open source pour l'évaluation du modèle de langue grand." Jiaju Lin (PTA Studio & PSU) et al. arXiv. [Paper] [Code] [Page du projet]
- [Juil 2023] "S ^ 3: Système de simulation de réseaux sociaux avec des agents de grande envergure de modèle de langue." Chen Gao (Thu) et al. arXiv. [papier]
- [Juil 2023] "Êtes-vous dans une mascarade? Explorer le comportement et l'impact des robots sociaux motivés par un modèle de grande langue dans les réseaux sociaux en ligne." Siyu Li (Scu) et al. arXiv. [papier] [ensemble de données]
- [Juil 2023] «Agents communicatifs pour le développement de logiciels». Chen Qian (Thu) et al. arXiv. [papier]
- [Juil 2023] "Modélisation épidémique avec des agents génératifs". Ross Williams (Virginia Tech) et al. arXiv. [papier] [Code]
- [Juil 2023] "à l'infini et au-delà: show-1 et agents showrunner dans des simulations multi-agents." Philipp Maas (Fable Studio) et al. préimprimée. [Paper] [Page du projet]
- [Juin 2023] "Recagent: un nouveau paradigme de simulation pour les systèmes de recommandation." Lei Wang (Ruc) et al. arXiv. [papier] [Code]
- [Mai 2023] "Jouer à des jeux répétés avec de grands modèles de langue". Elif Akata (U de Tübingen) et al. arXiv. [papier]
- [Mai 2023] "Le rôle du résumé dans les agents génératifs: une perspective préliminaire." Xiachong Feng (HIT) et al. arXiv. [papier]
- [Avr 2023] "Chat multipartite: agents conversationnels dans les paramètres de groupe avec les humains et les modèles." Jimmy Wei (Cornell et Meta) et al. arXiv. [papier] [ensemble de données] [Code]
- [Avr 2023] "Agents génératifs: simulacra interactif du comportement humain." Joon Sung Park (Stanford) et al. arXiv. [papier] [Code]
Interaction humaine-agent
- [Octobre 2023] "Comment le traitement de l'IA retarde la créativité: explorer la co-création de questions de recherche avec un agent basé sur LLM." Yiren Liu (UIUC) et al. arXiv. [papier]
- [Août 2023] "Quantification de l'impact des modèles de langue importants sur la dynamique d'opinion collective". Chao Li (ZJU) et al. arXiv. [papier]
- [Août 2023] "Sapien: agents virtuels affectifs alimentés par de grands modèles de langue." Masum Hasan (U de Rochester) et al. arXiv. [papier]
- [Juil 2023] "Comprendre les avantages et les défis de l'utilisation d'agents conversationnels basés sur un modèle de langage pour un soutien au bien-être mental." Zilin Ma (Harvard) et al. arXiv. [papier]
LLMS alimentés aux agents
- [Octobre 2023] "L'agent demande aux modèles de grands langues d'être des raisonneurs généraux à tirs zéro." Nicholas Crispino (Washu) et al. arXiv. [papier] [Code]
- [Octobre 2023] "CODER ß: apprentissage en renforcement profond basé sur la valeur pour la synthèse du programme." Zishun Yu (Uic & Bytedance) et al. arXiv. [papier]
- [Mai 2023] "Formation des modèles de langage alignés socialement dans la société humaine simulée". Ruibo Liu (Dartmouth) et al. arXiv. [papier] [Code]
- [Mai 2023] "Les modèles de langage rencontrent les modèles mondiaux: les expériences incarnées améliorent les modèles de langage." Jiannan Xiang (UCSD) et al. NIRIPS 2023. [Paper] [Code]
Référence
- [Juil 2024] "AppWorld: un monde contrôlable d'applications et de personnes pour l'analyse comparative des agents de codage interactif." Harsh Trivedi (Stony Brook University) et al. ACL 2024. [Paper] [Code] [Page du projet]
- [Déc. 2023] "T-Eval: évaluation de la capacité d'utilisation de l'outil de modèles de grande langue étape par étape." Zehui Chen (USTC, Shanghai Ai Lab) et al. arXiv. [Paper] [Code] [Page du projet]
- [Nov 2023] "Magic: Investigation of grand Language Model propulsé plusieurs agents dans la cognition, l'adaptabilité, la rationalité et la collaboration." * Lin Xu et al. (NUS, Bytedance, Stanford & UC Berkeley) * Arxiv. [Paper] [Page du projet]
- [Octobre 2023] "Équilibrer l'autonomie et l'alignement: une taxonomie multidimensionnelle pour les architectures multi-agents autonomes". Thorsten Händler (Fernfh) et al. arXiv. [papier]
- [Octobre 2023] "Comparti des modèles de grands langues en tant qu'agents de recherche sur l'IA". Qian Huang (Stanford) et al. arXiv. [papier] [Code]
- [Octobre 2023] "Benchmark Metatool pour les modèles de grande langue: décider s'il faut utiliser des outils et lequel utiliser." Yue Huang (Université Lehigh) et al. arXiv. [papier] [ensemble de données]
- [Octobre 2023] "SmartPlay: une référence pour les LLM en tant qu'agents intelligents." Yue Wu (CMU et Microsoft) et al. arXiv. [papier] [Code]
- [Sep 2023] "Identification des risques des agents LM avec un sable émuré LM" Yangjun Ruan (University of Toronto & Vector Institute) et al. arXiv. [Paper] [Code] [Demo] [Page du projet]
- [Août 2023] "Bolaa: analyse comparative et orchestration des agents autonomes auprès de LLM." Zhiwei Liu (Salesforce) et al. arXiv. [papier] [Code]
- [Août 2023] "Agentbench: évaluation des LLM en tant qu'agents." Xiao Liu (Thu) et al. arXiv. [Paper] [Code] [Page du projet]
- [Août 2023] "TPTU: planification des tâches et utilisation des outils d'agents d'IA basés sur un modèle de grande langue." Jingqing Ruan (Sensetime) et al. arXiv. [papier]
- [Juin 2023] "ToolQA: un ensemble de données pour la question LLM répondant avec des outils externes." Yuchen Zhuang (Gatech) et al. NIRIPS 2023. [Paper] [Code]
Enquête et tutoriel
- [Sep 2023] "Modélisation et raisonnement de contexte basé sur le langage naturel avec LLMS: un tutoriel." Haoyi Xiong (Baidu) et al. arXiv. [papier]
- [Sep 2023] "Une étude approfondie des agents d'intelligence artificielle basés sur un modèle de grande langue". Pengyu Zhao (Bjtu) et al. arXiv. [papier]
- [Sept. 2023] "La montée et le potentiel des agents basés sur un modèle grand langage: une enquête." Zhiheng Xi (FDU) et al. arXiv. [papier] [github]
- [Août 2023] "Une enquête sur les agents autonomes basés sur un modèle de grande langue." Lei Wang (Ruc) et al. arXiv. [papier] [github]
- [Mars 2023] "Une enquête sur les modèles de grandes langues (Sec. 6.3 - Planification pour la résolution de tâches complexes)." Wayne Xin Zhao (RUC) et al. arXiv. [papier] [github]
Projets open source
Projets de solveur de tâches autonomes
- Auto-GPT - Une tente de source ouverte expérimentale de rendre GPT-4 entièrement autonome.
- ? ️? Langchain - Construire des applications avec LLMS via la composabilité.
- GPT Ingénieur - Spécifiez ce que vous voulez qu'il construise, l'IA demande des clarifications, puis la construit.
- Metagpt -? Le cadre multi-agent: compte tenu d'une exigence de ligne, return prd, conception, tâches, repo.
- Babyagi - Un système de gestion des tâches alimenté par AI.
- L2MAC - Le cadre informatique automatique LLM: L2MAC
- Yacana - ?? PLAGE OPENSOURCE LLMS AVEC LES CHATS MULTI-AGENTS ET DES FLOX DE TRAVAILLEMENT BOULIONS.
Projets de simulation multi-agents
- Ai Town ?? - Un kit de démarrage déployable pour construire et personnaliser votre propre version de la ville d'AI - une ville virtuelle où les personnages d'IA vivent, discutent et socialisent.
- GPTEAM - Une simulation multi-agents open source.
- ? Chatarena - Environnements de jeux en langue multi-agents pour LLMS.
- ? Agentverse? - Un cadre flexible qui simplifie le processus de création d'environnements multi-agents personnalisés pour les modèles de grands langues (LLM).
Perspectives
- Agents linguistiques: une étape évolutive critique de l'intelligence artificielle - Yu Su (OSU), 5 septembre 2023.
- Introducing XLang: An Open-Source Framework for Building Language Model Agents via Executable Language Grounding - XLANG Lab, Aug 9, 2023.
- What are GPT Agents? A deep dive into the AI interface of the future - Learn why Agents are a core part of the future of AI, Logan Kilpatrick (OpenAI), Jul 25, 2023.
- Language Agents in the Digital World: Opportunities and Risks - Shunyu Yao (Princeton) et al., Jul 24, 2023.
- KokoMind: Can LLMs Understand Social Interactions? - Imagine an AI ? at a cocktail party ?, Weiyan Shi (Columbia) et al., Jul, 2023
- LLM Powered Autonomous Agents - Amazing blog by Lilian Weng (OpenAI), Jun 23, 2023.
Other Related Sources
- Personalized Generative AI @ CIKM'23
- LLM-Agents-Papers - A repo lists papers about LLM role playing, memory mechanism and LLM game playing.
- LLMAgentPapers - Must-read papers on multiagents of LLMs.
- awesome-llm-agents - A curated list of awesome LLM agents.
Reconnaissance
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).