Téléchargement de JARVIS 1 - JARVIS 1 Téléchargement du code source

JARVIS 1

Code Source AI

1.0.0

Télécharger

Jarvis-1: Agents multi-tâches en monde ouvert avec des modèles de langage multimodal à mémoire de mémoire

[Site Web] [Paper] [Twitter]

Abstrait

La réalisation de la planification et le contrôle de type humain avec des observations multimodales dans un monde ouvert est une étape clé pour les agents généralistes plus fonctionnels. Nous présentons Jarvis-1 , un agent en monde ouvert qui peut percevoir l'entrée multimodale (observations visuelles et instructions humaines), générer des plans sophistiqués et effectuer un contrôle incarné, le tout dans l'univers minecraft du monde ouvert populaire mais difficile. Plus précisément, nous développons Jarvis-1 au-dessus des modèles de langage multimodal pré-formé, qui cartographient les observations visuelles et les instructions textuelles aux plans. Les plans seront finalement envoyés aux contrôleurs conditionnés par le but. Nous équivaut à Jarvis-1 avec une mémoire multimodale, ce qui facilite la planification en utilisant à la fois des connaissances pré-formées et ses expériences réelles de survie du jeu. Jarvis-1 est l'agent le plus général existant de Minecraft, capable de accomplir plus de 200 tâches différentes en utilisant un espace de contrôle et d'observation similaire aux humains. Ces tâches vont des tâches en horizon court, par exemple, des "hachés des arbres" aux tâches longs-horizon, par exemple, "obtenant une pioche en diamant". Jarvis-1 fonctionne exceptionnellement bien dans les tâches en horizon court, réalisant des performances presque parfaites. Dans la tâche classique à long terme d'obtenirdiamondPickaxe, Jarvis-1 dépasse la fiabilité des agents actuels de pointe de la technologie et peut accomplir avec succès des tâches à horizon plus long et plus difficiles.

Agent jouant aux vidéos

Nous énumérons une série de vidéos montrant Jarvis-1 jouant à Minecraft. Vous pouvez trouver les vidéos sur notre page de projet.

Installer des dépendances

Ce projet est destiné à fonctionner uniquement sur Linux. La prise en charge d'autres plateformes n'est pas fournie.

Préparer l'environnement

Nous vous recommandons d'utiliser Anaconda pour gérer l'environnement. Si vous n'avez pas installé Anaconda, vous pouvez le télécharger à partir d'ici.

conda create -n jarvis python=3.10
conda activate jarvis

Assurez-vous que JDK 8 a installé. Si vous ne l'avez pas installé, vous pouvez l'installer en utilisant la commande suivante:

conda install openjdk=8

Pour vérifier votre version JDK, exécutez la commande java -version . Vous devriez voir un message similaire à ce qui suit (les détails peuvent varier si vous avez installé une distribution JDK différente):

openjdk version " 1.8.0_392 "
OpenJDK Runtime Environment (build 1.8.0_392-8u392-ga-1~20.04-b08)
OpenJDK 64-Bit Server VM (build 25.392-b08, mixed mode)

Une fois que vous avez installé les dépendances requises, vous pouvez exécuter le script prepare_mcp.py pour créer MCP-Rebor. Assurez-vous d'avoir une connexion Internet stable avant de commencer.

python prepare_mcp.py

Ensuite, vous pouvez installer Jarvis-1 en tant que package Python.

pip install -e .

Télécharger des poids

Jarvis-1 repose sur les poids de Steve-I. Vous pouvez télécharger les poids à partir du script. Ensuite, vous devez définir le chemin de poids dans le fichier jarvis/steveI/path.py

Usage

Vous devez d'abord définir la variable d'environnement TMPDIR et OPENAI_API_KEY .

 export TMPDIR=/tmp
export OPENAI_API_KEY= " sk-****** "

Apprendre avec une mémoire dynamique (à venir bientôt)

Ensuite, vous pouvez exécuter la commande suivante pour démarrer l'agent Jarvis-1.

python open_jarvis.py --task iron_pickaxe --timeout 10

Enfin, vous pouvez voir l'agent Jarvis-1 jouer à Minecraft dans la fenêtre affichée. Vous pouvez également exécuter la commande suivante pour démarrer l'agent Jarvis-1 en mode sans tête.

xfvb-run -a python open_jarvis.py --task iron_pickaxe --timeout 10

Évaluation hors ligne avec mémoire fixe

python offline_evaluation.py
or
xvfb-run -a python offline_evaluation.py

Maintenant, nous ne publions que le code `offline_evaluation`, c'est-à-dire que vous pouvez l'utiliser pour évaluer l'agent Jarvis-1 sur la mémoire fixe. Nous publierons bientôt le code `` en ligne_évaluation », c'est-à-dire que vous pouvez l'utiliser pour évaluer l'agent Jarvis-1 sur la mémoire croissante.

Différences par rapport au Jarvis-1 d'origine

Retirez le module self-check pour une planification efficace.
La mémoire multimodale actuelle dans assets/memory.json le fichier n'est pas terminée. Nous supprimons l' state multimodal et la séquence action , qui sera publié à l'avenir.
Le multimodal descriptor et la multimodel retrieval ne sont pas encore publiés. Vous ne pouvez donc expérimenter que le modèle linguistique de Jarvis-1 maintenant.

Faire

Libérez multimodal descriptor pour permettre à Jarvis-1 de comprendre le monde visuel. Nous prévoyons de télécharger la multimodal memory sur HuggingFace.
Libérez learning.py pour permettre à Jarvis-1 d'auto-amélioration avec de la mémoire croissante.

Projets connexes

Jarvis-1 est construit sur plusieurs projets de Minecraft. Voici quelques projets connexes qui pourraient vous intéresser:

Steve-1 est un modèle de pré-formation vidéo (VPT) réglé par l'instruction pour Minecraft. Nous l'utilisons dans le cadre de Controller dans Jarvis-1.
Minedojo est une suite de simulateurs avec des milliers de tâches ouvertes et appropriées en langue construites sur le jeu Minecraft populaire pour la recherche d'agents incarnée.
MC-Textworld est un environnement mondial de texte pour Minecraft. Il est conçu pour être une référence pour les agents textuels. Nous l'utilisons dans la première version de Jarvis-1 pour accumuler la mémoire du langage.

Découvrez notre papier!

Notre article est disponible sur Arxiv. Veuillez citer notre article si vous trouvez Jarvis-1 utile pour vos recherches:

 @article{wang2023jarvis1,
    title   = {JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal Language Models},
    author  = {Zihao Wang and Shaofei Cai and Anji Liu and Yonggang Jin and Jinbing Hou and Bowei Zhang and Haowei Lin and Zhaofeng He and Zilong Zheng and Yaodong Yang and Xiaojian Ma and Yitao Liang},
    year    = {2023},
    journal = {arXiv preprint arXiv: 2311.05997}
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-08
taille 7.19MB
Provenant de Github

Applications connexes

grok 1

2024-11-01
Application JARVIS oeil d'aigle

2023-05-31
Machines folles 1

2022-09-01
Balade 1

2022-08-31
Tension Épisode 1

2022-08-31
Géant de l'industrie 1

2022-07-27

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout