Alle Babyai -Umgebungen sind jetzt Teil der Minigridbibliothek. Dieses Repository ist nicht aktiv aufrechterhalten.
Mit diesem Repository können RL -Agenten in minigridischen (und Babyai-) Umgebungen geschult werden.
Dieses Repository enthält weiterhin Skripte, die, wenn sie an die Minigridbibliothek angepasst werden, verwendet werden können, um:
Babyai ist eine Plattform, die zur Untersuchung der Probeneffizienz des geerdeten Spracherwerbs verwendet wird, das bei MILA erstellt wurde.
Der Master -Zweig dieses Repositorys wird häufig aktualisiert. Wenn Sie die Basisergebnisse replizieren oder vergleichen möchten, empfehlen wir Ihnen, den Babyai 1.1 -Zweig zu verwenden, und zitieren beide:
@misc{hui2020babyai,
title={BabyAI 1.1},
author={David Yu-Tung Hui and Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Yoshua Bengio},
year={2020},
eprint={2007.12770},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
und das ICLR19 -Papier, in dem die experimentellen Setup und die Basisergebnisse von Babyai 1.0 beschrieben werden. Sein Quellcode befindet sich im ICLR19 -Zweig:
@inproceedings{
babyai_iclr19,
title={Baby{AI}: First Steps Towards Grounded Language Learning With a Human In the Loop},
author={Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Salem Lahlou and Lucas Willems and Chitwan Saharia and Thien Huu Nguyen and Yoshua Bengio},
booktitle={International Conference on Learning Representations},
year={2019},
url={https://openreview.net/forum?id=rJeXCo0cYX},
}
Diese Readme deckt Anweisungen zur Installation und Fehlerbehebung ab. Andere Anweisungen sind:
Wenn Sie Conda verwenden, können Sie eine babyai -Umgebung mit allen Abhängigkeiten erstellen, indem Sie ausgeführt werden:
git clone https://github.com/mila-iqia/babyai.git
cd babyai
conda env create -f environment.yaml
source activate babyai
Führen Sie danach die folgenden Befehle aus, um die Umgebung einzurichten.
cd ..
git clone https://github.com/maximecb/gym-minigrid.git
cd gym-minigrid
pip install --editable .
Der letzte Befehl installiert das Repository im bearbeitbaren Modus. Gehen Sie zurück zum babyai -Repository und installieren Sie dies auch im bearbeitbaren Modus.
cd ../babyai
pip install --editable .
Befolgen Sie schließlich diese Anweisungen
Anforderungen:
Installieren Sie zuerst Pytorch für Ihre Plattform.
Klonen Sie dann dieses Repository und installieren Sie die anderen Abhängigkeiten mit pip3 :
git clone https://github.com/mila-iqia/babyai.git
cd babyai
pip3 install --editable .
Befolgen Sie schließlich diese Anweisungen
Fügen Sie diese Zeile zu .bashrc (Linux) oder .bash_profile (MAC) hinzu.
export BABYAI_STORAGE='/<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT>'
wobei /<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT> ist der Ordner, in dem Sie git clone https://github.com/mila-iqia/babyai.git eingeben.
Modelle, Protokolle und Demos werden in diesem Verzeichnis in den Ordnern models , logs bzw. demos erstellt.
Diese können hier heruntergeladen werden
Stellen md5sum 1df202ef2bbf2de768633059ed8db64c
Vor der Extraktion:
gunzip -c copydemos.tar.gz | tar xvf -
Die Verwendung der pixels -Architektur funktioniert nicht mit Nachahmungslernen , da die Demonstrationen nicht für die Verwendung von Pixeln generiert wurden.
Wenn Sie Fehlermeldungen im Zusammenhang mit dem OpenAI -Fitnessstudio begegnen, ist möglicherweise die Version der von Ihnen installierten Bibliotheken nicht kompatibel. Sie können versuchen, bestimmte Bibliotheken mit PIP3, z. B. pip3 install --upgrade gym zu aktualisieren. Wenn das Problem weiterhin besteht, öffnen Sie bitte ein Problem in diesem Repository und fügen Sie eine vollständige Fehlermeldung zusammen mit einigen Informationen zu Ihrer Plattform ein (führen Sie Windows, Mac, Linux aus? Führen Sie dies auf einem MILA -Computer aus?).
Bitte beachten Sie, dass das Standardbeobachtungsformat eine teilweise beobachtbare Ansicht der Umgebung mit einer kompakten Codierung mit 3 Eingangswerten pro sichtbares Gitterzellen, 7x7x3 -Werten insgesamt ist. Diese Werte sind keine Pixel . Wenn Sie stattdessen eine Reihe von RGB -Pixeln als Beobachtungen erhalten möchten, verwenden Sie den RGBImgPartialObsWrapper . Sie können es wie folgt verwenden:
import babyai
from gym_minigrid.wrappers import *
env = gym.make('BabyAI-GoToRedBall-v0')
env = RGBImgPartialObsWrapper(env)
Diese Wrapper sowie andere Wrapper, um das Beobachtungsformat zu ändern, finden Sie hier.