すべてのbabyai環境は、現在、migridライブラリの一部です。このリポジトリは積極的に維持されていません。
このリポジトリを使用して、Minigrid(およびbabyai)環境でのRLエージェントのトレーニングを行うことができます。
このリポジトリには、Minigridライブラリに適応した場合、以下に使用できるスクリプトが含まれています。
Babyaiは、MILAで作成された接地言語習得のサンプル効率を研究するために使用されるプラットフォームです。
このリポジトリのマスターブランチは頻繁に更新されます。ベースラインの結果に対して複製または比較したい場合は、Babyai 1.1ブランチを使用して両方を引用することをお勧めします。
@misc{hui2020babyai,
title={BabyAI 1.1},
author={David Yu-Tung Hui and Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Yoshua Bengio},
year={2020},
eprint={2007.12770},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
ICLR19論文は、実験セットアップとBabyAI 1.0ベースラインの結果を詳述しています。そのソースコードはICLR19ブランチにあります。
@inproceedings{
babyai_iclr19,
title={Baby{AI}: First Steps Towards Grounded Language Learning With a Human In the Loop},
author={Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Salem Lahlou and Lucas Willems and Chitwan Saharia and Thien Huu Nguyen and Yoshua Bengio},
booktitle={International Conference on Learning Representations},
year={2019},
url={https://openreview.net/forum?id=rJeXCo0cYX},
}
このREADMEは、インストールとトラブルシューティングに関する指示をカバーしています。その他の指示は次のとおりです。
Condaを使用している場合は、実行してすべての依存関係を備えたbabyai環境を作成できます。
git clone https://github.com/mila-iqia/babyai.git
cd babyai
conda env create -f environment.yaml
source activate babyai
その後、次のコマンドを実行して環境をセットアップします。
cd ..
git clone https://github.com/maximecb/gym-minigrid.git
cd gym-minigrid
pip install --editable .
最後のコマンドは、編集モードにリポジトリをインストールします。 babyaiリポジトリに戻り、編集モードにもインストールします。
cd ../babyai
pip install --editable .
最後に、これらの指示に従ってください
要件:
最初にプラットフォームにPytorchをインストールします。
次に、このリポジトリをクローンして、 pip3に他の依存関係をインストールします。
git clone https://github.com/mila-iqia/babyai.git
cd babyai
pip3 install --editable .
最後に、これらの指示に従ってください
この行を.bashrc (linux)、または.bash_profile (mac)に追加します。
export BABYAI_STORAGE='/<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT>'
ここで/<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT>はgit clone https://github.com/mila-iqia/babyai.git入力したフォルダーです。
モデル、ログ、デモは、このディレクトリ、フォルダーmodels 、 logs 、 demosでそれぞれ作成されます。
これらはここからダウンロードできます
ダウンロードされたファイルに次のMD5チェックサム( md5sumを介して取得)があることを確認してください: 1df202ef2bbf2de768633059ed8db64c
抽出前:
gunzip -c copydemos.tar.gz | tar xvf -
pixelsアーキテクチャを使用すると、デモンストレーションがピクセルを使用するように生成されなかったため、模倣学習では機能しません。
Openaiジムに関連するエラーメッセージに遭遇した場合、インストールしたライブラリのバージョンが互換性がない可能性があります。 PIP3を使用して特定のライブラリをアップグレードしてみてください。例: pip3 install --upgrade gym 。問題が続く場合は、このリポジトリで問題を開き、完全なエラーメッセージを貼り付け、プラットフォームに関する情報を貼り付けてください(Windows、Mac、Linuxを実行していますか?これをMILAマシンで実行していますか?)。
デフォルトの観測形式は、目に見えるグリッドセルごとに3つの入力値、合計7x7x3値を使用して、コンパクトなエンコードを使用した環境の部分的に観察可能なビューであることに注意してください。これらの値はピクセルではありません。代わりに観測としてRGBピクセルの配列を取得する場合は、 RGBImgPartialObsWrapperを使用してください。次のように使用できます。
import babyai
from gym_minigrid.wrappers import *
env = gym.make('BabyAI-GoToRedBall-v0')
env = RGBImgPartialObsWrapper(env)
このラッパーと、観測形式を変更する他のラッパーは、ここにあります。