모든 Babyai 환경은 이제 Minigrid Library의 일부입니다. 이 저장소는 적극적으로 유지 관리되지 않습니다.
Minigrid (및 Babyai) 환경에 대한 RL 에이전트를 교육하면이 저장소를 사용하여 수행 할 수 있습니다.
이 저장소는 여전히 Minigrid Library에 적응할 수있는 스크립트가 포함되어 있습니다.
Babyai는 Mila에서 만들어진 접지 언어 습득의 샘플 효율성을 연구하는 데 사용되는 플랫폼입니다.
이 저장소의 마스터 브랜치는 자주 업데이트됩니다. 기준 결과와 복제하거나 비교하려는 경우 Babyai 1.1 지점을 사용하고 다음을 모두 인용하는 것이 좋습니다.
@misc{hui2020babyai,
title={BabyAI 1.1},
author={David Yu-Tung Hui and Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Yoshua Bengio},
year={2020},
eprint={2007.12770},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
실험 설정 및 Babyai 1.0 기준선 결과를 자세히 설명하는 ICLR19 용지. 소스 코드는 ICLR19 브랜치에 있습니다.
@inproceedings{
babyai_iclr19,
title={Baby{AI}: First Steps Towards Grounded Language Learning With a Human In the Loop},
author={Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Salem Lahlou and Lucas Willems and Chitwan Saharia and Thien Huu Nguyen and Yoshua Bengio},
booktitle={International Conference on Learning Representations},
year={2019},
url={https://openreview.net/forum?id=rJeXCo0cYX},
}
이 readme에는 설치 및 문제 해결에 대한 지침이 포함됩니다. 다른 지침은 다음과 같습니다.
Conda를 사용하는 경우 실행하여 모든 종속성으로 babyai 환경을 만들 수 있습니다.
git clone https://github.com/mila-iqia/babyai.git
cd babyai
conda env create -f environment.yaml
source activate babyai
그런 다음 환경을 설정하려면 다음 명령을 실행하십시오.
cd ..
git clone https://github.com/maximecb/gym-minigrid.git
cd gym-minigrid
pip install --editable .
마지막 명령은 저장소를 편집 가능한 모드로 설치합니다. babyai 저장소로 다시 이동하여 편집 가능한 모드로 설치하십시오.
cd ../babyai
pip install --editable .
마지막으로, 다음 지시 사항을 따르십시오
요구 사항 :
먼저 플랫폼에 Pytorch를 설치하십시오.
그런 다음이 저장소를 복제하고 pip3 로 다른 종속성을 설치하십시오.
git clone https://github.com/mila-iqia/babyai.git
cd babyai
pip3 install --editable .
마지막으로, 다음 지시 사항을 따르십시오
이 줄을 .bashrc (Linux) 또는 .bash_profile (Mac)에 추가하십시오.
export BABYAI_STORAGE='/<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT>'
여기서 /<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT> git clone https://github.com/mila-iqia/babyai.git 이전에 폴더입니다.
모델, 로그 및 데모는 폴더 models , logs 및 demos 에서이 디렉토리에서 각각 제작됩니다.
여기에서 다운로드 할 수 있습니다
다운로드 된 파일에 다음 MD5 체크섬이 있는지 확인하십시오 ( md5sum 을 통해 얻음) : 1df202ef2bbf2de768633059ed8db64c
추출 전 :
gunzip -c copydemos.tar.gz | tar xvf -
pixels 아키텍처를 사용하는 것은 픽셀을 사용하기 위해 시연이 생성되지 않았기 때문에 모방 학습과 함께 작동하지 않습니다 .
OpenAi 체육관과 관련된 오류 메시지가 발생하면 설치 한 라이브러리의 버전은 호환되지 않을 수 있습니다. PIP3 (예 : pip3 install --upgrade gym 으로 특정 라이브러리를 업그레이드 할 수 있습니다. 문제가 지속되면이 저장소에서 문제를 열고 플랫폼에 대한 정보와 함께 전체 오류 메시지를 붙여 넣으십시오 (Windows, Mac, Linux를 실행하고 있습니까? Mila 시스템에서이를 실행하고 있습니까?).
기본 관측 형식은 가시 그리드 셀당 3 개의 입력 값, 총 7x7x3 값을 사용하여 소형 인코딩을 사용하여 환경에 대한 부분적으로 관찰 가능한 뷰입니다. 이 값은 픽셀이 아닙니다 . 대신 관측치로 RGB 픽셀 배열을 얻으려면 RGBImgPartialObsWrapper 사용하십시오. 다음과 같이 사용할 수 있습니다.
import babyai
from gym_minigrid.wrappers import *
env = gym.make('BabyAI-GoToRedBall-v0')
env = RGBImgPartialObsWrapper(env)
관찰 형식을 변경하기위한 다른 포장지뿐만 아니라이 래퍼는 여기에서 찾을 수 있습니다.