สภาพแวดล้อมของ Babyai ทั้งหมดเป็นส่วนหนึ่งของห้องสมุด Minigrid ที่เก็บนี้ไม่ได้รับการดูแลอย่างแข็งขัน
การฝึกอบรมตัวแทน RL ในสภาพแวดล้อม minigrid (และ babyai) สามารถทำได้โดยใช้ที่เก็บนี้
ที่เก็บนี้ยังคงมีสคริปต์ซึ่งหากปรับให้เข้ากับไลบรารี minigrid สามารถใช้:
Babyai เป็นแพลตฟอร์มที่ใช้ในการศึกษาประสิทธิภาพตัวอย่างของการเรียนรู้ภาษาที่มีพื้นฐานซึ่งสร้างขึ้นที่ MILA
สาขาหลักของที่เก็บนี้ได้รับการปรับปรุงบ่อยครั้ง หากคุณต้องการทำซ้ำหรือเปรียบเทียบกับผลลัพธ์พื้นฐานเราขอแนะนำให้คุณใช้สาขา Babyai 1.1 และอ้างอิงทั้งสอง:
@misc{hui2020babyai,
title={BabyAI 1.1},
author={David Yu-Tung Hui and Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Yoshua Bengio},
year={2020},
eprint={2007.12770},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
และกระดาษ ICLR19 ซึ่งให้รายละเอียดการตั้งค่าการทดลองและผลลัพธ์พื้นฐานของ Babyai 1.0 ซอร์สโค้ดอยู่ในสาขา ICLR19:
@inproceedings{
babyai_iclr19,
title={Baby{AI}: First Steps Towards Grounded Language Learning With a Human In the Loop},
author={Maxime Chevalier-Boisvert and Dzmitry Bahdanau and Salem Lahlou and Lucas Willems and Chitwan Saharia and Thien Huu Nguyen and Yoshua Bengio},
booktitle={International Conference on Learning Representations},
year={2019},
url={https://openreview.net/forum?id=rJeXCo0cYX},
}
readme นี้ครอบคลุมคำแนะนำสำหรับการติดตั้งและการแก้ไขปัญหา คำแนะนำอื่น ๆ คือ:
หากคุณใช้ conda คุณสามารถสร้างสภาพแวดล้อม babyai ด้วยการพึ่งพาทั้งหมดโดยการวิ่ง:
git clone https://github.com/mila-iqia/babyai.git
cd babyai
conda env create -f environment.yaml
source activate babyai
หลังจากนั้นให้ดำเนินการคำสั่งต่อไปนี้เพื่อตั้งค่าสภาพแวดล้อม
cd ..
git clone https://github.com/maximecb/gym-minigrid.git
cd gym-minigrid
pip install --editable .
คำสั่งสุดท้ายติดตั้งที่เก็บในโหมดแก้ไขได้ ย้ายกลับไปที่ที่เก็บ babyai และติดตั้งในโหมดแก้ไขได้เช่นกัน
cd ../babyai
pip install --editable .
ในที่สุดทำตามคำแนะนำเหล่านี้
ความต้องการ:
ก่อนอื่นติดตั้ง pytorch สำหรับบนแพลตฟอร์มของคุณ
จากนั้นโคลนที่เก็บนี้และติดตั้งการพึ่งพาอื่น ๆ ด้วย pip3 :
git clone https://github.com/mila-iqia/babyai.git
cd babyai
pip3 install --editable .
ในที่สุดทำตามคำแนะนำเหล่านี้
เพิ่มบรรทัดนี้ลงใน .bashrc (linux) หรือ .bash_profile (mac)
export BABYAI_STORAGE='/<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT>'
โดยที่ /<PATH>/<TO>/<BABYAI>/<REPOSITORY>/<PARENT> เป็นโฟลเดอร์ที่คุณพิมพ์ git clone https://github.com/mila-iqia/babyai.git ก่อนหน้านี้
โมเดลบันทึกและการสาธิตจะถูกสร้างขึ้นในไดเรกทอรีนี้ในโมเดล models logs และ demos ตามลำดับ
สามารถดาวน์โหลดได้ที่นี่
ตรวจสอบให้แน่ใจว่าไฟล์ที่ดาวน์โหลดมีการตรวจสอบ MD5 ต่อไปนี้ (ได้รับผ่าน md5sum ): 1df202ef2bbf2de768633059ed8db64c
ก่อนการสกัด:
gunzip -c copydemos.tar.gz | tar xvf -
การใช้สถาปัตยกรรม pixels ไม่ทำงานกับการเรียนรู้เลียนแบบ เนื่องจากการสาธิตไม่ได้ถูกสร้างขึ้นเพื่อใช้พิกเซล
หากคุณพบกับข้อความแสดงข้อผิดพลาดที่เกี่ยวข้องกับ OpenAI Gym อาจเป็นไปได้ว่าเวอร์ชันของไลบรารีเหล่านั้นที่คุณติดตั้งนั้นไม่เข้ากัน คุณสามารถลองอัพเกรดไลบรารีที่เฉพาะเจาะจงด้วย PIP3 เช่น: pip3 install --upgrade gym หากปัญหายังคงมีอยู่โปรดเปิดปัญหาเกี่ยวกับที่เก็บนี้และวางข้อความแสดงข้อผิดพลาด ที่สมบูรณ์ พร้อมกับข้อมูลบางอย่างเกี่ยวกับแพลตฟอร์มของคุณ (คุณกำลังใช้ Windows, Mac, Linux หรือไม่คุณกำลังใช้งานนี้บนเครื่อง MILA หรือไม่)
โปรดทราบว่ารูปแบบการสังเกตเริ่มต้นเป็นมุมมองที่สังเกตได้บางส่วนของสภาพแวดล้อมโดยใช้การเข้ารหัสขนาดกะทัดรัดโดยมี 3 ค่าอินพุตต่อเซลล์กริดที่มองเห็นได้ค่ารวม 7x7x3 ค่าเหล่านี้ ไม่ใช่พิกเซล หากคุณต้องการรับอาร์เรย์ของพิกเซล RGB เป็นข้อสังเกตแทนให้ใช้ RGBImgPartialObsWrapper คุณสามารถใช้ได้ดังนี้:
import babyai
from gym_minigrid.wrappers import *
env = gym.make('BabyAI-GoToRedBall-v0')
env = RGBImgPartialObsWrapper(env)
wrapper นี้รวมถึง wrappers อื่น ๆ เพื่อเปลี่ยนรูปแบบการสังเกตสามารถพบได้ที่นี่