pysc2 examples
1.0.0
โปรแกรมตัวอย่างนี้ถูกสร้างขึ้น
วิธีที่ง่ายที่สุดในการรับ PYSC2 คือการใช้ PIP:
$ pip install git+https://github.com/deepmind/pysc2 นอกจากนี้คุณต้องติดตั้งไลบรารี baselines
$ pip install git+https://github.com/openai/baselinesคุณต้องซื้อ Starcraft II และติดตั้ง หรือแม้แต่รุ่นสตาร์ทเตอร์ก็ใช้ได้
http://us.battle.net/sc2/en/legacy-of-the-void/
ติดตามเอกสารของ Blizzard เพื่อรับเวอร์ชัน Linux โดยค่าเริ่มต้น PYSC2 คาดว่าเกมจะอยู่ใน ~/StarCraftII/
ดาวน์โหลดแผนที่บันไดและมินิเกมและแยกออกไปยัง StarcraftII/Maps/ Directory ของคุณ
$ python train_mineral_shards.py --algorithm=a2c$ python enjoy_mineral_shards.py$ python train_mineral_shards.py --algorithm=deepq --prioritized=True --dueling=True --timesteps=2000000 --exploration_fraction=0.2$ python train_mineral_shards.py --algorithm=a2c --num_agents=2 --num_scripts=2 --timesteps=2000000| คำอธิบาย | ค่าเริ่มต้น | ประเภทพารามิเตอร์ | |
|---|---|---|---|
| แผนที่ | สภาพแวดล้อมการออกกำลังกาย | ของสะสม | สาย |
| บันทึก | ประเภทการบันทึก: tensorboard, stdout | บอร์ดบอร์ด | สาย |
| อัลกอริทึม | ปัจจุบันสนับสนุน 2 อัลกอริทึม: DeepQ, A2C | A2C | สาย |
| การจับเวลา | ขั้นตอนการฝึกอบรมทั้งหมด | 2000000 | int |
| Exploration_fraction | เศษส่วนการสำรวจ | 0.5 | ลอย |
| ที่จัดลำดับความสำคัญ | ไม่ว่าจะใช้การเล่นซ้ำลำดับความสำคัญสำหรับ DQN | เท็จ | บูลีน |
| การต่อสู้ | ไม่ว่าจะใช้เครือข่ายการดวลสำหรับ DQN | เท็จ | บูลีน |
| LR | อัตราการเรียนรู้ (ถ้า 0 ตั้งค่าสุ่ม E-5 ~ e-3) | 0.0005 | ลอย |
| num_agents | จำนวนตัวแทนสำหรับ A2C | 4 | int |
| num_scripts | จำนวนตัวแทนสคริปต์สำหรับ A2C | 4 | int |
| nsteps | จำนวนขั้นตอนสำหรับนโยบายการอัปเดต | 20 | int |