pysc2 examples
1.0.0
تم بناء برنامج المثال هذا على
أسهل طريقة للحصول على PYSC2 هي استخدام PIP:
$ pip install git+https://github.com/deepmind/pysc2 أيضًا ، يجب عليك تثبيت مكتبة baselines .
$ pip install git+https://github.com/openai/baselinesيجب عليك شراء StarCraft II وتثبيته. أو حتى طبعة المبتدئين ستعمل.
http://us.battle.net/sc2/en/legacy-of-the-void/
اتبع وثائق Blizzard للحصول على إصدار Linux. بشكل افتراضي ، تتوقع PYSC2 أن تعيش اللعبة في ~/StarCraftII/ .
قم بتنزيل خرائط السلم والألعاب المصغرة واستخراجها إلى StarcraftII/Maps/ Directory.
$ python train_mineral_shards.py --algorithm=a2c$ python enjoy_mineral_shards.py$ python train_mineral_shards.py --algorithm=deepq --prioritized=True --dueling=True --timesteps=2000000 --exploration_fraction=0.2$ python train_mineral_shards.py --algorithm=a2c --num_agents=2 --num_scripts=2 --timesteps=2000000| وصف | تقصير | نوع المعلمة | |
|---|---|---|---|
| رسم خريطة | بيئة الصالة الرياضية | CollectMineralShards | خيط |
| سجل | نوع التسجيل: Tensorboard ، stdout | Tensorboard | خيط |
| خوارزمية | حاليا ، دعم 2 خوارزميات: DEEPQ ، A2C | A2C | خيط |
| الطوابع الزمنية | خطوات التدريب الكلية | 2000000 | int |
| exploration_fraction | جزء الاستكشاف | 0.5 | يطفو |
| إعطاء الأولوية | سواء باستخدام إعادة التشغيل الأولوية لـ DQN | خطأ شنيع | منطقية |
| المبارزة | سواء كان استخدام شبكة المبارزة لـ DQN | خطأ شنيع | منطقية |
| LR | معدل التعلم (إذا كان 0 تعيين عشوائي E-5 ~ E-3) | 0.0005 | يطفو |
| num_agents | عدد الوكلاء لـ A2C | 4 | int |
| num_scripts | عدد العوامل النصية لـ A2C | 4 | int |
| nsteps | عدد خطوات سياسة التحديث | 20 | int |