minimalRL
1.0.0
การใช้งานอัลกอริทึม RL พื้นฐานที่มีรหัสบรรทัดน้อยที่สุด! (ตาม Pytorch)
อัลกอริทึมแต่ละตัวจะเสร็จสมบูรณ์ภายในไฟล์เดียว
ความยาวของแต่ละไฟล์สูงถึง 100 ~ 150 บรรทัดของรหัส
ทุกอัลกอริทึมสามารถฝึกอบรมได้ภายใน 30 วินาทีแม้จะไม่มี GPU
Envs ได้รับการแก้ไขเป็น "cartpole-v1" คุณสามารถมุ่งเน้นไปที่การใช้งาน
# Works only with Python 3.
# e.g.
python3 REINFORCE.py
python3 actor_critic.py
python3 dqn.py
python3 ppo.py
python3 ddpg.py
python3 a3c.py
python3 a2c.py
python3 acer.py
python3 sac.py