minimalRL
1.0.0
Implementações de algoritmos básicos de RL com linhas mínimas de códigos! (Baseado em Pytorch)
Cada algoritmo está completo em um único arquivo.
O comprimento de cada arquivo é de até 100 ~ 150 linhas de códigos.
Cada algoritmo pode ser treinado em 30 segundos, mesmo sem GPU.
O ENVS é fixado em "Cartpole-V1". Você pode apenas se concentrar nas implementações.
# Works only with Python 3.
# e.g.
python3 REINFORCE.py
python3 actor_critic.py
python3 dqn.py
python3 ppo.py
python3 ddpg.py
python3 a3c.py
python3 a2c.py
python3 acer.py
python3 sac.py