minimalRL
1.0.0
コードの最小行を使用した基本的なRLアルゴリズムの実装! (Pytorchベース)
各アルゴリズムは単一のファイル内で完了します。
各ファイルの長さは、最大100〜150行のコードです。
すべてのアルゴリズムは、GPUがなくても30秒以内にトレーニングできます。
envsは「cartpole-v1」に固定されています。実装に焦点を当てることができます。
# Works only with Python 3.
# e.g.
python3 REINFORCE.py
python3 actor_critic.py
python3 dqn.py
python3 ppo.py
python3 ddpg.py
python3 a3c.py
python3 a2c.py
python3 acer.py
python3 sac.py