DRL code pytorch
1.0.0
補強、A2C、レインボーDQN、PPO(離散および連続)、DDPG、TD3、SAC、PPO-Discrete-RNN(LSTM/GRU)を含むDRLアルゴリズムの簡潔なPytorch実装。
python == 3.7.9
numpy == 1.19.4
pytorch == 1.12.0
テンソルボード== 0.6.0
ジム== 0.21.0