action_std ; untuk membuat pelatihan lebih stabil untuk lingkungan yang kompleks.csvPPO_colab.ipynb menggabungkan semua file untuk melatih / menguji / plot grafik / membuat gif di google colab di jupyter-notebook yang nyaman PPO_colab.ipynb di Google Colab Repositori ini memberikan implementasi Pytorch minimal dari Optimasi Kebijakan Proksimal (PPO) dengan tujuan terpotong untuk lingkungan gym openai. Ini terutama dimaksudkan untuk pemula dalam pembelajaran penguatan untuk memahami algoritma PPO. Ini masih dapat digunakan untuk lingkungan yang kompleks tetapi mungkin memerlukan beberapa tuning hiperparameter atau perubahan dalam kode. Penjelasan singkat tentang algoritma PPO dapat ditemukan di sini dan penjelasan menyeluruh dari semua detail untuk menerapkan PPO berkinerja terbaik dapat ditemukan di sini (semua belum diimplementasikan dalam repo ini).
Untuk menjaga prosedur pelatihan tetap sederhana:
train.pytest.pyplot_graph.pymake_gif.py.pyPPO_colab.ipynb menggabungkan semua file dalam jupyter-notebookREADME.md di ppo_pretrained direktori Silakan gunakan Bibtex ini jika Anda ingin mengutip repositori ini di publikasi Anda:
@misc{pytorch_minimal_ppo,
author = {Barhate, Nikhil},
title = {Minimal PyTorch Implementation of Proximal Policy Optimization},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/nikhilbarhate99/PPO-PyTorch}},
}
| PPO Continuous RoboschoolhalfCheetah-V1 | PPO Continuous RoboschoolhalfCheetah-V1 |
|---|---|
![]() | ![]() |
| PPO Continuous Roboschoolhopper-V1 | PPO Continuous Roboschoolhopper-V1 |
|---|---|
![]() | ![]() |
| PPO Continuous Roboschoolwalker2D-V1 | PPO Continuous Roboschoolwalker2D-V1 |
|---|---|
![]() | ![]() |
| PPO Bipedalwalker-V2 kontinu | PPO Bipedalwalker-V2 kontinu |
|---|---|
![]() | ![]() |
| PPO Discrete Cartpole-V1 | PPO Discrete Cartpole-V1 |
|---|---|
![]() | ![]() |
| PPO diskrit Lunarlander-V2 | PPO diskrit Lunarlander-V2 |
|---|---|
![]() | ![]() |
Dilatih dan diuji pada:
Python 3
PyTorch
NumPy
gym
Lingkungan pelatihan
Box-2d
Roboschool
pybullet
Grafik dan GIF
pandas
matplotlib
Pillow