rl book
1.0.0
一對一的映射Tensorflow 2和Pytorch 1&2實施,第一本強化學習教程書籍
| 英語版 | 中文版 | 中文2019年 |
|---|---|---|
如果您有興趣用其他語言出版本書,請給我發電子郵件。
特徵
這是一本關於強化學習的教程,並解釋了理論和Python實施。
在此處查看代碼,練習答案等。
檢查Springerlink Amazon的書籍內容。
所有代碼均已保存為.ipynb文件和同一目錄中的.html文件。
| 章 | 環境與封閉式政策 | 代理人 |
|---|---|---|
| 2 | Cliffwalking-V0 | 貝爾曼 |
| 3 | Frozenlake-V1 | DP |
| 4 | 二十一點-v1 | MC |
| 5 | 出租車V3 | Sarsa,Expectsa,QL,DoubleQl,Sarsa(λ) |
| 6 | MountainCar-V0 | SARSA,SARSA(λ),DQN TF火炬,Doubledqn TF Torch,Dueldqn TF Torch |
| 7 | Cartpole-0 | VPG TF火炬,VPGWBASELIN TF TORCH,OFFICYVPG TF TF TORCH,OFFCOLCYVPGWBASELIN |
| 8 | Acrobot-V1 | QAC TF火炬,Advantageac TF Torch,資格Traceceac TF Torch,PPO TF TORCH,NPG TF TF TORCH,TRPO TF TF TORCH,OFFPAC TF TF TORCH |
| 9 | 擺-V1 | DDPG TF Torch,TD3 TF火炬 |
| 10 | Lunarlander-V2 | SQL TF火炬,SAC TF火炬,Sacwa TF火炬 |
| 10 | lunarlanderconcontinuun-v2 | sacwa tf火炬 |
| 11 | BipedalWalker-V3 | Es,Ars |
| 12 | pongnoframeskip-v4 | 分類DQN TF火炬,QR-DQN TF TORCH,IQN TF TORCH |
| 13 | Bernoullimab-V0 | UCB |
| 13 | 高斯mab-v0 | UCB |
| 14 | Tictactoe-V0 | Alphazero TF Torch |
| 15 | 老虎V0 | vi |
| 16 | Humanoidbulletenv-V0 | 行為克隆TF火炬,蓋爾TF火炬 |
全球第一本配套tensorflow 2和pytorch 1/2對照代碼的強化學習教程書
中文版書籍支持內容
本書內容
本書特色
本書完整地介紹了主流強化學習理論。
python代碼,實戰性強。 ,實戰性強。
全球第一本配套張量2代碼的強化學習教程書
中國第一本配套張量2代碼的紙質算法書
中文版書籍支持內容
本書特色
python實現。
QQ群