rl book
1.0.0
一对一的映射Tensorflow 2和Pytorch 1&2实施,第一本强化学习教程书籍
| 英语版 | 中文版 | 中文2019年 |
|---|---|---|
如果您有兴趣用其他语言出版本书,请给我发电子邮件。
特征
这是一本关于强化学习的教程,并解释了理论和Python实施。
在此处查看代码,练习答案等。
检查Springerlink Amazon的书籍内容。
所有代码均已保存为.ipynb文件和同一目录中的.html文件。
| 章 | 环境与封闭式政策 | 代理人 |
|---|---|---|
| 2 | Cliffwalking-V0 | 贝尔曼 |
| 3 | Frozenlake-V1 | DP |
| 4 | 二十一点-v1 | MC |
| 5 | 出租车V3 | Sarsa,Expectsa,QL,DoubleQl,Sarsa(λ) |
| 6 | MountainCar-V0 | SARSA,SARSA(λ),DQN TF火炬,Doubledqn TF Torch,Dueldqn TF Torch |
| 7 | Cartpole-0 | VPG TF火炬,VPGWBASELIN TF TORCH,OFFICYVPG TF TF TORCH,OFFCOLCYVPGWBASELIN |
| 8 | Acrobot-V1 | QAC TF火炬,Advantageac TF Torch,资格Traceceac TF Torch,PPO TF TORCH,NPG TF TF TORCH,TRPO TF TF TORCH,OFFPAC TF TF TORCH |
| 9 | 摆-V1 | DDPG TF Torch,TD3 TF火炬 |
| 10 | Lunarlander-V2 | SQL TF火炬,SAC TF火炬,Sacwa TF火炬 |
| 10 | lunarlanderconcontinuun-v2 | sacwa tf火炬 |
| 11 | BipedalWalker-V3 | Es,Ars |
| 12 | pongnoframeskip-v4 | 分类DQN TF火炬,QR-DQN TF TORCH,IQN TF TORCH |
| 13 | Bernoullimab-V0 | UCB |
| 13 | 高斯mab-v0 | UCB |
| 14 | Tictactoe-V0 | Alphazero TF Torch |
| 15 | 老虎V0 | vi |
| 16 | Humanoidbulletenv-V0 | 行为克隆TF火炬,盖尔TF火炬 |
全球第一本配套tensorflow 2和pytorch 1/2对照代码的强化学习教程书
中文版书籍支持内容
本书内容
本书特色
本书完整地介绍了主流强化学习理论。
python代码,实战性强。,实战性强。
全球第一本配套张量2代码的强化学习教程书
中国第一本配套张量2代码的纸质算法书
中文版书籍支持内容
本书特色
python实现。
QQ群