openai_lab
ve PER
注意:请使用下一个版本,SLM-LAB。
OpenAI实验室文档
使用OpenAI健身房,Tensorflow和Keras进行增强学习的实验框架。
Openai实验室的创建是为了进行加强学习(RL),例如科学 -理论,实验。它通过自动实验和评估框架为Openai Gym和Keras提供了一个简单的接口。
借助OpenAI实验室,我们可以专注于研究强化学习的基本要素,例如算法,策略,内存和参数调整。它使我们能够使用现有组件与研究思想实现的现有组件有效地构建代理。然后,我们可以通过运行实验系统地测试研究假设。
阅读有关实验室在动机中解决的研究问题的更多信息。最终,该实验室是进行强化学习的一般框架,Openai Gym和Keras的不可知论。例如,基于Pytorch的实现在路线图上。
实施/计划的核心RL算法列表。
要查看他们在OpenAI健身环境中的分数,请访问Fitness Matrix 。
| 算法 | 执行 | 评估得分(待定) |
|---|---|---|
| DQN | DQN | - |
| 双DQN | DoubledQn | - |
| 决斗DQN | - | - |
| 萨尔 | Deepsarsa | - |
| 非政策SARSA | Offpolicysarsa | - |
| per(优先经验重播) | 优先级experienceReplay | - |
| CEM(交叉熵法) | 下一个 | - |
| 加强 | - | - |
| DPG(确定性政策梯度)非政治演员批评 | contorcritic | - |
| DDPG(深-DPG)具有目标网络的参数 | DDPG | - |
| A3C(异步优势参与者 - 批评) | - | - |
| dyna | 下一个 | - |
| trpo | - | - |
| Q*(lambda) | - | - |
| 追溯(lambda) | - | - |
| 神经情节对照(NEC) | - | - |
| EWC(弹性重量合并) | - | - |
接下来,请参阅安装,然后跳到Quickstart。
Openai实验室的时间解放,解决Cartpole-V0。