基本强化学习(RL)
该存储库旨在通过交付有关如何编码不同RL技术的步行来为增强学习(RL)提供介绍系列。
背景评论
可以在此处提供RL的快速背景评论。
教程:
参考:
- 克里斯·沃特金斯(Chris Watkins),从延迟的奖励中学习,剑桥,1989年(论文)
- 很棒的增强学习存储库,https://github.com/aikorea/awesome-rl
- 加固学习CS9417ML,计算机科学与工程学院,UNSW悉尼,http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- 强化学习博客文章,https://studywolf.wordpress.com/2012/11/25/reinforecession-learning-q-learning-andning-and-exploration/
- Openai Gym Docs,https://gym.openai.com/docs
- Vincent Bons实施,https://gist.github.com/wingedsheep
- 大卫·西尔弗(David Silver)的深入强化学习演讲,http://videolectures.net/rldm2015_silver_reinforecement_learning/
- 布罗克曼(G. Openai体育馆。 ARXIV预印型ARXIV:1606.01540。
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurencies