基本強化學習(RL)
該存儲庫旨在通過交付有關如何編碼不同RL技術的步行來為增強學習(RL)提供介紹系列。
背景評論
可以在此處提供RL的快速背景評論。
教程:
參考:
- 克里斯·沃特金斯(Chris Watkins),從延遲的獎勵中學習,劍橋,1989年(論文)
- 很棒的增強學習存儲庫,https://github.com/aikorea/awesome-rl
- 加固學習CS9417ML,計算機科學與工程學院,UNSW悉尼,http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- 強化學習博客文章,https://studywolf.wordpress.com/2012/11/25/reinforecession-learning-q-learning-andning-and-exploration/
- Openai Gym Docs,https://gym.openai.com/docs
- Vincent Bons實施,https://gist.github.com/wingedsheep
- 大衛·西爾弗(David Silver)的深入強化學習演講,http://videolectures.net/rldm2015_silver_reinforecement_learning/
- 布羅克曼(G. Openai體育館。 ARXIV預印型ARXIV:1606.01540。
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurencies