基本的な強化学習(RL)
このリポジトリは、さまざまなRLテクニックをコーディングする方法についてのウォークを提供することにより、強化学習(RL)の紹介シリーズを提供することを目的としています。
バックグラウンドレビュー
RLの簡単なバックグラウンドレビューはこちらから入手できます。
チュートリアル:
参考文献:
- クリス・ワトキンス、遅延報酬から学ぶ、ケンブリッジ、1989(論文)
- Awesome Rehnection Learning Repository、https://github.com/aikorea/awesome-rl
- 強化学習CS9417ML、コンピューターサイエンス&エンジニアリングスクール、UNSWシドニー、http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- 強化学習ブログ投稿、https://studywolf.wordpress.com/2012/11/25/reinforcement-learning-q-learning-and-exploration/
- Openai Gym Docs、https://gym.openai.com/docs
- Vincent Bonsの実装、https://gist.github.com/wingedsheep
- David Silver's Deep Reanfortion Learning Talk、http://videolectures.net/rldm2015_silver_reinforcement_learning/
- Brockman、G.、Cheung、V.、Pettersson、L.、Schneider、J.、Schulman、J.、Tang、J。、&Zaremba、W。(2016)。オープンジム。 Arxiv Preprint arxiv:1606.01540。
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurrencies