Основное обучение базового подкрепления (RL)
Этот репозиторий направлен на предоставление серии введения для подкрепления обучения (RL) путем проведения прогулки о том, как кодировать различные методы RL.
Фоновый обзор
Здесь доступен быстрый фоновый обзор RL.
Учебные пособия:
Ссылки:
- Крис Уоткинс, учится на задержанных вознаграждениях, Кембридж, 1989 (тезис)
- Потрясающее хранилище обучения, https://github.com/aikorea/awesome-rl
- Подкрепление обучения CS9417ML, Школа компьютерных наук и техники, UNSW Sydney, http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- Подкрепление обучения в блоге посты в блоге, https://studywolf.wordpress.com/2012/11/25/reinforment-learning-q-learning-and-exploration/
- Openai Gym Docs, https://gym.openai.com/docs
- Реализации Vincent Bons, https://gist.github.com/wingedsheep
- Дэвид Сильвер в глубокой подкреплении разговоры, http://videolectures.net/rldm2015_silver_reinforments_learning/
- Brockman, G., Cheung, V., Pettersson, L., Schneider, J., Schulman, J., Tang, J. & Zaremba, W. (2016). Openai Gym. Arxiv Preprint arxiv: 1606.01540.
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurrents