Apprentissage de renforcement de base (RL)
Ce référentiel vise à fournir une série d'introduction à l'apprentissage du renforcement (RL) en fournissant une marche sur la façon de coder différentes techniques RL.
Revue des antécédents
Un examen rapide des antécédents de RL est disponible ici.
Tutoriels:
Références:
- Chris Watkins, Learning From retardé des récompenses, Cambridge, 1989 (thèse)
- Référentiel d'apprentissage du renforcement génial, https://github.com/aikorea/awesome-rl
- Renforcement Learning CS9417ML, School of Computer Science & Engineering, Unsw Sydney, http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- Articles de blog de renforcement d'apprentissage, https://studywolf.wordpress.com/2012/11/25/reinforcement-learning-q-learning-and-exploration/
- Openai Gym Docs, https://gym.openai.com/docs
- Implémentations de Vincent Bons, https://gist.github.com/wingdsheep
- La conversation d'apprentissage en renforcement profond de David Silver, http://videolectures.net/rldm2015_silver_reinforcement_learning/
- Brockman, G., Cheung, V., Pettersson, L., Schneider, J., Schulman, J., Tang, J., et Zaremba, W. (2016). Openai Gym. ARXIV PRÉALLAGE ARXIV: 1606.01540.
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-crypto-monn