기본 강화 학습 (RL)
이 저장소는 다른 RL 기술을 코딩하는 방법에 대한 산책을 통해 소개 시리즈 강화 학습 (RL)을 제공하는 것을 목표로합니다.
배경 검토
RL에 대한 빠른 배경 검토가 여기에서 제공됩니다.
튜토리얼 :
참조 :
- Chris Watkins, 지연된 보상의 학습, 케임브리지, 1989 (논문)
- 멋진 강화 학습 저장소, https://github.com/aikorea/awesome-rl
- 강화 학습 CS9417ML, UNSW 시드니, 컴퓨터 과학 및 공학 학교, http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- 강화 학습 블로그 게시물, https://studywolf.wordpress.com/2012/11/25/reinforcement-learning-q-learning-and-exploration/
- Openai 체육관 문서, https://gym.openai.com/docs
- Vincent Bons 구현, https://gist.github.com/wingedsheep
- David Silver의 깊은 강화 학습 대화, http://videolectures.net/rldm2015_silver_reinforcement_learning/
- Brockman, G., Cheung, V., Pettersson, L., Schneider, J., Schulman, J., Tang, J., & Zaremba, W. (2016). Openai 체육관. ARXIV PREPRINT ARXIV : 1606.01540.
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurrencies