การเรียนรู้การเสริมแรงขั้นพื้นฐาน (RL)
พื้นที่เก็บข้อมูลนี้มีวัตถุประสงค์เพื่อจัดเตรียมชุดบทนำเพื่อเสริมกำลังการเรียนรู้ (RL) โดยส่งมอบวิธีการเดินเกี่ยวกับวิธีการเขียนรหัสเทคนิค RL ที่แตกต่างกัน
รีวิวพื้นหลัง
มีการตรวจสอบพื้นหลังอย่างรวดเร็วของ RL ที่นี่
บทเรียน:
ข้อมูลอ้างอิง:
- Chris Watkins, การเรียนรู้จากรางวัลล่าช้า, Cambridge, 1989 (วิทยานิพนธ์)
- พื้นที่เก็บข้อมูลการเรียนรู้การเสริมแรงที่ยอดเยี่ยม https://github.com/aikorea/awesome-rl
- การเรียนรู้การเสริมแรง CS9417ml, โรงเรียนวิทยาศาสตร์คอมพิวเตอร์และวิศวกรรม, UNSW ซิดนีย์, http://www.cse.unsw.edu.au/~cs9417ml/rl1/index.html
- โพสต์บล็อกการเรียนรู้เสริมแรง, https://studywolf.wordpress.com/2012/11/25/reinforcement-learning-q-learning-ly-and-exploration/
- Openai Gym Docs, https://gym.openai.com/docs
- การใช้งาน Vincent Bons, https://gist.github.com/wingedsheep
- การเรียนรู้การเรียนรู้การเสริมแรงอย่างลึกล้ำของ David Silver, http://videolectures.net/rldm2015_silver_reinforcement_learning/
- Brockman, G. , Cheung, V. , Pettersson, L. , Schneider, J. , Schulman, J. , Tang, J. , & Zaremba, W. (2016) Openai Gym. arxiv preprint arxiv: 1606.01540
- https://sites.google.com/view/deep-rl-bootcamp/lectures
- https://github.com/vmayoral/gym-cryptocurrencies