คุณต้องการให้ตัวแทน RL ย้ายไปอาตาริอย่างดีหรือไม่?
รุ้งคือสิ่งที่คุณต้องการ!
นี่คือการสอนทีละขั้นตอนจาก DQN ถึง Rainbow ทุกบทมีทั้งภูมิหลังทางทฤษฎีและการใช้งานเชิงวัตถุ เพียงแค่เลือกหัวข้อใด ๆ ที่คุณสนใจและเรียนรู้! คุณสามารถดำเนินการได้ทันทีด้วย colab แม้ในสมาร์ทโฟนของคุณ
โปรดอย่าลังเลที่จะเปิดปัญหาหรือการขอร้องหากคุณมีความคิดที่จะทำให้ดีขึ้น -
หากคุณต้องการการสอนสำหรับวิธีการไล่ระดับสีนโยบายโปรดดู PG เป็นสิ่งที่คุณต้องการ
สารบัญ
- DQN [NBViewer] [colab]
- doubledqn [nbviewer] [colab]
- PrioritizedExperienCeReplay [nbviewer] [colab]
- DuelingNet [nbviewer] [colab]
- Noisynet [nbviewer] [colab]
- CategoricalDQN [NBViewer] [colab]
- N-Stelearning [NbViewer] [colab]
- Rainbow [NbViewer] [colab]
ข้อกำหนดเบื้องต้น
ที่เก็บนี้ได้รับการทดสอบด้วย Python 3.8+
git clone https://github.com/Curt-Park/rainbow-is-all-you-need.git
cd rainbow-is-all-you-need
make setup
วิธีการวิ่ง
เอกสารที่เกี่ยวข้อง
- V. Mnih et al., "การควบคุมระดับมนุษย์ผ่านการเรียนรู้การเสริมแรงอย่างลึกซึ้ง" ธรรมชาติ, 518 (7540): 529–533, 2015
- Van Hasselt et al., "การเรียนรู้การเสริมแรงอย่างลึกล้ำด้วยการเรียนรู้สองครั้ง" arxiv preprint arxiv: 1509.06461, 2015
- T. Schaul et al., "Replay Experience Experience" arxiv preprint arxiv: 1511.05952, 2015
- Z. Wang et al., "สถาปัตยกรรมเครือข่ายดวลเพื่อการเรียนรู้การเสริมแรงอย่างลึกซึ้ง" arxiv preprint arxiv: 1511.06581, 2015
- M. Fortunato et al., "เครือข่ายที่มีเสียงดังสำหรับการสำรวจ" arxiv preprint arxiv: 1706.10295, 2017
- MG Bellemare et al., "มุมมองการกระจายเกี่ยวกับการเรียนรู้การเสริมแรง" arxiv preprint arxiv: 1707.06887, 2017
- RS Sutton "เรียนรู้ที่จะทำนายโดยวิธีการของความแตกต่างทางโลก" การเรียนรู้ของเครื่อง, 3 (1): 9–44, 1988
- M. Hessel et al., "Rainbow: การรวมการปรับปรุงในการเรียนรู้การเสริมแรงอย่างลึกซึ้ง" arxiv preprint arxiv: 1710.02298, 2017
ผู้มีส่วนร่วม
ขอบคุณไปที่คนที่ยอดเยี่ยมเหล่านี้ (คีย์อีโมจิ):
Jinwoo Park (Curt)
| Kyunghwan Kim
| Wei Chen - | วังเลย์ - | leeyaf
| Ahmadf
| Roberto Schiavone
|
เดวิดหยวน
| Dhanushka2001
|
โครงการนี้เป็นไปตามข้อกำหนดทั้งหมดของผู้เข้าร่วม การมีส่วนร่วมทุกชนิดยินดีต้อนรับ!