Apakah Anda ingin agen RL dengan baik bergerak di Atari?
Rainbow adalah semua yang Anda butuhkan!
Ini adalah tutorial langkah demi langkah dari DQN ke Rainbow. Setiap bab berisi latar belakang teoritis dan implementasi yang berorientasi objek. Pilih saja topik apa pun yang Anda minati, dan pelajari! Anda dapat menjalankannya segera dengan Colab bahkan di ponsel cerdas Anda.
Silakan membuka masalah atau permintaan tarik jika Anda memiliki ide untuk membuatnya lebih baik. :)
Jika Anda menginginkan tutorial untuk metode gradien kebijakan, silakan lihat PG adalah semua yang Anda butuhkan.
Isi
- Dqn [nbviewer] [colab]
- Doubledqn [nbviewer] [colab]
- Prioritas ExperiencePlay [NBVIEWER] [COLAB]
- Duelingnet [nbviewer] [colab]
- Noisynet [nbviewer] [colab]
- CategoricalDQN [nbviewer] [colab]
- N-STEPLEARNING [NBVIEWER] [COLAB]
- Rainbow [NBViewer] [Colab]
Prasyarat
Repositori ini diuji dengan Python 3.8+
git clone https://github.com/Curt-Park/rainbow-is-all-you-need.git
cd rainbow-is-all-you-need
make setup
Bagaimana menjalankan
Makalah Terkait
- V. Mnih et al., "Kontrol tingkat manusia melalui pembelajaran penguatan yang mendalam." Nature, 518 (7540): 529–533, 2015.
- Van Hasselt et al., "Pembelajaran penguatan mendalam dengan learning Q ganda." ARXIV Preprint ARXIV: 1509.06461, 2015.
- T. Schaul et al., "Pengalaman Prioritas Replay." ARXIV Preprint ARXIV: 1511.05952, 2015.
- Z. Wang et al., "Arsitektur jaringan duel untuk pembelajaran penguatan yang mendalam." ARXIV Preprint ARXIV: 1511.06581, 2015.
- M. Fortunato et al., "Jaringan bising untuk eksplorasi." ARXIV Preprint ARXIV: 1706.10295, 2017.
- MG Bellemare et al., "Perspektif distribusi tentang pembelajaran penguatan." ARXIV Preprint ARXIV: 1707.06887, 2017.
- RS Sutton, "Belajar memprediksi dengan metode perbedaan temporal." Pembelajaran Mesin, 3 (1): 9–44, 1988.
- M. Hessel et al., "Rainbow: Menggabungkan perbaikan dalam pembelajaran penguatan yang mendalam." ARXIV Preprint ARXIV: 1710.02298, 2017.
Kontributor
Terima kasih kepada orang -orang yang luar biasa ini (Kunci Emoji):
Jinwoo Park (Curt)
| Kyunghwan Kim
| Wei Chen ? | Wang Lei ? | LEEYAF
| Ahmadf
| Roberto Schiavone
|
David Yuan
| Dhanushka2001
|
Proyek ini mengikuti spesifikasi semua-kontributor. Kontribusi apa pun yang baik!