
Repositori ini berisi materi yang terkait dengan program Nanodegree Penguatan Penguatan Udacity.
Tutorial menuntun Anda melalui penerapan berbagai algoritma dalam pembelajaran penguatan. Semua kode ada di Pytorch (v0.4) dan Python 3.
Laboratorium dan proyek dapat ditemukan di bawah. Semua proyek menggunakan lingkungan simulasi yang kaya dari Unity ML-agents. Dalam Program Nanodegree Pembelajaran Penguatan Deep, Anda akan menerima ulasan tentang proyek Anda. Ulasan ini dimaksudkan untuk memberi Anda umpan balik yang dipersonalisasi dan memberi tahu Anda apa yang dapat ditingkatkan dalam kode Anda.
Acrobot-v1 dengan pengkodean ubin dan learning QCartpole-v0 dengan pendakian bukit | diselesaikan dalam 13 episodeCartpole-v0 dengan Tatforce | diselesaikan dalam 691 episodeMountainCarContinuous-v0 dengan metode cross-entropy | diselesaikan dalam 47 iterasiMountainCar-v0 dengan diskritisasi grid seragam dan Q-learning | diselesaikan dalam <50000 episodePendulum-v0 dengan gradien kebijakan deterministik mendalam (DDPG)BipedalWalker-v2 dengan gradien kebijakan deterministik mendalam (DDPG)CarRacing-v0 dengan q-networks yang dalam (dqn) | Segera hadir!LunarLander-v2 dengan Q-Networks Deep (DQN) | diselesaikan dalam 1504 episodeFrozenLake-v0 dengan pemrograman dinamisBlackjack-v0 dengan metode Monte CarloCliffWalking-v0 dengan metode perbedaan temporal Untuk mengatur lingkungan Python Anda untuk menjalankan kode di repositori ini, ikuti instruksi di bawah ini.
Buat (dan aktifkan) lingkungan baru dengan Python 3.6.
conda create --name drlnd python=3.6
source activate drlndconda create --name drlnd python=3.6
activate drlndJika berjalan di Windows , pastikan Anda memiliki "Build Tools for Visual Studio 2019" yang diinstal dari situs ini. Artikel ini juga mungkin sangat membantu. Ini dikonfirmasi untuk bekerja di Windows 10 Home.
Ikuti instruksi dalam repositori ini untuk melakukan pemasangan minimal gym OpenAI.
Kloning repositori (jika Anda belum melakukannya!), Dan navigasikan ke python/ folder. Kemudian, pasang beberapa dependensi.
git clone https://github.com/udacity/deep-reinforcement-learning.git
cd deep-reinforcement-learning/python
pip install . Buat kernel ipython untuk lingkungan drlnd .
python -m ipykernel install --user --name drlnd --display-name " drlnd " Sebelum menjalankan kode di buku catatan, ubah kernel agar sesuai dengan lingkungan drlnd dengan menggunakan menu Kernel drop-down.

Ayo belajar bersama kami dalam program penguatan nanodegree penguatan dalam di Udacity!
