deep reinforcement learning
1.0.0

該存儲庫包含與Udacity深入增強學習納米模板程序有關的材料。
這些教程使您通過在增強學習中實施各種算法。所有代碼都在Pytorch(V0.4)和Python 3中。
實驗室和項目可以在下面找到。所有項目都使用來自Unity ML代理的豐富仿真環境。在深入的增強學習納米模板計劃中,您將收到對項目的評論。這些評論旨在為您提供個性化的反饋,並告訴您代碼中可以改進的內容。
Acrobot-v1帶有瓷磚編碼和Q學習Cartpole-v0與爬山|解決了13集Cartpole-v0帶有增強|解決了691集MountainCarContinuous-v0 |解決了47次迭代MountainCar-v0 |解決了<50000集Pendulum-v0具有深層確定性政策梯度(DDPG)BipedalWalker-v2CarRacing-v0 |即將推出!LunarLander-v2帶有深Q-Networks(DQN)|解決了1504集FrozenLake-v0Blackjack-v0CliffWalking-v0 要設置您的Python環境以在此存儲庫中運行代碼,請按照以下說明進行操作。
使用Python 3.6創建(並激活)新環境。
conda create --name drlnd python=3.6
source activate drlndconda create --name drlnd python=3.6
activate drlnd如果在Windows中運行,請確保您從本網站安裝了“為Visual Studio 2019構建工具”。本文也可能非常有幫助。這被確認可以在Windows 10 Home工作。
請按照此存儲庫中的說明進行最少的OpenAI健身房安裝。
克隆存儲庫(如果還沒有!),然後導航到python/文件夾。然後,安裝幾個依賴項。
git clone https://github.com/udacity/deep-reinforcement-learning.git
cd deep-reinforcement-learning/python
pip install .為drlnd環境創建一個ipython內核。
python -m ipykernel install --user --name drlnd --display-name " drlnd "在筆記本中運行代碼之前,請使用下拉Kernel菜單更改內核以匹配drlnd環境。

在Udacity的深入加固學習納米模板計劃中與我們一起學習!
