
يحتوي هذا المستودع على مواد تتعلق ببرنامج التعزيز العميق في التعزيز العميق في Udacity.
تقودك البرامج التعليمية من خلال تنفيذ مختلف الخوارزميات في تعلم التعزيز. كل الكود في Pytorch (v0.4) و Python 3.
يمكن العثور على المختبرات والمشاريع أدناه. تستخدم جميع المشاريع بيئات المحاكاة الغنية من مواليد الوحدة. في برنامج التعلم العميق التعلم nanodegree ، ستتلقى مراجعة لمشروعك. تهدف هذه المراجعات إلى منحك ملاحظات مخصصة وإخبارك بما يمكن تحسينه في الكود الخاص بك.
Acrobot-v1 مع ترميز البلاط والتعلم QCartpole-v0 مع تسلق التل | تم حلها في 13 حلقةCartpole-v0 مع تعزيز | تم حلها في 691 حلقةMountainCarContinuous-v0 مع طريقة المتقاطع | حل في 47 تكرارMountainCar-v0 مع تقديري الشبكة الموحدة والتعلم Q | تم حلها في <50000 حلقاتPendulum-v0 مع تدرجات السياسة الحتمية العميقة (DDPG)BipedalWalker-v2 مع تدرجات السياسة الحتمية العميقة (DDPG)CarRacing-v0 مع Q-networks العميق (DQN) | قريباً!LunarLander-v2 مع Deep Q-Networks (DQN) | تم حلها في 1504 حلقةFrozenLake-v0 مع البرمجة الديناميكيةBlackjack-v0 مع أساليب Monte CarloCliffWalking-v0 مع طرق الفرق الزمني لإعداد بيئة Python لتشغيل الرمز في هذا المستودع ، اتبع الإرشادات أدناه.
إنشاء (وتفعيل) بيئة جديدة مع Python 3.6.
conda create --name drlnd python=3.6
source activate drlndconda create --name drlnd python=3.6
activate drlndإذا كنت تعمل في Windows ، فتأكد من أن لديك "أدوات البناء لـ Visual Studio 2019" المثبت من هذا الموقع. قد تكون هذه المقالة مفيدة للغاية. تم تأكيد ذلك للعمل في Windows 10 Home.
اتبع الإرشادات الواردة في هذا المستودع لأداء الحد الأدنى من تثبيت Openai Gym.
استنساخ المستودع (إذا لم تقم بالفعل!) ، وانتقل إلى python/ المجلد. ثم ، تثبيت العديد من التبعيات.
git clone https://github.com/udacity/deep-reinforcement-learning.git
cd deep-reinforcement-learning/python
pip install . إنشاء kernel ipython لبيئة drlnd .
python -m ipykernel install --user --name drlnd --display-name " drlnd " قبل تشغيل التعليمات البرمجية في دفتر ملاحظات ، قم بتغيير kernel لمطابقة بيئة drlnd باستخدام قائمة Kernel المنسدلة.

تعال وتعلم معنا في برنامج التعلم العميق التعلم النانودي في Udacity!
