pytorch a3c Download - تنزيل رمز المصدر pytorch a3c

pytorch a3c

بايثون

1.0.0

تنزيل

Pytorch-A3C

هذا هو تنفيذ Pytorch من الناقد غير المتزامن للممثل (A3C) من "الأساليب غير المتزامنة للتعلم التعزيز العميق".

هذا التنفيذ مستوحى من وكيل بداية الكون. على عكس وكيل المبتدئين ، فإنه يستخدم مُحسّنًا مع إحصائيات مشتركة كما في الورقة الأصلية.

يرجى استخدام هذا bibtex إذا كنت تريد الاستشهاد بهذا المستودع في منشوراتك:

 @misc{pytorchaaac,
  author = {Kostrikov, Ilya},
  title = {PyTorch Implementations of Asynchronous Advantage Actor Critic},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/ikostrikov/pytorch-a3c}},
}

A2C

أوصي بشدة بالتحقق من نسخة مخطوطة وخوارزميات أخرى: Pytorch-A2C-PPO-acktr.

في تجربتي ، يعمل A2C بشكل أفضل من A3C و Acktr أفضل من كلاهما. علاوة على ذلك ، PPO هي خوارزمية رائعة للتحكم المستمر. وبالتالي ، أوصي بتجربة A2C/PPO/ACKTR أولاً واستخدام A3C فقط إذا كنت في حاجة إليها على وجه التحديد لبعض الأسباب.

اقرأ أيضًا مدونة Openai لمزيد من المعلومات.

مساهمات

المساهمات مرحب بها للغاية. إذا كنت تعرف كيفية جعل هذا الرمز أفضل ، فلا تتردد في إرسال طلب سحب.

الاستخدام

 # Works only wih Python 3.
python3 main.py --env-name " PongDeterministic-v4 " --num-processes 16

يقوم هذا الرمز بتشغيل التقييم في مؤشر ترابط منفصل بالإضافة إلى 16 عملية.

نتائج

مع 16 عملية تتقارب مع Pongdeterministic-V4 في 15 دقيقة.

بالنسبة لـ BreakoutDeterministic-V4 ، يستغرق الأمر أكثر من عدة ساعات.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-12
الحجم 187.55KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل