pytorch a3c Download - pytorch a3c Quellcode Download

pytorch a3c

Python

1.0.0

Herunterladen

Pytorch-A3c

Dies ist eine Pytorch -Implementierung von Asynchronous Advantage Actor Critic (A3C) aus "asynchronen Methoden zum Tiefenstärkungslernen".

Diese Implementierung ist vom Universum Starter Agent inspiriert. Im Gegensatz zum Starteragenten verwendet es einen Optimierer mit gemeinsam genutzten Statistiken wie im Originalpapier.

Bitte verwenden Sie dieses Bibtex, wenn Sie dieses Repository in Ihren Veröffentlichungen zitieren möchten:

 @misc{pytorchaaac,
  author = {Kostrikov, Ilya},
  title = {PyTorch Implementations of Asynchronous Advantage Actor Critic},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/ikostrikov/pytorch-a3c}},
}

A2C

Ich empfehle dringend, eine sychrone Version und andere Algorithmen zu überprüfen: Pytorch-A2C-PPO-ACKTR.

Nach meiner Erfahrung funktioniert A2C besser als A3C und ACKTR ist besser als beide. Darüber hinaus ist PPO ein großartiger Algorithmus für die kontinuierliche Kontrolle. Daher empfehle ich, zuerst A2C/PPO/ACKTR auszuprobieren und A3C nur zu verwenden, wenn Sie ihn aus bestimmten Gründen speziell benötigen.

Lesen Sie auch OpenAI -Blog, um weitere Informationen zu erhalten.

Beiträge

Beiträge sind sehr willkommen. Wenn Sie wissen, wie Sie diesen Code besser machen können, zögern Sie nicht, eine Pull -Anfrage zu senden.

Verwendung

 # Works only wih Python 3.
python3 main.py --env-name " PongDeterministic-v4 " --num-processes 16

In diesem Code wird die Bewertung in einem separaten Thread zusätzlich zu 16 Prozessen ausgeführt.

Ergebnisse

Mit 16 Prozessen konvergiert es in 15 Minuten für PongDeterministic-V4.

Für BreakoutDeterministic-V4 dauert es mehr als mehrere Stunden.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Python
Aktualisierungszeit 2025-07-12
Größe 187.55KB
Kommt von Github

Ähnliche Anwendungen

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

pytorch a3c

Pytorch-A3c

A2C

Beiträge

Verwendung

Ergebnisse

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express