pytorch a3c Téléchargement - pytorch a3c Code source Télécharger

pytorch a3c

Python

1.0.0

Télécharger

pytorch-a3c

Il s'agit d'une mise en œuvre pytorch de l'avantage asynchrone Critique d'acteur (A3C) à partir de "méthodes asynchrones d'apprentissage en renforcement profond".

Cette implémentation est inspirée par l'agent de démarrage de l'univers. Contrairement à l'agent de démarrage, il utilise un optimiseur avec des statistiques partagées comme dans l'article d'origine.

Veuillez utiliser ce bibtex si vous souhaitez citer ce référentiel dans vos publications:

 @misc{pytorchaaac,
  author = {Kostrikov, Ilya},
  title = {PyTorch Implementations of Asynchronous Advantage Actor Critic},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/ikostrikov/pytorch-a3c}},
}

A2C

Je recommande fortement de vérifier une version sychronique et d'autres algorithmes: pytorch-a2c-pppo-backtr.

D'après mon expérience, A2C fonctionne mieux que A3C et ACKTR est meilleur que les deux. De plus, PPO est un excellent algorithme pour le contrôle continu. Ainsi, je recommande d'abord d'essayer A2C / PPO / ACKTR et d'utiliser A3C uniquement si vous en avez besoin spécifiquement pour certaines raisons.

Lisez également le blog Openai pour plus d'informations.

Contributions

Les contributions sont les bienvenues. Si vous savez comment améliorer ce code, n'hésitez pas à envoyer une demande de traction.

Usage

 # Works only wih Python 3.
python3 main.py --env-name " PongDeterministic-v4 " --num-processes 16

Ce code exécute l'évaluation dans un thread séparé en plus de 16 processus.

Résultats

Avec 16 processus, il converge pour le pongdeterministe-V4 en 15 minutes.

Pour Breakoutdeterministic-V4, il faut plus de plusieurs heures.

Développer

Informations supplémentaires

Version 1.0.0
Type Python
Date de mise à jour 2025-07-12
taille 187.55KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Outil de création de graphiques de données open source Redash v24.10.0

Python

24.10.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout