Téléchargement DeepRL Tutorials - DeepRL Tutorials Téléchargement du code source

DeepRL Tutorials

Python

1.0.0

Télécharger

Tortorial de profondeur

L'intention de ces cahiers Ipython est principalement de m'aider à pratiquer et à comprendre les articles que je lis; Ainsi, j'opterai pour la lisibilité à l'efficacité dans certains cas. Tout d'abord, l'implémentation sera téléchargée, suivie d'un balisage pour expliquer chaque partie du code. Je vais attribuer un crédit pour tout code emprunté dans la section Remerciements de cette lecture.

Documents pertinents:

Contrôle du niveau humain par l'apprentissage en renforcement profond [Publication] [Code]
Apprentissage en plusieurs étapes (de l'apprentissage du renforcement: une introduction, chapitre 7) [Publication] [Code]
Apprentissage en renforcement profond avec double Q-Learning [Publication] [Code]
Architectures de réseau en duel pour l'apprentissage en renforcement profond [Publication] [Code]
Réseaux bruyants pour l'exploration [Publication] [Code]
Expérience hiérarchisée Replay [Publication] [Code]
Une perspective de distribution sur l'apprentissage du renforcement [Publication] [Code]
Rainbow: combinant des améliorations de l'apprentissage en renforcement profond [Publication] [Code]
Apprentissage du renforcement distributionnel avec régression quantile [publication] [Code]
Arc-en-ciel avec régression quantile [code]
Apprentissage en QC récurrent profond pour les MDPs partiellement observables [Publication] [Code]
Avantage acteur critique (A2C) [Publication1] [Publication2] [Code]
Contrôle continu de grande dimension utilisant l'estimation des avantages généralisés [Publication] [Code]
Algorithmes d'optimisation de la politique proximale [Publication] [Code]

Exigences:

Python 3.6
Nombant
Salle de sport
Pytorch 0.4.0
Matplotlib
Opencv
Lignes de bases

Remerciements:

Crédit à @Baselines pour les emballages environnementaux et l'inspiration pour le code de relecture prioritaire utilisé uniquement dans le code de développement
Crédit à @higgsfield pour le code de traçage, le code de recuit Epsilon et l'inspiration pour l'implémentation de relecture prioritaire dans le cahier Ipython
Crédit à @kaixhin pour la mise en œuvre de la couche linéaire bruyante factorielle et la fonction projection_distribution trouvée dans catégorique-DQN.ipynb
Crédit à @ikostrikov pour A2C, GAE, PPO et Visdom Plotting Code Implémentation Reference

Développer

Informations supplémentaires

Version 1.0.0
Type Python
Date de mise à jour 2025-07-15
taille 63.82MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
datamule python

Python
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout