Télécharger openai_lab - openai_lab Code source Télécharger

openai_lab

Autre code source

ve PER

Télécharger

Laboratoire d'ouverture

AVIS: Veuillez utiliser la version suivante, SLM-LAB.

Documentation Openai Lab

Un cadre d'expérimentation pour l'apprentissage du renforcement à l'aide de l'Openai Gym, TensorFlow et Keras.

Openai Lab est créé pour faire l'apprentissage du renforcement (RL) comme la science - théoriser, expérimenter . Il fournit une interface facile à Openai Gym et Keras, avec un cadre automatisé d'expérimentation et d'évaluation.

Caractéristiques

Interface Unified RL Environment and Agent utilisant Openai Gym, TensorFlow, Keras, afin que vous puissiez vous concentrer sur le développement des algorithmes.
Implémentations des algorithmes RL Core, avec des composants modulaires réutilisables pour développer des algorithmes RL profonds.
Un cadre d'expérimentation pour exécuter des centaines d'essais d'optimisations d'hyperparamètre, avec des journaux, des parcelles et des analyses pour tester de nouveaux algorithmes RL. Les paramètres expérimentaux sont stockés dans des JSons standardisés pour la reproductibilité et les comparaisons.
Analyse automatisée des expériences pour évaluer les agents et les environnements RL, et pour aider à choisir la meilleure solution.
La matrice de fitness , une table des meilleurs scores d'algorithmes RL par rapport aux environnements; utile pour la recherche.

Avec Openai Lab, nous pourrions nous concentrer sur la recherche sur les éléments essentiels de l'apprentissage du renforcement tels que l'algorithme, la politique, la mémoire et le réglage des paramètres. Il nous permet de construire des agents en utilisant efficacement les composants existants avec les implémentations des idées de recherche. Nous avons ensuite pu tester systématiquement les hypothèses de recherche en exécutant des expériences.

En savoir plus sur les problèmes de recherche résultant du laboratoire dans les motivations. En fin de compte, le laboratoire est un cadre généralisé pour faire l'apprentissage par renforcement, agnostique de l'Openai Gym et Keras. Par exemple, les implémentations basées sur Pytorch sont sur la feuille de route.

Algorithmes implémentés

Une liste des algorithmes RL de base implémentés / planifiés.

Pour voir leurs scores contre les environnements Openai Gym, allez à la matrice de fitness .

algorithme	mise en œuvre	Score d'évaluation (en attente)
Dqn	Dqn	-
DQN double	Doublé	-
Duel dqn	-	-
Sarsa	Deepdsarsa	-
Sarsa hors politique	Offpolicysarsa	-
Par (relecture d'expérience prioritaire)	PriorizedExperiencereplay	-
CEM (méthode d'entropie croisée)	suivant	-
RENFORCER	-	-
DPG (gradient de politique déterministe) acteur hors politique	Acteurcritique	-
Acteur-critique DDPG (Deep-DPG) avec des réseaux cibles	Ddpg	-
A3C (Avantage asynchrone acteur-critique)	-	-
Dyna	suivant	-
Trpo	-	-
Q * (Lambda)	-	-
Retrace (lambda)	-	-
Contrôle épisodique neural (NEC)	-	-
EWC (consolidation de poids élastique)	-	-

Courir le laboratoire

Ensuite, consultez l'installation et passez à QuickStart.

Timelapse d'Openai Lab, résolvant Cartpole-V0.

Développer

Informations supplémentaires

Version ve PER
Type Autre code source
Date de mise à jour 2025-02-28
taille 76.39KB
Provenant de Github

Applications connexes

MB Lab

2024-11-12
ouvert

2024-05-24
Version nationale d'OpenAI

2024-05-22
Laboratoire de poche de numérisation

2024-02-22
Laboratoire de visée

2022-08-10
Rat de laboratoire

2022-08-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout