Téléchargement rl plotter - Téléchargement du code source rl plotter

rl plotter

Autre code source

v2.4.0

Télécharger

troupeur RL

Readme | 中文文档

Il s'agit d'un outil simple qui peut tracer facilement les courbes d'apprentissage pour l'apprentissage par renforcement (RL)

Installation

de pip

 pip install rl_plotter

de la source

 python setup.py install

Usage

1. Ajouter un enregistreur de base

Ajoutez notre enregistreur dans votre code d'évaluation (recommander)

 from rl_plotter . logger import Logger
logger = Logger ( exp_name = "your_exp_name" , env_name , seed , locals ())
····
logger . update ( score = evaluation_score_list , total_steps = current_training_steps )

Ou utilisez simplement Openai-Spinningup pour enregistrer (support)

ou vous pouvez utiliser un banc d'Openai-Baseline.Monitor (ne recommande pas)

 env = logger . monitor_env ( env )

2. Suivre d'autres variables (en option)

Si vous souhaitez suivre d'autres variables, vous pouvez utiliser notre Custom_logger:

 custom_logger = logger . new_custom_logger ( filename , fieldnames = [ "variable 1" , "variable 2" , ..., "variable n" ])
custom_logger . update ( fieldvalues = variable_value_list , total_steps = current_training_steps )

3. Tracer les résultats

Après la formation ou lorsque vous formez votre agent, vous pouvez tracer les courbes d'apprentissage de cette manière:

Passez au répertoire de journal ou au répertoire parent de Multi Log (par défaut: ./)
Exécutez la commande pour tracer:

 rl_plotter --save --show

Vous pouvez également utiliser le noyau Seaborn pour obtenir le même style de l'intrigue qu'Openai-Spinningup:

 rl_plotter_spinup --save --show

Exemple

1. Commandes couramment utilisées

 rl_plotter --save --show --filter HalfCheetah
rl_plotter --save --show --filter Ant --avg_group --shaded_std
rl_plotter --save --show --filter Swimmer --avg_group --shaded_std --shaded_err
rl_plotter --save --show --filter Walker2d --filename progress.txt --xkey TotalEnvInteracts --ykey AverageEpRet

2. Exemples pratiques

 rl_plotter --show --save --avg_group --shaded_err --shaded_std

 rl_plotter --show --save --avg_group --shaded_err --shaded_std --filename q --filters Walker HalfCheetah --ykey bias real_q --yduel --style default --smooth 0

3. Utilisation plus spécifique

Vous pouvez trouver tous les paramètres qui peuvent personnaliser le style de vos courbes en utilisant help

 rl_plotter --help

 optional arguments:
-h, --help            show this help message and exit
--fig_length          matplotlib figure length (default: 8)
--fig_width           matplotlib figure width (default: 6)
--style               matplotlib figure style (default: seaborn)
--title               matplotlib figure title (default: None)
--xlabel              matplotlib figure xlabel
--xkey                x-axis key in csv file (default: l)
--ykey                y-axis key in csv file (support multi) (default: r)
--yduel               duel y axis (use if has two ykeys)
--ylabel              matplotlib figure ylabel
--smooth              smooth radius of y axis (default: 10)
--resample            if not zero, size of the uniform grid in x direction
                      to resample onto. Resampling is performed via
                      symmetric EMA smoothing (see the docstring for
                      symmetric_ema). Default is zero (no resampling). Note
                      that if average_group is True, resampling is
                      necessary; in that case, default value is 512.
                      (default: 512)
--smooth_step         when resampling (i.e. when resample > 0 or
					  average_group is True), use this EMA decay parameter
                      (in units of the new grid step). See docstrings for
                      decay_steps in symmetric_ema or one_sided_ema functions. 
                      (default: 1.0)
--avg_group           average the curves in the same group and plot the mean
--shaded_std          shaded region corresponding to standard deviation of the group
--shaded_err          shaded region corresponding to error in mean estimate of the group
--legend_loc          location of legend
--legend_outside      place the legend outside of the figure
--borderpad           borderpad of legend (default: 0.5)
--labelspacing        labelspacing of legend (default: 0.5)
--no_legend_group_num don't show num of group in legend
--time                enable this will activate parameters about time
--time_unit           parameters about time, x axis time unit (default: h)
--time_interval       parameters about time, x axis time interval (default: 1)
--xformat             x-axis format
--xlim                x-axis limitation (default: None)
--log_dir             log dir (default: ./)
--filters             filter of dirname
--filename            csv filename
--show                show figure
--save                save figure
--dpi                 figure dpi (default: 400)

Caractéristiques

Enregistreur personnalisé, style, clé, étiquette, formateur de l'axe X, etc. ...
filtre du nom du répertoire
traceur multi-expériences
Multipliers des grains de tracé (tracé de Matplotlib indigène ou tracé de Seaborn)
Compatible avec le moniteur Openai-Baseline et Openai-Spinningup
couleur correspondante pour une expérience spécifique
Multi y Key & Duel Y Légende

Citant le projet

Si vous utilisez ce référentiel pour votre recherche ou votre publication, veuillez citer:

 @misc{rl-plotter,
  author = {Xiaoyu Gong},
  title = {RL-plotter: A plotter for reinforcement learning},
  year = {2020},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/gxywy/rl-plotter}},
}

Reconnaissance

Le cœur de cet outil est inspiré par Baslines / Plot_util.py et Spinningup / Plot.py

Développer

Informations supplémentaires

Version v2.4.0
Type Autre code source
Date de mise à jour 2025-03-04
taille 1.47MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout