rl plotter Download - rl plotter Source Code Download

rl plotter

Kode sumber lainnya

v2.4.0

Unduh

RL-Plotter

Readme | 中文文档

Ini adalah alat sederhana yang dapat merencanakan kurva pembelajaran dengan mudah untuk pembelajaran penguatan (RL)

Instalasi

dari pip

 pip install rl_plotter

dari sumber

 python setup.py install

Penggunaan

1. Tambahkan Logger Dasar

Tambahkan logger kami dalam kode evaluasi Anda (Rekomendasikan)

 from rl_plotter . logger import Logger
logger = Logger ( exp_name = "your_exp_name" , env_name , seed , locals ())
····
logger . update ( score = evaluation_score_list , total_steps = current_training_steps )

Atau cukup gunakan openai-spinningup untuk log (dukungan)

Atau Anda dapat menggunakan Openai-Baseline Bench.monitor (tidak merekomendasikan)

 env = logger . monitor_env ( env )

2. Lacak variabel lain (opsional)

Jika Anda ingin melacak variabel lain, Anda dapat menggunakan custom_logger kami:

 custom_logger = logger . new_custom_logger ( filename , fieldnames = [ "variable 1" , "variable 2" , ..., "variable n" ])
custom_logger . update ( fieldvalues = variable_value_list , total_steps = current_training_steps )

3. Plot Hasilnya

Setelah pelatihan atau saat Anda melatih agen Anda, Anda dapat merencanakan kurva pembelajaran dengan cara ini:

Beralih ke direktori log atau direktori induk multi -log (default: ./)
Jalankan perintah untuk plot:

 rl_plotter --save --show

Anda juga dapat menggunakan Kernel Seeborn untuk mendapatkan gaya plot yang sama dengan OpenAI-Spinningup:

 rl_plotter_spinup --save --show

Contoh

1. Perintah yang umum digunakan

 rl_plotter --save --show --filter HalfCheetah
rl_plotter --save --show --filter Ant --avg_group --shaded_std
rl_plotter --save --show --filter Swimmer --avg_group --shaded_std --shaded_err
rl_plotter --save --show --filter Walker2d --filename progress.txt --xkey TotalEnvInteracts --ykey AverageEpRet

2. Contoh -contoh praktis

 rl_plotter --show --save --avg_group --shaded_err --shaded_std

 rl_plotter --show --save --avg_group --shaded_err --shaded_std --filename q --filters Walker HalfCheetah --ykey bias real_q --yduel --style default --smooth 0

3. Penggunaan yang lebih spesifik

Anda dapat menemukan semua parameter yang dapat menyesuaikan gaya kurva Anda menggunakan help

 rl_plotter --help

 optional arguments:
-h, --help            show this help message and exit
--fig_length          matplotlib figure length (default: 8)
--fig_width           matplotlib figure width (default: 6)
--style               matplotlib figure style (default: seaborn)
--title               matplotlib figure title (default: None)
--xlabel              matplotlib figure xlabel
--xkey                x-axis key in csv file (default: l)
--ykey                y-axis key in csv file (support multi) (default: r)
--yduel               duel y axis (use if has two ykeys)
--ylabel              matplotlib figure ylabel
--smooth              smooth radius of y axis (default: 10)
--resample            if not zero, size of the uniform grid in x direction
                      to resample onto. Resampling is performed via
                      symmetric EMA smoothing (see the docstring for
                      symmetric_ema). Default is zero (no resampling). Note
                      that if average_group is True, resampling is
                      necessary; in that case, default value is 512.
                      (default: 512)
--smooth_step         when resampling (i.e. when resample > 0 or
					  average_group is True), use this EMA decay parameter
                      (in units of the new grid step). See docstrings for
                      decay_steps in symmetric_ema or one_sided_ema functions. 
                      (default: 1.0)
--avg_group           average the curves in the same group and plot the mean
--shaded_std          shaded region corresponding to standard deviation of the group
--shaded_err          shaded region corresponding to error in mean estimate of the group
--legend_loc          location of legend
--legend_outside      place the legend outside of the figure
--borderpad           borderpad of legend (default: 0.5)
--labelspacing        labelspacing of legend (default: 0.5)
--no_legend_group_num don't show num of group in legend
--time                enable this will activate parameters about time
--time_unit           parameters about time, x axis time unit (default: h)
--time_interval       parameters about time, x axis time interval (default: 1)
--xformat             x-axis format
--xlim                x-axis limitation (default: None)
--log_dir             log dir (default: ./)
--filters             filter of dirname
--filename            csv filename
--show                show figure
--save                save figure
--dpi                 figure dpi (default: 400)

Fitur

Logger Kustom, Gaya, Kunci, Label, Formatter X-Axis, dan sebagainya ...
filter nama direktori
Plotter multi-eksperimen
beberapa kernel yang merencanakan (plot mattlotlib asli atau plot laut)
kompatibel dengan monitor openai-baseline dan pemintalan openai
Warna yang sesuai untuk percobaan tertentu
Legenda Key & Duel Y Multi Y

Mengutip proyek

Jika menggunakan repositori ini untuk penelitian atau publikasi Anda, silakan kutip:

 @misc{rl-plotter,
  author = {Xiaoyu Gong},
  title = {RL-plotter: A plotter for reinforcement learning},
  year = {2020},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/gxywy/rl-plotter}},
}

Pengakuan

Inti dari alat ini terinspirasi oleh baselines/plot_util.py dan spinningup/plot.py

Memperluas

Informasi Tambahan

Versi v2.4.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-04
ukuran 1.47MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua