Stable -BaselinesのContribパッケージ3-実験補強学習(RL)コード。略して「sb3-contrib」。
実験的と見なされるRLアルゴリズムとツールの場所、たとえば最新の出版物の実装など。目標は、安定したベースラインのシンプルさ、ドキュメント、スタイルを維持することです。
安定した盆地と安定した盆地の範囲で、コミュニティは、より良い伐採ユーティリティ、環境ラッパー、拡張サポート(異なるアクションスペースなど)、学習アルゴリズムの形で貢献したいと考えています。
ただし、これらのユーティリティは、安定したベースラインのために考慮されないほどニッチであったり、混乱を引き起こすことなく既存のコードに統合するのが難しすぎることが証明された場合があります。 SB3-Contribは、既存のコードとの最もきちんとしたコード統合を必要とせず、あまりにもニッチであるものに制限を設定しないことでこれを修正することを目指しています。これにより、メインリポジトリ内の比較的小さなユーティリティの範囲を超えて、安定した基準(一貫したスタイル、ドキュメントなど)に従って信頼できる実装を提供できることを願っています。
含まれる機能の完全なリストについては、ドキュメントを参照してください。
RLアルゴリズム:
ジムラッパー:
ドキュメントはオンラインで入手できます:https://sb3-contrib.readthedocs.io/
Stable Baselines3をPIPにインストールするには、実行してください。
pip install sb3-contrib
Stable Baselines3のmasterバージョンを使用することをお勧めします3。
Stable Baselines3 masterバージョンをインストールするには:
pip install git+https://github.com/DLR-RM/stable-baselines3
Stable Baselines3コントリブmasterバージョンをインストールするには:
pip install git+https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
貢献したい場合は、最初にConvributing.MDガイドをお読みください。
出版物でこのリポジトリを引用するには(SB3を直接引用してください)。
@article { stable-baselines3 ,
author = { Antonin Raffin and Ashley Hill and Adam Gleave and Anssi Kanervisto and Maximilian Ernestus and Noah Dormann } ,
title = { Stable-Baselines3: Reliable Reinforcement Learning Implementations } ,
journal = { Journal of Machine Learning Research } ,
year = { 2021 } ,
volume = { 22 } ,
number = { 268 } ,
pages = { 1-8 } ,
url = { http://jmlr.org/papers/v22/20-1364.html }
}