Beitragspaket für stabile Baselines3 - RL -Code (Experimental Construcement Learning). "SB3-Contrib" kurz.
Ein Ort für RL -Algorithmen und -Tools, die als experimentelle Implementierungen der neuesten Veröffentlichungen angesehen werden. Ziel ist es, die Einfachheit, Dokumentation und den Stil von stabilen Baselines zu halten, jedoch für weniger reife Implementierungen.
Während der Zeitspanne von stabilen Baselinen und Stabilen-Baselines3 war die Gemeinde bestrebt, in Form von besseren Protokollierungsversorgungsunternehmen, Umweltverpackern, erweiterten Unterstützung (z. B. unterschiedlichen Aktionsräume) und Lernalgorithmen einen Beitrag zu leisten.
Manchmal waren diese Versorgungsunternehmen jedoch zu Nische, um für stabile Baselines in Betracht gezogen zu werden, oder erwies sich als zu schwierig, um sich gut in den vorhandenen Code zu integrieren, ohne ein Chaos zu erstellen. SB3-CONTRIB zielt darauf ab, dies zu beheben, indem Sie nicht die schönste Code-Integration mit vorhandenem Code benötigen und keine Grenzen für die Nische festlegen: Fast alles, was von der Ferne nützlich ist! Wir hoffen, dass wir dies ermöglicht, zuverlässige Implementierungen nach den üblichen Standards der stabilen Baselines (konsistenter Stil, Dokumentation usw.) über den relativ kleinen Umfang der Versorgungsunternehmen im Hauptrepository hinaus bereitzustellen.
In den Dokumentationen finden Sie die vollständige Liste der enthaltenen Funktionen.
RL -Algorithmen :
Fitnessstudio -Verpackungen :
Die Dokumentation ist online verfügbar: https://sb3-contrib.readthedocs.io/
Um stabile Baselines zu installieren, tragen Sie mit PIP aus: Ausführen:
pip install sb3-contrib
Wir empfehlen, die master -Version von stabilen Baselines3 zu verwenden.
So installieren Sie stabile Baselines3 master -Version:
pip install git+https://github.com/DLR-RM/stable-baselines3
So installieren Sie stabile Baselines3 master -Versionen:
pip install git+https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
Wenn Sie einen Beitrag leisten möchten, lesen Sie bitte zuerst die Mitarbeit.md Guide.
So zitieren Sie dieses Repository in Veröffentlichungen (bitte direkt SB3 angeben):
@article { stable-baselines3 ,
author = { Antonin Raffin and Ashley Hill and Adam Gleave and Anssi Kanervisto and Maximilian Ernestus and Noah Dormann } ,
title = { Stable-Baselines3: Reliable Reinforcement Learning Implementations } ,
journal = { Journal of Machine Learning Research } ,
year = { 2021 } ,
volume = { 22 } ,
number = { 268 } ,
pages = { 1-8 } ,
url = { http://jmlr.org/papers/v22/20-1364.html }
}