Pacote de contributo para o código estável -Baselines3 - Código de Aprendizagem de Reforço Experimental (RL). "SB3-Contrib" para abreviar.
Um local para algoritmos e ferramentas RL que são considerados implementações experimentais, por exemplo, das mais recentes publicações. O objetivo é manter a simplicidade, documentação e estilo de base estável3, mas para implementações menos amadurecidas.
Ao longo das linhas de base estável e da base estável3, a comunidade está ansiosa para contribuir na forma de melhores utilitários de log, invólucros do ambiente, suporte estendido (por exemplo, diferentes espaços de ação) e algoritmos de aprendizado.
No entanto, às vezes, esses utilitários eram muito nicho para serem considerados para baselas estáveis ou provaram ser muito difíceis de se integrar bem ao código existente sem criar uma bagunça. O SB3-Contrib visa corrigir isso, não exigindo a maior integração de código com o código existente e não definindo limites para o que é muito nicho: quase tudo o que é útil remotamente é necessário! Esperamos que isso nos permita fornecer implementações confiáveis, seguindo os padrões usuais de base estável (estilo consistente, documentação etc.) além do escopo relativamente pequeno dos utilitários no repositório principal.
Consulte a documentação para obter a lista completa dos recursos incluídos.
Algoritmos RL :
Ginástica de ginástica :
A documentação está disponível online: https://sb3-contrib.readthedocs.io/
Para instalar linhas de base estável3 Contrible com PIP, execute:
pip install sb3-contrib
Recomendamos usar a versão master das linhas de base estável3.
Para instalar as linhas de base estável3 versão master :
pip install git+https://github.com/DLR-RM/stable-baselines3
Para instalar linhas de base estável3 Versão master Contrib:
pip install git+https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
Se você deseja contribuir, leia o guia contribuinte.md primeiro.
Para citar este repositório em publicações (cite o SB3 diretamente):
@article { stable-baselines3 ,
author = { Antonin Raffin and Ashley Hill and Adam Gleave and Anssi Kanervisto and Maximilian Ernestus and Noah Dormann } ,
title = { Stable-Baselines3: Reliable Reinforcement Learning Implementations } ,
journal = { Journal of Machine Learning Research } ,
year = { 2021 } ,
volume = { 22 } ,
number = { 268 } ,
pages = { 1-8 } ,
url = { http://jmlr.org/papers/v22/20-1364.html }
}