Пакет CONTIB для стабильных баселинов3 - Код экспериментального обучения подкреплению (RL). "SB3-Contrib" за короткий.
Место для алгоритмов RL и инструментов, которые считаются экспериментальными, например, реализациями последних публикаций. Цель состоит в том, чтобы сохранить простоту, документацию и стиль стабильных баселин3, но для менее зрелых реализаций.
На протяжении всей стабильной базелины и стабильных баселин3 сообщество стремится внести свой вклад в форме лучших утилит для ведения ведения ведения ведения, обертки окружающей среды, расширенной поддержки (например, различных пространств действия) и алгоритмов обучения.
Однако иногда эти утилиты были слишком нишевыми, чтобы их можно было учитывать для стабильных баселин или оказалось слишком сложным, чтобы хорошо интегрироваться в существующий код без создания беспорядка. SB3-Contrib стремится исправить это, не требуя самой аккуратной интеграции кода с существующим кодом и не устанавливая ограничения на то, что слишком нишевое: почти все удаленно полезно! Мы надеемся, что это позволит нам обеспечить надежные реализации после обычных стандартов стабильных базелей (последовательный стиль, документация и т. Д.) Помимо относительно небольшого объема коммунальных услуг в основном репозитории.
См. Документацию для полного списка включенных функций.
Алгоритмы RL :
Обертки в спортзале :
Документация доступна онлайн: https://sb3-contrib.readthedocs.io/
Чтобы установить стабильный базовый вклад в PIP, выполнить:
pip install sb3-contrib
Мы рекомендуем использовать master версию стабильных базовых показателей3.
Для установки стабильной базовой версии3 master версия:
pip install git+https://github.com/DLR-RM/stable-baselines3
Чтобы установить стабильную master -версию Baserines3:
pip install git+https://github.com/Stable-Baselines-Team/stable-baselines3-contrib
Если вы хотите внести свой вклад, сначала прочитайте ancoming.md -гид.
Чтобы привести этот репозиторий в публикациях (пожалуйста, цитируйте SB3 напрямую):
@article { stable-baselines3 ,
author = { Antonin Raffin and Ashley Hill and Adam Gleave and Anssi Kanervisto and Maximilian Ernestus and Noah Dormann } ,
title = { Stable-Baselines3: Reliable Reinforcement Learning Implementations } ,
journal = { Journal of Machine Learning Research } ,
year = { 2021 } ,
volume = { 22 } ,
number = { 268 } ,
pages = { 1-8 } ,
url = { http://jmlr.org/papers/v22/20-1364.html }
}