cartpole
1.0.0

Openai의 카트 폴의 강화 학습 솔루션.
해당 매체 기사를 확인하십시오 : Cartpole- 강화 학습 소개 (DQN -Deep Q- 러닝)
기둥은 카트에 비 연락 조인트에 의해 부착되어 마찰이없는 트랙을 따라 움직입니다. 이 시스템은 카트에 +1 또는 -1의 힘을 적용하여 제어됩니다. 진자는 똑바로 시작되며 목표는 그것이 넘어지지 않도록하는 것입니다. 기둥이 똑바로 유지되는 모든 타임 스펙에 대해 +1의 보상이 제공됩니다. 에피소드는 기둥이 수직에서 15도를 초과하거나 카트가 중앙에서 2.4 대 이상 이동하면 끝납니다. 원천
경험이 재생되는 표준 DQN.
Cartpole-V0은 "해결"을 100 회 연속 시험에서 195.0의 평균 보상을받는 것으로 정의합니다. 원천



Greg (Grzegorz) Surma
포트폴리오
github
블로그