cartpole 다운로드 - cartpole 소스 코드 다운로드

한국어

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

홈페이지>프로그래밍 관련>기타 소스코드

cartpole

기타 소스코드

1.0.0

다운로드

카트 폴

Openai의 카트 폴의 강화 학습 솔루션.

해당 매체 기사를 확인하십시오 : Cartpole- 강화 학습 소개 (DQN -Deep Q- 러닝)

에 대한

기둥은 카트에 비 연락 조인트에 의해 부착되어 마찰이없는 트랙을 따라 움직입니다. 이 시스템은 카트에 +1 또는 -1의 힘을 적용하여 제어됩니다. 진자는 똑바로 시작되며 목표는 그것이 넘어지지 않도록하는 것입니다. 기둥이 똑바로 유지되는 모든 타임 스펙에 대해 +1의 보상이 제공됩니다. 에피소드는 기둥이 수직에서 15도를 초과하거나 카트가 중앙에서 2.4 대 이상 이동하면 끝납니다. 원천

DQN

경험이 재생되는 표준 DQN.

하이퍼 파라미터 :

감마 = 0.95
Learning_rate = 0.001
memory_size = 10000000
batch_size = 20
Exploration_max = 1.0
Exploration_min = 0.01
Exploration_decay = 0.995

모델 구조 :

고밀도 - 입력 : 4 , 출력 : 24 , 활성화 : Relu
밀도가 높은 레이어 - 입력 24 , 출력 : 24 , 활성화 : Relu
고밀도 - 입력 24 , 출력 : 2 , 활성화 : 선형

MSE 손실 기능
Adam Optimizer

성능

Cartpole-V0은 "해결"을 100 회 연속 시험에서 195.0의 평균 보상을받는 것으로 정의합니다. 원천

예제 시험 GIF

예제 시험 차트

해결 된 시험 차트

작가

Greg (Grzegorz) Surma

포트폴리오

github

블로그

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-03-02
크기 1.05MB
출처 Github

관련 애플리케이션

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

추천

chat.petals.dev

기타 소스코드

1.0.0
GPT Prompt Templates

기타 소스코드

1.0.0
GPTyped

기타 소스코드

GPTyped 1.0.5
Google Dorks

기타 소스코드

1.0
shepherd

기타 소스코드

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

기타 소스코드

v1.1.0-rc-3
Google Dorks

기타 소스코드

1.0
shepherd

기타 소스코드

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

기타 소스코드

v1.1.0-rc-3

관련 정보 전체