minimalRLダウンロードminimalRLソースコードのダウンロード

minimalRL

パイソン

1.0.0

ダウンロード

minimalrl-pytorch

コードの最小行を使用した基本的なRLアルゴリズムの実装！（Pytorchベース）

各アルゴリズムは単一のファイル内で完了します。
各ファイルの長さは、最大100〜150行のコードです。
すべてのアルゴリズムは、GPUがなくても30秒以内にトレーニングできます。
envsは「cartpole-v1」に固定されています。実装に焦点を当てることができます。

アルゴリズム

強化（67行）
バニラ俳優 - 批評家（98行）
DQN（リプレイメモリとターゲットネットワークを含む112行）
PPO（GAEを含む119行）
DDPG（OUノイズとソフトターゲットの更新を含む145行）
A3c（129行）
エイサー（149行）
A2C（188行）
SAC（171行）追加!!
PPO-CONTINUOUS（161行）追加!!
vtrace（137行）追加!!
何か提案...？

依存関係

Pytorch
Openaiジム（> 0.26.2重要!!以前のバージョンのサポートがなくなりました）

使用法

 # Works only with Python 3.
# e.g.
python3 REINFORCE.py
python3 actor_critic.py
python3 dqn.py
python3 ppo.py
python3 ddpg.py
python3 a3c.py
python3 a2c.py
python3 acer.py
python3 sac.py

拡大する

追加情報

バージョン 1.0.0
タイプパイソン
更新時間 2025-07-12
サイズ 20.12KB
から Github

minimalRL

minimalrl-pytorch

アルゴリズム

依存関係

使用法

ToDo Co

Python Portfolio

Redash オープンソースデータチャートツール v24.10.0

datamule python

スマートチャートデータ視覚化プラットフォーム v6.9

Locust 負荷テストツール v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Redash オープンソースデータチャートツール v24.10.0

Google Dorks

shepherd

mongo express