Unduh openai_lab - Unduh Kode Sumber openai

openai_lab

Kode sumber lainnya

ve PER

Unduh

Lab Openai

Perhatikan: Silakan gunakan versi berikutnya, SLM-LAB.

Dokumentasi Lab Openai

Kerangka kerja eksperimen untuk pembelajaran penguatan menggunakan gym openai, tensorflow, dan keras.

Lab Openai dibuat untuk melakukan pembelajaran penguatan (RL) seperti sains - teori, percobaan . Ini menyediakan antarmuka yang mudah untuk Openai Gym dan Keras, dengan kerangka kerja eksperimen dan evaluasi otomatis.

Fitur

Antarmuka Lingkungan RL dan Agen Terpadu Menggunakan Openai Gym, TensorFlow, Keras, sehingga Anda dapat fokus pada pengembangan algoritma.
Implementasi Algoritma RL Core, dengan komponen modular yang dapat digunakan kembali untuk mengembangkan algoritma RL yang dalam.
Kerangka kerja eksperimen untuk menjalankan ratusan uji coba optimisasi hiperparameter, dengan log, plot, dan analitik untuk menguji algoritma RL baru. Pengaturan eksperimental disimpan dalam JSON standar untuk reproduktifitas dan perbandingan.
Analisis otomatis dari percobaan untuk mengevaluasi agen dan lingkungan RL, dan untuk membantu memilih solusi terbaik.
The Fitness Matrix , tabel skor terbaik dari algoritma RL vs lingkungan; Berguna untuk penelitian.

Dengan Openai Lab, kami dapat fokus meneliti elemen -elemen penting dari pembelajaran penguatan seperti algoritma, kebijakan, memori, dan penyetelan parameter. Ini memungkinkan kami untuk membangun agen secara efisien menggunakan komponen yang ada dengan implementasi dari ide -ide penelitian. Kami kemudian dapat menguji hipotesis penelitian secara sistematis dengan menjalankan eksperimen.

Baca lebih lanjut tentang masalah penelitian yang diatasi laboratorium dalam motivasi. Pada akhirnya, lab adalah kerangka kerja umum untuk melakukan pembelajaran penguatan, agnostik Openai Gym dan Keras. Misalnya implementasi berbasis Pytorch ada di peta jalan.

Algoritma yang diimplementasikan

Daftar algoritma RL inti yang diimplementasikan/direncanakan.

Untuk melihat skor mereka melawan lingkungan gym Openai, buka Fitness Matrix .

algoritma	pelaksanaan	skor evaluasi (tertunda)
Dqn	Dqn	-
DQN ganda	Doubledqn	-
DQN Dueling	-	-
Sarsa	Deepsarsa	-
Sarsa off-policy	Offpolicysarsa	-
Per (Pengalaman Prioritas Replay)	Prioritas ExperiencePer	-
CEM (metode entropi silang)	Berikutnya	-
MEMPERKUAT	-	-
DPG (Gradien Kebijakan Deterministik) Aktor off-Policy Aktor	Aktorcritic	-
DDPG (Deep-DPG) Aktor-kritik dengan jaringan target	Ddpg	-
A3C (Asynchronous Advantage Actor-Critic)	-	-
Dyna	Berikutnya	-
Trpo	-	-
Q*(Lambda)	-	-
Retrace (Lambda)	-	-
Kontrol Episodik Saraf (NEC)	-	-
EWC (konsolidasi berat elastis)	-	-

Jalankan lab

Selanjutnya, lihat instalasi dan lompat ke QuickStart.

Timelapse of Openai Lab, Memecahkan Cartpole-V0.

Memperluas

Informasi Tambahan

Versi ve PER
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-28
ukuran 76.39KB
Berasal dari Github

Aplikasi Terkait

MB Lab

2024-11-12
terbuka

2024-05-24
Versi domestik OpenAI

2024-05-22
Pindai Lab Saku

2024-02-22
Lab Tujuan

2022-08-10
Tikus Lab

2022-08-08

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua