DeepRL Tutorials Download - DeepRL Tutorials Source Source Download

ภาษาไทย

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

หน้าแรก>การเขียนโปรแกรมที่เกี่ยวข้อง>หลาม

DeepRL Tutorials

หลาม

1.0.0

ดาวน์โหลด

deeprl-tutorials

ความตั้งใจของสมุดบันทึก Ipython เหล่านี้ส่วนใหญ่จะช่วยฉันฝึกฝนและเข้าใจเอกสารที่ฉันอ่าน ดังนั้นฉันจะเลือกใช้ความสามารถในการอ่านมากกว่าประสิทธิภาพในบางกรณี ก่อนอื่นการใช้งานจะถูกอัปโหลดตามด้วยมาร์กอัปเพื่ออธิบายแต่ละส่วนของรหัส ฉันจะกำหนดเครดิตสำหรับรหัสใด ๆ ที่ยืมมาในส่วนกิตติกรรมประกาศของ readMe นี้

เอกสารที่เกี่ยวข้อง:

การควบคุมระดับมนุษย์ผ่านการเรียนรู้แบบเสริมกำลัง [สิ่งพิมพ์] [รหัส]
การเรียนรู้หลายขั้นตอน (จากการเรียนรู้การเสริมแรง: บทนำบทที่ 7) [สิ่งพิมพ์] [รหัส]
การเรียนรู้การเสริมแรงอย่างลึกล้ำด้วยการเรียนรู้สองครั้ง [สิ่งพิมพ์] [รหัส]
สถาปัตยกรรมเครือข่ายดวลเพื่อการเรียนรู้การเสริมแรงอย่างลึกซึ้ง [สิ่งพิมพ์] [รหัส]
เครือข่ายที่มีเสียงดังสำหรับการสำรวจ [สิ่งพิมพ์] [รหัส]
การเล่นซ้ำประสบการณ์การเล่นซ้ำ [สิ่งพิมพ์] [รหัส]
มุมมองการกระจายเกี่ยวกับการเรียนรู้การเสริมแรง [สิ่งพิมพ์] [รหัส]
Rainbow: การรวมการปรับปรุงในการเรียนรู้การเสริมแรงอย่างลึกซึ้ง [สิ่งพิมพ์] [รหัส]
การเรียนรู้การเสริมแรงแบบกระจายด้วยการถดถอยเชิงปริมาณ [สิ่งพิมพ์] [รหัส]
สายรุ้งที่มีการถดถอยแบบควอนไทล์ [รหัส]
Q-Learning ที่เกิดขึ้นอีกครั้งสำหรับ MDPs ที่สังเกตได้บางส่วน [Publication] [Code]
นักวิจารณ์นักแสดง Advantage (A2C) [Publication1] [Publication2] [รหัส]
การควบคุมอย่างต่อเนื่องมิติสูงโดยใช้การประมาณค่าความได้เปรียบทั่วไป [สิ่งพิมพ์] [รหัส]
อัลกอริทึมการเพิ่มประสิทธิภาพนโยบายใกล้เคียง [สิ่งพิมพ์] [รหัส]

ความต้องการ:

Python 3.6
นม
โรงยิม
Pytorch 0.4.0
matplotlib
opencv
เป็นเส้นใย

กิตติกรรมประกาศ:

เครดิตเป็น @Baselines สำหรับเครื่องห่อสิ่งแวดล้อมและแรงบันดาลใจสำหรับรหัสเล่นซ้ำที่มีความสำคัญซึ่งใช้ในรหัสการพัฒนาเท่านั้น
เครดิตไปยัง @higgsfield สำหรับรหัสการพล็อตรหัสการหลอม Epsilon และแรงบันดาลใจสำหรับการใช้งานการเล่นซ้ำที่จัดลำดับความสำคัญในสมุดบันทึก ipython
เครดิตไปยัง @kaixhin สำหรับการใช้เลเยอร์เชิงเส้นที่มีเสียงดัง
เครดิตไปที่ @Ikostrikov สำหรับ A2C, GAE, PPO และ VISDOM Plotting Code Reference Ideplementation

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-15
ขนาด 63.82MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
datamule python

หลาม
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด