pytorch a3c Download - pytorch a3c Source Source Download Download

pytorch a3c

หลาม

1.0.0

ดาวน์โหลด

Pytorch-A3C

นี่คือการใช้ Pytorch ของนักวิจารณ์นักแสดง Asynchronous Advantage (A3C) จาก "วิธีการแบบอะซิงโครนัสสำหรับการเรียนรู้การเสริมแรงอย่างลึกล้ำ"

การใช้งานนี้ได้รับแรงบันดาลใจจากตัวแทนเริ่มต้นจักรวาล ตรงกันข้ามกับตัวแทนเริ่มต้นใช้เครื่องมือเพิ่มประสิทธิภาพที่มีสถิติที่ใช้ร่วมกันเช่นเดียวกับในกระดาษต้นฉบับ

โปรดใช้ bibtex นี้หากคุณต้องการอ้างถึงที่เก็บนี้ในสิ่งพิมพ์ของคุณ:

 @misc{pytorchaaac,
  author = {Kostrikov, Ilya},
  title = {PyTorch Implementations of Asynchronous Advantage Actor Critic},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/ikostrikov/pytorch-a3c}},
}

A2C

ฉัน ขอแนะนำ ให้ตรวจสอบเวอร์ชัน sychronous และอัลกอริทึมอื่น ๆ : Pytorch-A2C-PPO-ACKTR

จากประสบการณ์ของฉัน A2C ทำงานได้ดีกว่า A3C และ ACKTR ดีกว่าทั้งคู่ ยิ่งไปกว่านั้น PPO เป็นอัลกอริทึมที่ยอดเยี่ยมสำหรับการควบคุมอย่างต่อเนื่อง ดังนั้นฉันขอแนะนำให้ลอง A2C/PPO/ACKTR ก่อนและใช้ A3C เฉพาะในกรณีที่คุณต้องการโดยเฉพาะด้วยเหตุผลบางอย่าง

อ่านบล็อก OpenAI สำหรับข้อมูลเพิ่มเติม

ผลงาน

ยินดีต้อนรับการมีส่วนร่วมอย่างมาก หากคุณรู้วิธีทำให้รหัสนี้ดีขึ้นอย่าลังเลที่จะส่งคำขอดึง

การใช้งาน

 # Works only wih Python 3.
python3 main.py --env-name " PongDeterministic-v4 " --num-processes 16

รหัสนี้เรียกใช้การประเมินผลในเธรดแยกต่างหากนอกเหนือจาก 16 กระบวนการ

ผลลัพธ์

ด้วยกระบวนการ 16 ครั้งมันมาบรรจบกันสำหรับ pongdeterministic-V4 ใน 15 นาที

สำหรับ BreakoutDeterministic-V4 ใช้เวลามากกว่าหลายชั่วโมง

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-12
ขนาด 187.55KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

หลาม

24.10.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด