
Holodeck เป็นเครื่องจำลองความเที่ยงตรงสูงสำหรับการเรียนรู้การเสริมแรงที่สร้างขึ้นบน UNREAL Engine 4
pip install holodeck
(ต้องการ> = Python 3.5)
ดูการติดตั้งสำหรับคำแนะนำที่สมบูรณ์ (รวมถึงนักเทียบท่า)
อินเทอร์เฟซของ Holodeck นั้นคล้ายกับโรงยิมของ Openai
เราพยายามและจัดหาแบตเตอรี่รวมถึงวิธีการที่จะให้คุณกระโดดลงไปในการใช้ Holodeck โดยต้องใช้ซอน้อยที่สุด
เพื่อแสดงให้เห็นนี่คือตัวอย่างที่รวดเร็วโดยใช้แพ็คเกจ DefaultWorlds :
import holodeck
# Load the environment. This environment contains a UAV in a city.
env = holodeck . make ( "UrbanCity-MaxDistance" )
# You must call `.reset()` on a newly created environment before ticking/stepping it
env . reset ()
# The UAV takes 3 torques and a thrust as a command.
command = [ 0 , 0 , 0 , 100 ]
for i in range ( 30 ):
state , reward , terminal , info = env . step ( command ) state : คำสั่งชื่อเซ็นเซอร์ตามค่าของเซ็นเซอร์ (NPARRAY)reward : รางวัลที่ได้รับจากการกระทำก่อนหน้านี้terminal : ระบุว่าสถานะปัจจุบันเป็นสถานะเทอร์มินัลหรือไม่info : มีข้อมูลเฉพาะสภาพแวดล้อมเพิ่มเติมหากคุณต้องการเข้าถึงข้อมูลของเซ็นเซอร์เฉพาะให้นำเข้าเซ็นเซอร์และดึงค่าที่ถูกต้องจากพจนานุกรมสถานะ:
print ( state [ "LocationSensor" ])Holodeck รองรับสภาพแวดล้อมที่หลากหลาย
การโทรไปยัง step ให้การดำเนินการสำหรับตัวแทนหลักเท่านั้นจากนั้นทำเครื่องหมายการจำลอง
act ให้การดำเนินการถาวรสำหรับตัวแทนเฉพาะและไม่ทำเครื่องหมายการจำลอง หลังจากมีการดำเนินการแล้ว tick จะทำการจำลองล่วงหน้า การกระทำยังคงมีอยู่จนกว่าจะมีการเรียกร้องให้ act อื่นให้การดำเนินการที่แตกต่างกัน
import holodeck
import numpy as np
env = holodeck . make ( "CyberPunkCity-Follow" )
env . reset ()
# Provide an action for each agent
env . act ( 'uav0' , np . array ([ 0 , 0 , 0 , 100 ]))
env . act ( 'nav0' , np . array ([ 0 , 0 , 0 ]))
# Advance the simulation
for i in range ( 300 ):
# The action provided above is repeated
states = env . tick ()คุณสามารถเข้าถึงรางวัลเทอร์มินัลและที่ตั้งสำหรับสภาพแวดล้อมที่หลากหลายดังนี้:
task = states [ "uav0" ][ "FollowTask" ]
reward = task [ 0 ]
terminal = task [ 1 ]
location = states [ "uav0" ][ "LocationSensor" ] ( uav0 มาจากไฟล์การกำหนดค่าสถานการณ์)
Holodeck สามารถทำงานได้อย่างไร้หัวด้วยการเรนเดอร์เร่งความเร็ว GPU ดูการใช้ Holodeck Headless
@misc{HolodeckPCCL,
Author = {Joshua Greaves and Max Robinson and Nick Walton and Mitchell Mortensen and Robert Pottorff and Connor Christopherson and Derek Hancock and Jayden Milne and David Wingate},
Title = {Holodeck: A High Fidelity Simulator},
Year = {2018},
}
Holodeck เป็นโครงการของห้องปฏิบัติการการรับรู้การรับรู้และการควบคุมของ BYU (https://pcc.cs.byu.edu/)