แมงมุมเว็บที่รวบรวมข้อมูล howlongtobeat เพื่อแยกเกมและข้อมูลเวลาเสร็จสมบูรณ์
ขอขอบคุณ HowlongTobeat ที่ยิ่งใหญ่สำหรับการให้บริการที่ยอดเยี่ยมเช่นนี้ ขออภัยเกี่ยวกับการขูด!
HowlongTobeat (HLTB) เป็นเว็บไซต์ที่ยอดเยี่ยมสำหรับการค้นพบเวลาที่ผู้คนใช้ในการเล่นเกมให้สำเร็จ ในขณะที่สุกด้วยข้อมูล แต่น่าเสียดายที่ขาด API โครงการนี้ทำให้เกมที่รู้จักทั้งหมด (ในเวลาที่เขียน) บนเว็บไซต์แยกข้อมูลเกมรวมถึงรายการที่เสร็จสมบูรณ์ทั้งหมด
โครงการนี้เป็นส่วนหนึ่งของการร่วมทุนของฉันสู่โลกแห่งวิทยาศาสตร์ข้อมูล
HLTB_Game_Spider ใน hltb-game.py scrapes เกมทั้งหมดที่มีอยู่ผ่านฟังก์ชั่นการค้นหาของเว็บไซต์ HLTB_Completions_Spider ใน hltb-completions.py scrapes รายการเสร็จสิ้นผู้ใช้ทั้งหมดที่ส่งมาสำหรับแต่ละเกมเดียวกัน (แม้ว่าบางรายการจะไม่มีรายการและจะหายไป)
คอลัมน์ HLTB_Game_Spider แยกคอลัมน์ (โพสต์ทำความสะอาด):
id - รหัสเกมจากเว็บไซต์title - ชื่อเกมmain_story - เวลาเสร็จเฉลี่ยของ 'เรื่องราวหลัก' ในเวลาไม่กี่ชั่วโมงmain_plus_extras - เวลาเสร็จเฉลี่ยของ 'main + extras' ในชั่วโมงcompletionist - เวลาเสร็จเฉลี่ยของ 'เสร็จสมบูรณ์' ในเวลาไม่กี่ชั่วโมงall_styles - เวลาเสร็จเฉลี่ยของ 'สไตล์ทั้งหมด' ในชั่วโมงcoop - เวลาเสร็จเฉลี่ยของ 'co -op' ในเวลาไม่กี่ชั่วโมงversus - เวลาเสร็จเฉลี่ยของ 'vs. ' ในชั่วโมง.type - พิมพ์รายการเพื่อแยกความแตกต่าง DLC/Expansion , Mod และ ROM Hack จากรายการเกมปกติdevelopers - รายการที่คั่นด้วยเครื่องหมายจุลภาคของนักพัฒนาทั้งหมดของรายการpublishers - รายการคั่นด้วยเครื่องหมายจุลภาคของผู้เผยแพร่ทั้งหมดของรายการplatforms - รายการคั่นด้วยเครื่องหมายจุลภาคของแพลตฟอร์มทั้งหมดมีรายการเข้าgenres - รายการประเภทที่คั่นด้วยเครื่องหมายจุลภาคสำหรับรายการrelease_na - วันที่วางจำหน่ายในอเมริกาเหนือ (ถ้ามี)release_eu - วันที่วางจำหน่ายในยุโรป (ถ้ามี)release_jp - วันที่วางจำหน่ายในญี่ปุ่น (ถ้ามี) คอลัมน์ HLTB_Completions_Spider สกัดคอลัมน์ (โพสต์ทำความสะอาด):
id - รหัสเกม ที่สามารถอ้างอิงข้ามกับชุดข้อมูลด้านบนtype - ประเภทของรายการที่สมบูรณ์ ( Main Story , Main + Extras , Completionists , Co-Op Multiplayer , Speed Run - Any% , Speed Run - 100% )platform - แพลตฟอร์มรายการเฉพาะเสร็จสมบูรณ์time - เวลาในการเข้าชั่วโมงและนาที (เช่น 2hr 50m )