hltb scraper
1.0.0
게임 및 완료 시간 데이터를 추출하기 위해 Howlongtobeat를 기어 다니는 웹 거미.
그러한 풍부한 데이터로 훌륭한 서비스를 제공 한 Howlongtobeat에게 큰 감사를드립니다. 스크래핑에 대해 죄송합니다!
Hlongtobeat (HLTB)는 사람들이 게임을 완료하는 데 걸리는 시간을 발견하기위한 훌륭한 웹 사이트입니다. 데이터가 익숙하지만 불행히도 API가 부족합니다. 이 프로젝트는 웹 사이트에서 알려진 모든 게임 (글을 쓰는 시점)을 긁어 내고 게임 데이터와 기존 완료 항목을 추출합니다.
이 프로젝트는 데이터 과학의 세계로의 벤처의 일부입니다.
hltb-game.py 의 HLTB_Game_Spider 는 웹 사이트의 검색 기능을 통해 사용할 수있는 모든 게임을 긁어냅니다. hltb-completions.py 의 HLTB_Completions_Spider .
HLTB_Game_Spider 는 열을 추출합니다 (사후 청소) :
id 웹 사이트의 게임 ID.title - 게임 이름.main_story 몇 시간 동안 '메인 스토리'의 평균 완료 시간.main_plus_extras 시간에 'main + extras'의 평균 완료 시간.completionist - 몇 시간 안에 '완료 주의자'의 평균 완료 시간.all_styles '모든 스타일'의 평균 완료 시간.coop 시간에 '협동 조합'의 평균 완료 시간.versus - 평균 완료 시간 '대' 몇 시간 만에.type - 일반 게임 항목에서 DLC/Expansion , Mod 및 ROM Hack 구별하기위한 입력 유형.developers - 쉼표 공간에서 항목의 모든 개발자의 분리 목록.publishers - 쉼표 공간에서 항목의 모든 게시자의 분리 된 목록.platforms - 쉼표 공간 분리 된 모든 플랫폼 목록에서 항목을 사용할 수 있습니다.genres - 항목을위한 쉼표로 구분 된 장르 목록.release_na 북미 출시일 (사용 가능한 경우).release_eu 유럽 출시일 (사용 가능한 경우).release_jp 일본 출시일 (사용 가능한 경우). HLTB_Completions_Spider 는 열을 추출합니다 (사후 청소) :
id 위의 데이터 세트와 교차 참조 할 수있는 게임 ID.type - 완료 유형 ( Main Story , Main + Extras , Completionists , Co-Op Multiplayer , Speed Run - Any% , Speed Run - 100% ).platform - 플랫폼 특정 항목이 완료되었습니다.time - 시간과 분의 입장 시간 (예 : 2hr 50m ).