kaggle CrowdFlower
1.0.0
โซลูชันอันดับ 1 สำหรับผลการค้นหาที่เกี่ยวข้องกับการแข่งขันบน Kaggle
รุ่นเดียวที่ดีที่สุดที่เราได้รับในระหว่างการแข่งขันคือโมเดล XGBOOST พร้อม Booster เชิงเส้นของคะแนน LB สาธารณะ 0.69322 และคะแนน LB ส่วนตัว 0.70768 การยอมแพ้ครั้งสุดท้ายของเราคือชุดค่ามัธยฐานของการส่ง LB สาธารณะที่ดีที่สุด 35 รายการ การส่งนี้ทำคะแนน 0.70807 สำหรับ Public LB และ 0.72189 ใน LB ส่วนตัว

ดู ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf สำหรับเอกสารประกอบ
./Data datapython ./Code/Feat/run_all.py เพื่อสร้างคุณสมบัติ จะใช้เวลาสองสามชั่วโมงpython ./Code/Model/generate_best_single_model.py เพื่อสร้างการส่งแบบจำลองเดียวที่ดีที่สุด จากประสบการณ์ของเรามันใช้เวลาเพียงไม่กี่การทดลองในการสร้างรูปแบบของประสิทธิภาพที่ดีที่สุดหรือประสิทธิภาพที่คล้ายกัน ดูการฝึกอบรมเข้าสู่ระบบ ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log output/log/ [aterprepre@solution like_ [feat@svd100_and_bow_jun27 lime_ [atermodel@reg_xgb_linear like_hyperopt.logpython ./Code/Model/generate_model_library.py เพื่อสร้างไลบรารีรุ่น มันใช้เวลาค่อนข้างนาน แต่คุณไม่ต้องรอให้สคริปต์นี้เสร็จสิ้น: คุณสามารถเรียกใช้ขั้นตอนต่อไปเมื่อคุณได้รับการฝึกอบรมบางรุ่นpython ./Code/Model/generate_ensemble_submission.py เพื่อสร้างการส่งผ่านการเลือกชุด./Output/Subm OUTPUT/SUBM