kaggle CrowdFlower
1.0.0
Kaggle에서 검색 결과 관련 경쟁을위한 1 위 솔루션
경쟁에서 얻은 최고의 단일 모델은 Public LB Score 0.69322 및 Private LB Score 0.70768 의 선형 부스터를 가진 XGBoost 모델이었습니다. 우리의 마지막 승리 제출은 35 개의 최고의 공개 LB 제출물의 중간 앙상블이었습니다. 이 제출물은 Public LB에서 0.70807 , Private LB에서 0.72189를 기록했습니다.

문서는 ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf 참조하십시오.
./Data 에 넣습니다.python ./Code/Feat/run_all.py 를 실행하여 기능을 생성하십시오. 몇 시간이 걸릴 것입니다.python ./Code/Model/generate_best_single_model.py 실행하여 최상의 단일 모델 제출을 생성하십시오. 우리의 경험에 따르면, 최상의 성능 또는 유사한 성능 모델을 생성하기 위해서는 몇 번의 시험 만 필요합니다. 훈련 로그인 ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log @solution]을 참조하십시오. _ @svd100_and_bow_jun27혁을 참조하십시오.python ./Code/Model/generate_model_library.py 를 실행하여 모델 라이브러리를 생성합니다. 이것은 시간이 많이 걸립니다. 그러나이 스크립트가 완료 될 때까지 기다릴 필요는 없습니다. 일부 모델이 훈련되면 다음 단계를 실행할 수 있습니다.python ./Code/Model/generate_ensemble_submission.py 를 실행하십시오../Output/Subm 에서 파일을 제출하십시오.