kaggle CrowdFlower
1.0.0
Solução de 1º lugar para os resultados da pesquisa Concorrência relevante em Kaggle
O melhor modelo único que obtivemos durante a competição foi um modelo XGBOOST com impulsionador linear da pontuação pública de LB 0,69322 e escore LB privado 0,70768 . Nossa finalização final foi um conjunto mediano de 35 melhores envios públicos de LB. Este envio obteve 0,70807 em Public LB e 0,72189 no Private LB.

Veja ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf para documentação.
./Data .python ./Code/Feat/run_all.py para gerar recursos. Isso levará algumas horas.python ./Code/Model/generate_best_single_model.py para gerar o melhor envio de modelo único. Em nossa experiência, são necessárias apenas algumas tentativas para gerar modelo de melhor desempenho ou desempenho semelhante. Consulte o login de treinamento ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log ]_[feat@svd100_and_bow_jun27 ]_[model@reg_xgb_linears ]_hyperOpt.log Por exemplo.python ./Code/Model/generate_model_library.py para gerar biblioteca de modelos. Isso consome bastante tempo. Mas você não precisa esperar que esse script termine: você pode executar a próxima etapa depois de treinar alguns modelos.python ./Code/Model/generate_ensemble_submission.py para gerar envio via seleção de conjuntos../Output/Subm .