kaggle CrowdFlower
1.0.0
Solución de 1er lugar para los resultados de búsqueda de competencia de relevancia en Kaggle
El mejor modelo único que hemos obtenido durante la competencia fue un modelo XGBOOST con un refuerzo lineal de puntaje LB público 0.69322 y puntaje de LB privado 0.70768 . Nuestra final de presentación ganadora fue un conjunto medio de 35 mejores presentaciones de LB públicas. Esta presentación obtuvo 0.70807 en Public LB y 0.72189 en LB privado.

Ver ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf para la documentación.
./Data .python ./Code/Feat/run_all.py para generar características. Esto tomará unas horas.python ./Code/Model/generate_best_single_model.py para generar el mejor envío de modelo único. En nuestra experiencia, solo se necesitan algunas pruebas para generar un modelo de mejor rendimiento o rendimiento similar. Consulte el inicio de sesión de capacitación ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log Por ejemplo.python ./Code/Model/generate_model_library.py para generar la biblioteca de modelos. Esto lleva mucho tiempo. Pero no tiene que esperar a que termine este script: puede ejecutar el siguiente paso una vez que tenga algunos modelos entrenados.python ./Code/Model/generate_ensemble_submission.py para generar envío a través de la selección de conjunto../Output/Subm .