kaggle CrowdFlower
1.0.0
Solution de la 1ère place pour les résultats de recherche Concours de pertinence sur Kaggle
Le meilleur modèle unique que nous avons obtenu pendant la compétition était un modèle XGBOost avec un booster linéaire de score LB public 0,69322 et un score LB privé 0,70768 . Notre dernière soumission gagnante était un ensemble médian de 35 meilleures soumissions publiques LB. Cette soumission a marqué 0,70807 sur le LB public et 0,72189 sur le LB privé.

Voir ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf pour la documentation.
./Data .python ./Code/Feat/run_all.py pour générer des fonctionnalités. Cela prendra quelques heures.python ./Code/Model/generate_best_single_model.py pour générer la meilleure soumission de modèle unique. D'après notre expérience, il ne faut que quelques essais pour générer un modèle de meilleures performances ou de performances similaires. Voir la formation de formation ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log de LOBTAGE_OFEAT@SVD100_AND_BOW_JUN27 DMADE_OMODEL@reg_xgb_linear.python ./Code/Model/generate_model_library.py pour générer une bibliothèque de modèles. Cela prend beaucoup de temps. Mais vous n'avez pas à attendre que ce script se termine: vous pouvez exécuter l'étape suivante une fois que certains modèles ont été formés.python ./Code/Model/generate_ensemble_submission.py pour générer une soumission via la sélection d'ensemble../Output/Subm .