kaggle CrowdFlower
1.0.0
1st Place -Lösung für Suchergebnisse Relevanz Wettbewerb auf Kaggle
Das beste Einzelmodell, das wir während des Wettbewerbs erhalten haben, war ein XGBOOST -Modell mit linearem Booster des öffentlichen LB -Score 0,69322 und einem privaten LB -Score 0,70768 . Unsere endgültige Gewinneinreichung war ein mittleres Ensemble von 35 besten öffentlichen LB -Einsendungen. Diese Einreichung erzielte 0,70807 bei öffentlichem LB und 0,72189 für private LB.

Siehe ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf zur Dokumentation.
./Data .python ./Code/Feat/run_all.py aus, um Funktionen zu generieren. Dies wird ein paar Stunden dauern.python ./Code/Model/generate_best_single_model.py aus, um die beste Einzelmodell -Einreichung zu generieren. Nach unserer Erfahrung sind nur wenige Versuche erforderlich, um ein Modell für die beste Leistung oder eine ähnliche Leistung zu generieren. Siehe das Trainingsanmelde in ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log weibliche 0Feat@svd100_and_bow_jun27] weibs 0,lom 0model@reg_xgb_linepython ./Code/Model/generate_model_library.py aus, um die Modellbibliothek zu generieren. Das ist ziemlich zeitaufwändig. Sie müssen jedoch nicht warten, bis dieses Skript fertiggestellt wird: Sie können den nächsten Schritt ausführen, sobald Sie einige Modelle trainieren.python ./Code/Model/generate_ensemble_submission.py aus, um die Einreichung über die Auswahl der Ensemble zu generieren../Output/Subm .