kaggle CrowdFlower
1.0.0
1 -е место для решения для результатов поиска Соревнования на Kaggle
Лучшей единственной моделью, которую мы получили во время конкурса, была модель XGBOOST с линейным усилителем общественного балла LB 0,69322 и частным баллом LB 0,70768 . Наша последняя победная подчинение стало средним ансамблем из 35 лучших публичных представлений LB. Это представление набрало 0,70807 на общественном LB и 0,72189 на частном LB.

См ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf
./Data .python ./Code/Feat/run_all.py чтобы генерировать функции. Это займет несколько часов.python ./Code/Model/generate_best_single_model.py чтобы генерировать лучшую подчинение единственной модели. По нашему опыту, для получения модели лучшей производительности или аналогичной производительности требуется всего несколько испытаний. См. Журнал обучения ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.logpython ./Code/Model/generate_model_library.py чтобы генерировать библиотеку модели. Это занимает много времени. Но вам не нужно ждать, пока этот скрипт завершится: вы можете запустить следующий шаг, как только у вас будут подготовлены некоторые модели.python ./Code/Model/generate_ensemble_submission.py чтобы генерировать подчинение через выбор ансамбля../Output/Subm .