kaggle CrowdFlower
1.0.0
検索結果のための1位のソリューションKaggleの関連性競争
競争中に得た最高の単一モデルは、パブリックLBスコア0.69322とプライベートLBスコア0.70768の線形ブースターを備えたXGBoostモデルでした。私たちの最終的な服従は、35の最高の公共LB提出のアンサンブルの中央値でした。この提出物は、公共LBで0.70807 、プライベートLBで0.72189を記録しました。

ドキュメントについては./Doc/Kaggle_CrowdFlower_ChenglongChen.pdfを参照してください。
./Dataに入れます。python ./Code/Feat/run_all.pyを実行して機能を生成します。これには数時間かかります。python ./Code/Model/generate_best_single_model.pyを実行して、ベストシングルモデルの提出を生成します。私たちの経験では、最高のパフォーマンスまたは同様のパフォーマンスのモデルを生成するために、ほんの数回の試行が必要です。トレーニングログの./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.log [pre@solution ]_ [feat@svd100_and_bow_jun27]python ./Code/Model/generate_model_library.pyを実行して、モデルライブラリを生成します。これはかなり時間がかかります。ただし、このスクリプトが終了するのを待つ必要はありません。いくつかのモデルをトレーニングしたら、次のステップを実行できます。python ./Code/Model/generate_ensemble_submission.pyを実行して、アンサンブル選択を介して送信を生成します。./Output/Submに送信してください。