kaggle CrowdFlower
1.0.0
حل المركز الأول لنتائج البحث المنافسة على kaggle
كان أفضل نموذج واحد حصلنا عليه خلال المسابقة هو نموذج XGBOOST مع تعزيز خطي لدرجة LB العامة 0.69322 ودرجة LB الخاصة 0.70768 . كان تقديمنا النهائي هو مجموعة متوسطة من 35 أفضل التقديمات العامة LB. سجل هذا التقديم 0.70807 على LB العام و 0.72189 على LB.

انظر ./Doc/Kaggle_CrowdFlower_ChenglongChen.pdf للتوثيق.
./Data .python ./Code/Feat/run_all.py لإنشاء الميزات. هذا سوف يستغرق بضع ساعات.python ./Code/Model/generate_best_single_model.py لإنشاء أفضل تقديم نموذج واحد. في تجربتنا ، لا يتطلب الأمر سوى بعض التجارب لإنشاء نموذج لأفضل أداء أو أداء مشابه. راجع سجل التدريب ./Output/Log/[Pre@solution]_[Feat@svd100_and_bow_Jun27]_[Model@reg_xgb_linear]_hyperopt.logpython ./Code/Model/generate_model_library.py لإنشاء مكتبة النموذج. هذا مضيعة للوقت. لكن ليس عليك الانتظار حتى ينتهي هذا البرنامج النصي: يمكنك تشغيل الخطوة التالية بمجرد تدريب بعض النماذج.python ./Code/Model/generate_ensemble_submission.py لإنشاء التقديم عبر اختيار الفرقة../Output/Subm .