
هذه هي مجموعة البيانات الأكثر شهرة في ML وأفضل للمبتدئين الذين يرغبون في الوصول إلى هناك Dirty مع ML/Data Science . امتلاك ميزات وملاحظات أقل لزهور القزحية ، ولا توجد قيم مفقودة أو القيم المتطرفة للتعامل معها ، وهذا يجعل تنفيذ نماذج ML أسهل وبسيطة.
نظرًا لأن المشروع نظيف وصغير ، فسوف نستخدم هذا لصالحنا ونتولى على كيفية تنفيذ تصور البيانات باستخدام Matplotlib و Seaborn (مكتبات تصور البيانات) ، ونطبق معظم طرق اختيار الميزات المستخدمة في مشروع ML/Data Science ، وتطبيق جميع نماذج التصنيف على مجموعة البيانات هذه. هذا سيمنحنا الممارسة والتجربة على كيفية ومتى التنفيذ والتي تعمل بشكل أفضل مع مجموعة البيانات.
يحتوي هذا المشروع على ملف واحد و 2 مجلدات:
report.ipynb .export/ : مجلد يحتوي على ملف إصدار HTML و PDF من دفتر الملاحظات.plots/ : يحتوي على صور لجميع المؤامرات التي يتم عرضها في ملف report.ipynb . | المهمة المرتبطة | تصنيف |
| خصائص مجموعة البيانات | متعدد المتغيرات |
| خصائص السمة | حقيقي |
| عدد الحالات | 150 |
| عدد السمات | 4 |
| قيم مفقودة؟ | لا |
| منطقة | حياة |
تحتوي مجموعة البيانات على 3 فئات من 50 حالة لكل منها ، إجمالي 150 حالة ، حيث يشير كل فئة إلى نوع من مصنع IRIS. فئة واحدة يمكن فصلها خطيًا عن الآخر 2 والأخير لا يمكن فصلهما خطيًا عن بعضها البعض.
السمة التنبؤ: فئة من نبات القزحية.
معلومات السمة: لدينا 4 ميزات في مجموعة البيانات هذه class متغيرة الهدف.
تم حل هذا المشروع مع تثبيت الإصدارات التالية من المكتبات:
| المكتبات اللغة | يستخدم | إصدار |
|---|---|---|
| بيثون | اللغة المستخدمة للمشروع | 3.7.0 |
| numpy | للحوسبة العلمية | 1.15.2 |
| الباندا | لتحليل البيانات | 0.23.4 |
| Matplotlib | للتصور | 3.0.0 |
| بحر | للتصور | 0.9.0 |
| Scikit-Learn | مكتبة ML للتدريب والاختبار بيانات | 0.20.0 |
إذا لم يكن لديك Python مثبت بعد ، فمن المستحسن بشدة أن تقوم بتثبيت توزيع Anaconda لـ Python ، والذي يحتوي بالفعل على الحزم أعلاه وأكثر من ذلك فيه.
ستحتاج أيضًا إلى تثبيت دفتر Jupyter Jupyter لتشغيل وتنفيذ report.ipynb . يمكنك أيضًا استخدام JupyterLab أيضًا لتشغيل وتنفيذ ، JupyterLab هو إصدار أفضل من دفتر Jupyter Notebook . يمكن العثور على تعليمات لتنزيل jupyterlab هنا.
في محطة أو نافذة أوامر ، انتقل إلى دليل المشروع الأعلى Iris_Flower (الذي يحتوي على هذه القراءة) وقم بتشغيل أحد الأوامر التالية:
ipython notebook report.ipynbأو
jupyter notebook report.ipynbأو إذا تم تثبيت "Jupyter Lab"
jupyter labسيؤدي ذلك إلى فتح دفتر Jupyter/Ipython أو برنامج JupyterLab وملف المشروع في متصفحك.