
Это самый известный набор данных в ML, который лучше всего подходит для начинающих, которые хотят попасть туда руки с помощью ML/Data Science . Наличие меньше особенностей и наблюдений за цветами радужной оболочки, отсутствия недостающих значений или выбросов для работы, это делает реализацию моделей ML проще и простыми.
Поскольку проект является чистым и небольшим, мы будем использовать это в нашу пользу и получим практику о том, как выполнить визуализацию данных с помощью Matplotlib и Seaborn (библиотеки визуализации данных), реализовать наиболее используемые методы выбора функций в проекте ML/Data Science и применяем все модели классификации в этом наборе данных. Это даст нам практику и справляется с опытом в отношении того, как и когда нужно реализовать, и что работает лучше всего, учитывая набор данных.
Этот проект содержит 1 файл и 2 папки:
report.ipynb : Это основной файл, в котором я выполнил свою работу над проектом.export/ : Папка, содержащая файл версии HTML и PDF в ноутбуке.plots/ : содержит изображения всех графиков, которые отображаются в файле report.ipynb . | Связанная задача | Классификация |
| Характеристики набора данных | Многомерный |
| Характеристики атрибута | Настоящий |
| Количество экземпляров | 150 |
| Количество атрибутов | 4 |
| Отсутствующие значения? | Нет |
| Область | Жизнь |
Набор данных содержит по 3 класса по 50 экземпляров каждый , в общей сложности 150 экземпляров , где каждый класс относится к типу радужной оболочки. Один класс линейно отделяется от других 2, а последний не линейно отделяется друг от друга.
Прогнозирование атрибута: класс растительного завода.
Информация о атрибуте: у нас есть 4 функции в этом наборе данных и целевой class переменной.
Этот проект был решен со следующими версиями установленных библиотек:
| Библиотеки Язык | Использовать | Версия |
|---|---|---|
| Питон | Язык, используемый для проекта | 3.7.0 |
| Numpy | Для научных вычислений | 1.15.2 |
| Панды | Для анализа данных | 0,23,4 |
| matplotlib | Для визуализации | 3.0.0 |
| морской | Для визуализации | 0.9.0 |
| Scikit-learn | Библиотека ML для обучения и тестирования | 0,20,0 |
Если у вас еще нет установки Python, настоятельно рекомендуется установить распределение Python Anaconda, в котором уже есть вышеуказанные пакеты и больше включены в него.
Вам также нужно будет установить программную записную книжку Jupyter для запуска и выполнения файла report.ipynb . IPYNB. Вы также можете использовать jupyterlab для запуска и выполнения, Jupyterlab - лучшая версия Notebook Jupyter . Инструкции по загрузке jupyterlab можно найти здесь.
В терминале или командном окне перейдите к каталогу проектов на верхнем уровне Iris_Flower (который содержит этот README) и запустите одну из следующих команд:
ipython notebook report.ipynbили
jupyter notebook report.ipynbили если у вас установлена «Юпитер -лаборатория»
jupyter labЭто откроет ноутбук Jupyter/ipython или программное обеспечение JupyterLab и файл проекта в вашем браузере.