Iris_Flower
1.0.0

这是ML中最著名的数据集,也是想与ML/Data Science弄脏的初学者。对虹膜花的功能和观察较少,没有缺少的值或要处理的异常值,这使得实现ML模型更加简单。
由于该项目干净且较小,因此我们将利用它来获得优势,并获得如何使用Matplotlib和Seaborn(数据可视化库)执行数据可视化,在ML/Data Science项目中实现大多数使用的功能选择方法,并在此数据集中应用所有分类模型。这将为我们提供有关如何以及何时实施以及在数据集中最有效的练习和方面的经验。
该项目包含1个文件和2个文件夹:
report.ipynb :这是我在项目上执行工作的主要文件。export/ :包含HTML和PDF版本文件的文件夹。plots/ :包含report.ipynb文件中显示的所有图的图像。 | 关联的任务 | 分类 |
| 数据集特征 | 多变量 |
| 属性特征 | 真实的 |
| 实例数 | 150 |
| 属性数 | 4 |
| 缺少值? | 不 |
| 区域 | 生活 |
数据集包含3个类别的3个类别,总共150个实例,每个类都引用了一种类型的虹膜工厂。一个类与另一个类别可分离,而后者则不能彼此线性分离。
预测属性:虹膜植物类。
属性信息:我们在此数据集中有4个功能和一个目标变量class 。
该项目已安装了以下版本:
| 库语言 | 使用 | 版本 |
|---|---|---|
| Python | 该项目使用的语言 | 3.7.0 |
| numpy | 用于科学计算 | 1.15.2 |
| 熊猫 | 用于数据分析 | 0.23.4 |
| matplotlib | 可视化 | 3.0.0 |
| 海洋 | 可视化 | 0.9.0 |
| Scikit-Learn | 用于培训和测试数据的ML库 | 0.20.0 |
如果您尚未安装Python,强烈建议您安装Python的Anaconda发行版,该分发已经包含上述软件包,其中包含更多。
您还需要安装软件jupyter笔记本以运行和执行report.ipynb文件。您也可以使用Jupyterlab运行和执行, Jupyterlab是Jupyter Notebook的更好版本。可以在此处找到下载Jupyterlab的说明。
在终端或命令窗口中,导航到顶级项目目录Iris_Flower (包含此读数)并运行以下命令之一:
ipython notebook report.ipynb或者
jupyter notebook report.ipynb或者如果您安装了“ Jupyter Lab”
jupyter lab这将打开Jupyter/ipython笔记本或jupyterlab软件和浏览器中的项目文件。