Iris_Flower
1.0.0

這是ML中最著名的數據集,也是想與ML/Data Science弄髒的初學者。對虹膜花的功能和觀察較少,沒有缺少的值或要處理的異常值,這使得實現ML模型更加簡單。
由於該項目乾淨且較小,因此我們將利用它來獲得優勢,並獲得如何使用Matplotlib和Seaborn(數據可視化庫)執行數據可視化,在ML/Data Science項目中實現大多數使用的功能選擇方法,並在此數據集中應用所有分類模型。這將為我們提供有關如何以及何時實施以及在數據集中最有效的練習和方面的經驗。
該項目包含1個文件和2個文件夾:
report.ipynb :這是我在項目上執行工作的主要文件。export/ :包含HTML和PDF版本文件的文件夾。plots/ :包含report.ipynb文件中顯示的所有圖的圖像。 | 關聯的任務 | 分類 |
| 數據集特徵 | 多變量 |
| 屬性特徵 | 真實的 |
| 實例數 | 150 |
| 屬性數 | 4 |
| 缺少值? | 不 |
| 區域 | 生活 |
數據集包含3個類別的3個類別,總共150個實例,每個類都引用了一種類型的虹膜工廠。一個類與另一個類別可分離,而後者則不能彼此線性分離。
預測屬性:虹膜植物類。
屬性信息:我們在此數據集中有4個功能和一個目標變量class 。
該項目已安裝了以下版本:
| 庫語言 | 使用 | 版本 |
|---|---|---|
| Python | 該項目使用的語言 | 3.7.0 |
| numpy | 用於科學計算 | 1.15.2 |
| 貓熊 | 用於數據分析 | 0.23.4 |
| matplotlib | 可視化 | 3.0.0 |
| 海洋 | 可視化 | 0.9.0 |
| Scikit-Learn | 用於培訓和測試數據的ML庫 | 0.20.0 |
如果您尚未安裝Python,強烈建議您安裝Python的Anaconda發行版,該分發已經包含上述軟件包,其中包含更多。
您還需要安裝軟件jupyter筆記本以運行和執行report.ipynb文件。您也可以使用Jupyterlab運行和執行, Jupyterlab是Jupyter Notebook的更好版本。可以在此處找到下載Jupyterlab的說明。
在終端或命令窗口中,導航到頂級項目目錄Iris_Flower (包含此讀數)並運行以下命令之一:
ipython notebook report.ipynb或者
jupyter notebook report.ipynb或者如果您安裝了“ Jupyter Lab”
jupyter lab這將打開Jupyter/ipython筆記本或jupyterlab軟件和瀏覽器中的項目文件。