
นี่คือชุดข้อมูลที่มีชื่อเสียงที่สุดใน ML และดีที่สุดสำหรับผู้เริ่มต้นที่ต้องการไปที่นั่นอย่างสกปรกด้วย ML/Data Science มีคุณสมบัติและการสังเกตน้อยลงของดอกไม้ม่านตาไม่มีค่าที่ขาดหายไปหรือค่าผิดปกติในการจัดการสิ่งนี้ทำให้การใช้โมเดล ML ง่ายขึ้นและง่าย
เนื่องจากโครงการสะอาดและมีขนาดเล็กเราจะใช้สิ่งนี้เพื่อประโยชน์ของเราและฝึกฝนเกี่ยวกับวิธีการสร้างภาพข้อมูลด้วย Matplotlib และ Seoborn (ไลบรารีการสร้างภาพข้อมูล) ใช้วิธีการเลือกคุณสมบัติที่ใช้มากที่สุดใน โครงการ ML/Data Science และใช้แบบจำลองการจำแนกประเภททั้งหมดในชุดข้อมูลนี้ สิ่งนี้จะทำให้เราฝึกฝนและมีประสบการณ์เกี่ยวกับวิธีการและเวลาที่จะใช้งานและทำงานได้ดีที่สุดกับชุดข้อมูล
โครงการนี้มี 1 ไฟล์และ 2 โฟลเดอร์:
report.ipynb : นี่คือไฟล์หลักที่ฉันได้ทำงานในโครงการexport/ : โฟลเดอร์ที่มีไฟล์ HTML และ PDF เวอร์ชันของโน้ตบุ๊กplots/ : มีรูปภาพของพล็อตทั้งหมดที่แสดงในไฟล์ report.ipynb | งานที่เกี่ยวข้อง | การจำแนกประเภท |
| คุณสมบัติชุดข้อมูล | หลายตัวแปร |
| คุณสมบัติของคุณลักษณะ | จริง |
| จำนวนอินสแตนซ์ | 150 |
| จำนวนคุณลักษณะ | 4 |
| ค่าที่ขาดหายไป? | เลขที่ |
| พื้นที่ | ชีวิต |
ชุดข้อมูลมี 3 คลาส 50 อินสแตนซ์แต่ละรายการ รวม 150 อินสแตนซ์ ซึ่งแต่ละคลาสหมายถึงพืชไอริสชนิดหนึ่ง คลาสหนึ่งสามารถแยกออกได้อย่างเป็นเส้นตรงจากอีก 2 และหลัง ไม่สามารถแยกออกจากกันได้เป็นเส้นตรง
การทำนายแอตทริบิวต์: ชั้นของพืชไอริส
ข้อมูลแอตทริบิวต์: เรามี คุณสมบัติ 4 ประการ ในชุดข้อมูลนี้และ class ตัวแปรเป้าหมาย
โครงการนี้ได้รับการแก้ไขด้วยการติดตั้งไลบรารีเวอร์ชันต่อไปนี้:
| ห้องสมุด ภาษา | ใช้ | รุ่น |
|---|---|---|
| งูหลาม | ภาษาที่ใช้สำหรับโครงการ | 3.7.0 |
| นม | สำหรับการคำนวณทางวิทยาศาสตร์ | 1.15.2 |
| แพนด้า | สำหรับการวิเคราะห์ข้อมูล | 0.23.4 |
| matplotlib | สำหรับการสร้างภาพ | 3.0.0 |
| สัตว์ทะเล | สำหรับการสร้างภาพ | 0.9.0 |
| Scikit-learn | ML Library สำหรับการฝึกอบรมและการทดสอบข้อมูล | 0.20.0 |
หากคุณยังไม่ได้ติดตั้ง Python ขอแนะนำอย่างยิ่งให้คุณติดตั้งการกระจาย Anaconda ของ Python ซึ่งมีแพ็คเกจข้างต้นและรวมอยู่ในนั้น
คุณจะต้องติดตั้งซอฟต์แวร์ JUPYTER Notebook เพื่อเรียกใช้และเรียกใช้ไฟล์ report.ipynb นอกจากนี้คุณยังสามารถใช้ JupyterLab ได้เช่นกันเพื่อเรียกใช้และดำเนินการ JupyterLab เป็นเวอร์ชันที่ดีกว่าของ Jupyter Notebook คำแนะนำในการดาวน์โหลด JupyterLab สามารถพบได้ที่นี่
ในหน้าต่างเทอร์มินัลหรือคำสั่งนำทางไปยังไดเรกทอรีโครงการระดับบนสุด Iris_Flower (ที่มี readme นี้) และเรียกใช้หนึ่งในคำสั่งต่อไปนี้:
ipython notebook report.ipynbหรือ
jupyter notebook report.ipynbหรือถ้าคุณติดตั้ง 'Jupyter Lab'
jupyter labสิ่งนี้จะเปิดสมุดบันทึก Jupyter/Ipython หรือซอฟต์แวร์ JupyterLab และไฟล์โครงการในเบราว์เซอร์ของคุณ