
Dies ist der berühmteste Datensatz in ML und am besten für Anfänger, die mit ML/Data Science die Hände schmutzig werden möchten. Sie haben weniger Merkmale und Beobachtungen der Irisblüten, keine fehlenden Werte oder Ausreißer, damit die Implementierung von ML -Modellen einfacher und einfacher.
Da das Projekt sauber und klein ist, werden wir dies zu unserem Vorteil nutzen und die Durchführung der Datenvisualisierung mit Matplotlib und Seeborn (Datenvisualisierungsbibliotheken) durchführen, die am häufigsten verwendeten Merkmalsauswahlmethoden im ML/Data Science -Projekt implementieren und alle Klassifizierungsmodelle auf diesem Datensatz anwenden. Dies gibt uns Praxis und praktische Erfahrungen darüber, wie und wann sie implementiert werden sollen und welche angesichts des Datensatzes am besten geeignet sind.
Dieses Projekt enthält 1 Datei und 2 Ordner:
report.ipynb : Dies ist die Hauptdatei, in der ich meine Arbeiten am Projekt ausgeführt habe.export/ : Ordner mit HTML- und PDF -Versionsdatei von Notebook.plots/ : Enthält Bilder aller Diagramme, die in der Datei report.ipynb angezeigt werden. | Assoziierte Aufgabe | Einstufung |
| Datensatzeigenschaften | Multivariate |
| Attributmerkmale | Real |
| Anzahl der Fälle | 150 |
| Anzahl der Attribute | 4 |
| Fehlende Werte? | NEIN |
| Bereich | Leben |
Der Datensatz enthält 3 Klassen mit jeweils 50 Instanzen , insgesamt 150 Instanzen , in denen sich jede Klasse auf eine Art von Irisanlage bezieht. Eine Klasse ist linear trennbar von der anderen 2 und letztere sind nicht linear voneinander trennbar .
Vorhersageattribut: Klasse der Iris -Pflanzen.
Attributinformationen: Wir haben 4 Funktionen in diesem Datensatz und eine class .
Dieses Projekt wurde mit den folgenden Versionen der installierten Bibliotheken gelöst:
| Bibliotheken Sprache | Verwenden | Version |
|---|---|---|
| Python | Sprache, die für das Projekt verwendet wird | 3.7.0 |
| Numpy | Für wissenschaftliches Computer | 1.15.2 |
| Pandas | Zur Datenanalyse | 0,23,4 |
| Matplotlib | Zur Visualisierung | 3.0.0 |
| Seeborn | Zur Visualisierung | 0.9.0 |
| Scikit-Learn | ML -Bibliothek für Schulungen und Testen von Daten | 0.20.0 |
Wenn Sie Python noch nicht installiert haben, wird dringend empfohlen, die Anaconda -Verteilung von Python zu installieren, die bereits die oben genannten Pakete enthält und mehr darin enthalten ist.
Sie müssen auch Software -Jupyter -Notizbuch für das Ausführen und Ausführen report.ipynb -Datei installiert. Sie können auch JupyterLab verwenden, um auszuführen und auszuführen. JupyterLab ist eine bessere Version des Jupyter -Notizbuchs . Anweisungen zum Herunterladen von JupyterLab finden Sie hier.
Navigieren Sie in einem Terminal- oder Befehlsfenster zum obersten Projektverzeichnis Iris_Flower (das diese Readme enthält) und führen Sie einen der folgenden Befehle aus:
ipython notebook report.ipynboder
jupyter notebook report.ipynboder wenn Sie "Jupyter Lab" installiert haben
jupyter labDadurch wird das Jupyter/Ipython -Notebook oder die JupyterLab -Software und die Projektdatei in Ihrem Browser geöffnet.