
이것은 ML에서 가장 유명한 데이터 세트이며 ML/Data Science 와 함께 손을 더럽 히고 싶은 초보자에게 가장 좋습니다. 아이리스 꽃의 기능과 관찰이 적고, 결 측값이나 이상치를 다루지 않으면 ML 모델을 쉽고 간단하게 구현할 수 있습니다.
프로젝트는 깨끗하고 작기 때문에이를 활용하여 Matplotlib 및 Seaborn (데이터 시각화 라이브러리)으로 데이터 시각화를 수행하는 방법에 대한 실습을 얻고 ML/Data Science Project 에서 가장 많이 사용되는 기능 선택 방법을 구현 하며이 데이터 세트에 모든 분류 모델을 적용합니다. 이를 통해 데이터 세트를 구현하는 방법과시기 및시기에 대한 경험에 대한 연습과 경험을 제공합니다.
이 프로젝트에는 1 개의 파일과 2 개의 폴더가 포함되어 있습니다.
report.ipynb : 프로젝트에 대한 작업을 수행 한 주요 파일입니다.export/ : 노트북의 HTML 및 PDF 버전 파일을 포함하는 폴더.plots/ : report.ipynb 파일에 표시된 모든 플롯의 이미지가 포함되어 있습니다. | 관련 작업 | 분류 |
| 데이터 세트 특성 | 다변량 |
| 속성 특성 | 진짜 |
| 인스턴스 수 | 150 |
| 속성 수 | 4 |
| 결 측값? | 아니요 |
| 영역 | 삶 |
데이터 세트에는 각각의 50 개의 인스턴스 , 총 150 개의 인스턴스 의 3 개의 클래스가 포함되어 있으며, 각 클래스는 아이리스 플랜트 유형을 나타냅니다. 한 클래스는 다른 클래스와 선형으로 분리 될 수 있고 후자는 서로 선형으로 분리 할 수 없습니다 .
속성 예측 : 아이리스 플랜트 클래스.
속성 정보 : 이 데이터 세트에 4 개의 기능 과 대상 변수 class 있습니다.
이 프로젝트는 다음 버전의 라이브러리가 설치된 것으로 해결되었습니다.
| 라이브러리 언어 | 사용 | 버전 |
|---|---|---|
| 파이썬 | 프로젝트에 사용되는 언어 | 3.7.0 |
| Numpy | 과학 컴퓨팅 용 | 1.15.2 |
| 팬더 | 데이터 분석 | 0.23.4 |
| matplotlib | 시각화를 위해 | 3.0.0 |
| 슈타본 | 시각화를 위해 | 0.9.0 |
| Scikit-Learn | 교육 및 테스트 데이터를위한 ML 라이브러리 | 0.20.0 |
아직 Python이 설치되지 않은 경우 이미 위의 패키지가 있고 더 많은 Python의 Anaconda 분포를 설치하는 것이 좋습니다.
또한 report.ipynb 파일을 실행하고 실행하려면 소프트웨어 Jupyter 노트북을 설치해야합니다. Jupyterlab도 실행하고 실행할 수도 있습니다. Jupyterlab은 Jupyter Notebook 의 더 나은 버전입니다. jupyterlab을 다운로드하는 지침은 여기에서 찾을 수 있습니다.
터미널 또는 명령 창에서 최상위 프로젝트 디렉토리 Iris_Flower (이 readME를 포함하는)로 이동하여 다음 명령 중 하나를 실행하십시오.
ipython notebook report.ipynb또는
jupyter notebook report.ipynb또는 'Jupyter Lab'이 설치된 경우
jupyter lab이렇게하면 브라우저에서 Jupyter/Ipython 노트북 또는 Jupyterlab 소프트웨어 및 프로젝트 파일이 열립니다.