easy analysis
1.0.0
이 패키지를 사용하여 데이터 분석을 쉽게 수행하십시오.
pip install arv-easy-analysis 예를 들어, 우리는 seaborn Library의 TIPS 데이터 세트를 작업하고 있습니다.
import seaborn as sns
tips = sns . load_dataset ( "tips" )data.summary 모듈.데이터에 대한 사용자 정의 및보다 통찰력있는 요약을 받으십시오.
from easy_analysis . data import summary
summary . custom_describe ( tips [[ "total_bill" , "tip" , "size" ]])산출:
| Total_bill | 팁 | 크기 | |
|---|---|---|---|
| 세다 | 244 | 244 | 244 |
| 평균 | 19.786 | 2.998 | 2.57 |
| std | 8.902 | 1.384 | 0.951 |
| 최소 | 3.07 | 1 | 1 |
| 1% | 7.25 | 1 | 1 |
| 5% | 9.558 | 1.44 | 2 |
| 25% | 13.348 | 2 | 2 |
| 50% | 17.795 | 2.9 | 2 |
| 75% | 24.127 | 3.562 | 3 |
| 95% | 38.061 | 5.196 | 4 |
| 99% | 48.227 | 7.214 | 6 |
| 맥스 | 50.81 | 10 | 6 |
| 비스듬한 | 1.133 | 1.465 | 1.448 |
| 첨도 | 1.218 | 3.648 | 1.732 |
| NOTNULL | 244 | 244 | 244 |
| ISNULL | 0 | 0 | 0 |
data.outliers 모듈이 함수는 IQR 메소드를 사용하여 주어진 데이터 세트에서 이상치를 추출하고 데이터 프레임을 반환합니다.
from easy_analysis . data import outliers
outliers . extract_outliers ( tips [[ "total_bill" , "tip" , "size" ]], "total_bill" )산출:
| Total_bill | 팁 | 크기 |
|---|---|---|
| 50.81 | 10 | 3 |
| 48.33 | 9 | 4 |
| 48.27 | 6.73 | 4 |
| 48.17 | 5 | 6 |
| 45.35 | 3.5 | 3 |
| 44.3 | 2.5 | 3 |
| 43.11 | 5 | 4 |
| 41.19 | 5 | 5 |
| 40.55 | 3 | 2 |
plots.univariate 모듈포괄적 인 일 변량 음모에 사용하십시오.
from easy_analysis . plots import univariate
univariate . visualize_feature ( tips [ "total_bill" ])
plots.insights insights.null_plot 함수를 사용하여 그래프에서 null 값에 대한 개요를 얻으십시오.
from easy_analysis . plots import insights
insights . null_plot ( tips ) # Output: A graph which gives a overview of null values.이 프로젝트와 관련된 문제 나 쿼리가 있으면 여기에서 올릴 수 있습니다.