easy analysis
1.0.0
使用此软件包轻松执行数据分析。
pip install arv-easy-analysis例如,我们正在研究seaborn图书馆的提示数据集。
import seaborn as sns
tips = sns . load_dataset ( "tips" )data.summary模块。获取您的数据的自定义和更有见地的摘要。
from easy_analysis . data import summary
summary . custom_describe ( tips [[ "total_bill" , "tip" , "size" ]])输出:
| total_bill | 提示 | 尺寸 | |
|---|---|---|---|
| 数数 | 244 | 244 | 244 |
| 意思是 | 19.786 | 2.998 | 2.57 |
| std | 8.902 | 1.384 | 0.951 |
| 最小 | 3.07 | 1 | 1 |
| 1% | 7.25 | 1 | 1 |
| 5% | 9.558 | 1.44 | 2 |
| 25% | 13.348 | 2 | 2 |
| 50% | 17.795 | 2.9 | 2 |
| 75% | 24.127 | 3.562 | 3 |
| 95% | 38.061 | 5.196 | 4 |
| 99% | 48.227 | 7.214 | 6 |
| 最大限度 | 50.81 | 10 | 6 |
| 偏斜 | 1.133 | 1.465 | 1.448 |
| 峰度 | 1.218 | 3.648 | 1.732 |
| Notnull | 244 | 244 | 244 |
| isnull | 0 | 0 | 0 |
data.outliers模块此功能使用IQR方法从给定数据集提取离群值并返回数据框。
from easy_analysis . data import outliers
outliers . extract_outliers ( tips [[ "total_bill" , "tip" , "size" ]], "total_bill" )输出:
| total_bill | 提示 | 尺寸 |
|---|---|---|
| 50.81 | 10 | 3 |
| 48.33 | 9 | 4 |
| 48.27 | 6.73 | 4 |
| 48.17 | 5 | 6 |
| 45.35 | 3.5 | 3 |
| 44.3 | 2.5 | 3 |
| 43.11 | 5 | 4 |
| 41.19 | 5 | 5 |
| 40.55 | 3 | 2 |
plots.univariate模块将其用于全面的单变量图。
from easy_analysis . plots import univariate
univariate . visualize_feature ( tips [ "total_bill" ])
plots.insights使用insights.null_plot函数以获取图中的空值的概述。
from easy_analysis . plots import insights
insights . null_plot ( tips ) # Output: A graph which gives a overview of null values.如果您有与此项目相关的任何问题或查询,则可以在此处提出。