easy analysis
1.0.0
使用此軟件包輕鬆執行數據分析。
pip install arv-easy-analysis例如,我們正在研究seaborn圖書館的提示數據集。
import seaborn as sns
tips = sns . load_dataset ( "tips" )data.summary模塊。獲取您的數據的自定義和更有見地的摘要。
from easy_analysis . data import summary
summary . custom_describe ( tips [[ "total_bill" , "tip" , "size" ]])輸出:
| total_bill | 提示 | 尺寸 | |
|---|---|---|---|
| 數數 | 244 | 244 | 244 |
| 意思是 | 19.786 | 2.998 | 2.57 |
| std | 8.902 | 1.384 | 0.951 |
| 最小 | 3.07 | 1 | 1 |
| 1% | 7.25 | 1 | 1 |
| 5% | 9.558 | 1.44 | 2 |
| 25% | 13.348 | 2 | 2 |
| 50% | 17.795 | 2.9 | 2 |
| 75% | 24.127 | 3.562 | 3 |
| 95% | 38.061 | 5.196 | 4 |
| 99% | 48.227 | 7.214 | 6 |
| 最大限度 | 50.81 | 10 | 6 |
| 偏斜 | 1.133 | 1.465 | 1.448 |
| 峰度 | 1.218 | 3.648 | 1.732 |
| Notnull | 244 | 244 | 244 |
| isnull | 0 | 0 | 0 |
data.outliers模塊此功能使用IQR方法從給定數據集提取離群值並返回數據框。
from easy_analysis . data import outliers
outliers . extract_outliers ( tips [[ "total_bill" , "tip" , "size" ]], "total_bill" )輸出:
| total_bill | 提示 | 尺寸 |
|---|---|---|
| 50.81 | 10 | 3 |
| 48.33 | 9 | 4 |
| 48.27 | 6.73 | 4 |
| 48.17 | 5 | 6 |
| 45.35 | 3.5 | 3 |
| 44.3 | 2.5 | 3 |
| 43.11 | 5 | 4 |
| 41.19 | 5 | 5 |
| 40.55 | 3 | 2 |
plots.univariate模塊將其用於全面的單變量圖。
from easy_analysis . plots import univariate
univariate . visualize_feature ( tips [ "total_bill" ])
plots.insights使用insights.null_plot函數以獲取圖中的空值的概述。
from easy_analysis . plots import insights
insights . null_plot ( tips ) # Output: A graph which gives a overview of null values.如果您有與此項目相關的任何問題或查詢,則可以在此處提出。