
Edamame ได้รับแรงบันดาลใจจากแพ็คเกจเช่นการทำแพนด้าการทำ Pycaret และ Yellowbrick เป้าหมายของ edamame คือการจัดทำฟังก์ชั่นที่ใช้งานง่ายสำหรับการดำเนินการวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) ในชุดข้อมูลรวมถึงการฝึกอบรมและวิเคราะห์แบตเตอรี่ของแบบจำลองสำหรับปัญหาการถดถอยหรือการจำแนกประเภท
เพื่อติดตั้งแพ็คเกจ
pip install edamameแพ็คเกจ Edamame ทำงานได้อย่างถูกต้องภายใน Jupyter-Notebook คุณสามารถค้นหาเอกสารประกอบของแพ็คเกจในหน้า Edamame เอกสาร
แพ็คเกจประกอบด้วยสามโมดูล: EDA ซึ่งทำการวิเคราะห์ข้อมูลเชิงสำรวจ และ regressor และตัวจําแนกซึ่งจัดการกับการฝึกอบรมแบบจำลองการเรียนรู้ของเครื่องสำหรับการถดถอยและการจำแนกตามลำดับ หากต้องการดูตัวอย่างของการใช้แพ็คเกจ Edamame คุณสามารถตรวจสอบโฟลเดอร์ตัวอย่างในที่เก็บ
import edamame . eda as edaโมดูล EDA มีฟังก์ชั่นที่หลากหลายสำหรับการดำเนินการวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) บนชุดข้อมูล ด้วยโมดูลนี้คุณสามารถสำรวจและจัดการข้อมูลของคุณดำเนินการสถิติเชิงพรรณนาการวิเคราะห์ความสัมพันธ์และเตรียมข้อมูลของคุณสำหรับการเรียนรู้ของเครื่อง โมดูล "EDA" เสนอฟังก์ชันต่อไปนี้:
ฟังก์ชั่นการสำรวจและจัดการข้อมูล:
ฟังก์ชั่นสถิติเชิงพรรณนา:
ฟังก์ชั่นการวิเคราะห์สหสัมพันธ์:
ฟังก์ชั่นที่มีประโยชน์:
from edamame . regressor import TrainRegressor , regression_metricsคลาส TrainRegressor ได้รับการออกแบบให้ใช้เป็นท่อสำหรับการฝึกอบรมและการจัดการแบบจำลองการถดถอย
คลาสมีวิธีการหลายวิธีในการปรับรูปแบบการถดถอยที่แตกต่างกันตัวชี้วัดแบบจำลองการคำนวณโมเดลการบันทึกและการโหลดและการใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามการวัดประสิทธิภาพ วิธีการเหล่านี้รวมถึง:
หลังจากบันทึกโมเดลด้วยวิธี SAVE_MODEL เราสามารถอัปโหลดโมเดลโดยใช้ฟังก์ชัน LOAD_MODEL ของโมดูล EDA และประเมินประสิทธิภาพของข้อมูลใหม่โดยใช้ฟังก์ชัน Regression_Metrics
from edamame . regressor import RegressorDiagnoseคลาส Regressordiagnose ได้รับการออกแบบมาเพื่อวินิจฉัยโมเดลการถดถอยและวิเคราะห์ประสิทธิภาพของพวกเขา ชั้นเรียนมีวิธีการหลายวิธีในการวินิจฉัยและวิเคราะห์ประสิทธิภาพของแบบจำลองการถดถอย วิธีการเหล่านี้รวมถึง:
from sklearn . datasets import make_regression
from edamame . regressor import TrainRegressor
import pandas as pd
import edamame . eda as eda
from edamame . regressor import RegressorDiagnose
X , y = make_regression ( n_samples = 1000 , n_features = 5 , n_targets = 1 , random_state = 42 )
X = pd . DataFrame ( X , columns = [ "f1" , "f2" , "f3" , "f4" , "f5" ])
y = pd . DataFrame ( y , columns = [ "y" ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
regressor = TrainRegressor ( X_train_s , y_train , X_test_s , y_test )
rf = regressor . random_forest ()
regressor . model_metrics ()
diagnose = RegressorDiagnose ( X_train_s , y_train , X_test_s , y_test )
diagnose . random_forest_fi ( model = rf )
diagnose . prediction_error ( model = rf ) from edamame . classifier import TrainClassifierคลาส TrainClassifier ได้รับการออกแบบให้ใช้เป็นท่อสำหรับการฝึกอบรมและการจัดการแบบจำลอง clasification
คลาสมีวิธีการหลายวิธีในการปรับรูปแบบการถดถอยที่แตกต่างกันตัวชี้วัดแบบจำลองการคำนวณโมเดลการบันทึกและการโหลดและการใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามการวัดประสิทธิภาพ วิธีการเหล่านี้รวมถึง:
หลังจากบันทึกโมเดลด้วยวิธี SAVE_MODEL เราสามารถอัปโหลดโมเดลโดยใช้ฟังก์ชัน LOAD_MODEL ของโมดูล EDA และประเมินประสิทธิภาพของข้อมูลใหม่โดยใช้ฟังก์ชัน classIFIER_METRICS
from edamame . classifier import classifier_metrics from edamame . classifier import TrainClassifier
from sklearn import datasets
import edamame . eda as eda
iris = datasets . load_iris ()
X = iris . data
X = pd . DataFrame ( X , columns = iris . feature_names )
y = iris . target
y = pd . DataFrame ( y , columns = [ 'y' ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
classifier = TrainClassifier ( X_train_s , y_train , X_test_s , y_test )
models = classifier . auto_ml ()
svm = classifier . svm ()
classifier . model_metrics ( model_name = "svm" )
classifier . save_model ( model_name = "svm" )
svm_upload = eda . load_model ( path = "svm.pkl" )
classifier_metrics ( svm_upload , X_train_s , y_train )