
Edamame terinspirasi oleh paket-paket seperti profil panda, pycaret, dan yellowbrick. Tujuan edamame adalah untuk menyediakan fungsi yang ramah pengguna untuk melakukan analisis data eksplorasi (EDA) pada dataset, serta untuk melatih dan menganalisis baterai model untuk masalah regresi atau klasifikasi.
Untuk menginstal paket,
pip install edamamePaket edamame berfungsi dengan benar di dalam buku note-note. Anda dapat menemukan dokumentasi paket di halaman Edamame-Documentation.
Paket ini terdiri dari tiga modul: EDA, yang melakukan analisis data eksplorasi; dan regressor dan classifier, yang menangani pelatihan model pembelajaran mesin untuk regresi dan klasifikasi, masing -masing. Untuk melihat contoh penggunaan paket edamame, Anda dapat memeriksa folder contoh di repositori.
import edamame . eda as edaModul EDA menyediakan berbagai fungsi untuk melakukan analisis data eksplorasi (EDA) pada dataset. Dengan modul ini Anda dapat dengan mudah mengeksplorasi dan memanipulasi data Anda, melakukan statistik deskriptif, analisis korelasi, dan menyiapkan data Anda untuk pembelajaran mesin. Modul "EDA" menawarkan fungsionalitas berikut:
Fungsi Eksplorasi dan Manipulasi Data:
Fungsi statistik deskriptif:
Fungsi Analisis Korelasi:
Fungsi yang berguna:
from edamame . regressor import TrainRegressor , regression_metricsKelas Trainregressor dirancang untuk digunakan sebagai pipa untuk pelatihan dan penanganan model regresi.
Kelas ini menyediakan beberapa metode untuk pemasangan model regresi yang berbeda, metrik model komputasi, model menyimpan dan memuat, dan menggunakan AutomL untuk memilih model terbaik berdasarkan metrik kinerja. Metode -metode ini termasuk:
Setelah menyimpan model dengan metode Save_Model , kami dapat mengunggah model menggunakan fungsi muat Modul EDA dan mengevaluasi kinerjanya pada data baru menggunakan fungsi regression_metrics .
from edamame . regressor import RegressorDiagnoseKelas Regressordiagnosis dirancang untuk mendiagnosis model regresi dan menganalisis kinerjanya. Kelas ini menyediakan beberapa metode untuk mendiagnosis dan menganalisis kinerja model regresi. Metode -metode ini termasuk:
from sklearn . datasets import make_regression
from edamame . regressor import TrainRegressor
import pandas as pd
import edamame . eda as eda
from edamame . regressor import RegressorDiagnose
X , y = make_regression ( n_samples = 1000 , n_features = 5 , n_targets = 1 , random_state = 42 )
X = pd . DataFrame ( X , columns = [ "f1" , "f2" , "f3" , "f4" , "f5" ])
y = pd . DataFrame ( y , columns = [ "y" ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
regressor = TrainRegressor ( X_train_s , y_train , X_test_s , y_test )
rf = regressor . random_forest ()
regressor . model_metrics ()
diagnose = RegressorDiagnose ( X_train_s , y_train , X_test_s , y_test )
diagnose . random_forest_fi ( model = rf )
diagnose . prediction_error ( model = rf ) from edamame . classifier import TrainClassifierKelas TrainClassifier dirancang untuk digunakan sebagai pipa untuk pelatihan dan penanganan model klasifikasi.
Kelas ini menyediakan beberapa metode untuk pemasangan model regresi yang berbeda, metrik model komputasi, model menyimpan dan memuat, dan menggunakan AutomL untuk memilih model terbaik berdasarkan metrik kinerja. Metode -metode ini termasuk:
Setelah menyimpan model dengan metode Save_Model , kami dapat mengunggah model menggunakan fungsi muat Modul EDA dan mengevaluasi kinerjanya pada data baru menggunakan fungsi classifier_metrics .
from edamame . classifier import classifier_metrics from edamame . classifier import TrainClassifier
from sklearn import datasets
import edamame . eda as eda
iris = datasets . load_iris ()
X = iris . data
X = pd . DataFrame ( X , columns = iris . feature_names )
y = iris . target
y = pd . DataFrame ( y , columns = [ 'y' ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
classifier = TrainClassifier ( X_train_s , y_train , X_test_s , y_test )
models = classifier . auto_ml ()
svm = classifier . svm ()
classifier . model_metrics ( model_name = "svm" )
classifier . save_model ( model_name = "svm" )
svm_upload = eda . load_model ( path = "svm.pkl" )
classifier_metrics ( svm_upload , X_train_s , y_train )