ดาวน์โหลด edamame - ดาวน์โหลดซอร์สโค้ด edamame

edamame

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

edamame

edamame
ฟังก์ชั่น
โมดูล EDA
โมดูล regressor
- ตัวอย่าง:
ตัวจําแนกโมดูล
- ตัวอย่าง:
โทดอส

Edamame ได้รับแรงบันดาลใจจากแพ็คเกจเช่นการทำแพนด้าการทำ Pycaret และ Yellowbrick เป้าหมายของ edamame คือการจัดทำฟังก์ชั่นที่ใช้งานง่ายสำหรับการดำเนินการวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) ในชุดข้อมูลรวมถึงการฝึกอบรมและวิเคราะห์แบตเตอรี่ของแบบจำลองสำหรับปัญหาการถดถอยหรือการจำแนกประเภท

เพื่อติดตั้งแพ็คเกจ

 pip install edamame

แพ็คเกจ Edamame ทำงานได้อย่างถูกต้องภายใน Jupyter-Notebook คุณสามารถค้นหาเอกสารประกอบของแพ็คเกจในหน้า Edamame เอกสาร

ฟังก์ชั่น

แพ็คเกจประกอบด้วยสามโมดูล: EDA ซึ่งทำการวิเคราะห์ข้อมูลเชิงสำรวจ และ regressor และตัวจําแนกซึ่งจัดการกับการฝึกอบรมแบบจำลองการเรียนรู้ของเครื่องสำหรับการถดถอยและการจำแนกตามลำดับ หากต้องการดูตัวอย่างของการใช้แพ็คเกจ Edamame คุณสามารถตรวจสอบโฟลเดอร์ตัวอย่างในที่เก็บ

โมดูล EDA

 import edamame . eda as eda

โมดูล EDA มีฟังก์ชั่นที่หลากหลายสำหรับการดำเนินการวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) บนชุดข้อมูล ด้วยโมดูลนี้คุณสามารถสำรวจและจัดการข้อมูลของคุณดำเนินการสถิติเชิงพรรณนาการวิเคราะห์ความสัมพันธ์และเตรียมข้อมูลของคุณสำหรับการเรียนรู้ของเครื่อง โมดูล "EDA" เสนอฟังก์ชันต่อไปนี้:

ฟังก์ชั่นการสำรวจและจัดการข้อมูล:
- ขนาด : ฟังก์ชั่นแสดงจำนวนแถวและคอลัมน์ของ pandas dataframe ผ่าน
- identify_types : ระบุชนิดข้อมูลของแต่ละคอลัมน์
- View_Cardinality : ดูจำนวนค่าที่ไม่ซ้ำกันในแต่ละคอลัมน์หมวดหมู่
- modify_cardinality : แก้ไขจำนวนของค่าที่ไม่ซ้ำกันในคอลัมน์
- ขาดหายไป : ตรวจสอบว่ามีข้อมูลที่ขาดหายไปในชุดข้อมูลหรือไม่
- HANDLING_MISSING : แทนที่หรือลบค่าที่หายไปในชุดข้อมูล
- drop_columns : ลบคอลัมน์เฉพาะออกจากชุดข้อมูล
- num_to_categorical : ฟังก์ชั่นส่งคืน dataframe ด้วยคอลัมน์ที่แปลงเป็น "วัตถุ"
- การโต้ตอบ : ฟังก์ชั่นแสดงพล็อตแบบโต้ตอบสำหรับการวิเคราะห์ความสัมพันธ์ระหว่างคอลัมน์ตัวเลขด้วย scatterplot
- การตรวจสอบ : ฟังก์ชั่นแสดงพล็อตแบบโต้ตอบสำหรับการวิเคราะห์การกระจายตัวของตัวแปรตามความสำคัญที่แตกต่างกันของตัวแปรเป้าหมาย
- split_and_scaling : ฟังก์ชั่นส่งคืนสอง dataframes pandas: regressor matrix x มีตัวทำนายทั้งหมดสำหรับโมเดลซีรีส์ y มีค่าของตัวแปรตอบสนอง
ฟังก์ชั่นสถิติเชิงพรรณนา:
- desplent_distribution : ฟังก์ชั่นแสดงผลลัพธ์ของวิธีการอธิบาย () วิธีการที่ใช้กับ pandas dataframe หารด้วยคอลัมน์ตัวเลขและวัตถุ
- plot_categorical : ฟังก์ชั่นส่งคืนลำดับของตารางและแปลงสำหรับตัวแปรหมวดหมู่
- plot_numerical : ฟังก์ชั่นส่งคืนลำดับของตารางและแปลงสำหรับตัวแปรตัวเลข
- num_variable_study : เขาฟังก์ชั่นแสดงการแปลงรูปแบบต่อไปนี้ของตัวแปร col ที่ผ่าน: log (x), sqrt (x), x^2, box-cox, 1/x
ฟังก์ชั่นการวิเคราะห์สหสัมพันธ์:
- correlation_pearson : ฟังก์ชั่นดำเนินการความสัมพันธ์ของเพียร์สันระหว่างคู่คอลัมน์
- correlation_categorical : ฟังก์ชั่นดำเนินการทดสอบไคสแควร์ของความเป็นอิสระระหว่างตัวแปรเด็ดขาดของชุดข้อมูล
- correlation_phik : คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ phik ระหว่างคอลัมน์ทั้งหมด (ลิงก์กระดาษ)
ฟังก์ชั่นที่มีประโยชน์:
- load_model : ฟังก์ชั่นโหลดโมเดลที่บันทึกไว้ในรูปแบบดอง
- การตั้งค่า : ฟังก์ชั่นส่งคืนองค์ประกอบต่อไปนี้: x_train, y_train, x_test, y_test
- การปรับสเกล : ฟังก์ชั่นส่งคืนเมทริกซ์ปกติ/มาตรฐาน
- OHE : ฟังก์ชั่นส่งคืนอาร์เรย์ NumPy ที่ส่งผ่านเป็นอินพุตซึ่งแปลงโดยใช้การเข้ารหัสแบบร้อนหนึ่งครั้ง

โมดูล regressor

 from edamame . regressor import TrainRegressor , regression_metrics

คลาส TrainRegressor ได้รับการออกแบบให้ใช้เป็นท่อสำหรับการฝึกอบรมและการจัดการแบบจำลองการถดถอย

คลาสมีวิธีการหลายวิธีในการปรับรูปแบบการถดถอยที่แตกต่างกันตัวชี้วัดแบบจำลองการคำนวณโมเดลการบันทึกและการโหลดและการใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามการวัดประสิทธิภาพ วิธีการเหล่านี้รวมถึง:

เชิงเส้น : เหมาะกับแบบจำลองการถดถอยเชิงเส้นกับข้อมูลการฝึกอบรม
Lasso : เหมาะกับรูปแบบการถดถอยของ Lasso กับข้อมูลการฝึกอบรม
Ridge : เหมาะกับแบบจำลองการถดถอยของสันเขากับข้อมูลการฝึกอบรม
Tree : เหมาะกับรูปแบบการถดถอยของต้นไม้ตัดสินใจกับข้อมูลการฝึกอบรม
Random_Forest : เหมาะกับแบบจำลองการถดถอยป่าแบบสุ่มกับข้อมูลการฝึกอบรม
XGBOOST : เหมาะกับรูปแบบการถดถอย XGBOOST กับข้อมูลการฝึกอบรม
Auto_ML : ใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามตัวชี้วัดประสิทธิภาพ
model_metrics : คำนวณและพิมพ์ตัวชี้วัดประสิทธิภาพสำหรับแต่ละรุ่นที่ผ่านการฝึกอบรม
save_model : บันทึกโมเดลที่ผ่านการฝึกอบรมไปยังไฟล์

หลังจากบันทึกโมเดลด้วยวิธี SAVE_MODEL เราสามารถอัปโหลดโมเดลโดยใช้ฟังก์ชัน LOAD_MODEL ของโมดูล EDA และประเมินประสิทธิภาพของข้อมูลใหม่โดยใช้ฟังก์ชัน Regression_Metrics

 from edamame . regressor import RegressorDiagnose

คลาส Regressordiagnose ได้รับการออกแบบมาเพื่อวินิจฉัยโมเดลการถดถอยและวิเคราะห์ประสิทธิภาพของพวกเขา ชั้นเรียนมีวิธีการหลายวิธีในการวินิจฉัยและวิเคราะห์ประสิทธิภาพของแบบจำลองการถดถอย วิธีการเหล่านี้รวมถึง:

ค่าสัมประสิทธิ์ : คำนวณและพิมพ์ค่าสัมประสิทธิ์ของแบบจำลองการถดถอย
RANDOR_FOREST_FI : แสดงพล็อตความสำคัญของคุณลักษณะสำหรับแบบจำลองการถดถอยแบบสุ่มฟอเรสต์
RANDOR_FOREST_FI : แสดงพล็อตความสำคัญของคุณลักษณะสำหรับโมเดลการถดถอย XGBOOST
Prediction_error : คำนวณและพิมพ์ข้อผิดพลาดการทำนายของแบบจำลองการถดถอยบนข้อมูลการทดสอบ
Residual_plot : สร้างและแสดงพล็อตที่เหลือสำหรับโมเดลการถดถอย
qqplot : สร้างและแสดงพล็อต QQ สำหรับโมเดลการถดถอย

ตัวอย่าง:

 from sklearn . datasets import make_regression
from edamame . regressor import TrainRegressor
import pandas as pd
import edamame . eda as eda
from edamame . regressor import RegressorDiagnose
X , y = make_regression ( n_samples = 1000 , n_features = 5 , n_targets = 1 , random_state = 42 )
X = pd . DataFrame ( X , columns = [ "f1" , "f2" , "f3" , "f4" , "f5" ])
y = pd . DataFrame ( y , columns = [ "y" ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
regressor = TrainRegressor ( X_train_s , y_train , X_test_s , y_test )
rf = regressor . random_forest ()
regressor . model_metrics ()
diagnose = RegressorDiagnose ( X_train_s , y_train , X_test_s , y_test )
diagnose . random_forest_fi ( model = rf )
diagnose . prediction_error ( model = rf )

ตัวจําแนกโมดูล

 from edamame . classifier import TrainClassifier

คลาส TrainClassifier ได้รับการออกแบบให้ใช้เป็นท่อสำหรับการฝึกอบรมและการจัดการแบบจำลอง clasification

คลาสมีวิธีการหลายวิธีในการปรับรูปแบบการถดถอยที่แตกต่างกันตัวชี้วัดแบบจำลองการคำนวณโมเดลการบันทึกและการโหลดและการใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามการวัดประสิทธิภาพ วิธีการเหล่านี้รวมถึง:

โลจิสติก : เหมาะกับแบบจำลองโลจิสติกกับข้อมูลการฝึกอบรม
Gaussian_NB : เหมาะกับโมเดล Gaussina Naive Bayes กับข้อมูลการฝึกอบรม
KNN : เหมาะกับรูปแบบการจำแนกประเภทเพื่อนบ้าน K-Nearest กับข้อมูลการฝึกอบรม
TREE : เหมาะกับรูปแบบการจำแนกต้นไม้การตัดสินใจกับข้อมูลการฝึกอบรม
Random_Forest : เหมาะกับรูปแบบการจำแนกป่าแบบสุ่มกับข้อมูลการฝึกอบรม
XGBOOST : เหมาะกับรูปแบบการจำแนกประเภท XGBOOST กับข้อมูลการฝึกอบรม
- SVM : เหมาะกับรูปแบบการจำแนกเวกเตอร์สนับสนุนกับข้อมูลการฝึกอบรม
Auto_ML : ใช้ AutomL เพื่อเลือกรุ่นที่ดีที่สุดตามตัวชี้วัดประสิทธิภาพ
model_metrics : คำนวณและพิมพ์ตัวชี้วัดประสิทธิภาพสำหรับแต่ละรุ่นที่ผ่านการฝึกอบรม
save_model : บันทึกโมเดลที่ผ่านการฝึกอบรมไปยังไฟล์

หลังจากบันทึกโมเดลด้วยวิธี SAVE_MODEL เราสามารถอัปโหลดโมเดลโดยใช้ฟังก์ชัน LOAD_MODEL ของโมดูล EDA และประเมินประสิทธิภาพของข้อมูลใหม่โดยใช้ฟังก์ชัน classIFIER_METRICS

 from edamame . classifier import classifier_metrics

ตัวอย่าง:

 from edamame . classifier import TrainClassifier
from sklearn import datasets
import edamame . eda as eda
iris = datasets . load_iris ()
X = iris . data
X = pd . DataFrame ( X , columns = iris . feature_names )
y = iris . target
y = pd . DataFrame ( y , columns = [ 'y' ])
X_train , y_train , X_test , y_test = eda . setup ( X , y )
X_train_s = eda . scaling ( X_train )
X_test_s = eda . scaling ( X_test )
classifier = TrainClassifier ( X_train_s , y_train , X_test_s , y_test )
models = classifier . auto_ml ()
svm = classifier . svm ()
classifier . model_metrics ( model_name = "svm" )
classifier . save_model ( model_name = "svm" )
svm_upload = eda . load_model ( path = "svm.pkl" )
classifier_metrics ( svm_upload , X_train_s , y_train )

โทดอส

เพิ่มโน้ตบุ๊กสำหรับ EDA ในปัญหาการจำแนกประเภทไปยังที่เก็บ edamame-notebook
เพิ่มสมุดบันทึกสำหรับการฝึกอบรม/การวินิจฉัยรูปแบบการจำแนกประเภทไปยังที่เก็บ edamame-notebook
เพิ่มวิธี ROCAUC ในคลาส classifierDiagnose
อัปเดตสมุดบันทึกตัวอย่าง

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-26
ขนาด 1.92MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด