Unduh zipml - Unduh Kode Sumber zipml

zipml

Kode Sumber AI

1.0.0

Unduh

Zipml

ZIPML adalah perpustakaan AutomL yang ringan yang dirancang untuk kumpulan data kecil, menawarkan fungsi-fungsi helper penting seperti pemisahan uji-kereta, perbandingan model, dan generasi matriks kebingungan.

Fitur

Pelatihan Model Otomatis : Secara otomatis melatih dan membandingkan model pembelajaran mesin pada dataset Anda.
Fungsi Pembantu :
- Fungsi split uji-kereta untuk manajemen data yang mudah.
- Generasi matriks kebingungan dan kemampuan untuk menyimpannya sebagai PNG.
- Fitur logging khusus untuk pelacakan kinerja model Anda yang lebih baik.
Perbandingan Model : Bandingkan kinerja model yang berbeda dengan mudah, memberikan metrik dan umpan balik visual.
Dukungan CLI : Jalankan tugas pembelajaran mesin langsung dari baris perintah.
Extensible : Tambahkan model Anda sendiri dan sesuaikan alur kerja sesuai kebutuhan.
Alat Visualisasi : Termasuk alat untuk memvisualisasikan metrik kinerja model, membantu memahami perilaku model dengan lebih baik.
Tuning Hyperparameter : Dukungan untuk Tuning Hyperparameter Untuk Mengoptimalkan Kinerja Model.
Preprocessing data : Langkah-langkah preprocessing data bawaan untuk menangani nilai yang hilang, penskalaan, dan pengkodean.

Struktur Paket

zipml/
│
├── data/
│   ├── encoding.py
│   ├── file_operations.py
│   ├── split_data.py
│
├── model/
│   ├── analyze_model_predictions.py
│   ├── calculate_model_results.py
│   ├── measure_prediction_time.py
│
├── utils/
│   ├── calculate_sentence_length_percentile.py
│   ├── read_time_series_data.py
│
├── visualization/
│   ├── combine_and_plot_model_results.py
│   ├── plot_random_image.py
│   ├── plot_time_series.py
│   ├── save_and_plot_confusion_matrix.py
│
└── zipml.py

Cara menggunakan paket `zipml`

Paket zipml menyediakan berbagai utilitas untuk preprocessing data, menganalisis model, dan memvisualisasikan hasil, semua dirancang untuk menyederhanakan alur kerja AI dan pembelajaran mesin. Di bawah ini adalah instruksi untuk menggunakan beberapa fungsi utama.

1. Evaluasi model

analyze_model_predictions.py : Mengevaluasi prediksi model dengan membandingkannya dengan nilai -nilai aktual dan mengembalikan data yang terperinci dari prediksi bersama dengan prediksi yang paling salah.
```
 from zipml . model import analyze_model_predictions
val_df , most_wrong = analyze_model_predictions ( best_model , X_test , y_test )
```

Instalasi

Instal paket melalui PIP:

pip install zipml

Atau, klon repositori:

git clone https://github.com/abdozmantar/zipml.git
cd zipml
pip install .

Penggunaan

Contoh Penggunaan dengan Kode

Berikut adalah contoh praktis tentang cara menggunakan ZIPML:

 import pandas as pd
from zipml . model import analyze_model_predictions
from zipml . model import calculate_model_results
from zipml . visualization import save_and_plot_confusion_matrix
from zipml . data import split_data
from zipml import compare_models
from sklearn . ensemble import RandomForestClassifier , GradientBoostingClassifier
from sklearn . linear_model import LogisticRegression


# Sample dataset
data = {
    'feature_1' : [ 0.517 , 0.648 , 0.105 , 0.331 , 0.781 , 0.026 , 0.048 ],
    'feature_2' : [ 0.202 , 0.425 , 0.643 , 0.721 , 0.646 , 0.827 , 0.303 ],
    'feature_3' : [ 0.897 , 0.579 , 0.014 , 0.167 , 0.015 , 0.358 , 0.744 ],
    'feature_4' : [ 0.457 , 0.856 , 0.376 , 0.527 , 0.648 , 0.534 , 0.047 ],
    'feature_5' : [ 0.046 , 0.118 , 0.222 , 0.001 , 0.969 , 0.239 , 0.203 ],
    'target' : [ 0 , 1 , 1 , 1 , 1 , 1 , 0 ]
}

# Creating DataFrame
df = pd . DataFrame ( data )

# Splitting data into features (X) and target (y)
X = df . drop ( 'target' , axis = 1 )
y = df [ 'target' ]

# Split the data into training and test sets
X_train , X_test , y_train , y_test = split_data ( X , y )

# Define models
models = [
    RandomForestClassifier (),
    LogisticRegression (),
    GradientBoostingClassifier ()
]

# Compare models and select the best one
best_model , performance = compare_models ( models , X_train , X_test , y_train , y_test )
print ( f"Best model: { best_model } with performance: { performance } " )

# Calculate performance metrics for the best model
best_model_metrics = calculate_model_results ( y_test , best_model . predict ( X_test ))

# Analyze model predictions
val_df , most_wrong = analyze_model_predictions ( best_model , X_test , y_test )

# Save and plot confusion matrix
save_and_plot_confusion_matrix ( y_test , best_model . predict ( X_test ), save_path = "confusion_matrix.png" )

Penggunaan CLI

Anda dapat menjalankan ZIPML dari baris perintah menggunakan perintah berikut:

Latih satu model

zipml --train train.csv --test test.csv --model randomforest --result results.json

--train : jalur ke file Dataset Pelatihan CSV.
--test : Path to pengujian Dataset CSV File.
--model : Nama model yang akan dilatih (misalnya, randomforest , logisticregression , gradientboosting ).
--result : jalur ke file JSON di mana hasilnya akan disimpan.

Bandingkan beberapa model

zipml --train train.csv --test test.csv --compare --compare_models randomforest svc knn --result results.json

--compare : Bendera untuk menunjukkan beberapa perbandingan model.
--compare_models : Daftar model yang akan dibandingkan (misalnya, randomforest , logisticregression , gradientboosting ).
--result : jalur ke file JSON di mana hasil perbandingan akan disimpan.

Memuat model pra-terlatih dan membuat prediksi

zipml --load_model trained_model.pkl --test test.csv --result predictions.json

--load_model : Path ke file model yang disimpan.
--test : Path to pengujian Dataset CSV File.
--result : jalur ke file json di mana prediksi akan disimpan.

Simpan model terlatih

Untuk menyimpan model terlatih setelah pelatihan:

zipml --train train.csv --test test.csv --model randomforest --save_model trained_model.pkl

--result : jalur ke file di mana model terlatih akan disimpan.

Keluaran

Output dari perintah pelatihan dan perbandingan akan mencakup berbagai metrik kinerja seperti akurasi, presisi, penarikan, dan skor F1.
Hasil akan disimpan dalam format JSON, membuatnya mudah ditinjau dan dianalisis.