تنزيل MLstatkit - تنزيل رمز المصدر MLstatkit

MLstatkit

كود الذكاء الاصطناعي

v0.1.4

تنزيل

mlstatkit

MLStatkit هي مكتبة Python شاملة مصممة لدمج الأساليب الإحصائية المعمول بها بسلاسة في مشاريع التعلم الآلي. ويشمل مجموعة متنوعة من الأدوات ، بما في ذلك اختبار Delong لمقارنة المناطق تحت اثنين من المنحنيات المميزة للتشغيل (ROC) المخصصة للمستقبل ، و bootstrapping لحساب فترات الثقة ، AUC2OR لتحويل المنطقة تحت المنحنى المميز للمستقبل ( AUC ) في العديد من الإحصائيات ذات الصلة مثل CHEN D ، Pearson's RPB ، الأهمية الإحصائية للفرق بين مقاييس النموذجين عن طريق خلط البيانات بشكل عشوائي وإعادة حساب المقاييس لإنشاء توزيع الاختلافات. بفضل تصميمه المعياري ، تقدم MLStatkit للباحثين وعلماء البيانات مجموعة أدوات مرنة وقوية لزيادة تحليلاتهم وتقييمات النماذج ، والتي تلبي مجموعة واسعة من احتياجات الاختبار الإحصائية في مجال التعلم الآلي.

تثبيت

تثبيت mlstatkit مباشرة من pypi باستخدام PIP:

pip install MLstatkit

الاستخدام

اختبار ديلونج

تتيح دالة Delong_test التقييم الإحصائي للاختلافات بين المناطق التي تقع في ظل اثنين من منحنيات تشغيل المتلقي (ROC) المرتبطة المستمدة من نماذج متميزة . هذا يسهل فهم أعمق للأداء النموذج المقارن.

حدود:

صحيح : صفيف يشبه الشكل (n_samples ،)
التسميات الثنائية الحقيقية في المدى {0 ، 1}.
prob_a : صفيف يشبه الشكل (n_samples ،)
الاحتمالات المتوقعة من قبل النموذج الأول.
prob_b : صفيف يشبه الشكل (n_samples ،)
الاحتمالات المتوقعة من قبل النموذج الثاني.

عائدات:

Z_Score : تعويم
درجة Z من مقارنة AUCs من نموذجين.
p_value : تعويم
قيمة P من مقارنة AUCs من نموذجين.

مثال:

 from MLstatkit . stats import Delong_test

# Example data
true = np . array ([ 0 , 1 , 0 , 1 ])
prob_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 ])
prob_B = np . array ([ 0.2 , 0.3 , 0.4 , 0.7 ])

# Perform DeLong's test
z_score , p_value = Delong_test ( true , prob_A , prob_B )

print ( f"Z-Score: { z_score } , P-Value: { p_value } " )

يوضح هذا استخدام Delong_test لمقارنة AUCs من النموذجين من النماذج بناءً على احتمالاتهما والعلامات الحقيقية. تساعد درجة Z و P-value التي تم إرجاعها في فهم ما إذا كان الفرق في العروض النموذجية ذات دلالة إحصائية.

bootstrapping لفترات الثقة

تقوم وظيفة Bootstrapping بحساب فترات الثقة لمقاييس الأداء المحددة باستخدام bootstrapping ، مما يوفر مقياسًا لموثونة التقدير. وهو يدعم حساب AUROC (المساحة تحت منحنى ROC) ، AUPRC (المساحة تحت منحنى Recall Precision) ، ومقاييس نقاط F1.

حدود:

صحيح : صفيف يشبه الشكل (n_samples ،)
التسميات الثنائية الحقيقية ، حيث تكون العلامات إما {0 ، 1}.
prob : صفيف يشبه الشكل (n_samples ،)
الاحتمالات المتوقعة ، كما تم إرجاعها بواسطة طريقة Predict_proba الخاصة بالمصنف ، أو التنبؤات الثنائية بناءً على وظيفة التسجيل المحددة والعتبة.
metric_str : str ، default = 'f1'
المعرف لوظيفة التسجيل لاستخدامها. تشمل القيم المدعومة "F1" و "Accuracy" و "rection" و "Precision" و "ROC_AUC" و "Pr_auc" و "Media_Precision".
n_bootstraps : int ، الافتراضي = 1000
عدد تكرارات bootstrap لأداء. زيادة هذا الرقم يحسن موثوقية تقدير فاصل الثقة ولكنه يزيد أيضًا من الوقت الحسابي.
strust_level : تعويم ، افتراضي = 0.95
مستوى الثقة لتقدير الفاصل. على سبيل المثال ، يمثل 0.95 فاصل ثقة 95 ٪.
عتبة : تعويم ، افتراضي = 0.5
قيمة عتبة تستخدم لتحويل الاحتمالات إلى الملصقات الثنائية للمقاييس مثل "F1" ، حيثما ينطبق.
المتوسط : str ، default = 'macro'
يحدد طريقة المتوسط للتطبيق على الأهداف متعددة الطبقات/متعددة العلامات. تشمل الخيارات الأخرى "micro" و "العينات" و "الموزونة" و "الثنائية".
Random_State : int ، الافتراضي = 0
بذرة لمولد الأرقام العشوائية. هذه المعلمة تضمن استنساخ النتائج.

عائدات:

Original_score : تعويم
النتيجة المحسوبة من مجموعة البيانات الأصلية دون bootstrapping.
الثقة _lower : تعويم
الحد الأدنى من فاصل الثقة.
الثقة _upper : تعويم
الحد الأعلى من فاصل الثقة.

أمثلة:

 from MLstatkit . stats import Bootstrapping

# Example data
y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
y_prob = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])

# Calculate confidence intervals for AUROC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'roc_auc' )
print ( f"AUROC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUPRC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'pr_auc' )
print ( f"AUPRC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for F1 score with a custom threshold
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'f1' , threshold = 0.5 )
print ( f"F1 Score: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUROC, AUPRC, F1 score
for score in [ 'roc_auc' , 'pr_auc' , 'f1' ]:
    original_score , conf_lower , conf_upper = Bootstrapping ( y_true , y_prob , score , threshold = 0.5 )
    print ( f" { score . upper () } original score: { original_score :.3f } , confidence interval: [ { conf_lower :.3f } - { conf_upper :.3f } ]" )

اختبار التقليب للأهمية الإحصائية

تقوم دالة Permutation_test بتقييم الأهمية الإحصائية للفرق بين مقاييس النموذجين عن طريق خلط البيانات بشكل عشوائي وإعادة حساب المقاييس لإنشاء توزيع الاختلافات. لا تفترض هذه الطريقة توزيعًا محددًا للبيانات ، مما يجعلها خيارًا قويًا لمقارنة أداء النموذج.

حدود:

y_true : صفيف يشبه الشكل (n_samples ،)
التسميات الثنائية الحقيقية ، حيث تكون العلامات إما {0 ، 1}.
prob_model_a : صفيف يشبه الشكل (n_samples ،)
الاحتمالات المتوقعة من النموذج الأول.
prob_model_b : صفيف يشبه الشكل (n_samples ،)
الاحتمالات المتوقعة من النموذج الثاني.
metric_str : str ، default = 'f1'
المقياس للمقارنة. تتضمن المقاييس المدعومة "F1" و "Accuracy" و "Recall" و "Precision" و "ROC_AUC" و "Pr_auc" و "Meverity_Precision".
n_bootstraps : int ، الافتراضي = 1000
عدد عينات التقليب لتوليدها.
عتبة : تعويم ، افتراضي = 0.5
قيمة عتبة تستخدم لتحويل الاحتمالات إلى الملصقات الثنائية للمقاييس مثل "F1" ، حيثما ينطبق.
المتوسط : str ، default = 'macro'
يحدد طريقة المتوسط للتطبيق على الأهداف متعددة الطبقات/متعددة العلامات. تشمل الخيارات الأخرى "micro" و "العينات" و "الموزونة" و "الثنائية".
Random_State : int ، الافتراضي = 0
بذرة لمولد الأرقام العشوائية. هذه المعلمة تضمن استنساخ النتائج.

عائدات:

metric_a : تعويم
المقياس المحسوب للنموذج A باستخدام البيانات الأصلية.
metric_b : تعويم
المقياس المحسوب للنموذج ب باستخدام البيانات الأصلية.
p_value : تعويم
القيمة p من اختبار التقليب ، مما يشير إلى احتمال مراقبة الفرق مثل ، أو أكثر من الفرق المرصود في ظل الفرضية الفارغة.
المعيار : تعويم
الفرق الملحوظ بين مقاييس النموذج A والنموذج B.
SANDERS_MEAN : تعويم
متوسط الاختلافات المترتبة.
samples_std : تعويم
الانحراف المعياري للاختلافات المترتبة.

أمثلة:

 from MLstatkit . stats import Permutation_test

y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
prob_model_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])
prob_model_B = np . array ([ 0.2 , 0.3 , 0.25 , 0.85 , 0.15 , 0.35 , 0.45 , 0.65 , 0.01 ])

# Conduct a permutation test to compare F1 scores
metric_a , metric_b , p_value , benchmark , samples_mean , samples_std = Permutation_test (
    y_true , prob_model_A , prob_model_B , 'f1'
)

print ( f"F1 Score Model A: { metric_a :.5f } , Model B: { metric_b :.5f } " )
print ( f"Observed Difference: { benchmark :.5f } , p-value: { p_value :.5f } " )
print ( f"Permuted Differences Mean: { samples_mean :.5f } , Std: { samples_std :.5f } " )

تحويل AUC إلى نسبة الأرجحية (أو)

تقوم دالة AUC2OR بتحويل منطقة تحت قيمة المنحنى (AUC) إلى نسبة الأرجحية (OR) وإرجاع القيم الوسيطة اختياريًا مثل T و Z و D و LN_OR. يعد هذا التحويل مفيدًا لفهم العلاقة بين AUC ، وهو مقياس مشترك في التصنيف الثنائي ، أو ، والذي يتم استخدامه غالبًا في التحليلات الإحصائية.

حدود:

AUC : تعويم
المساحة تحت المنحنى (AUC) المراد تحويلها.
Return_all : Bool ، افتراضي = خطأ
إذا كان هذا صحيحًا ، فالقيم المتوسطة (T ، Z ، D ، LN_OR) بالإضافة إلى OR.

عائدات:

أو : تعويم
نسبة الأرجحية المحسوبة (OR) من قيمة AUC المحددة.
T : تعويم ، اختياري
القيمة الوسيطة المحسوبة من AUC.
ض : تعويم ، اختياري
القيمة الوسيطة المحسوبة من ر.
D : تعويم ، اختياري
القيمة الوسيطة المحسوبة من z.
ln_or : تعويم ، اختياري
اللوغاريتم الطبيعي لنسبة الأرجحية.

أمثلة:

 from MLstatkit . stats import AUC2OR

AUC = 0.7  # Example AUC value

# Convert AUC to OR and retrieve all intermediate values
t , z , d , ln_OR , OR = AUC2OR ( AUC , return_all = True )

print ( f"t: { t :.5f } , z: { z :.5f } , d: { d :.5f } , ln_OR: { ln_OR :.5f } , OR: { OR :.5f } " )

# Convert AUC to OR without intermediate values
OR = AUC2OR ( AUC )
print ( f"OR: { OR :.5f } " )

مراجع

اختبار ديلونج

يعتمد تنفيذ Delong_test في MlStatkit على المنشور التالي:

Xu Sun و Weichao Xu ، "التنفيذ السريع لخوارزمية Delong لمقارنة المناطق الموجودة تحت منحنيات مميزة تشغيل المستقبل المرتبطة" ، في رسائل معالجة إشارة IEEE ، المجلد. 21 ، لا. 11 ، ص. 1389-1393 ، 2014 ، IEEE.

bootstrapping

لا تشير طريقة Bootstrapping لحساب فترات الثقة مباشرة إلى منشور واحد ولكنه تقنية إحصائية مقبولة على نطاق واسع لتقدير توزيع مقياس عن طريق إعادة التشكيل مع الاستبدال. للحصول على نظرة عامة شاملة على طرق bootstrapping ، راجع:

B. Efron and R. Tibshirani ، "مقدمة إلى Bootstrap ،" Mongraps Chapman & Hall/CRC على الإحصائيات والاحتمال التطبيقي ، 1994.

اختبار التقليب

يتم استخدام Permutation_tests لتقييم أهمية الفرق في مقاييس الأداء بين نموذجين من خلال إعادة تخصيص الملاحظات عشوائيا للمجموعات وحساب المقياس. لا يجعل هذا النهج افتراضات توزيعة محددة ، مما يجعله متعدد الاستخدامات لأنواع البيانات المختلفة. للمناقشة التأسيسية حول اختبارات التقليب ، راجع:

P. جيد ، "اختبارات التقليب: دليل عملي لإعادة تشكيل طرق لاختبار الفرضيات" ، سلسلة Springer في الإحصاء ، 2000.

تضع هذه المراجع الأساس للاختبارات والمنهجيات الإحصائية التي تم تنفيذها في MLSTATKIT ، مما يوفر للمستخدمين فهمًا عميقًا للأساس العلمي وتطبيقه.

AUC2OR

تقوم وظيفة AUR2OR بتحويل المنطقة الموجودة تحت منحنى مميزة تشغيل المتلقي (AUC) إلى العديد من الإحصاءات ذات الصلة بما في ذلك Cohen's D و Pearson's RPB و RATIO و RATIO الطبيعي. هذا التحويل مفيد بشكل خاص في تفسير أداء نماذج التصنيف. للحصول على شرح مفصل للصيغ الرياضية المستخدمة في هذا التحويل ، راجع:

سالجادو ، JF (2018). "تحويل المنطقة تحت المنحنى الطبيعي (AUC) إلى Cohen's D و Pearson's RPB و Ratio و Natural Log-Ratio: جدولين للتحويل." تطبق المجلة الأوروبية لعلم النفس على السياق القانوني ، 10 (1) ، 35-47.

توفر هذه المراجع الأساس الرياضي لوظيفة AUR2OR ، مما يضمن أن يمكن للمستخدمين تفسير الأهمية الإحصائية بدقة والآثار العملية لمقاييس الأداء النموذجية الخاصة بهم.

المساهمة

نرحب بالمساهمات في mlstatkit! يرجى الاطلاع على إرشادات المساهمة لدينا لمزيد من التفاصيل.

رخصة

يتم توزيع MlStatkit بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. لمزيد من المعلومات ، راجع ملف الترخيص في مستودع GitHub.

تحديث سجل

0.1.7 تحديث README.md
0.1.6 تصحيح.
0.1.5 تحديث README.md ، إضافة وظيفة AUC2OR .
0.1.4 تحديث README.md ، إضافة وظيفة Permutation_tests ، إعادة استخدام معلمات Bootstrapping .
0.1.3 تحديث README.md .
0.1.2 إضافة Bootstrapping عملية عملية التقدم.
0.1.1 تحديث README.md ، setup.py . إضافة CONTRIBUTING.md .
0.1.0 الطبعة الأولى

يوسع

معلومات إضافية

الإصدار v0.1.4
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-29
الحجم 39.61KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل