ดาวน์โหลด MLstatkit - MLstatkit ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

MLstatkit

โค้ดแหล่งที่มา AI

v0.1.4

ดาวน์โหลด

mlstatkit

MLSTATKIT เป็นห้องสมุด Python ที่ครอบคลุมซึ่งออกแบบมาเพื่อรวมวิธีการทางสถิติที่จัดตั้งขึ้นอย่างราบรื่นเข้ากับโครงการการเรียนรู้ของเครื่อง มันครอบคลุมเครื่องมือที่หลากหลายรวมถึง การทดสอบของ DeLong สำหรับการเปรียบเทียบพื้นที่ภายใต้เส้นโค้งการทำงานของตัวรับสัญญาณที่สัมพันธ์กันสองแบบ (ROC), bootstrapping สำหรับการคำนวณช่วงความเชื่อมั่น, AUC2or สำหรับการ แปลง พื้นที่ภายใต้การประเมินลักษณะการใช้งานของตัวรับสัญญาณ นัยสำคัญทางสถิติของความแตกต่างระหว่างตัวชี้วัดของสองรุ่นโดยการสับข้อมูลแบบสุ่มและคำนวณตัวชี้วัดใหม่เพื่อสร้างการกระจายความแตกต่าง ด้วยการออกแบบแบบแยกส่วน MLSTATKIT ให้นักวิจัยและนักวิทยาศาสตร์ด้านข้อมูลมีชุดเครื่องมือที่มีความยืดหยุ่นและทรงพลังในการเพิ่มการวิเคราะห์และการประเมินแบบจำลองของพวกเขาซึ่งจัดทำขึ้นเพื่อความต้องการการทดสอบทางสถิติภายในโดเมนของการเรียนรู้ของเครื่อง

การติดตั้ง

ติดตั้ง MLSTATKIT โดยตรงจาก PYPI โดยใช้ PIP:

pip install MLstatkit

การใช้งาน

การทดสอบของ DeLong

ฟังก์ชั่น Delong_test ช่วยให้การประเมินทางสถิติของความแตกต่างระหว่าง พื้นที่ภายใต้สองเส้นโค้งการทำงานของตัวรับสัญญาณ (ROC) ที่ได้รับจากแบบจำลองที่แตกต่างกัน สิ่งนี้อำนวยความสะดวกให้กับความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับประสิทธิภาพของโมเดลเปรียบเทียบ

พารามิเตอร์:

จริง : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ฉลากไบนารีจริงในช่วง {0, 1}
prob_a : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ความน่าจะเป็นที่คาดการณ์ไว้โดยรุ่นแรก
prob_b : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ความน่าจะเป็นที่คาดการณ์ไว้โดยรุ่นที่สอง

ผลตอบแทน:

z_score : ลอย
คะแนน Z จากการเปรียบเทียบ AUCs ของสองรุ่น
p_value : ลอย
ค่า P จากการเปรียบเทียบ AUCs ของสองรุ่น

ตัวอย่าง:

 from MLstatkit . stats import Delong_test

# Example data
true = np . array ([ 0 , 1 , 0 , 1 ])
prob_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 ])
prob_B = np . array ([ 0.2 , 0.3 , 0.4 , 0.7 ])

# Perform DeLong's test
z_score , p_value = Delong_test ( true , prob_A , prob_B )

print ( f"Z-Score: { z_score } , P-Value: { p_value } " )

สิ่งนี้แสดงให้เห็นถึงการใช้งาน Delong_test เพื่อเปรียบเทียบ AUCs ของสองรุ่นตามความน่าจะเป็นและฉลากที่แท้จริง คะแนน Z ที่ส่งคืนและ P-value ในการทำความเข้าใจหากความแตกต่างในการแสดงของแบบจำลองมีนัยสำคัญทางสถิติหรือไม่

Bootstrapping สำหรับช่วงความมั่นใจ

ฟังก์ชั่น Bootstrapping คำนวณช่วงความเชื่อมั่นสำหรับการวัดประสิทธิภาพที่ระบุโดยใช้ bootstrapping ให้การวัดความน่าเชื่อถือของการประมาณ รองรับการคำนวณสำหรับ AUROC (พื้นที่ใต้เส้นโค้ง ROC), AUPRC (พื้นที่ภายใต้เส้นโค้งการตั้งค่าความแม่นยำ) และการวัดคะแนน F1

พารามิเตอร์:

จริง : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ฉลากไบนารีจริงที่ฉลากเป็น {0, 1}
Prob : Array-like of Shape (n_samples,)
ความน่าจะเป็นที่คาดการณ์ไว้ซึ่งส่งคืนโดยวิธี Predict_Proba ของตัวจําแนกหรือการทำนายไบนารีตามฟังก์ชันการให้คะแนนที่ระบุและเกณฑ์
Metric_str : str, default = 'f1'
ตัวระบุสำหรับฟังก์ชั่นการให้คะแนนที่จะใช้ ค่าที่รองรับ ได้แก่ 'F1', 'ความแม่นยำ', 'เรียกคืน', 'ความแม่นยำ', 'ROC_AUC', 'PR_AUC' และ 'ค่าเฉลี่ย _Precision'
n_bootstraps : int, default = 1000
จำนวนการทำซ้ำ bootstrap ที่จะดำเนินการ การเพิ่มจำนวนนี้ช่วยเพิ่มความน่าเชื่อถือของการประมาณช่วงความเชื่อมั่น แต่ยังเพิ่มเวลาในการคำนวณ
ความมั่นใจ _level : ลอย, ค่าเริ่มต้น = 0.95
ระดับความเชื่อมั่นสำหรับการประมาณช่วงเวลา ตัวอย่างเช่น 0.95 แสดงถึงช่วงความเชื่อมั่น 95%
Threshold : ลอย, ค่าเริ่มต้น = 0.5
ค่าเกณฑ์ที่ใช้สำหรับการแปลงความน่าจะเป็นเป็นฉลากไบนารีสำหรับตัวชี้วัดเช่น 'F1' หากมี
ค่าเฉลี่ย : str, default = 'macro'
ระบุวิธีการเฉลี่ยเพื่อนำไปใช้กับเป้าหมายหลายชั้น/หลายฉลาก ตัวเลือกอื่น ๆ ได้แก่ 'ไมโคร', 'ตัวอย่าง', 'ถ่วงน้ำหนัก' และ 'ไบนารี'
RANDER_STATE : int, default = 0
เมล็ดสำหรับเครื่องกำเนิดตัวเลขสุ่ม พารามิเตอร์นี้ช่วยให้มั่นใจได้ว่าการทำซ้ำของผลลัพธ์

ผลตอบแทน:

Original_score : ลอย
คะแนนที่คำนวณจากชุดข้อมูลดั้งเดิมโดยไม่ต้องใช้ bootstrapping
ความมั่นใจ _lower : ลอย
ขอบเขตที่ต่ำกว่าของช่วงความเชื่อมั่น
ความมั่นใจ _upper : ลอย
ขอบเขตบนของช่วงความเชื่อมั่น

ตัวอย่าง:

 from MLstatkit . stats import Bootstrapping

# Example data
y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
y_prob = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])

# Calculate confidence intervals for AUROC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'roc_auc' )
print ( f"AUROC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUPRC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'pr_auc' )
print ( f"AUPRC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for F1 score with a custom threshold
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'f1' , threshold = 0.5 )
print ( f"F1 Score: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUROC, AUPRC, F1 score
for score in [ 'roc_auc' , 'pr_auc' , 'f1' ]:
    original_score , conf_lower , conf_upper = Bootstrapping ( y_true , y_prob , score , threshold = 0.5 )
    print ( f" { score . upper () } original score: { original_score :.3f } , confidence interval: [ { conf_lower :.3f } - { conf_upper :.3f } ]" )

การทดสอบการเปลี่ยนรูปสำหรับนัยสำคัญทางสถิติ

ฟังก์ชั่น Permutation_test ประเมินนัยสำคัญทางสถิติของความแตกต่างระหว่างตัวชี้วัดของสองรุ่นโดยการสับข้อมูลแบบสุ่มและคำนวณตัวชี้วัดใหม่เพื่อสร้างการกระจายความแตกต่าง วิธีนี้ไม่ถือว่าเป็นการกระจายข้อมูลเฉพาะทำให้เป็นตัวเลือกที่แข็งแกร่งสำหรับการเปรียบเทียบประสิทธิภาพของโมเดล

พารามิเตอร์:

y_true : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ฉลากไบนารีจริงที่ฉลากเป็น {0, 1}
prob_model_a : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ความน่าจะเป็นที่คาดการณ์จากรุ่นแรก
prob_model_b : อาร์เรย์เหมือนรูปร่าง (n_samples,)
ความน่าจะเป็นที่คาดการณ์จากรุ่นที่สอง
Metric_str : str, default = 'f1'
ตัวชี้วัดสำหรับการเปรียบเทียบ ตัวชี้วัดที่ได้รับการสนับสนุน ได้แก่ 'F1', 'ความแม่นยำ', 'เรียกคืน', 'ความแม่นยำ', 'ROC_AUC', 'PR_AUC' และ 'ค่าเฉลี่ย _Precision'
n_bootstraps : int, default = 1000
จำนวนตัวอย่างการเปลี่ยนแปลงที่จะสร้าง
Threshold : ลอย, ค่าเริ่มต้น = 0.5
ค่าเกณฑ์ที่ใช้สำหรับการแปลงความน่าจะเป็นเป็นฉลากไบนารีสำหรับตัวชี้วัดเช่น 'F1' หากมี
ค่าเฉลี่ย : str, default = 'macro'
ระบุวิธีการเฉลี่ยเพื่อนำไปใช้กับเป้าหมายหลายชั้น/หลายฉลาก ตัวเลือกอื่น ๆ ได้แก่ 'ไมโคร', 'ตัวอย่าง', 'ถ่วงน้ำหนัก' และ 'ไบนารี'
RANDER_STATE : int, default = 0
เมล็ดสำหรับเครื่องกำเนิดตัวเลขสุ่ม พารามิเตอร์นี้ช่วยให้มั่นใจได้ว่าการทำซ้ำของผลลัพธ์

ผลตอบแทน:

Metric_a : ลอย
ตัวชี้วัดที่คำนวณได้สำหรับโมเดล A โดยใช้ข้อมูลต้นฉบับ
Metric_B : ลอย
ตัวชี้วัดที่คำนวณได้สำหรับโมเดล B โดยใช้ข้อมูลต้นฉบับ
p_value : ลอย
ค่า p จากการทดสอบการเปลี่ยนแปลงซึ่งบ่งบอกถึงความน่าจะเป็นของการสังเกตความแตกต่างที่รุนแรงหรือรุนแรงกว่าความแตกต่างที่สังเกตได้ภายใต้สมมติฐานว่าง
เกณฑ์มาตรฐาน : ลอย
ความแตกต่างที่สังเกตได้ระหว่างตัวชี้วัดของแบบจำลอง A และ Model B
samples_mean : ลอย
ค่าเฉลี่ยของความแตกต่างที่อนุญาต
samples_std : ลอย
ค่าเบี่ยงเบนมาตรฐานของความแตกต่างที่อนุญาต

ตัวอย่าง:

 from MLstatkit . stats import Permutation_test

y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
prob_model_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])
prob_model_B = np . array ([ 0.2 , 0.3 , 0.25 , 0.85 , 0.15 , 0.35 , 0.45 , 0.65 , 0.01 ])

# Conduct a permutation test to compare F1 scores
metric_a , metric_b , p_value , benchmark , samples_mean , samples_std = Permutation_test (
    y_true , prob_model_A , prob_model_B , 'f1'
)

print ( f"F1 Score Model A: { metric_a :.5f } , Model B: { metric_b :.5f } " )
print ( f"Observed Difference: { benchmark :.5f } , p-value: { p_value :.5f } " )
print ( f"Permuted Differences Mean: { samples_mean :.5f } , Std: { samples_std :.5f } " )

การแปลงอัตราส่วน AUC ต่ออัตราต่อรอง (OR)

ฟังก์ชั่น AUC2OR แปลงพื้นที่ภายใต้ค่าเส้นโค้ง (AUC) เป็นอัตราส่วนอัตราต่อรอง (OR) และส่งคืนค่ากลางเช่น T, Z, D และ LN_OR การแปลงนี้มีประโยชน์สำหรับการทำความเข้าใจความสัมพันธ์ระหว่าง AUC ซึ่งเป็นตัวชี้วัดทั่วไปในการจำแนกแบบไบนารีและหรือซึ่งมักใช้ในการวิเคราะห์ทางสถิติ

พารามิเตอร์:

AUC : ลอย
พื้นที่ภายใต้ค่าเส้นโค้ง (AUC) ที่จะแปลง
return_all : bool, default = false
ถ้าเป็นจริงให้ส่งคืนค่ากลาง (t, z, d, ln_or) นอกเหนือจากหรือ

ผลตอบแทน:

หรือ : ลอย
อัตราส่วนอัตราต่อรองที่คำนวณได้ (OR) จากค่า AUC ที่กำหนด
T : ลอย, ไม่บังคับ
ค่ากลางคำนวณจาก AUC
z : ลอยตัวเป็นทางเลือก
ค่ากลางคำนวณจาก t
D : Float, เสริม
ค่ากลางคำนวณจาก z
ln_or : ลอยตัวเป็นทางเลือก
ลอการิทึมธรรมชาติของอัตราส่วนอัตราต่อรอง

ตัวอย่าง:

 from MLstatkit . stats import AUC2OR

AUC = 0.7  # Example AUC value

# Convert AUC to OR and retrieve all intermediate values
t , z , d , ln_OR , OR = AUC2OR ( AUC , return_all = True )

print ( f"t: { t :.5f } , z: { z :.5f } , d: { d :.5f } , ln_OR: { ln_OR :.5f } , OR: { OR :.5f } " )

# Convert AUC to OR without intermediate values
OR = AUC2OR ( AUC )
print ( f"OR: { OR :.5f } " )

การอ้างอิง

การทดสอบของ DeLong

การใช้งาน Delong_test ใน mlstatkit ขึ้นอยู่กับสิ่งพิมพ์ต่อไปนี้:

Xu Sun และ Weichao Xu "การใช้อัลกอริทึมของ Delong อย่างรวดเร็วสำหรับการเปรียบเทียบพื้นที่ภายใต้เส้นโค้งลักษณะการทำงานของตัวรับสัญญาณที่สัมพันธ์กัน" ใน จดหมายประมวลผลสัญญาณ IEEE , ฉบับที่ 21 ไม่ 11, pp. 1389-1393, 2014, IEEE

bootstrapping

วิธี Bootstrapping สำหรับการคำนวณช่วงความเชื่อมั่นไม่ได้อ้างอิงโดยตรงสิ่งพิมพ์เดียว แต่เป็นเทคนิคทางสถิติที่ได้รับการยอมรับอย่างกว้างขวางสำหรับการประเมินการกระจายตัวของตัวชี้วัดโดยการสุ่มตัวอย่างใหม่ด้วยการทดแทน สำหรับภาพรวมที่ครอบคลุมของวิธีการ bootstrapping โปรดดู:

B. Efron และ R. Tibshirani, "บทนำสู่ Bootstrap," Chapman & Hall/CRC Monographs เกี่ยวกับสถิติและความน่าจะเป็นประยุกต์, 1994

การทดสอบการเปลี่ยนรูป

Permutation_tests ถูกนำมาใช้เพื่อประเมินความสำคัญของความแตกต่างในการวัดประสิทธิภาพระหว่างสองโมเดลโดยการสุ่มการสังเกตแบบสุ่มไปยังกลุ่มและการคำนวณตัวชี้วัด วิธีการนี้ไม่ได้สร้างสมมติฐานการกระจายที่เฉพาะเจาะจงทำให้มันหลากหลายสำหรับประเภทข้อมูลต่างๆ สำหรับการอภิปรายพื้นฐานเกี่ยวกับการทดสอบการเปลี่ยนแปลงอ้างอิง:

P. Good, "การทดสอบการเปลี่ยนแปลง: คู่มือปฏิบัติในการสุ่มตัวอย่างวิธีการใหม่สำหรับการทดสอบสมมติฐาน" ชุด Springer ในสถิติ, 2000

การอ้างอิงเหล่านี้วางรากฐานสำหรับการทดสอบทางสถิติและวิธีการที่นำมาใช้ใน MLStatKit ทำให้ผู้ใช้มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับพื้นฐานทางวิทยาศาสตร์และการบังคับใช้

auc2or

ฟังก์ชั่น AUR2OR แปลงพื้นที่ภายใต้เส้นโค้งลักษณะการทำงานของตัวรับสัญญาณ (AUC) เป็นสถิติที่เกี่ยวข้องหลายอย่างรวมถึง Cohen's D, RPB ของ Pearson, อัตราต่อรองและอัตราต่อรองบันทึกตามธรรมชาติ การแปลงนี้มีประโยชน์อย่างยิ่งในการตีความประสิทธิภาพของแบบจำลองการจำแนกประเภท สำหรับคำอธิบายโดยละเอียดของสูตรทางคณิตศาสตร์ที่ใช้ในการแปลงนี้โปรดดู:

Salgado, JF (2018) "การเปลี่ยนพื้นที่ภายใต้เส้นโค้งปกติ (AUC) เป็น Cohen's D, RPB ของ Pearson, อัตราต่อรอง, และอัตราต่อรองบันทึกตามธรรมชาติ: ตารางการแปลงสองตาราง" วารสารจิตวิทยายุโรปนำไปใช้กับบริบททางกฎหมาย, 10 (1), 35-47

การอ้างอิงเหล่านี้ให้รากฐานทางคณิตศาสตร์สำหรับฟังก์ชั่น Aur2or เพื่อให้แน่ใจว่าผู้ใช้สามารถตีความความสำคัญทางสถิติและผลกระทบเชิงปฏิบัติของตัวชี้วัดประสิทธิภาพของแบบจำลองได้อย่างถูกต้อง

การบริจาค

เรายินดีต้อนรับการมีส่วนร่วมของ MlStatkit! โปรดดูแนวทางการบริจาคของเราสำหรับรายละเอียดเพิ่มเติม

ใบอนุญาต

MLStatKit มีการแจกจ่ายภายใต้ใบอนุญาต MIT สำหรับข้อมูลเพิ่มเติมดูไฟล์ใบอนุญาตในที่เก็บ GitHub

อัพเดทบันทึก

0.1.7 อัปเดต README.md
0.1.6 การดีบัก
0.1.5 อัปเดต README.md , เพิ่มฟังก์ชั่น AUC2OR
0.1.4 อัปเดต README.md , เพิ่มฟังก์ชั่น Permutation_tests , พารามิเตอร์ Bootstrapping ซ้ำ
0.1.3 อัปเดต README.md
0.1.2 เพิ่มความคืบหน้าของกระบวนการดำเนินการ Bootstrapping
0.1.1 อัปเดต README.md , setup.py เพิ่ม CONTRIBUTING.md
0.1.0 ฉบับพิมพ์ครั้งแรก

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.1.4
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-29
ขนาด 39.61KB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด