DCDevaluation เป็นไลบรารีที่ปรับกระบวนการประเมินแบบจำลองให้เหมาะสม มันถูกสร้างขึ้นตามความจำเป็นของทีมวิทยาศาสตร์ข้อมูลของ บริษัท ชื่อ Decode ซึ่งตั้งอยู่บนพื้นฐานของเซาเปาโล - บราซิล เนื่องจากอยู่ในระยะแรกสำหรับตอนนี้มันรองรับโมเดลการจำแนกประเภทเท่านั้น
pip install dcdevaluationfrom dcdevaluation import Evaluatorsในการใช้คลาส "ผู้ประเมินผล" ให้เข้าสู่วัตถุ Python ที่ผ่านรายการความน่าจะเป็น (จะถูกส่งออกโดยโมเดลของคุณ) และค่าที่แท้จริงของฐานข้อมูลของคุณ (คุณสมบัติเป้าหมายที่ใช้ฝึกอบรมโมเดลของคุณ)
train_dataset = Evaluators(predicted_y, true_y)คะแนนแอตทริบิวต์สำหรับตัวชี้วัดที่รองรับทั้งหมด (ดูด้านบน) ไปยังชุดข้อมูลที่เลือกของคุณ "
train_dataset.evaluate ()วิธีนี้กลับมา:
train_dataset.ks
train_dataset.auc
train_dataset.f1
train_dataset.precision
train_dataset.recall
train_dataset.accuracyสร้าง dataframe pandas ด้วยตัวชี้วัดที่รองรับทั้งหมด
train_dataset.to_table ()วิธีนี้กลับมา:
# DataFrame with all supported metrics
train_dataset.metric_df
# Transposed DataFrame
train_dataset.t_metric_dfสร้างกราฟที่แสดงอัตราที่ดีหรือไม่ดีของโมเดลของคุณ
มีถังขยะแอตทริบิวต์ซึ่งอนุญาตให้ผู้ใช้เปลี่ยนจำนวนการแยกที่ต้องการ (default = 10)
train_dataset.split_rate_graph ()แสดงให้เห็นถึงความแม่นยำการเรียกคืนและคะแนน F1 สำหรับ 20 จุดตัดที่แตกต่างกัน
นอกจากนี้ยังมีตัวเลือกในการเลือกช่วงของจุดตัด (ค่าเริ่มต้น: min = 0, max = 20)
train_dataset.find_cut ()สร้างเป็นกราฟที่แสดงเส้นโค้งเดอ ROC และเปรียบเทียบกับ "เหรียญ"
train_dataset.ROC_auc ()