เป้าหมายของโครงการนี้คือการให้ผู้คนประเมินว่าพวกเขาต้องการเท่าใดตามสถานการณ์สุขภาพส่วนบุคคลของพวกเขา หลังจากนั้นลูกค้าสามารถทำงานร่วมกับผู้ให้บริการประกันสุขภาพและแผนและสิทธิประโยชน์ในขณะที่รักษาค่าใช้จ่ายที่คาดการณ์ไว้จากการศึกษาของเราในใจ สิ่งนี้สามารถช่วยบุคคลในการมุ่งเน้นด้านสุขภาพของนโยบายการประกันแทนที่จะเป็นส่วนที่ไม่มีประสิทธิภาพ
แหล่งข้อมูลหลักสำหรับโครงการนี้มาจากที่เก็บ Kaggle คุณสามารถดาวน์โหลดชุดข้อมูลได้จากที่นี่
การดำเนินงานการเรียนรู้ของเครื่องจักรเช่นการสำรวจข้อมูลเชิงสำรวจ (EDA), การทำความสะอาดข้อมูล, วิศวกรรมคุณลักษณะ, การสร้างแบบจำลองและการทดสอบแบบจำลองเพื่อสร้างโซลูชันที่ควรทำนายพรีเมี่ยมของส่วนบุคคลสำหรับการประกันสุขภาพ
การสำรวจข้อมูล: สำรวจและวิเคราะห์ชุดข้อมูลโดยใช้, Pandas, Numpy, Matplotlib และ Libraries Seaborn
การสร้างภาพข้อมูล: พล็อตกราฟที่แตกต่างกันเพื่อให้ได้ข้อมูลเชิงลึกมากขึ้นเกี่ยวกับตัวแปร/คุณลักษณะที่เป็นอิสระและขึ้นอยู่กับ
วิศวกรรมคุณลักษณะ: การเข้ารหัสคุณสมบัติที่ดำเนินการการปรับขนาดคุณลักษณะและการเลือกคุณสมบัติ
การสร้างแบบจำลอง: ในขั้นตอนนี้การแยกชุดข้อมูลแรกจะเสร็จสิ้น หลังจากรุ่นนั้นได้รับการฝึกฝนเกี่ยวกับอัลกอริทึมการเรียนรู้ของเครื่องที่แตกต่างกันเช่น:
การประเมินแบบจำลอง
การทดสอบแบบจำลอง
การสร้างเว็บแอปพลิเคชัน
การปรับใช้เว็บแอปพลิเคชัน