Tujuan dari proyek ini adalah untuk memberi orang perkiraan seberapa besar mereka dibutuhkan berdasarkan situasi kesehatan individu mereka. Setelah itu, pelanggan dapat bekerja dengan operator asuransi kesehatan dan rencananya serta fasilitasnya sambil menjaga biaya yang diproyeksikan dari studi kami dalam pikiran. Ini dapat membantu seseorang dalam berkonsentrasi di sisi kesehatan dari polis asuransi, bukan bagian yang tidak efektif.
Sumber utama data untuk proyek ini adalah dari Kaggle Repository. Anda dapat mengunduh dataset dari sini
Melakukan tugas pelajaran mesin seperti Exploratory Data Exploration (EDA), pembersihan data, rekayasa fitur, pembangunan model dan pengujian model untuk membangun solusi yang harus dapat memprediksi premi pribadi untuk asuransi kesehatan.
Eksplorasi Data: Dataset yang Dieksplorasi dan Dianalisis Menggunakan, Pandas, Numpy, Matplotlib, dan SeaBorn Libraries
Visualisasi Data: Memlot berbagai grafik untuk mendapatkan lebih banyak wawasan tentang variabel/fitur independen dan independen.
Teknik Fitur: Pengkodean Fitur yang Dilakukan, Penskalaan Fitur dan Pilihan Fitur
Model Building: Pada langkah ini, pemisahan dataset pertama dilakukan. Setelah itu model dilatih pada algoritma pembelajaran mesin yang berbeda seperti:
Evaluasi model
Pengujian model
Pembangunan aplikasi web
Penyebaran Aplikasi Web