El objetivo de este proyecto es dar a las personas una estimación de cuánto necesitan en función de su situación de salud individual. Después de eso, los clientes pueden trabajar con cualquier compañía de seguros de salud y sus planes y ventajas mientras mantiene en mente el costo proyectado de nuestro estudio. Esto puede ayudar a una persona a concentrarse en el lado de la salud de una póliza de seguro en lugar de tener la parte ineficaz.
La principal fuente de datos para este proyecto fue del repositorio de Kaggle. Puede descargar el conjunto de datos desde aquí
Tareas de aprendizaje de máquinas como exploratory Data Exploration (EDA), limpieza de datos, ingeniería de características, construcción de modelos y pruebas de modelos para construir una solución que debería predecir la prima del seguro personal para el seguro de salud.
Exploración de datos: el conjunto de datos explorado y analizado utilizando las bibliotecas de pandas, numpy, matplotlib y sayborn
Visualización de datos: trazó diferentes gráficos para obtener más información sobre las variables/características dependientes e independientes.
Ingeniería de características: codificación de características realizada, escala de características y selección de características
Construcción del modelo: en este paso, se realiza la primera división del conjunto de datos. Después de que ese modelo esté capacitado en diferentes algoritmos de aprendizaje automático, como:
Evaluación del modelo
Prueba modelo
Edificio de aplicaciones web
Implementación de aplicaciones web