L'objectif de ce projet est de donner aux gens une estimation de leur besoin en fonction de leur situation de santé individuelle. Après cela, les clients peuvent travailler avec n'importe quelle compagnie d'assurance maladie et ses plans et avantages tout en gardant à l'esprit le coût prévu de notre étude. Cela peut aider une personne à se concentrer sur la santé d'une police d'assurance plutôt que la partie inefficace.
La principale source de données pour ce projet provenait du référentiel Kaggle. Vous pouvez télécharger l'ensemble de données à partir d'ici
Effectuer des tâches d'apprentissage en machine comme l'exploration exploratoire des données (EDA), le nettoyage des données, l'ingénierie des fonctionnalités, la construction de modèles et les tests de modèles pour créer une solution qui devrait prédire la prime du personnel pour l'assurance maladie.
Exploration des données: Ensemble de données exploré et analysé à l'aide des bibliothèques Pandas, Numpy, Matplotlib et Seaborn
Visualisation des données: tracé différents graphiques pour obtenir plus d'informations sur les variables / fonctionnalités dépendantes et indépendantes.
Ingénierie des fonctionnalités: codage des fonctionnalités effectuées, mise à l'échelle des fonctionnalités et sélection des fonctionnalités
Bâtiment du modèle: Dans cette étape, le premier division d'ensemble de données est effectué. Après ce modèle, il est formé sur différents algorithmes d'apprentissage automatique tels que:
Évaluation du modèle
Tests de modèles
Création d'application Web
Déploiement d'application Web