O objetivo deste projeto é dar às pessoas uma estimativa de quanto elas precisam com base em sua situação de saúde individual. Depois disso, os clientes podem trabalhar com qualquer operadora de seguro de saúde e seus planos e vantagens, mantendo o custo projetado em mente. Isso pode ajudar uma pessoa a se concentrar no lado da saúde de uma apólice de seguro, em vez da parte ineficaz.
A principal fonte de dados para este projeto foi do repositório Kaggle. Você pode baixar o conjunto de dados aqui
Executando tarefas de aprendizagem de máquinas como exploração exploratória de dados (EDA), limpeza de dados, engenharia de recursos, construção de modelos e testes de modelo para criar uma solução capaz de prever o prêmio do seguro pessoal para o seguro de saúde.
Exploração de dados: explorou e analisou o conjunto de dados usando bibliotecas Pandas, Numpy, Matplotlib e Seaborn
Visualização de dados: plotado gráficos diferentes para obter mais informações sobre variáveis/recursos dependentes e independentes.
Engenharia de Engenharia: Execução de Recursos Executados, Escala de Recursos e Seleção de Recursos
Construção do modelo: Nesta etapa, a divisão do primeiro conjunto de dados é concluída. Depois desse modelo, é treinado em diferentes algoritmos de aprendizado de máquina, como:
Avaliação do modelo
Teste de modelo
Construção de aplicativos da web
Implantação de aplicativos da web