Diabetes tipo 2, Fatores de risco, Aprendizado de máquina, Modelo de previsão, Acurácia, Intervenções precoces, Prevenção, Tratamento
Este estudo visa prever a presença de diabetes tipo 2 em mulheres Pima com base em dados médicos utilizando algoritmos de aprendizado de máquina na plataforma Google Colab com linguagem Python. O conjunto de dados do Instituto Nacional de Diabetes e Doenças Digestivas e Renais foi utilizado, contendo informações de mulheres indígenas Pima com idade superior a 21 anos. A análise exploratória detalhada do banco de dados foi realizada para compreender as variáveis e identificar padrões. Algoritmos de aprendizado de máquina, como Random Forest e Gradiente Descendente, foram implementados para construir modelos preditivos. A avaliação do desempenho dos modelos foi realizada utilizando métricas como acurácia, sensibilidade, especificidade e AUC. Os resultados demonstraram que o modelo Ensemble, combinando Random Forest e Gradiente Descendente, obteve a melhor performance, com acurácia acima de 86%, superando os modelos individuais de Regressão Logística. As métricas de sensibilidade e especificidade também apresentaram valores satisfatórios, indicando a capacidade dos modelos em identificar corretamente pacientes com e sem diabetes tipo 2. O estudo conclui que a combinação de algoritmos de aprendizado de máquina, especialmente o modelo Ensemble, apresenta um desempenho superior na previsão de diabetes tipo 2 em mulheres Pima. A análise exploratória detalhada do banco de dados foi fundamental para o sucesso da modelagem. Essa abordagem pode auxiliar profissionais de saúde na detecção precoce da doença e na tomada de decisões mais assertivas para o tratamento.