PREVISÃO DA QUALIDADE DA ÁGUA: UMA APLICAÇÃO DO MODELO DE APRENDIZADO SUPERVISIONADO XGBOOST
Resumo
Avaliar a adequação da água potável, recurso essencial para sustentar a vida humana, é vital para
gerações atuais e futuras. Sua previsão precisa, por meio de algoritmos de Machine Learning, pode ajudar a reduzir
a incidência de doenças transmitidas pela água, tais como diarreia, cólera, entre outras. Neste contexto, este
trabalho tem como objetivo avaliar o desempenho, na detecção de água potável, do modelo XGBoost (Xtreme
Gradient Boosting). Utilizou-se, para realizar esta avaliação, a base de dados de qualidade da água Water Quality,
a técnica resample para balanceamento das classes e a biblioteca de ajuste de hiperparâmetros Optuna. A base de
dados possui os seguintes parâmetros: pH, Hardness, Solids, Chloramine, Sulfate, Conductivity, Organic_carbon,
Trihalomethanes, Turbidity e Potability. As métricas Accuracy, Precision, Sensitivity, F1-Score e AUC foram
utilizadas para avaliar o desempenho do modelo. Resultados experimentais demonstraram que o modelo XGBoost
apresentou muito bom desempenho de classificação, alcançando 92% de acurácia.