
Mineração de Dados Aplicada à Predição do Desempenho de Escolas e Técnicas de Interpretabilidade dos Modelos
Author(s) -
Milton V. Gama Neto,
Germano C. Vasconcelos,
Cleber Zanchettin
Publication year - 2021
Publication title -
anais do xxxii simpósio brasileiro de informática na educação (sbie 2021)
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbie.2021.217421
Subject(s) - counterfactual thinking , statistics , mathematics , physics , humanities , computer science , philosophy , psychology , social psychology
Este trabalho analisa o desempenho com mineração de dados das escolas de São Paulo no exame SARESP, com dados da SEDUC-SP. A metodologia, baseada no CRISP-DM, propõe uma solução de aprendizagem de máquina para prever o desempenho das escolas e extrair padrões relevantes do desempenho educacional com técnicas de IA Explicativas. Sete classificadores alcançaram alta acurácia (93%) e AUC ROC (0.97) na previsão do desempenho das escolas, com dados do perfil de alunos, escolas e valores sócio-econômicos externos. O modelo não-linear e as técnicas SHAP e Counterfactual evidenciaram fatores relevantes que podem impactar o resultado educacional e a utilidade da metodologia no apoio à decisão.