
Matched-Pair Analysis Using Machine Learning to Predict 1-year Mortality in Newborn Twins
Author(s) -
Everton Jesus,
Lucas CalaisFerreira,
Marcos Barreto
Publication year - 2020
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbcas.2020.11515
Subject(s) - humanities , physics , computer science , philosophy
A análise de pares de gêmeos é uma ferramenta importante para avaliar fatores de risco familiares relacionados a diversos problemas, inclusive doenças. Modelos de aprendizado de máquina são ferramentas consolidadas utilizadas em diversas tarefas de predição nas mais diversas áreas. Porém, elas não são totalmente adequadas para a análise de conjuntos de dados onde os pares de registros possuem forte correlação entre si, como é o caso de gêmeos. Este artigo avalia a adequabilidade de modelos de aprendizado de máquina para predizer a mortalidade até um ano de gêmeos nascidos no Brasil, utilizando dados extraídos de bases de dados públicas. Além disso, também é avaliado um método para análise de dados pareados, criando uma base de dados alternativa para verificar se a aplicação dos modelos de aprendizado de máquina promove ganhos no processo de classificação. OS resultados demonstraram que i) o modelo de aprendizado de máquina Gradient Boosting obteve os melhores resultados na tarefa de classificação e ii) a estratégia para análise de dados pareados não melhorou os resultados conforme esperado.