
Análise do impacto de viés nos conjuntos de dados para detecção de Malwares Android
Author(s) -
Lucas Vilanova,
Renato Sayyed,
Tainá Soares,
Guilherme Siqueira,
Gustavo Rodrigues,
Eduardo Feitosa,
Diego Kreutz
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/errc.2021.18543
Subject(s) - computer science , physics , humanities , philosophy
Atualmente, a detecção de malwares Android é realizada, majoritariamente, através de modelos de aprendizado de máquina. O problema é que a maioria dos modelos desenvolvidos têm sido treinados com conjuntos de dados defasados (e.g., de 2012). Nosso objetivo é coletar evidências iniciais para demonstrar o impacto de diferentes datasets no desempenho de modelos preditivos. Para isto, utilizamos conjuntos de dados de diferentes períodos temporais, isto é, de 2012 a 2021.