
Proposta e Análise de Desempenho de Dois Métodos de Seleção de Características para Random Forests
Author(s) -
Denise Bastos,
Patricia Santos Nascimento,
Marcelo de Souza Lauretto
Publication year - 2013
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbsi.2013.5675
Subject(s) - physics , mathematics , statistics
Em aprendizado supervisionado, é comum a ocorrência de bases de dados contendo atributos irrelevantes. Sob tais circunstâncias, a adoção de critérios de seleção de características relevantes para a classificação é fundamental, principalmente nos problemas em que os custos de coleta de dados são proporcionais à quantidade de atributos. Neste artigo, propomos dois critérios de seleção de atributos voltados para Random Forests, denominados Fator de Incidência (FI) e Fator de Profundidade (FP). Testes comparativos indicam que o FP é um critério robusto, com desempenho superior ao da Importância Baseada no Erro (IE) e equivalente ao da Importância de Gini (IG) – os dois principais critérios para Random Forests atualmente em uso.