
CbDGen: Uma ferramenta de geração de dados sintéticos baseada na complexidade
Author(s) -
Thiago Valle França,
Péricles Miranda,
Ricardo B. C. Prudêncio,
André Nascimento
Publication year - 2020
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/eniac.2020.12123
Subject(s) - humanities , physics , philosophy
Ferramentas de geração de bases de dados sintéticos ganharam atenção como uma alternativa para a avaliação eficaz de classificadores. Como são altamente configuráveis, as ferramentas possibilitam a criação de bases com características específicas, permitindo a avaliação do classificador em diferentes cenários. Este trabalho propõe a CbDGen, uma ferramenta para geração de bases sintéticas baseada em complexidade de dados. Com uma interface simples e parametrizável, a CbDGen possibilita a inserção de informações básicas (i.e., número de classes, atributos), a seleção de diferentes distribuições e nível de ruído. O seu grande diferencial é permitir que a escolha do tipo de complexidade desejado (i.e., balanceamento, separabilidade), bem como o nível desta complexidade. Os resultados mostraram que a CbDGen é capaz de produzir bases sintéticas aderentes às escolhas realizadas pelo usuário, se mostrando uma plataforma propícia para a avaliação de classificadores.