
Um framework para análise da relação entre tamanho e complexidade de conjuntos de dados
Author(s) -
Mateus José dos Santos,
André Brun,
Ronan Assumpção Silva
Publication year - 2021
Publication title -
revista brasileira de computação aplicada
Language(s) - Portuguese
Resource type - Journals
ISSN - 2176-6649
DOI - 10.5335/rbca.v13i2.10898
Subject(s) - humanities , physics , art
Na área de Reconhecimento de Padrões, um problema de classificação é dito complexo quando as observações de classes diferentes apresentam elevada semelhança. Ao reconhecer a estimativa de complexidade como um fator importante na obtenção de acurácia, a literatura propôs uma variedade de descritores de complexidade. Porém, não se sabe a sensibilidade desses descritores quanto a variação do tamanho dos conjuntos de treinamento. Neste trabalho, este comportamento foi analisado. Os descritores foram medidos em 20.800 subconjuntos criados a partir de: i) 26 problemas de classificação, ii) 2 geradores e iii) 4 tamanhos. Os resultados comprovaram que a sensibilidade dos descritores ao tamanho é uma realidade, sendo menos perceptíveis em F1, F2, L2, N4, L3, T1, D2 e D3. Já as métricas F3, F4, N1, N2 e N3 são mais influenciadas por variações no número de instâncias presentes no conjunto.