Open Access
Uso de visualização de dados para auxiliar na análise e pré-processamento de dados categóricos
Author(s) -
Isabel Harb Manssour,
Lucas Bertoglio Ciocari,
Alessandra Maciel Paz Milani
Publication year - 2020
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sibgrapi.est.2020.13010
Subject(s) - computer science
A quantidade de dados disponíveis sobre diferentes assuntos cresceu muito nos últimos anos, gerando novos desafios para os cientistas de dados e para diversas áreas de pesquisa, tais como mineração e visualização de dados. Com o objetivo de auxiliar na análise e pré-processamento de dados categóricos, esse trabalho propõe a inclusão de duas novas visualizações para dados categóricos à biblioteca Pandas Profiling. A primeira corresponde a um Diagrama de Cordas Bidimensional que possibilita ver a relação entre dados categóricos. A segunda é uma visualização do tipo Display Tabular que permite fazer uma análise de todo conjunto de dados. Estas visualizações visam auxiliar cientistas de dados na etapa de pré-processamento, principalmente com o objetivo de ajudar a entender o volume de dados a ser analisado.