z-logo
open-access-imgOpen Access
Análise Exploratória de Atributos Textuais em Bases de Dados para Identificação de Campos Sensíveis
Author(s) -
Bruno H. Labres,
André Grégio,
Fabiano Silva
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbseg_estendido.2021.17365
Subject(s) - humanities , philosophy , mathematics
A iminente implantação da Lei Geral de Proteção de Dados Pessoais brasileira torna urgente a criação de técnicas automatizadas para anonimização de bases de dados. As ferramentas existentes são dependentes de que um especialista manualmente escolha os campos de interesse. Neste trabalho, propõe-se o uso de algoritmos de aprendizado de máquina em atributos textuais a fim de explorar como identificar nomes e outras informações sensíveis. Com isso, espera-se fomentar aplicações capazes de classificar automaticamente campos sensíveis em bancos de dados em um passo anterior à anonimização. A avaliação experimental da representação por frequência de digramas proposta, mostra que é possível obter modelos simples de aprendizado de máquina, como florestas aleatórias e redes neurais, capazes de classificar nomes de pessoas, endereços e descrições textuais com alta taxa de acurácia (97%) usando 676 características.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here