
Análise de diferentes técnicas de pré-processamento em algoritmos de Aprendizado de Máquina na detecção de SQL Injection
Author(s) -
Vanessa Aparecida Feijó de Souza,
Erick T. A. Silva,
Martinus Rafael,
Melise Maria Veiga de Paula
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/semish.2021.15830
Subject(s) - physics , sql injection , computer science , sql , database , information retrieval , query by example , web search query , search engine
Atualmente, a SQL Injection é uma das maiores ameaças à segurança das aplicações WEB. Desta forma, diversas abordagens vêm sendo analisadas para tentar resolver esse problema. O objetivo deste trabalho foi utilizar algoritmos de aprendizado de máquina para detectar SQL Injection a partir do tratamento dos dados de entrada de cinco formas diferentes, variando a tokenização, transformação e extração de atributos das bases de SQL Padrão e Injection. Os algoritmos utilizados foram Naive Bayes, SVM, Gradient Boosting Tree (GBT) e Random Forest (RF). O melhor resultado foi obtido com o GBT com as métricas G-Test e Entropia, calculadas sobre tokenização e transformação com expressão regular, apresentando acurácia de 98.46%.