Viés em Aprendizagem de Máquina: como a inteligência Artificial pode prejudicar as minorias
Author(s) -
Sergio CLEGER,
Marcela Pessoa,
Jessica Luana Oliveira de LIMA
Publication year - 2019
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.29327/112260.8-1
Subject(s) - humanities , computer science , artificial intelligence , philosophy
This paper presents an analysis of the impact that social bias causes on machine learning algorithms and may perpetuate some biases if they are not addressed. For this, it describes the functioning of machine learning, cases of prejudice by the Artificial intelligence system and the importance of diversity in the area, besides the need to facilitate access to knowledge about the subject, as well as the importance of having data open and accessible to all. Resumo. Este artigo apresenta uma análise do impacto que o viés social causa nos algoritmos de aprendizagem de máquina e podem perpetuar alguns preconceitos se estes não forem tratados. Para isso, descreve o funcionamento de aprendizagem de máquina, casos de preconceito por parte de sistema de inteligência Artificial e a importância da diversidade na área, além da necessidade de se facilitar o acesso ao conhecimento sobre o assunto, bem como a importância de ter dados abertos e acessíveis a todos. 1. Introdução Inteligência Artificial (AI) é a construção de computadores, algoritmos e robôs capazes de simular a inteligência humana, máquinas com capacidades como: aprender, resolver problemas, fazer escolhas e racionalizar. Ao contrário da computação tradicional, a IA pode tomar decisões em uma variedade de situações que não foram pré-programadas por um ser humano (Teixeira 1990). Existem duas vertentes da IA, que são: Inteligência Artificial Forte e Inteligência Artificial Fraca. A Inteligência Artificial Fraca está relacionada com a construção de máquinas ou softwares inteligentes, porém, que não são capazes de raciocinar e tomar decisões por si próprias. Por outro lado, a Inteligência Artificial Forte está relacionada à criação de máquinas que tenham autoconsciência e que possam pensar; e não somente simular raciocínios (Searle 1980). Entre os cientistas existe uma grande preocupação com o futuro da IA forte, retratado muitas vezes por filmes onde acontece o apocalipse robótico e as máquinas dominam o mundo, porém está prestando menos atenção aos problemas gerados pela IA Fraca, que já é presente em nossas vidas, e como evitar que esses programas sejam amplificados e causem mais desigualdades devido a ideais e comportamentos humanos antigos que têm sido propagados até hoje e consequentemente as máquinas têm aprendido e repetido este comportamento, ou seja, por culpa de preconceitos do passado a IA pode afetar negativamente os membros mais “vulneráveis” da nossa sociedade. Os algoritmos de Inteligência Artificial trazem possibilidades magníficas de otimização de trabalho, personalização da experiência e outras transformações positivas, mas também trazem riscos e desafios que precisam ser conhecidos e considerados antes de sua adoção. A possibilidade de criar máquinas inteligentes levanta uma série de questões éticas das quais pouco são discutidas e difundidas no meio tecnológico e social. É preciso ter a consciência de que esses algoritmos são programados por pessoas que injetam nesses códigos visões de mundo e viés pessoais. Além disso, esses algoritmos são treinados com um grande volume de dados preexistentes que podem conter distorções (Vieira 2019). Este artigo está organizado da seguinte forma. Na Seção 2 é apresentado o referencial teórico. Na Seção 3 são apresentadas as iniciativas que tentam diminuir preconceitos em diversas áreas. A Seção 4 apresenta uma análise comparativa sobre a influência de viés nas ferramentas que utilizam IA e na Seção 5 é apresentada a conclusão. 2. Referencial Teórico Nesta seção são descritos os conceitos necessários para o entendimento e valorização da proposta. 2.1. Aprendizagem de Máquina Aprendizagem de máquina (machine learning) é dar a uma máquina a habilidade de aprender, mesmo que nem tudo esteja explicitamente programado. Contudo, existem duas grandes divisões iniciais de formas pelas quais a aprendizagem de máquina pode ocorrer: aprendizagem de máquina supervisionada e aprendizaem de máquina nãosupervisionada. Neste trabalho são abordados aspectos de aprendizagem supervisionada, que está sendo descrita na subseção a seguir. 2.2.1 Aprendizagem Supervisionada Resume-se na conexão de uma distribuição conjunta de variáveis X (suas características, features ou as colunas de uma tabela de dados) em uma variável alvo y (o target, uma determinada coluna da tabela que se tem o interesse de prever). É suposto que haja um conjunto classificado de exemplos, ou seja, registros na tabela que possuam o valor de y para que se possa treinar um modelo que aprenderá a fazer essa conexão. O resultado obtido é um modelo que é capaz de conectar novos exemplos vindos da distribuição conjunta X à valores de y, ou seja, prevê-los. 2.2. Erros em Aprendizado de Máquina Um dos grandes temas em aprendizado de máquina é o conflito entre viés (bias) e variância (variance). O erro de generalização de um algoritmo de aprendizado, o quão bem ele pode prever novos casos, pode ser decomposto em viés e variância. Entre os erros é possível citar: Erro sistemático: o viés, também chamado de erro sistemático, é sobre o algoritmo não ser capaz de expressar a forma funcional de como aquele fenômeno se dá. Ou seja, por mais que sejam usadas amostras diferentes ou maiores, ele nunca se aproximará do valor real que quer se estimar, pois não é capaz. Erro aleatório: a variância, chamada também de erro aleatório, captura nuances das amostras, uma vez que tende a construir regras complexas demais sem a quantidade de exemplos necessária. Underfitting: se existe um modelo com o viés alto (underfitting), o erro será alto. Se for feito amostragem aleatória do conjunto de treinamento (bootstrapping) e forem treinados 10 modelos, serão obtidas 10 previsões muito parecidas entre si, porém, todas serão ruins. Overfitting: no caso de um modelo com o erro de variância alto (overfitting), se forem feitos os treinamentos, vão obter-se 10 previsões bem diferentes entre si, sendo que algumas podem passar bem próxima do valor real, enquanto outras passariam longe. A Figura 1 ilustra a comparação entre underfitting e overfitting. Figure 1. Gráfico de modelos em IA 2.1.3. Viés em estatística É o desvio sistemático do valor real, ou seja, é o desvio por não coincidir com o valor real e é sistemático por acontecer consistentemente, em média (Uriel 2013). Então é dito que um estimador, ou seja, uma abordagem para estimar (encontrar uma aproximação) um parâmetro, que é uma característica real de algo, como a média de uma população, é não viesado se na média o estimador é igual ao valor real. Estamos falando do viés, que pode estar ou não contido no estimador, isto é, na abordagem usada para acessar o valor real de um parâmetro que é desconhecido, que é impossível ou muito custoso de ser medido diretamente (Uriel 2013). 2.3. Problema: Com quem as máquinas estão aprendendo? Em aprendizado de máquina deseja-se aprender uma relação ou fenômeno para que haja uma análise e uma previsão. É necessária uma base de dados para que a máquina possa aprender todas as regras que informam como as características podem predizer um possível caso. Como exemplo disso podemos mencionar as análises de crédito, diagnósticos de doença, entre outras. O grande problema da questão é como essa base foi construída? os dados são tendenciosos? como fazer uma previsão justa? o que poderia ser aceito como justo? Nem sempre há o que possa ser considerado como verdade (ground truth) para um fenômeno. E há casos em que só se pode observar a variável alvo de uma decisão, que pode ter sido tomada baseada em um modelo pré-existente (Moneda 2019). Pode-se afirmar que a variável alvo de um modelo de aprendizagem é a principal fonte do que é chamado de viés, que consiste em um erro sistemático na previsão dos resultados (Moneda 2019). 2.3.1 Causas dos problemas nos algoritmos O fato de que um modelo necessita aprender com o passado e aplica as regras no presente, o que influencia o futuro e os novos dados que realimentarão os modelos, portanto, ele propaga viés do passado; Regras, preconceitos e viés são aprendidos pelos modelos tendo a variável alvo construída com embasamento de anotações geradas pela ação de humanos; Nem sempre é possível observar a formação da variável alvo, o modelo pode ser a causa disso. Um modelo que é usado para conceder crédito não vai possibilitar que se observe como bom ou mal pagador uma pessoa que teve o crédito negado. Quando pensamos em algoritmos de aprendizado de máquina, podemos definir como um conjunto de regras matemáticas que irão automatizar um processo anteriormente realizado por um humano. A tecnologia, na verdade, não muda a realidade, mas sim potencializa o contexto já existente. É por esse motivo que O'Neill (O’Neil 2009) afirma que os algoritmos são como armas matemáticas de destruição, na medida em que, longe de serem neutros e objetivos, embutem em seus códigos uma série de decisões e opiniões que não podem ser contestadas, até porque não são conhecidas. “Esqueça deles por um minuto, eles podem dizer, e foque em todas as pessoas que conseguem ajuda com os nossos algoritmos de recomendação: que encontram músicas que amam, conseguem o emprego perfeito no Linkedin ou até encontram o amor da vida delas e ignore as imperfeições” (O’Neil 2009). 3. Iniciativa para minimizar os impactos Com a presença cada vez mais marcante da IA, maior também é a necessidade de igualdade de gênero, já que a própria natureza do aprendizado de máquina exige a diversidade. Um dos objetivos da IA é levar máquinas a fazer o que humanos fariam naturalmente: reconhecer falas, tomar decisões e saber a diferença entre uma feijoada e um caldinho de feijão. Para fazer isso, as máquinas precisam de grandes quantidades de informações e as processam assim como todos nós absorvemos informações desde o nascimento. A IA não é só mais uma tendência e sim um mecanismo poderoso de mudança social e apesar dela estar cada vez mais útil e fácil de usar, falta deixá-la ao alcance de todos, para que os próprios algoritmos po
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom