
Refinamento do Conjunto Inicial de Resultados Utilizando Informações Contextuais para Recuperação Interativa de Imagens
Author(s) -
Luciano Araújo Dourado Filho
Publication year - 2019
Publication title -
anais do ... seminário de iniciação científica/anais seminário de iniciação científica
Language(s) - Portuguese
Resource type - Journals
eISSN - 2595-0339
pISSN - 2175-8735
DOI - 10.13102/semic.v0i22.4031
Subject(s) - humanities , physics , art
O avanço das tecnologias de captura e armazenamento de conteúdo digital proporcionaum aumento na quantidade de dados (imagens, vídeos, e-mails, documentos, etc) queconsequentemente demanda por desenvolvimento de técnicas para sua exploração tendoem vista sua grande quantidade e disponibilidade, em sistemas computacionais ao redordo mundo. Esses dados podem ser utilizados para fins diversos, como medicina, análiseforense, estudo de biodiversidade, redes sociais, bibliotecas digitais, entre outros (Lew,2001) e a eficácia em suas técnicas de exploração/recuperação podem tornar o acessomais fácil e produtivo.Quando trata-se de imagens, por exemplo, os principais paradigmas de buscaconsistem em levar em consideração informações textuais associadas (anotações,metadados, palavras-chave) para realizar sua recuperação para um usuário a partir debancos de dados (Lieberman & Rosenzweig, 2001). Outra abordagem comum se dáatravés da representação computacional das propriedades visuais de imagens (cor, formae textura) e com base nisso computar similaridade entre imagens. As entidadesresponsáveis por realizar esse processo são denominadas descritores. Os sistemascomputacionais de recuperação de imagens por conteúdo, podem, a partir de uma oumais imagens de consulta, ordenar as imagens de sua base deacordo com a similaridade em relação à imagem de consulta e retornar as maisparecidas para o usuário (Torres & Falcão, 2006).Um problema comum às duas abordagens citadas trata-se da noção desimilaridade, que varia de acordo com a percepção de cada usuário e da discrepânciaentre a interpretação das características semânticas de uma imagem por um ser humanoem relação à representação de suas propriedades por meio de uma máquina (gapsemântico). Com intuito de minimizar o problema tenta-se combinar descritores visuaisde modo a adaptar a busca às necessidades do usuário (Atrey et al., 2010). Outrapossibilidade é permitir que o usuário interaja com o sistema, indicando a relevância dasimagens no resultado o que possibilita ao sistema retornar outras similarmenterelevantes (Ruthven & Lalmas, 2010; Calumby et al., 2010). Com isso, à partir detécnicas de aprendizado de máquina é possível buscar por padrões que representem asnecessidades do usuário.A aplicação de técnicas de aprendizado de máquina com realimentação derelevância permitem ao usuário interagir com o sistema enquanto ele tenta aprendercomo atender às suas necessidades. Esse processo é realizado de maneira iterativaenquanto o usuário não se declarar satisfeito. O usuário alimenta o sistema ao longo dasiterações quando indica a relevância dos itens exibidos, desta forma, o sistema tentacodificar quais propriedades visuais melhor caracterizam as imagens informadas comorelevantes pelo usuário, portanto tende a retornar resultados mais relevantes, ao longodas iterações, em relação ao conjunto inicial. De forma intuitiva, se o conjunto inicialapresenta resultados não satisfatórios, a tendência é que o usuário não tenha comofornecer informação de qualidade para o sistema e assim os resultados consequentestambém sejam insatisfatórios (Calumby et al., 2017).Desta forma, têm-se desenvolvido técnicas de re-ranqueamento com o intuito demelhorar a eficácia de sistemas de recuperação de imagens. Exemplo disso é o métodode re-ranqueamento baseado em espaços contextuais (Pedronette et al., 2014). A ideiageral é explorar as informações que as relações entre várias imagens podem prover.Deste modo, é possível redefinir o grau de similaridade entre duas imagens levando emconsideração a similaridade de uma das imagens, em relação às suas vizinhas. Ou seja, épossível refinar as distâncias entre imagens levando em consideração o contexto em queuma delas estão inseridas.Este trabalho realizou a avaliação do emprego desta técnica, com intuito derefinar o conjunto inicial de resultados de busca de imagens por conteúdo e analisar seuimpacto ao longo das iterações.