z-logo
open-access-imgOpen Access
SEREIA - Busca por Palavras-Chave em Document Stores
Author(s) -
Ariel Afonso,
Paulo André da Silva Martins,
Altigran Soares da Silva
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbbd.2021.17872
Subject(s) - humanities , computer science , physics , philosophy
Gerenciadores de documentos (GDs) ou document stores, como MongoDB e CouchDB, têm se tornado cada vez mais populares devido à flexibilidade em carregar e recuperar dados em larga escala usando documentos semi-estruturados, pois evitam a necessidade de definição de esquemas antes da ingestão de dados. Por outro lado, especificar consultas neste tipo de sistema é uma tarefa complexa, ainda mais que em sistemas relacionais, devido à natureza semi-estruturada dos documentos e à possibilidade de aninhar itens de dados complexos. Para lidar com esse problema, apresentamos uma abordagem chamada SEREIA, que permite a execução de consultas por palavras-chave sobre coleções de documentos armazenados em GDs sem necessidade de conhecimento da estrutura das coleções. Nossa abordagem é baseada na geração de Candidate Join Networks que representam diferentes interpretações da consulta fornecida, a fim de ranqueá-las e escolher a alternativa mais adequada. Experimentos realizados em um banco de dados representativo, contendo diversas coleções de documentos, mostram que nossa abordagem foi eficaz em gerar consultas estruturadas que satisfazem a intenção original do usuário expressa na consulta por palavras-chave, alcançando valores de Precisão e MRR de 1.0 e 0.98, respectivamente.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here