z-logo
open-access-imgOpen Access
Análise Integrada de Grafos de Proveniência Heterogêneos por meio de uma Abordagem PolyStore
Author(s) -
Yan Mendes,
Victor Ströele,
Daniel de Oliveira,
Kary Ocaña
Publication year - 2019
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbbd.2019.8809
Subject(s) - humanities , computer science , philosophy
Workflows’ provenance data are captured by several existing Wofkflow Management Systems (WfMSs). Distinct WfMSs use different storing formats to represent data and, usually, captures and store data in different granularities using a graph-like shape. This allows researchers to analyze and validate their workflows’ results. Yet, in more complex scenarios where scientists need to compare provenance data originated from different WfMSs and workflows, a challenge emerges. To solve this problem, we propose an approach named PolyFlow, based on Polystore systems, being able to integrate multiple heterogeneous provenance databases adopting an on-demand global schema (ProvONE), i.e., it transforms the data in execution time, allowing researchers to query multiple provenance graphs via , exploring and linking provenance of different workflows. To assess PolyFlow’s viability, we developed conceptual to two WfMSs (Swift/T and Kepler) using a real experiment to analyze phylogenetic data. Resumo. Dados de proveniência de um workflow são capturados por quase todos os Sistemas de Gerência de Workflows (SGWfs) existentes. Cada SGWf utiliza um formato próprio para representar tais dados, e, comumente, captura e armazena os dados em diferentes granularidades na forma de um grafo. Isso permite cientistas analisarem e validarem resultados de um workflow específico. Entretanto, em cenários mais complexos em que o cientista necessita analisar grafos de proveniência oriundos de múltiplos SGWfs e workflows, um desafio surge. Para resolver esse problema, propomos uma abordagem chamada PolyFlow, que se baseia no conceito de Sistemas PolyStore, sendo capaz de integrar diversos bancos de dados de proveniência heterogêneos adotando um esquema ProvONE global sob demanda, i.e., sem necessidade de conversão prévia dos dados (que pode ser bastante custosa). Os cientistas podem, então, consultar múltiplos grafos de proveniência nesse banco de dados integrado via PolyFlow, explorando e vinculando a proveniência de workflows diferentes. De forma a analisar a viabilidade da abordagem PolyFlow, desenvolvemos mapeamentos para dois SGWf (Swift/T e Kepler) utilizando um experimento real de análise de dados filogenéticos.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here
Accelerating Research

Address

John Eccles House
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom