
Uma proposta de data lake para pesquisa em saúde a partir de data pools multicêntricos interoperáveis
Author(s) -
Daniel Magalhães Lima,
Ramón Moreno,
Fábio A Pires,
Marco Antônio Gutierrez
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbbd.2021.17900
Subject(s) - humanities , art
Com a alta demanda em ciência de dados, a organização e preparo de bases de dados se tornaram atividades críticas, consumindo mais de 80% do esforço do projeto. No domínio de assistência ao paciente, muitos hospitais já utilizam uma miríade de tecnologias e sistemas informatizados para prontuários e imagens, mas nem sempre adotam padrões de dados uniformes e interoperáveis, e raramente adotam ferramentas voltadas à análise (data lakes e warehouses). Neste artigo é proposto o data pool, um modelo de dados intermediário para facilitar a organização de data lakes voltados à pesquisa em saúde. O datapool foi implementado e adotado em um ciclo completo de pesquisa médica real, dando suporte a fluxos de aprendizagem computacional.