
O Balanceamento de Réplicas em um Cluster HDFS com base na Confiabilidade dos Racks
Author(s) -
Rhauani Weber Aita Fazul,
Patrícia Pitthan Barcelos,
Paulo Vinícius Cardoso
Publication year - 2019
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbesc_estendido.2019.8632
Subject(s) - physics , operating system , cluster (spacecraft) , computer science , humanities , philosophy
A replicação de dados é um dos principais mecanismos de tolerância a falhas utilizados pelo HDFS. Porém, a forma de posicionamento das réplicas entre os nodos computacionais afeta diretamente o balanceamento e o desempenho do sistema. O HDFS Balancer é uma solução disponibilizada pelo Apache Hadoop que visa equilibrar a distribuição dos dados. Todavia, sua política de operação atual não permite endereçar demandas de disponibilidade e confiabilidade ao redistribuir as réplicas entre os racks do cluster. Esse trabalho apresenta uma estratégia de balanceamento customizada para o HDFS Balancer baseada em fatores de confiança, que são calculados para cada rack a partir da taxa de falhas de seus nodos. Após detalhar a implementação, conduziu-se uma investigação experimental que permitiu validar e demonstrar a efetividade da estratégia desenvolvida.