z-logo
open-access-imgOpen Access
O Balanceamento de Réplicas no HDFS frente a aplicações com uso intensivo de E/S, dados e CPU
Author(s) -
Rhauani Weber Aita Fazul,
Patrícia Pitthan Barcelos
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/sbesc_estendido.2021.18499
Subject(s) - computer science , operating system , cluster (spacecraft) , replica , physics , parallel computing , art , visual arts
A replicação de dados é essencial para o sistema de arquivos distribuído do Apache Hadoop (HDFS). Para garantir alta confiabilidade, disponibilidade e desempenho, as réplicas precisam estar armazenadas de forma otimizada pelos nodos do cluster. Entretanto, quando os nodos armazenam quantidades desproporcionais de dados, o funcionamento do sistema é afetado. Visando mitigar os problemas inerentes do desbalanceamento de réplicas, o HDFS Balancer é a solução oficial disponibilizada para a redistribuição dos dados já armazenados no cluster. Neste trabalho, nós avaliamos a efetividade do HDFS Balancer e como o sistema de arquivos explora a localidade dos dados em diferentes situações. Para uma análise aprofundada, aplicações com comportamentos distintos foram consideradas. Os resultados demonstram que o balanceamento de réplicas possibilita otimizações de desempenho significativas no HDFS.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here