[I] O documento descreve a arquitetura do framework Apache Hadoop, incluindo seu histórico, conceitos-chave como MapReduce e HDFS, e como os componentes se encaixam e interagem uns com os outros. [II] Hadoop usa HDFS para armazenamento distribuído tolerante a falhas e YARN para gerenciar recursos e executar trabalhos em larga escala de forma paralela e confiável. [III] A arquitetura é baseada em um NameNode master que controla o HDFS e vários DataNodes que armazenam e