O documento descreve o que é Hadoop, MapReduce, HDFS e Hive. Hadoop é uma plataforma de computação distribuída para processar grandes conjuntos de dados através de clusters de computadores. MapReduce é um framework para processar dados em paralelo usando as etapas Map e Reduce. HDFS é um sistema de arquivos distribuído projetado para armazenar arquivos muito grandes. Hive é um framework para data warehousing que executa queries SQL no Hadoop.