O documento discute os principais implementadores do Hadoop, como Hortonworks, Cloudera e MapR. Ele também aborda o que é Big Data e como o Hadoop, através do HDFS e MapReduce, permite processar grandes volumes de dados de forma distribuída. Por fim, explica como Oracle, Microsoft, IBM e EMC também oferecem suas próprias soluções baseadas no Hadoop.
4. Hadoop
• Projeto Open Source
• Criado pela Yahoo em 2005
• Licenciado pela Apache
• É a combinação de dois projetos :
Hadoop MapReduce (HMR)
Hadoop Distributed File System (HDFS)
5. Hadoop
Apache Hadoop é um framework que permite o processamento
de grandes volumes de dados através de clusters. É um sistema
distribuído usando uma arquitetura Master-Slave armazenando
informações através do Hadoop Distributed File System (HDFS) e
implementa algoritmos de MapReduce.
7. O que é Big Data?
Segundo a Wikipedia:
“Big Data consiste em datasets que crescem em uma escala tão
grande e complexa que fica difícil de processar utilizando as
ferramentas de gerenciamento de banco de dados tradicionais.
As dificuldades incluem captura, armazenamento, busca,
compartilhamento, analise e visualização.”
9. Mercado de trabalho
Fonte : http://classificados.folha.uol.com.br/empregos/2013/06/1291482-
empresas-tem-de-reduzir-exigencias-para-ocupar-vagas.shtml
10. Mercado de trabalho
Fonte : http://classificados.folha.uol.com.br/empregos/2013/06/1291482-
empresas-tem-de-reduzir-exigencias-para-ocupar-vagas.shtml