O documento discute a história e conceitos do Hadoop e HDFS, incluindo como o HDFS fornece armazenamento de dados em larga escala e como o MapReduce permite análises de dados distribuídas. É explicada a arquitetura do HDFS e do MapReduce e exemplos de como empresas como Yahoo, Facebook e Walmart usam Hadoop.
7. HDFS - Design
Very large files Low-latency data access
Streaming data access! Lots of small files!
Commodity hardware
Multiple writers, arbitrary
file modifications!
Leonardo Martins
leonardo.martins@wal-mart.com
17. HDFS - Sysadmin
Adicionar e remover Data Node ao cluster!
Check de integridade do filesystem!
Balanceamento do cluster!
Adicionar e remover Task Tracker!
Monitorar os recursos do cluster!
Leonardo Martins
leonardo.martins@wal-mart.com
25. Possibilidades de uso
Text mining Index building
Graph creation and
analysis
Pattern recognition
Prediction models Sentiment analysis
Cálculo de frete
Cálculo de rota de
caminhões!
Mecanismos de
Antifraude
Leonardo Martins
leonardo.martins@wal-mart.com