O documento discute como a Internet das Coisas (IoT) e Big Data irão mudar a forma como lidamos com a tecnologia, mencionando como essas tecnologias estão relacionadas à Indústria 4.0 e apresentando breves explicações sobre MapReduce, Hadoop e Spark.
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecnologia
1. Indústria 4.0: como a IoT
e Big Data mudarão a
forma como lidamos
com a tecnologia
2. 2
Sobre...
Vinícius Aires Barros
Ciência da Computação 2016 - UFT
Mestrando em Ciência da Computação - ICMC USP
Laboratório de Sistemas Distribuídos e Programação
Concorrente - LaSDPC
Áreas de Interesse: IoT, Distributed Systems,
Big Data (...)
GitHub: @v4ires
Website: http://viniciusaires.me
E-mail: v4ires@gmail.com
3. Contextualização
● Big Data (5V’s)
○ Volume
○ Variedade
○ Velocidade
○ Veracidade
○ Valor
● Internet das Coisas (IoT)
● Grandes Volumes de Dados
● Programação Distribuída e
Paralela
● Dados Estruturados, Não
Estruturados e Semiestruturados
● Bancos de Dados SQL e NoSQL
● MapReduce
● Apache Hadoop, Spark, etc.
3
5. “Indústria 4.0 ou Quarta
Revolução Industrial é uma
expressão que engloba algumas
tecnologias para automação e
troca de dados e utiliza
conceitos de Sistemas
ciber-físicos, Internet das Coisas
e Computação em Nuvem.
5
7. Internet das Coisas (IoT)
IoT refere-se à uma nova
abordagem sobre a
interconexão de coisas,
tecnologias e objetos,
através da Internet. Essa
abordagem proporcionou ao
longo do tempo a criação da
rede global de dispositivos.
7
8. Google Trends (IoT vs Big Data)
8
Total de Pesquisas Realizadas no Google em Relação a IoT e
Big Data (Fonte: Google Trends).
16. “Big Data é definido como um
conjunto de dados estruturados
ou não estruturados que não
puderam ser percebidos,
adquiridos, gerenciados e
processados pelos modelos
tradicionais de hardware e
software.
16
22. O que é o Hadoop?
O Apache Hadoop é um software de código aberto
mantido pela Apache Foundation que tem como
propósito fornecer uma implementação livre do
modelo de programação MapReduce.
22
24. Características
24
❏ Implementação em Java
❏ Arquitetura Mestre Escravo (Master/Slave)
❏ Modelo de Programação MapReduce
❏ Hadoop Distributed File System (HDFS)
❏ Memória Secundária (Disco)
❏ Processamento Distribuído
❏ Escalável
❏ Tolerante a Falhas
25. O que não é?
25
❏ Linguagem de Programação
❏ Biblioteca de Aprendizagem de Máquina
❏ Processamento em Tempo Real
❏ Solução Definitiva
❏ Hadoop ≠ Spark
30. O que é o Spark?
O Apache Spark é um software de código aberto
mantido pela Apache Foundation que tem como
propósito fornecer uma implementação livre e
melhorada do modelo de programação MapReduce.
30