SlideShare uma empresa Scribd logo
1 de 83
Baixar para ler offline
Realização
DO BIG DATA À INTELIGÊNCIA CORPORATIVA
Claudinei Walker
II SDTA / 2016
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Libreria Acqua Alta, VenezaEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Censo Americano de 1890
0
1
2
3
4
5
6
7
MILHÕES
1890 United States Census
Total Population 61M
https://en.wikipedia.org/wiki/1890_United_States_Census
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Censo Americano de 1890
https://en.wikipedia.org/wiki/1890_United_States_Census
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Estimativa
1 registro =~ 3 Kbytes
61 M registros =~ 190 GBytes
Em 1890, um
problema de Big Data!
99% dos dados foram perdidos em um incêndio em 1921!
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Advento da internet nos anos 90: explosão na geração de dados não estruturados
Copyright ©2012 Accenture All rights reserved.
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Foco na alta
disponibilidade
dos dados
http://backtobazics.com/big-data/hadoop/simple-explanation-of-hadoop-core-components-hdfs-and-mapreduce/
HDFS Architecture
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Mover a computação
para os dados
http://www.docsity.com/en/news/algorithms/5-algorithms-widely-industry/
Map Reduce
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Volume
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Volume
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Velocidade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Velocidade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Variedade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Variedade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Definição do Gartner
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Definição do Gartner
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
1º Paradigma - milhares de anos
atrás
• Ciência fundamentalmente empírica
e baseada na observação e
descrição dos fenômenos naturais
Kala-Rahu
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Conceitos
2º Paradigma – séculos atrás
• Uso de teorias, modelos e
generalizações
Equações de Maxwell
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
3º Paradigma – algumas décadas
atrás
• Abordagem computacional
• Simulação de fenômenos
complexos
Hansen et al. (2009)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
4º Paradigma – Hoje
• Exploração de dados;
• Unificação da teoria,
experimentação e simulação;
• Dados capturados por
instrumentos ou gerados por
simulação;
• Informação/Conhecimento
armazenado em computadores;
• Obtenção do conhecimento a
partir da análise de dados.
C. Walker (2006)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Dados tradicionais em uma
companhia:
• Dados transacionais de ERPs
• Sistemas CRM
• Transações WEB
• Dados financeiros
Volume:
• Gigabytes (109)
• Terabytes (1012)
Velocidade:
• Batch ou near real-time
• Em geral não exige resposta
imediata
Variedade:
• Estruturados
• Não-estruturados
Valor:
• BI, análise e relatórios
Dados gerados fora da empresa
por fontes de dados não
tradicionais, incluindo:
• Media social
• Dados de sensores (IOT)
• Dados de Logs
• Device Data
• Video, imagens, etc.
Volume:
• Terabytes (1012)
• Petabytes (1015)
• Exabytes (1018)
• Zettabytes (1021)
Velocidade:
• Frequentemente em tempo-real
• Exigem resposta imediata
Variedade:
• Estruturados
• Não-estruturados
• Semiestruturados
Valor:
• Análises preditivas avançadas
• Insights para os negócios
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Modelos de Processamento
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: chave-valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: column store
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: Documentos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: Grafos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Common Pipeline – Aquisição, transformação, processamento e visualização
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Common Pipeline – Aquisição, transformação, processamento e visualização
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MATLAB 3D animation of AT over LEVC by @JorgeGT
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
• Descrição simplificada dos dados
• Reports com informações históricas
• OLAP, BI, Dashboards
• Data mining
• OLAP, BI, Dashboards
• Regressão linear
• Predição e probabilidades futuras
• Data mining para extração de
padrões
• Regressão linear e logística
• Foco na tomada de decisão e eficiência
• Uso de técnicas de otimização para a busca de
soluções ótimas
• Uso de simulações para obter insights e identificar
problemas
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Inconsciente Consciente Experimental
Oportunista Estratégico Transformador
• Inércia
• Terceirização
• Imaturidade em BI
• Ausência de cases
• Stakeholders x
Oportunidades
• Tecnologia?
• Ausência de
conhecimento sobre
o tema e Governança
da Informação
• Conceitos
estabelecidos
• POCs executadas
• APPs em “silos”
• Implantação de LDW
• Soluções
customizadas
• > nível maturidade
• Acompanhar
evolução tecnológica
• Implantação de CDM
• Catálogo de
dados
• Avaliação da
maturidade em BI
• Plano de
melhorias
• Plano de
aculturamento
• Selecionar business
cases
• Gerar MVPs
• Levantamento da
Governança da
Informação
• Plano de
desenvolvimento
• Promover a cultura em
Big Data
• Revisitar
considerações
iniciais
• Ajustar estratégias
• Avaliar lições
aprendidas
• Estabelecimento da
Governança
• HW/SW
estabilizados
• Tema Big Data é algo
normal
• Operacionalizar infra
HW/SW
• Planos de capacitação
e suporte
• Completar adoção de
LDW
• Formação de times
multidisciplinares
• Selecionar melhores ideias
• Desenvolver POCs
• Selecionar tecnologias
Roadmap
*LDW: Logical Data WarehouseEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014
~100 K flights/day/world!
~8K flight/day/Brazil
Huge amount of data!
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014
Pistas ADS-B
~ 10 GB entre
NOV14 e NOV15
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014 – Trajetória Média
𝜃 (𝑙𝑎𝑡)
𝜌 (𝑙𝑜𝑛)
𝛼 (𝑎𝑙𝑡)
𝜃
𝜌
𝛼
𝐿 𝑎
𝑘 =
1
𝑛
𝑖=1
𝑛
𝜃𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝐿 𝑔
𝑘
=
1
𝑛
𝑖=1
𝑛
𝜌𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝐴 𝑘 =
1
𝑛
𝑖=1
𝑛
𝛼𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝑝 𝑘
= (𝐿 𝑔
𝑘
, 𝐿 𝑎
𝑘
, 𝐴 𝑘
)
𝑛 = #𝑑𝑎𝑡𝑎 𝑝𝑜𝑖𝑛𝑡𝑠
Π = (𝑝1, 𝑝2, … , 𝑝 𝑘) 𝑇
𝑚 = 𝑔𝑟𝑖𝑑 𝑓𝑎𝑐𝑡𝑜𝑟
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Dados:
• Mensagens ADS-B em formato SBS-1
• 04/03/2015 a 08/04/2015
• 1.5 M mensagens (total)
• 204 K mensagens consideradas no
cálculo da trajetória média
NOV 2014 – Trajetória Média
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
Áreas agrupadas:
- Nível inferior: 0 a 149 FL
- Nível superior: 150 a 999 FL
1 semana de dados:
33 milhões de detecções radar
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
TERÇA
SÁBADO
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
Ocupação da área 07 – ACCBS – 21/09/2015
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Mapa de Calor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Atech Data Intelligence Platform
Collaboration
IHM
V3D
DS3
COTS tools
Open-source tools
IHM improvements
DA
Statistical Analytics
Semantic Analytics
Text Analytics
Machine Learning
Visual Analytics
Pattern Recognition
DF
Data Association
Decision Fusion
State Estimation
DB
HDFS
Log
Sensors
Legacy
Intelligence
IoT
Devices
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Atividade de Cooperação: Atech – DT Sistemas Embraer
1. Plataformas e Arquiteturas
Knowledge Sharing (19 a 22/12)
• Treinamento teórico DT Sistemas – Atech
• Workshop Atech – DT Sistemas
Ideias para o desenvolvimento de PoCs
• Dados abertos e dados “privados”
• Cloud e infra local
• Frameworks  agilidade e flexibilidade
• Algoritmos:
• Classificação, agrupamento ou associação
de resultados
• Melhor diagnóstico e prognóstico
• Visualizações dinâmicas
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (WEBINT)
• 1 alvo  412 vínculos classificados por grau de iteração
• Reconstrução de perfis fechados do Facebook
• Web crawling nos sites Escavador e do TCU
• ~200K vínculos para 1 e 2 níveis de distância da rede
• Resultado: rede de relacionamentos do alvo e seus vínculos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (OSINT)
• 2 x Server Dell PowerEdge R630 with 24
cores,384GB RAM, and 8 x 1.2TB SAS HDD
• 1 VM Geoserver, 2 VM data ingestion, 2 VM IHM
• 145 alvos; 23K empresas; 5K pessoas; 8K voos;
15K registros sobre co-indiciamento; eleições
2014/2016; 6K contratos
• ~ 5TB de dados
• Resultado: Rede de alvos e evidências claras
de suspeitos ilícitos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (Attivio)
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Data Scientist
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
The dream is over?
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Everyone talks about it,
nobody really knows how
to do it, everyone thinks
everyone else is doing it,
so everyone claims they
are doing it...”
“Big Data is like
tennage sex:
“Predictably Irrational”
Dan Ariely
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
OBRIGADO!
www.atech.com.br
contato@atech.com.br
SÃO JOSÉ DOS CAMPOS
Rodovia Presidente Dutra, KM 138
Bloco 3, Sala 302
+55 12 3878-4373
SÃO PAULO
Rua do Rocio, 313 - 4° andar
Vila Olímpia
+55 11 3103-4600
ATECH Talks
Apresentações e discussões sobre assuntos
técnicos de interesse.
SDTA
Ciclo de palestras anual para compartilhamento
de conhecimentos desenvolvidos e/ou de
interesse dos colaboradores.
UX CAFÉ
Encontro mensal com o objetivo de debater sobre
os temas usabilidade, design e experiência do
usuário.

Mais conteúdo relacionado

Semelhante a II SDTA - Do Big Data à Inteligência Corporativa

Cloud Computing - Computação em Nuvem
Cloud Computing - Computação em NuvemCloud Computing - Computação em Nuvem
Cloud Computing - Computação em NuvemCompanyWeb
 
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem Híbrida
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem HíbridaApresentação na Futurecom 2014 - Casos de Uso da Nuvem Híbrida
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem HíbridaWesley Almeida
 
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e Inovação
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e InovaçãoO Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e Inovação
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e InovaçãoThomas Buck
 
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0CESAR
 
Congresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoCongresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoFernando Botafogo
 
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvem
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvemATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvem
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvemATMOSPHERE .
 
8ª Conseguro - Cristina Mano
8ª Conseguro - Cristina Mano8ª Conseguro - Cristina Mano
8ª Conseguro - Cristina ManoCNseg
 
PLM Summit 2018 Apresentação 03a
PLM Summit 2018 Apresentação 03aPLM Summit 2018 Apresentação 03a
PLM Summit 2018 Apresentação 03aCADWARE-TECHNOLOGY
 
Engenharia do conhecimento: quando os dados falam
Engenharia do conhecimento: quando os dados falamEngenharia do conhecimento: quando os dados falam
Engenharia do conhecimento: quando os dados falamRoberto C. S. Pacheco
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...Eduardo Hahn
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
Harvard Business Review - LGPD
Harvard Business Review - LGPDHarvard Business Review - LGPD
Harvard Business Review - LGPDThiago Santiago
 
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...tdc-globalcode
 
Webinar projetos e ti - business intelligence - como fazer
Webinar   projetos e ti - business intelligence - como fazerWebinar   projetos e ti - business intelligence - como fazer
Webinar projetos e ti - business intelligence - como fazerProjetos e TI
 
LGPD - Webinar Cloudera e FIAP
LGPD - Webinar Cloudera e FIAPLGPD - Webinar Cloudera e FIAP
LGPD - Webinar Cloudera e FIAPThiago Santiago
 

Semelhante a II SDTA - Do Big Data à Inteligência Corporativa (20)

Cloud Computing - Computação em Nuvem
Cloud Computing - Computação em NuvemCloud Computing - Computação em Nuvem
Cloud Computing - Computação em Nuvem
 
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem Híbrida
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem HíbridaApresentação na Futurecom 2014 - Casos de Uso da Nuvem Híbrida
Apresentação na Futurecom 2014 - Casos de Uso da Nuvem Híbrida
 
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e Inovação
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e InovaçãoO Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e Inovação
O Futuro da Engenharia sob a Ótica da Ciência, Tecnologia e Inovação
 
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0
[CESAR REPORTS] Industrial Internet of Things: A Revolução da Indústria 4.0
 
Congresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoCongresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco Aquino
 
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvem
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvemATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvem
ATMOSPHERE - RNP Webinar Cooperação TIC sobre computação em nuvem
 
8ª Conseguro - Cristina Mano
8ª Conseguro - Cristina Mano8ª Conseguro - Cristina Mano
8ª Conseguro - Cristina Mano
 
PLM Summit 2018 Apresentação 03a
PLM Summit 2018 Apresentação 03aPLM Summit 2018 Apresentação 03a
PLM Summit 2018 Apresentação 03a
 
Engenharia do conhecimento: quando os dados falam
Engenharia do conhecimento: quando os dados falamEngenharia do conhecimento: quando os dados falam
Engenharia do conhecimento: quando os dados falam
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Harvard Business Review - LGPD
Harvard Business Review - LGPDHarvard Business Review - LGPD
Harvard Business Review - LGPD
 
Gravação_Sunlytics PitchDeck.PDF
Gravação_Sunlytics PitchDeck.PDFGravação_Sunlytics PitchDeck.PDF
Gravação_Sunlytics PitchDeck.PDF
 
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...
TDC2018SP | Trilha Arquitetura Corporativa - EA + IA: como dar maturidade às ...
 
Webinar projetos e ti - business intelligence - como fazer
Webinar   projetos e ti - business intelligence - como fazerWebinar   projetos e ti - business intelligence - como fazer
Webinar projetos e ti - business intelligence - como fazer
 
LL2#26
LL2#26LL2#26
LL2#26
 
LGPD - Webinar Cloudera e FIAP
LGPD - Webinar Cloudera e FIAPLGPD - Webinar Cloudera e FIAP
LGPD - Webinar Cloudera e FIAP
 

Mais de Atech S.A. | Embraer Group

III SDTA - Seleção e Coordenação de Times Ágeis na Atech
III SDTA - Seleção e Coordenação de Times Ágeis na AtechIII SDTA - Seleção e Coordenação de Times Ágeis na Atech
III SDTA - Seleção e Coordenação de Times Ágeis na AtechAtech S.A. | Embraer Group
 
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)Atech S.A. | Embraer Group
 
III SDTA - Framework SCRUM no Processo de Desenvolvimento de Sistemas
III SDTA - Framework SCRUM no Processo de Desenvolvimento de SistemasIII SDTA - Framework SCRUM no Processo de Desenvolvimento de Sistemas
III SDTA - Framework SCRUM no Processo de Desenvolvimento de SistemasAtech S.A. | Embraer Group
 
III SDTA - Estimativas x Metodologias de Desenvolvimento
III SDTA - Estimativas x Metodologias de DesenvolvimentoIII SDTA - Estimativas x Metodologias de Desenvolvimento
III SDTA - Estimativas x Metodologias de DesenvolvimentoAtech S.A. | Embraer Group
 
III SDTA - Estamos Resolvendo o Problema Certo?
III SDTA - Estamos Resolvendo o Problema Certo?III SDTA - Estamos Resolvendo o Problema Certo?
III SDTA - Estamos Resolvendo o Problema Certo?Atech S.A. | Embraer Group
 
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)Atech S.A. | Embraer Group
 
III SDTA - Descomplicando Integrações de Sistemas com Barramento de Serviços
III SDTA - Descomplicando Integrações de Sistemas com Barramento de ServiçosIII SDTA - Descomplicando Integrações de Sistemas com Barramento de Serviços
III SDTA - Descomplicando Integrações de Sistemas com Barramento de ServiçosAtech S.A. | Embraer Group
 
III SDTA - Arkhe Governance: do Conceito ao Mercado
III SDTA - Arkhe Governance: do Conceito ao MercadoIII SDTA - Arkhe Governance: do Conceito ao Mercado
III SDTA - Arkhe Governance: do Conceito ao MercadoAtech S.A. | Embraer Group
 
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...Atech S.A. | Embraer Group
 
II SDTA - Comando e Controle da 5a Dimensão Operacional
II SDTA - Comando e Controle da 5a Dimensão OperacionalII SDTA - Comando e Controle da 5a Dimensão Operacional
II SDTA - Comando e Controle da 5a Dimensão OperacionalAtech S.A. | Embraer Group
 
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa Aeroespacial
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa AeroespacialII SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa Aeroespacial
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa AeroespacialAtech S.A. | Embraer Group
 
II SDTA - Paralelismo e Processamento Acústico
II SDTA - Paralelismo e Processamento AcústicoII SDTA - Paralelismo e Processamento Acústico
II SDTA - Paralelismo e Processamento AcústicoAtech S.A. | Embraer Group
 
II SDTA - Sistemas Especiais do Controle Nuclear
II SDTA - Sistemas Especiais do Controle NuclearII SDTA - Sistemas Especiais do Controle Nuclear
II SDTA - Sistemas Especiais do Controle NuclearAtech S.A. | Embraer Group
 

Mais de Atech S.A. | Embraer Group (20)

III SDTA - Seleção e Coordenação de Times Ágeis na Atech
III SDTA - Seleção e Coordenação de Times Ágeis na AtechIII SDTA - Seleção e Coordenação de Times Ágeis na Atech
III SDTA - Seleção e Coordenação de Times Ágeis na Atech
 
III SDTA - Práticas de GC na Atech
III SDTA - Práticas de GC na AtechIII SDTA - Práticas de GC na Atech
III SDTA - Práticas de GC na Atech
 
III SDTA - Pentaho PDI na Prática
III SDTA - Pentaho PDI na PráticaIII SDTA - Pentaho PDI na Prática
III SDTA - Pentaho PDI na Prática
 
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)
III SDTA - Modelos Híbridos de Gestão de Projetos (SCRUM + PMBOK)
 
III SDTA - Framework SCRUM no Processo de Desenvolvimento de Sistemas
III SDTA - Framework SCRUM no Processo de Desenvolvimento de SistemasIII SDTA - Framework SCRUM no Processo de Desenvolvimento de Sistemas
III SDTA - Framework SCRUM no Processo de Desenvolvimento de Sistemas
 
III SDTA - Estimativas x Metodologias de Desenvolvimento
III SDTA - Estimativas x Metodologias de DesenvolvimentoIII SDTA - Estimativas x Metodologias de Desenvolvimento
III SDTA - Estimativas x Metodologias de Desenvolvimento
 
III SDTA - Estamos Resolvendo o Problema Certo?
III SDTA - Estamos Resolvendo o Problema Certo?III SDTA - Estamos Resolvendo o Problema Certo?
III SDTA - Estamos Resolvendo o Problema Certo?
 
III SDTA - DEVOPS na Atech?
III SDTA - DEVOPS na Atech?III SDTA - DEVOPS na Atech?
III SDTA - DEVOPS na Atech?
 
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)
III SDTA - Processo para Desenvolvimento de Software Seguro (Embarcado e ATM)
 
III SDTA - Descomplicando Integrações de Sistemas com Barramento de Serviços
III SDTA - Descomplicando Integrações de Sistemas com Barramento de ServiçosIII SDTA - Descomplicando Integrações de Sistemas com Barramento de Serviços
III SDTA - Descomplicando Integrações de Sistemas com Barramento de Serviços
 
III SDTA - Arkhe Governance: do Conceito ao Mercado
III SDTA - Arkhe Governance: do Conceito ao MercadoIII SDTA - Arkhe Governance: do Conceito ao Mercado
III SDTA - Arkhe Governance: do Conceito ao Mercado
 
II SDTA - Vantagens do Protótipo Navegável
II SDTA - Vantagens do Protótipo NavegávelII SDTA - Vantagens do Protótipo Navegável
II SDTA - Vantagens do Protótipo Navegável
 
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...
II SDTA - Melhorando as Experiências do Usuário para Ganhar em Produtividade ...
 
II SDTA - Tecnologias de Submarinos
II SDTA - Tecnologias de SubmarinosII SDTA - Tecnologias de Submarinos
II SDTA - Tecnologias de Submarinos
 
II SDTA - Comando e Controle da 5a Dimensão Operacional
II SDTA - Comando e Controle da 5a Dimensão OperacionalII SDTA - Comando e Controle da 5a Dimensão Operacional
II SDTA - Comando e Controle da 5a Dimensão Operacional
 
II SDTA - Battlefield Management System
II SDTA - Battlefield Management SystemII SDTA - Battlefield Management System
II SDTA - Battlefield Management System
 
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa Aeroespacial
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa AeroespacialII SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa Aeroespacial
II SDTA - Ciclo de C2 e a Evolução das Soluções de Defesa Aeroespacial
 
II SDTA - Paralelismo e Processamento Acústico
II SDTA - Paralelismo e Processamento AcústicoII SDTA - Paralelismo e Processamento Acústico
II SDTA - Paralelismo e Processamento Acústico
 
II SDTA - Sistemas Especiais do Controle Nuclear
II SDTA - Sistemas Especiais do Controle NuclearII SDTA - Sistemas Especiais do Controle Nuclear
II SDTA - Sistemas Especiais do Controle Nuclear
 
II SDTA - Produtos de Defesa e Segurança
II SDTA - Produtos de Defesa e SegurançaII SDTA - Produtos de Defesa e Segurança
II SDTA - Produtos de Defesa e Segurança
 

II SDTA - Do Big Data à Inteligência Corporativa

  • 1. Realização DO BIG DATA À INTELIGÊNCIA CORPORATIVA Claudinei Walker II SDTA / 2016
  • 2. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 3. Libreria Acqua Alta, VenezaEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 4. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 5. Censo Americano de 1890 0 1 2 3 4 5 6 7 MILHÕES 1890 United States Census Total Population 61M https://en.wikipedia.org/wiki/1890_United_States_Census Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 6. Censo Americano de 1890 https://en.wikipedia.org/wiki/1890_United_States_Census Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 7. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 8. Estimativa 1 registro =~ 3 Kbytes 61 M registros =~ 190 GBytes Em 1890, um problema de Big Data! 99% dos dados foram perdidos em um incêndio em 1921! Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 9. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 10. Advento da internet nos anos 90: explosão na geração de dados não estruturados Copyright ©2012 Accenture All rights reserved. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 11. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 12. Foco na alta disponibilidade dos dados http://backtobazics.com/big-data/hadoop/simple-explanation-of-hadoop-core-components-hdfs-and-mapreduce/ HDFS Architecture Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 13. Mover a computação para os dados http://www.docsity.com/en/news/algorithms/5-algorithms-widely-industry/ Map Reduce Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 14. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 15. Volume Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 16. Volume Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 17. Velocidade Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 18. Velocidade Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 19. Variedade Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 20. Variedade Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 21. Definição do Gartner Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 22. Definição do Gartner Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 23. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 24. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 25. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 26. 1º Paradigma - milhares de anos atrás • Ciência fundamentalmente empírica e baseada na observação e descrição dos fenômenos naturais Kala-Rahu Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 27. Conceitos 2º Paradigma – séculos atrás • Uso de teorias, modelos e generalizações Equações de Maxwell Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 28. 3º Paradigma – algumas décadas atrás • Abordagem computacional • Simulação de fenômenos complexos Hansen et al. (2009)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 29. 4º Paradigma – Hoje • Exploração de dados; • Unificação da teoria, experimentação e simulação; • Dados capturados por instrumentos ou gerados por simulação; • Informação/Conhecimento armazenado em computadores; • Obtenção do conhecimento a partir da análise de dados. C. Walker (2006)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 30. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 31. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 32. Dados tradicionais em uma companhia: • Dados transacionais de ERPs • Sistemas CRM • Transações WEB • Dados financeiros Volume: • Gigabytes (109) • Terabytes (1012) Velocidade: • Batch ou near real-time • Em geral não exige resposta imediata Variedade: • Estruturados • Não-estruturados Valor: • BI, análise e relatórios Dados gerados fora da empresa por fontes de dados não tradicionais, incluindo: • Media social • Dados de sensores (IOT) • Dados de Logs • Device Data • Video, imagens, etc. Volume: • Terabytes (1012) • Petabytes (1015) • Exabytes (1018) • Zettabytes (1021) Velocidade: • Frequentemente em tempo-real • Exigem resposta imediata Variedade: • Estruturados • Não-estruturados • Semiestruturados Valor: • Análises preditivas avançadas • Insights para os negócios Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 33. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 34. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 35. Modelos de Processamento Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 36. Persistência Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 37. Persistência: chave-valor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 38. Persistência: column store Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 39. Persistência: Documentos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 40. Persistência: Grafos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 41. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 42. Common Pipeline – Aquisição, transformação, processamento e visualização Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 43. Common Pipeline – Aquisição, transformação, processamento e visualização Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 44. MATLAB 3D animation of AT over LEVC by @JorgeGT Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 45. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 46. Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Por que aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 47. Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Por que aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor • Descrição simplificada dos dados • Reports com informações históricas • OLAP, BI, Dashboards • Data mining • OLAP, BI, Dashboards • Regressão linear • Predição e probabilidades futuras • Data mining para extração de padrões • Regressão linear e logística • Foco na tomada de decisão e eficiência • Uso de técnicas de otimização para a busca de soluções ótimas • Uso de simulações para obter insights e identificar problemas Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 48. Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Por que aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 49. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 50. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 51. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 52. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 53. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 54. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 55. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 56. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 57. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 58. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 59. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 60. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 61. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 62. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 63. Inconsciente Consciente Experimental Oportunista Estratégico Transformador • Inércia • Terceirização • Imaturidade em BI • Ausência de cases • Stakeholders x Oportunidades • Tecnologia? • Ausência de conhecimento sobre o tema e Governança da Informação • Conceitos estabelecidos • POCs executadas • APPs em “silos” • Implantação de LDW • Soluções customizadas • > nível maturidade • Acompanhar evolução tecnológica • Implantação de CDM • Catálogo de dados • Avaliação da maturidade em BI • Plano de melhorias • Plano de aculturamento • Selecionar business cases • Gerar MVPs • Levantamento da Governança da Informação • Plano de desenvolvimento • Promover a cultura em Big Data • Revisitar considerações iniciais • Ajustar estratégias • Avaliar lições aprendidas • Estabelecimento da Governança • HW/SW estabilizados • Tema Big Data é algo normal • Operacionalizar infra HW/SW • Planos de capacitação e suporte • Completar adoção de LDW • Formação de times multidisciplinares • Selecionar melhores ideias • Desenvolver POCs • Selecionar tecnologias Roadmap *LDW: Logical Data WarehouseEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 64. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 65. NOV 2014 ~100 K flights/day/world! ~8K flight/day/Brazil Huge amount of data! Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 66. NOV 2014 Pistas ADS-B ~ 10 GB entre NOV14 e NOV15 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 67. NOV 2014 – Trajetória Média 𝜃 (𝑙𝑎𝑡) 𝜌 (𝑙𝑜𝑛) 𝛼 (𝑎𝑙𝑡) 𝜃 𝜌 𝛼 𝐿 𝑎 𝑘 = 1 𝑛 𝑖=1 𝑛 𝜃𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝐿 𝑔 𝑘 = 1 𝑛 𝑖=1 𝑛 𝜌𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝐴 𝑘 = 1 𝑛 𝑖=1 𝑛 𝛼𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝑝 𝑘 = (𝐿 𝑔 𝑘 , 𝐿 𝑎 𝑘 , 𝐴 𝑘 ) 𝑛 = #𝑑𝑎𝑡𝑎 𝑝𝑜𝑖𝑛𝑡𝑠 Π = (𝑝1, 𝑝2, … , 𝑝 𝑘) 𝑇 𝑚 = 𝑔𝑟𝑖𝑑 𝑓𝑎𝑐𝑡𝑜𝑟 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 68. Dados: • Mensagens ADS-B em formato SBS-1 • 04/03/2015 a 08/04/2015 • 1.5 M mensagens (total) • 204 K mensagens consideradas no cálculo da trajetória média NOV 2014 – Trajetória Média Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 69. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 70. MAR 2015 – Ocupação de Setores Áreas agrupadas: - Nível inferior: 0 a 149 FL - Nível superior: 150 a 999 FL 1 semana de dados: 33 milhões de detecções radar Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 71. MAR 2015 – Ocupação de Setores TERÇA SÁBADO Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 72. MAR 2015 – Ocupação de Setores Ocupação da área 07 – ACCBS – 21/09/2015 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 73. MAR 2015 – Mapa de Calor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 74. Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em uma série de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 75. Atech Data Intelligence Platform Collaboration IHM V3D DS3 COTS tools Open-source tools IHM improvements DA Statistical Analytics Semantic Analytics Text Analytics Machine Learning Visual Analytics Pattern Recognition DF Data Association Decision Fusion State Estimation DB HDFS Log Sensors Legacy Intelligence IoT Devices Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 76. Atividade de Cooperação: Atech – DT Sistemas Embraer 1. Plataformas e Arquiteturas Knowledge Sharing (19 a 22/12) • Treinamento teórico DT Sistemas – Atech • Workshop Atech – DT Sistemas Ideias para o desenvolvimento de PoCs • Dados abertos e dados “privados” • Cloud e infra local • Frameworks  agilidade e flexibilidade • Algoritmos: • Classificação, agrupamento ou associação de resultados • Melhor diagnóstico e prognóstico • Visualizações dinâmicas Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 77. Provas de Conceito – Segurança Pública (WEBINT) • 1 alvo  412 vínculos classificados por grau de iteração • Reconstrução de perfis fechados do Facebook • Web crawling nos sites Escavador e do TCU • ~200K vínculos para 1 e 2 níveis de distância da rede • Resultado: rede de relacionamentos do alvo e seus vínculos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 78. Provas de Conceito – Segurança Pública (OSINT) • 2 x Server Dell PowerEdge R630 with 24 cores,384GB RAM, and 8 x 1.2TB SAS HDD • 1 VM Geoserver, 2 VM data ingestion, 2 VM IHM • 145 alvos; 23K empresas; 5K pessoas; 8K voos; 15K registros sobre co-indiciamento; eleições 2014/2016; 6K contratos • ~ 5TB de dados • Resultado: Rede de alvos e evidências claras de suspeitos ilícitos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 79. Provas de Conceito – Segurança Pública (Attivio) Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 80. Data Scientist Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 81. The dream is over? Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 82. Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it...” “Big Data is like tennage sex: “Predictably Irrational” Dan Ariely Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 83. OBRIGADO! www.atech.com.br contato@atech.com.br SÃO JOSÉ DOS CAMPOS Rodovia Presidente Dutra, KM 138 Bloco 3, Sala 302 +55 12 3878-4373 SÃO PAULO Rua do Rocio, 313 - 4° andar Vila Olímpia +55 11 3103-4600 ATECH Talks Apresentações e discussões sobre assuntos técnicos de interesse. SDTA Ciclo de palestras anual para compartilhamento de conhecimentos desenvolvidos e/ou de interesse dos colaboradores. UX CAFÉ Encontro mensal com o objetivo de debater sobre os temas usabilidade, design e experiência do usuário.