2. Transformando Grandes
Volumes de Dados em
Insight em Tempo Real
usando Fast Data & CEPusando Fast Data & CEP
Ricardo Ferreira
Java, FMW & Engineered Systems Expert
ricardo.s.ferreira@oracle.com
5. Explosão de
Dados
As redes sociais e
alguns websites
foram os primeiros
5
foram os primeiros
a serem afetados...
6. … mas agora isso já é problema das
corporações também
… but
enterprises are
also facing it
now
6
Empresas implantando sensores inteligentes?
200x mais informação indo aos data centers!
Fonte: http://www.oracle.com/us/corporate/press/1704764
7. Storage is the first obvious
problem.
Analysis is next.
Storage é o primeiro dos problemas.
Análise é sem dúvida o segundo.
“Big Data Is Not About the
Created Content, nor Is It
Even Its Consumption
— It Is the Analysis of All
the Data Surrounding or
7
Swirling Around It“
IDC’s Digital Universe
Study, June 2011
8. 1. Big Data ≠ Storage Infinito
Sim, storage é barato mas você precisa
filtrar os dados e eliminar as redundâncias
2. Apache Hadoop é orientado a batch, e
Implementando Big Data: Alguns dos Desafios
Big Data resolve realmente tudo?
8
2. Apache Hadoop é orientado a batch, e
existe nele uma grande latência inerente
"With the paths that go through Hadoop [at
Yahoo!], the latency is about fifteen minutes
[…] it will never be true real-time. " *
Raymie Stata, Yahoo! CTO
(June 2011)
*: http://www.theregister.co.uk/2011/06/30/yahoo_hadoop_and_realtime/
mins, hrs
9. Diferenciando-se em Big Data: Fast Data!
Filtragem,
correlação
1. Filtragem de Dados & Correlação
Elimine os “ruídos” tais como leituras de ticks
sem alteração de dados. Crie contextos para
os dados correlacionando múltiplas fontes de
Aplicando Event Processing, CEP
9
os dados correlacionando múltiplas fontes de
dados simultâneamente.
2. Identifique situações críticas do negócio
(oportunidades ou ameaças) a medida
que os dados são inseridos no HDFS
Mova a parte de análise que é crítica e
sensível a tempo para o inicio do processo
10. Fast Data versus Big Data
Principais cenários e casos de utilização
Big Data
mins, hrsµs, ms
Fast Data
:deep
Historicaldepth:
shallow
Exemplo:
Análise de padrões
de tráfego e dos
congestionamentos
para planejamento
urbano de cidades.
10
Historicaldepth:deep
Historicaldepth
shallow
Exemplo:
Monitoração de
câmeras de tráfego
para garantir que a
mesma placa não
esteja sendo usada
em dois veículos.
Adicione mais “profundidade” ao seu Fast Data
mesclando eventos com as saídas do Map/Reduce