Realização
DO BIG DATA À INTELIGÊNCIA CORPORATIVA
Claudinei Walker
II SDTA / 2016
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Libreria Acqua Alta, VenezaEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Censo Americano de 1890
0
1
2
3
4
5
6
7
MILHÕES
1890 United States Census
Total Population 61M
https://en.wikipedia.org/wiki/1890_United_States_Census
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Censo Americano de 1890
https://en.wikipedia.org/wiki/1890_United_States_Census
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Estimativa
1 registro =~ 3 Kbytes
61 M registros =~ 190 GBytes
Em 1890, um
problema de Big Data!
99% dos dados foram perdidos em um incêndio em 1921!
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Advento da internet nos anos 90: explosão na geração de dados não estruturados
Copyright ©2012 Accenture All rights reserved.
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Foco na alta
disponibilidade
dos dados
http://backtobazics.com/big-data/hadoop/simple-explanation-of-hadoop-core-components-hdfs-and-mapreduce/
HDFS Architecture
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Mover a computação
para os dados
http://www.docsity.com/en/news/algorithms/5-algorithms-widely-industry/
Map Reduce
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Volume
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Volume
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Velocidade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Velocidade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Variedade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Variedade
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Definição do Gartner
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Definição do Gartner
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
1º Paradigma - milhares de anos
atrás
• Ciência fundamentalmente empírica
e baseada na observação e
descrição dos fenômenos naturais
Kala-Rahu
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Conceitos
2º Paradigma – séculos atrás
• Uso de teorias, modelos e
generalizações
Equações de Maxwell
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
3º Paradigma – algumas décadas
atrás
• Abordagem computacional
• Simulação de fenômenos
complexos
Hansen et al. (2009)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
4º Paradigma – Hoje
• Exploração de dados;
• Unificação da teoria,
experimentação e simulação;
• Dados capturados por
instrumentos ou gerados por
simulação;
• Informação/Conhecimento
armazenado em computadores;
• Obtenção do conhecimento a
partir da análise de dados.
C. Walker (2006)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Dados tradicionais em uma
companhia:
• Dados transacionais de ERPs
• Sistemas CRM
• Transações WEB
• Dados financeiros
Volume:
• Gigabytes (109)
• Terabytes (1012)
Velocidade:
• Batch ou near real-time
• Em geral não exige resposta
imediata
Variedade:
• Estruturados
• Não-estruturados
Valor:
• BI, análise e relatórios
Dados gerados fora da empresa
por fontes de dados não
tradicionais, incluindo:
• Media social
• Dados de sensores (IOT)
• Dados de Logs
• Device Data
• Video, imagens, etc.
Volume:
• Terabytes (1012)
• Petabytes (1015)
• Exabytes (1018)
• Zettabytes (1021)
Velocidade:
• Frequentemente em tempo-real
• Exigem resposta imediata
Variedade:
• Estruturados
• Não-estruturados
• Semiestruturados
Valor:
• Análises preditivas avançadas
• Insights para os negócios
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Modelos de Processamento
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: chave-valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: column store
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: Documentos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Persistência: Grafos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Common Pipeline – Aquisição, transformação, processamento e visualização
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Common Pipeline – Aquisição, transformação, processamento e visualização
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MATLAB 3D animation of AT over LEVC by @JorgeGT
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
• Descrição simplificada dos dados
• Reports com informações históricas
• OLAP, BI, Dashboards
• Data mining
• OLAP, BI, Dashboards
• Regressão linear
• Predição e probabilidades futuras
• Data mining para extração de
padrões
• Regressão linear e logística
• Foco na tomada de decisão e eficiência
• Uso de técnicas de otimização para a busca de
soluções ótimas
• Uso de simulações para obter insights e identificar
problemas
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Prescritivo
Preditivo
Diagnóstico
Descritivo
O que aconteceu?
Por que aconteceu?
O que irá acontecer?
Como podemos
fazer acontecer?
Complexidade
Valor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Inconsciente Consciente Experimental
Oportunista Estratégico Transformador
• Inércia
• Terceirização
• Imaturidade em BI
• Ausência de cases
• Stakeholders x
Oportunidades
• Tecnologia?
• Ausência de
conhecimento sobre
o tema e Governança
da Informação
• Conceitos
estabelecidos
• POCs executadas
• APPs em “silos”
• Implantação de LDW
• Soluções
customizadas
• > nível maturidade
• Acompanhar
evolução tecnológica
• Implantação de CDM
• Catálogo de
dados
• Avaliação da
maturidade em BI
• Plano de
melhorias
• Plano de
aculturamento
• Selecionar business
cases
• Gerar MVPs
• Levantamento da
Governança da
Informação
• Plano de
desenvolvimento
• Promover a cultura em
Big Data
• Revisitar
considerações
iniciais
• Ajustar estratégias
• Avaliar lições
aprendidas
• Estabelecimento da
Governança
• HW/SW
estabilizados
• Tema Big Data é algo
normal
• Operacionalizar infra
HW/SW
• Planos de capacitação
e suporte
• Completar adoção de
LDW
• Formação de times
multidisciplinares
• Selecionar melhores ideias
• Desenvolver POCs
• Selecionar tecnologias
Roadmap
*LDW: Logical Data WarehouseEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014
~100 K flights/day/world!
~8K flight/day/Brazil
Huge amount of data!
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014
Pistas ADS-B
~ 10 GB entre
NOV14 e NOV15
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
NOV 2014 – Trajetória Média
𝜃 (𝑙𝑎𝑡)
𝜌 (𝑙𝑜𝑛)
𝛼 (𝑎𝑙𝑡)
𝜃
𝜌
𝛼
𝐿 𝑎
𝑘 =
1
𝑛
𝑖=1
𝑛
𝜃𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝐿 𝑔
𝑘
=
1
𝑛
𝑖=1
𝑛
𝜌𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝐴 𝑘 =
1
𝑛
𝑖=1
𝑛
𝛼𝑖
𝑘
, 𝑘 = 1, … , 𝑚
𝑝 𝑘
= (𝐿 𝑔
𝑘
, 𝐿 𝑎
𝑘
, 𝐴 𝑘
)
𝑛 = #𝑑𝑎𝑡𝑎 𝑝𝑜𝑖𝑛𝑡𝑠
Π = (𝑝1, 𝑝2, … , 𝑝 𝑘) 𝑇
𝑚 = 𝑔𝑟𝑖𝑑 𝑓𝑎𝑐𝑡𝑜𝑟
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Dados:
• Mensagens ADS-B em formato SBS-1
• 04/03/2015 a 08/04/2015
• 1.5 M mensagens (total)
• 204 K mensagens consideradas no
cálculo da trajetória média
NOV 2014 – Trajetória Média
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
Áreas agrupadas:
- Nível inferior: 0 a 149 FL
- Nível superior: 150 a 999 FL
1 semana de dados:
33 milhões de detecções radar
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
TERÇA
SÁBADO
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Ocupação de Setores
Ocupação da área 07 – ACCBS – 21/09/2015
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
MAR 2015 – Mapa de Calor
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Big Data
Histórico
Técnicos
Negócios
Conceitos
4º
Paradigma
baseia-se em
uma série de
proporciona a
criação de novos
apresenta um
série de aspectos
está associado
a um contexto
Definição
do
Gartner
Surgimento
da Web
Novos
paradigmas
computacionais
como o
que motivou o
estabelecimento de
Plataformas
e
arquiteturas
Cognitive
Computing
Common
pipeline
Analytics
Small X Big
Data
Cases
Na
Atech?
Futuro?
um deles o
Onde o mercado
adota a
que permitem
diferenciar
em infra
como
adotando um
com modelos
de
e modelos de
onde já existem vários
e experimentações
nos preparando
Computação
eletromecânica
e existe desde a
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Atech Data Intelligence Platform
Collaboration
IHM
V3D
DS3
COTS tools
Open-source tools
IHM improvements
DA
Statistical Analytics
Semantic Analytics
Text Analytics
Machine Learning
Visual Analytics
Pattern Recognition
DF
Data Association
Decision Fusion
State Estimation
DB
HDFS
Log
Sensors
Legacy
Intelligence
IoT
Devices
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Atividade de Cooperação: Atech – DT Sistemas Embraer
1. Plataformas e Arquiteturas
Knowledge Sharing (19 a 22/12)
• Treinamento teórico DT Sistemas – Atech
• Workshop Atech – DT Sistemas
Ideias para o desenvolvimento de PoCs
• Dados abertos e dados “privados”
• Cloud e infra local
• Frameworks  agilidade e flexibilidade
• Algoritmos:
• Classificação, agrupamento ou associação
de resultados
• Melhor diagnóstico e prognóstico
• Visualizações dinâmicas
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (WEBINT)
• 1 alvo  412 vínculos classificados por grau de iteração
• Reconstrução de perfis fechados do Facebook
• Web crawling nos sites Escavador e do TCU
• ~200K vínculos para 1 e 2 níveis de distância da rede
• Resultado: rede de relacionamentos do alvo e seus vínculos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (OSINT)
• 2 x Server Dell PowerEdge R630 with 24
cores,384GB RAM, and 8 x 1.2TB SAS HDD
• 1 VM Geoserver, 2 VM data ingestion, 2 VM IHM
• 145 alvos; 23K empresas; 5K pessoas; 8K voos;
15K registros sobre co-indiciamento; eleições
2014/2016; 6K contratos
• ~ 5TB de dados
• Resultado: Rede de alvos e evidências claras
de suspeitos ilícitos
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Provas de Conceito – Segurança Pública (Attivio)
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Data Scientist
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
The dream is over?
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
Everyone talks about it,
nobody really knows how
to do it, everyone thinks
everyone else is doing it,
so everyone claims they
are doing it...”
“Big Data is like
tennage sex:
“Predictably Irrational”
Dan Ariely
Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
OBRIGADO!
www.atech.com.br
contato@atech.com.br
SÃO JOSÉ DOS CAMPOS
Rodovia Presidente Dutra, KM 138
Bloco 3, Sala 302
+55 12 3878-4373
SÃO PAULO
Rua do Rocio, 313 - 4° andar
Vila Olímpia
+55 11 3103-4600
ATECH Talks
Apresentações e discussões sobre assuntos
técnicos de interesse.
SDTA
Ciclo de palestras anual para compartilhamento
de conhecimentos desenvolvidos e/ou de
interesse dos colaboradores.
UX CAFÉ
Encontro mensal com o objetivo de debater sobre
os temas usabilidade, design e experiência do
usuário.

II SDTA - Do Big Data à Inteligência Corporativa

  • 1.
    Realização DO BIG DATAÀ INTELIGÊNCIA CORPORATIVA Claudinei Walker II SDTA / 2016
  • 2.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 3.
    Libreria Acqua Alta,VenezaEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 4.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 5.
    Censo Americano de1890 0 1 2 3 4 5 6 7 MILHÕES 1890 United States Census Total Population 61M https://en.wikipedia.org/wiki/1890_United_States_Census Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 6.
    Censo Americano de1890 https://en.wikipedia.org/wiki/1890_United_States_Census Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 7.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 8.
    Estimativa 1 registro =~3 Kbytes 61 M registros =~ 190 GBytes Em 1890, um problema de Big Data! 99% dos dados foram perdidos em um incêndio em 1921! Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 9.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 10.
    Advento da internetnos anos 90: explosão na geração de dados não estruturados Copyright ©2012 Accenture All rights reserved. Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 11.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 12.
    Foco na alta disponibilidade dosdados http://backtobazics.com/big-data/hadoop/simple-explanation-of-hadoop-core-components-hdfs-and-mapreduce/ HDFS Architecture Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 13.
    Mover a computação paraos dados http://www.docsity.com/en/news/algorithms/5-algorithms-widely-industry/ Map Reduce Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 14.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 15.
    Volume Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 16.
    Volume Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 17.
    Velocidade Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 18.
    Velocidade Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 19.
    Variedade Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 20.
    Variedade Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 21.
    Definição do Gartner Estainformação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 22.
    Definição do Gartner Estainformação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 23.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 24.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 25.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 26.
    1º Paradigma -milhares de anos atrás • Ciência fundamentalmente empírica e baseada na observação e descrição dos fenômenos naturais Kala-Rahu Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 27.
    Conceitos 2º Paradigma –séculos atrás • Uso de teorias, modelos e generalizações Equações de Maxwell Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 28.
    3º Paradigma –algumas décadas atrás • Abordagem computacional • Simulação de fenômenos complexos Hansen et al. (2009)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 29.
    4º Paradigma –Hoje • Exploração de dados; • Unificação da teoria, experimentação e simulação; • Dados capturados por instrumentos ou gerados por simulação; • Informação/Conhecimento armazenado em computadores; • Obtenção do conhecimento a partir da análise de dados. C. Walker (2006)Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 30.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 31.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 32.
    Dados tradicionais emuma companhia: • Dados transacionais de ERPs • Sistemas CRM • Transações WEB • Dados financeiros Volume: • Gigabytes (109) • Terabytes (1012) Velocidade: • Batch ou near real-time • Em geral não exige resposta imediata Variedade: • Estruturados • Não-estruturados Valor: • BI, análise e relatórios Dados gerados fora da empresa por fontes de dados não tradicionais, incluindo: • Media social • Dados de sensores (IOT) • Dados de Logs • Device Data • Video, imagens, etc. Volume: • Terabytes (1012) • Petabytes (1015) • Exabytes (1018) • Zettabytes (1021) Velocidade: • Frequentemente em tempo-real • Exigem resposta imediata Variedade: • Estruturados • Não-estruturados • Semiestruturados Valor: • Análises preditivas avançadas • Insights para os negócios Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 33.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 34.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 35.
    Modelos de Processamento Estainformação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 36.
    Persistência Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 37.
    Persistência: chave-valor Esta informaçãoé propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 38.
    Persistência: column store Estainformação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 39.
    Persistência: Documentos Esta informaçãoé propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 40.
    Persistência: Grafos Esta informaçãoé propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 41.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 42.
    Common Pipeline –Aquisição, transformação, processamento e visualização Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 43.
    Common Pipeline –Aquisição, transformação, processamento e visualização Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 44.
    MATLAB 3D animationof AT over LEVC by @JorgeGT Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 45.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 46.
    Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Porque aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 47.
    Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Porque aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor • Descrição simplificada dos dados • Reports com informações históricas • OLAP, BI, Dashboards • Data mining • OLAP, BI, Dashboards • Regressão linear • Predição e probabilidades futuras • Data mining para extração de padrões • Regressão linear e logística • Foco na tomada de decisão e eficiência • Uso de técnicas de otimização para a busca de soluções ótimas • Uso de simulações para obter insights e identificar problemas Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 48.
    Prescritivo Preditivo Diagnóstico Descritivo O que aconteceu? Porque aconteceu? O que irá acontecer? Como podemos fazer acontecer? Complexidade Valor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 49.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 50.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 51.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 52.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 53.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 54.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 55.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 56.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 57.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 58.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 59.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 60.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 61.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 62.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 63.
    Inconsciente Consciente Experimental OportunistaEstratégico Transformador • Inércia • Terceirização • Imaturidade em BI • Ausência de cases • Stakeholders x Oportunidades • Tecnologia? • Ausência de conhecimento sobre o tema e Governança da Informação • Conceitos estabelecidos • POCs executadas • APPs em “silos” • Implantação de LDW • Soluções customizadas • > nível maturidade • Acompanhar evolução tecnológica • Implantação de CDM • Catálogo de dados • Avaliação da maturidade em BI • Plano de melhorias • Plano de aculturamento • Selecionar business cases • Gerar MVPs • Levantamento da Governança da Informação • Plano de desenvolvimento • Promover a cultura em Big Data • Revisitar considerações iniciais • Ajustar estratégias • Avaliar lições aprendidas • Estabelecimento da Governança • HW/SW estabilizados • Tema Big Data é algo normal • Operacionalizar infra HW/SW • Planos de capacitação e suporte • Completar adoção de LDW • Formação de times multidisciplinares • Selecionar melhores ideias • Desenvolver POCs • Selecionar tecnologias Roadmap *LDW: Logical Data WarehouseEsta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 64.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 65.
    NOV 2014 ~100 Kflights/day/world! ~8K flight/day/Brazil Huge amount of data! Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 66.
    NOV 2014 Pistas ADS-B ~10 GB entre NOV14 e NOV15 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 67.
    NOV 2014 –Trajetória Média 𝜃 (𝑙𝑎𝑡) 𝜌 (𝑙𝑜𝑛) 𝛼 (𝑎𝑙𝑡) 𝜃 𝜌 𝛼 𝐿 𝑎 𝑘 = 1 𝑛 𝑖=1 𝑛 𝜃𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝐿 𝑔 𝑘 = 1 𝑛 𝑖=1 𝑛 𝜌𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝐴 𝑘 = 1 𝑛 𝑖=1 𝑛 𝛼𝑖 𝑘 , 𝑘 = 1, … , 𝑚 𝑝 𝑘 = (𝐿 𝑔 𝑘 , 𝐿 𝑎 𝑘 , 𝐴 𝑘 ) 𝑛 = #𝑑𝑎𝑡𝑎 𝑝𝑜𝑖𝑛𝑡𝑠 Π = (𝑝1, 𝑝2, … , 𝑝 𝑘) 𝑇 𝑚 = 𝑔𝑟𝑖𝑑 𝑓𝑎𝑐𝑡𝑜𝑟 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 68.
    Dados: • Mensagens ADS-Bem formato SBS-1 • 04/03/2015 a 08/04/2015 • 1.5 M mensagens (total) • 204 K mensagens consideradas no cálculo da trajetória média NOV 2014 – Trajetória Média Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 69.
    Esta informação épropriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 70.
    MAR 2015 –Ocupação de Setores Áreas agrupadas: - Nível inferior: 0 a 149 FL - Nível superior: 150 a 999 FL 1 semana de dados: 33 milhões de detecções radar Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 71.
    MAR 2015 –Ocupação de Setores TERÇA SÁBADO Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 72.
    MAR 2015 –Ocupação de Setores Ocupação da área 07 – ACCBS – 21/09/2015 Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 73.
    MAR 2015 –Mapa de Calor Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 74.
    Big Data Histórico Técnicos Negócios Conceitos 4º Paradigma baseia-se em umasérie de proporciona a criação de novos apresenta um série de aspectos está associado a um contexto Definição do Gartner Surgimento da Web Novos paradigmas computacionais como o que motivou o estabelecimento de Plataformas e arquiteturas Cognitive Computing Common pipeline Analytics Small X Big Data Cases Na Atech? Futuro? um deles o Onde o mercado adota a que permitem diferenciar em infra como adotando um com modelos de e modelos de onde já existem vários e experimentações nos preparando Computação eletromecânica e existe desde a Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 75.
    Atech Data IntelligencePlatform Collaboration IHM V3D DS3 COTS tools Open-source tools IHM improvements DA Statistical Analytics Semantic Analytics Text Analytics Machine Learning Visual Analytics Pattern Recognition DF Data Association Decision Fusion State Estimation DB HDFS Log Sensors Legacy Intelligence IoT Devices Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 76.
    Atividade de Cooperação:Atech – DT Sistemas Embraer 1. Plataformas e Arquiteturas Knowledge Sharing (19 a 22/12) • Treinamento teórico DT Sistemas – Atech • Workshop Atech – DT Sistemas Ideias para o desenvolvimento de PoCs • Dados abertos e dados “privados” • Cloud e infra local • Frameworks  agilidade e flexibilidade • Algoritmos: • Classificação, agrupamento ou associação de resultados • Melhor diagnóstico e prognóstico • Visualizações dinâmicas Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 77.
    Provas de Conceito– Segurança Pública (WEBINT) • 1 alvo  412 vínculos classificados por grau de iteração • Reconstrução de perfis fechados do Facebook • Web crawling nos sites Escavador e do TCU • ~200K vínculos para 1 e 2 níveis de distância da rede • Resultado: rede de relacionamentos do alvo e seus vínculos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 78.
    Provas de Conceito– Segurança Pública (OSINT) • 2 x Server Dell PowerEdge R630 with 24 cores,384GB RAM, and 8 x 1.2TB SAS HDD • 1 VM Geoserver, 2 VM data ingestion, 2 VM IHM • 145 alvos; 23K empresas; 5K pessoas; 8K voos; 15K registros sobre co-indiciamento; eleições 2014/2016; 6K contratos • ~ 5TB de dados • Resultado: Rede de alvos e evidências claras de suspeitos ilícitos Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 79.
    Provas de Conceito– Segurança Pública (Attivio) Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 80.
    Data Scientist Esta informaçãoé propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 81.
    The dream isover? Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 82.
    Everyone talks aboutit, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it...” “Big Data is like tennage sex: “Predictably Irrational” Dan Ariely Esta informação é propriedade da Atech e não pode ser usada ou reproduzida sem autorização por escrito
  • 83.
    OBRIGADO! www.atech.com.br contato@atech.com.br SÃO JOSÉ DOSCAMPOS Rodovia Presidente Dutra, KM 138 Bloco 3, Sala 302 +55 12 3878-4373 SÃO PAULO Rua do Rocio, 313 - 4° andar Vila Olímpia +55 11 3103-4600 ATECH Talks Apresentações e discussões sobre assuntos técnicos de interesse. SDTA Ciclo de palestras anual para compartilhamento de conhecimentos desenvolvidos e/ou de interesse dos colaboradores. UX CAFÉ Encontro mensal com o objetivo de debater sobre os temas usabilidade, design e experiência do usuário.