SlideShare uma empresa Scribd logo
1 de 32
 
	
  
	
  
Big	
  Data	
  
Aplicação	
  e	
  tecnologia	
  
07	
  de	
  junho	
  de	
  2014	
  
Dilúvio	
  de	
  Dados	
  na	
  Ciência	
  
Selfie	
  do	
  Opportunity	
  –	
  138	
  MB	
  
Hubble	
  –	
  844	
  GB/mês	
  
CERN	
  –	
  35	
  Petabytes/ano	
  	
  
O	
  que	
  muda	
  na	
  ciência	
  ?	
  
E	
  aqui	
  não	
  está	
  diferente	
  
1,2	
  bilhões	
  de	
  Likes/dia	
  
E	
  os	
  volumes	
  con;nuarão	
  crescendo
	
  	
  
•  Internet	
  das	
  Coisas	
  (IoT)	
  9,6	
  bilhões	
  de	
  
disposiQvos	
  conectados	
  
•  IoT	
  está	
  apenas	
  na	
  sua	
  infância	
  
•  Até	
  2020	
  os	
  carros	
  conectados	
  irão	
  gerar	
  	
  
11	
  Petabytes	
  
Disposi;vos	
  móveis	
  -­‐	
  crescimento	
  
The	
  Nexus	
  Forces	
  -­‐	
  Gartner	
  
O	
  Termo	
  Big	
  Data	
  
Erik	
  Larson,	
  1989	
  	
  na	
  Harper’s	
  Magazine:	
  
	
  
“The	
  keepers	
  of	
  Big	
  Data	
  say	
  they	
  do	
  it	
  for	
  the	
  
consumer's	
  benefit.	
  But	
  data	
  have	
  a	
  way	
  of	
  being	
  used	
  
for	
  purposes	
  other	
  than	
  originally	
  intended.”	
  
	
  
Aqueles	
  que	
  guardam	
  grandes	
  volumes	
  de	
  dados	
  dizem	
  
que	
  o	
  fazem	
  em	
  bene`cio	
  do	
  consumidor.	
  Mas	
  há	
  
formas	
  de	
  usá-­‐los	
  para	
  propósitos	
  diferentes	
  dos	
  
originais.	
  
O	
  que	
  você	
  diz	
  pelo	
  disposi;vo	
  móvel	
  
Tipo	
  de	
  lugar	
  que	
  frequenta,	
  onde	
  
circula	
  na	
  cidade	
  
Inclinações	
  políQcas	
  
Hábitos	
  de	
  compra,	
  de	
  consumo	
  
de	
  entretenimento	
  etc.	
  
E	
  o	
  que	
  empresas	
  e	
  governos	
  fazem?	
  
•  Empresas	
  formam	
  perfis	
  para	
  	
  
–  IdenQficar	
  propensão	
  e	
  hábitos	
  de	
  consumo	
  
–  Ofertar	
  produtos	
  e	
  serviços	
  próprios	
  e	
  de	
  terceiros	
  
–  Melhorar	
  a	
  experiência	
  de	
  consumo	
  
–  Engajar	
  e	
  fidelizar	
  
–  GeomarkeQng	
  
–  Criar	
  uma	
  fonte	
  rica	
  de	
  feedback	
  de	
  produtos	
  e	
  serviços	
  
•  Governos	
  
–  IdenQficar	
  ameaças	
  e	
  riscos	
  (terrorismo)	
  
–  Mobilidade	
  urbana	
  
–  Cidades	
  inteligentes	
  
Relações	
  econômicas	
  baseadas	
  em	
  dados	
  
Ad	
  	
  para	
  esporQsta,	
  
25-­‐35	
  anos,	
  classe	
  
A,	
  zona	
  sul	
  de	
  SP.	
  
Pago	
  $1	
  por	
  
exposição	
  e	
  $2	
  por	
  
conversão.	
  	
  
API	
  
Aceito	
  /	
  
TransmiQdo	
  para	
  
500.000	
  perfis	
  
API	
  
Data	
  Broker	
  
Organização	
  
Banco	
  de	
  dados	
  logo	
  
será	
  um	
  aQvo	
  assim	
  
como	
  a	
  marca	
  
Big	
  Data	
  Analy;cs	
  
Big	
  Data	
  me	
  sugere	
  uma	
  questão	
  de	
  engenharia.	
  
	
  
AnalyQcs,	
  por	
  outro	
  lado,	
  sobre	
  como	
  gerar	
  valor.	
  
Big	
  Data	
  –	
  a	
  resposta	
  de	
  engenharia	
  
Yahoo	
  Hadoop	
  Cluster	
  
Dividir	
  para	
  conquistar	
  
Escalabilidade	
  Horizontal	
  X	
  Ver;cal 	
  	
  
Ciência	
  de	
  dados	
  -­‐	
  requisitos	
  
Drew	
  Conway’s	
  Data	
  Science	
  Venn	
  
Diagram	
  
hkp://drewconway.com/zia/2013/3/26/
the-­‐data-­‐science-­‐venn-­‐diagram	
  
Perfil	
  do	
  Cien;sta	
  de	
  Dados	
  	
  
A	
  profissão	
  mais	
  sexy	
  do	
  século	
  21	
  
•  Programador	
  em	
  várias	
  linguagens	
  
•  Computação	
  avançada	
  para	
  processamento	
  
distribuído,	
  massivo	
  e	
  paralelo	
  
•  Modelagem	
  de	
  Dados	
  (relacional	
  e	
  não	
  relacional)	
  
•  DBA	
  (administrador	
  de	
  banco	
  de	
  dados)	
  
•  EstamsQco	
  
•  MatemáQco	
  
•  Designer	
  de	
  Visualização	
  e	
  ReporQng	
  
•  Entender	
  o	
  Negócio	
  e	
  ter	
  domínio	
  do	
  Qpo	
  de	
  
informação	
  que	
  está	
  lidando	
  
hkp://hbr.org/2012/10/data-­‐scienQst-­‐the-­‐sexiest-­‐job-­‐of-­‐the-­‐21st-­‐century/ar/1	
  
	
  
• Estabelece	
  hipóteses	
  1	
  
• Coleta	
  e	
  normaliza	
  dados	
  2	
  
• Processa	
  e	
  analisa	
  resultados	
  3	
  
• Comunica	
  resultados	
  4	
  
A;vidades	
  de	
  um	
  cien;sta	
  de	
  dados	
  
•  Análise	
  Operacional	
  (estamsQca	
  descriQva)	
  
•  Exploratória	
  (correlações,	
  business	
  insights)	
  
•  Modelos	
  PrediQvos	
  (regressão)	
  
•  Análise	
  de	
  redes	
  (grafos)	
  
•  Análise	
  de	
  Metadados	
  (NSA)	
  
Ciência	
  de	
  Dados	
  -­‐	
  zona	
  morna	
  
Ciência	
  de	
  Dados	
  –	
  zona	
  quente	
  
•  Machine	
  Learning	
  /	
  Aprendizado	
  de	
  Máquina	
  
– Sistemas	
  de	
  recomendação	
  (Amazon,	
  Neplix	
  etc.)	
  
– Search	
  Engine	
  (Google	
  Humingbird	
  /	
  PageRank)	
  
– Análise	
  de	
  senQmento	
  e	
  categorização	
  de	
  texto	
  
(processamento	
  da	
  linguagem	
  natural-­‐NLP)	
  
– Segurança	
  (AnQ-­‐Fraude,	
  anQ-­‐spam,	
  vírus	
  etc.)	
  
– Prevenção	
  ao	
  cancelamento	
  de	
  assinaturas	
  
(customer	
  churn)	
  
– Detecção	
  de	
  anomalias	
  
– Visão	
  de	
  máquina	
  
Machine	
  Learning	
  e	
  as	
  novas	
  fronteiras	
  
•  Internet	
  das	
  Coisas	
  
–  Segurança	
  patrimonial	
  
–  Edi`cios	
  inteligentes	
  
–  Consumo	
  de	
  eletricidade	
  
–  Monitoramento	
  aQvo	
  em	
  processos	
  produQvos	
  (refinarias,	
  linhas	
  de	
  
produção	
  etc.)	
  
•  QuanQfied	
  	
  Self	
  
–  Administração	
  dos	
  níveis	
  glicêmicos	
  para	
  diabéQcos	
  
–  Monitoramento	
  aQvo	
  e	
  intervenção	
  em	
  pacientes	
  de	
  risco	
  
–  Frequência	
  cardíaca,	
  arritmias	
  
•  Smart	
  CiQes	
  
–  Distribuição	
  de	
  água	
  
–  Mobilidade	
  urbana	
  
–  Administração	
  de	
  áreas	
  de	
  risco	
  
•  Prevenção	
  de	
  catástrofes	
  naturais	
  (deslizamento	
  de	
  terra,	
  sismos,	
  enchentes,	
  
tsunamis	
  etc)	
  
Ferramental	
  do	
  cien;sta	
  de	
  dados	
  
•  R	
  e	
  RStudio	
  
•  Python	
  /	
  iPhyton	
  (bibliotecas	
  scikit	
  learn,	
  nltk,	
  
pandas	
  etc.)	
  
•  Octave	
  /	
  MatLab	
  
•  Linguagem	
  SQL	
  (acesso	
  a	
  Hadoop	
  e	
  bancos	
  
colunares	
  de	
  alta	
  performance)	
  
•  SAS	
  
•  SPSS	
  
•  Gephi	
  	
  e	
  Neo4J	
  para	
  Grafos	
  
•  etc	
  
Informações	
  importantes	
  
•  R,	
  Python	
  e	
  Octave	
  podem	
  tratar	
  dados	
  até	
  o	
  
limite	
  da	
  máquina	
  onde	
  operam	
  (dependem	
  
de	
  escalabilidade	
  verQcal)	
  
•  Vários	
  meios	
  de	
  conexão	
  entre	
  R,	
  Python	
  e	
  
Hadoop	
  
•  Python	
  é	
  uma	
  linguagem	
  que	
  ganhou	
  
habilidade	
  estamsQca	
  	
  
•  R	
  é	
  um	
  sotware	
  estamsQco	
  que	
  ganhou	
  uma	
  
linguagem	
  de	
  programação	
  
Empregos	
  em	
  Data	
  Science	
  
hkp://www.indeed.com/jobtrends?q=Data-­‐science&relaQve=1	
  
Indeed.com	
  searches	
  millions	
  of	
  jobs	
  from	
  thousands	
  of	
  job	
  sites.	
  
This	
  job	
  trends	
  graph	
  shows	
  relaQve	
  growth	
  for	
  jobs	
  we	
  find	
  matching	
  your	
  search	
  terms.	
  	
  
Mercado	
  de	
  novas	
  possibilidades	
  
Telecomunicação	
  
• Perfil	
  de	
  Cliente	
  
• Análise	
  e	
  OQmização	
  de	
  redes	
  
U>lidades	
  
• Smart	
  Meter	
  AnalyQcs	
  
• Gerenciamento	
  dos	
  AQvos	
  
Varejo	
  
• Omni-­‐channel	
  MarkeQng	
  
• Real-­‐Qme	
  promoQons	
  
Transporte	
  
• oQmização	
  logísQca	
  
• congesQonamento	
  do	
  
tráfego	
  
Serviços	
  
Financeiros	
  
• Detecção	
  de	
  Fraude	
  
• Visão	
  360°do	
  cliente	
  
Midia	
  Digital	
  
• Segmentação	
  de	
  
anúncios	
  em	
  tempo	
  real	
  
Saúde	
  
• Análise	
  de	
  registros	
  médicos	
  
• Monitoramento	
  de	
  doenças	
  
Segurança	
  
• Vigilância	
  MulQmodal	
  
• Detecção	
  de	
  segurança	
  
cibernéQca	
  
Visão	
  de	
  BI	
  e	
  de	
  Data	
  Science	
  
BI	
   Data	
  Science	
  
PerspecQva	
   Olha	
  o	
  que	
  já	
  foi	
   Olha	
  o	
  que	
  virá	
  
ExperQse	
   Usuário	
  no	
  negócio	
   CienQsta	
  de	
  dados	
  
Questões	
   O	
  que	
  houve?	
   O	
  que	
  pode	
  acontecer?	
  	
  
E	
  se?	
  Será	
  que?	
  
Olha	
   Para	
  dentro	
   Para	
  o	
  contexto	
  
Análise	
   DescriQva	
   PrediQva	
  
Resultado	
   DiagnósQco	
   PerspecQva	
  
Números	
   Exatos	
   Aproximados	
  
Somando	
  BI	
  e	
  Data	
  Science	
  	
  
•  Analista	
  do	
  Walmart	
  cruza	
  vendas	
  do	
  BI	
  com	
  
dados	
  de	
  tempo	
  e	
  descobre	
  que	
  quando	
  há	
  
alerta	
  de	
  furacões:	
  
– Aumenta	
  muito	
  a	
  venda	
  de	
  cerveja	
  (inesperado)	
  
– Aumenta	
  venda	
  de	
  mini-­‐tortas	
  de	
  morango	
  e	
  
bolos	
  para	
  o	
  café	
  da	
  manhã	
  (inesperado)	
  
•  Decisão:	
  reforçar	
  estoques	
  desses	
  itens	
  nas	
  
lojas	
  que	
  estão	
  no	
  raio	
  de	
  ação	
  de	
  furacões.	
  
Mais	
  informações 	
  	
  
•  Linkedin:	
  Grupo	
  Big	
  Data	
  e	
  Machine	
  Learning	
  no	
  Brasil	
  
•  MOOC’s	
  do	
  Coursera	
  	
  
–  Machine	
  Learning	
  –	
  Johns	
  Hopkins	
  University	
  
–  Data	
  Science	
  –	
  Bill	
  Howe	
  –	
  Univ.	
  Washington	
  
–  Machine	
  Learning	
  –	
  Stanford	
  –	
  Andrew	
  NG	
  
–  Neural	
  Networks	
  for	
  Machine	
  Learning	
  –	
  Univ.	
  Toronto	
  
–  CompuQng	
  for	
  Data	
  Analysis	
  –	
  Johns	
  Hopkins	
  University	
  
–  Social	
  Network	
  Analysis	
  –	
  Univ.	
  Michigan	
  	
  
–  Core	
  concepts	
  in	
  Data	
  Analysis	
  –	
  Higher	
  School	
  of	
  Economics	
  
•  Unicamp	
  
•  UFSCar	
  
–  Prof.:	
  Estevam	
  Rafael	
  Hruschka	
  Junior	
  	
  
(hkp://www2.dc.ufscar.br/~estevam/)	
  
Recomendo	
  
Obrigado	
  
hkp://br.linkedin.com/in/helioss/	
  
Hasta	
  la	
  
vista,	
  
baby.	
  
Hélio	
  Silva	
  

Mais conteúdo relacionado

Mais procurados

Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?Ambiente Livre
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Marcos Luiz Lins Filho
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Bruno Rocha
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data scienceCaio Gomes
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosDayane Cristine Leite
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e DesafiosFlávio Sousa
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus ImpactosAlex Silva
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 

Mais procurados (20)

Big Data
Big DataBig Data
Big Data
 
Big Data
Big DataBig Data
Big Data
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
 
Big data
Big dataBig data
Big data
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data science
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
Big Data e NoSQL
Big Data e NoSQLBig Data e NoSQL
Big Data e NoSQL
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data
Big DataBig Data
Big Data
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e Desafios
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus Impactos
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
BigData
BigDataBigData
BigData
 

Destaque

Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Amarribo
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12ufumec
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data miningCassius Busemeyer
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Entendo Business Intelligence
Entendo Business IntelligenceEntendo Business Intelligence
Entendo Business IntelligenceDouglas Scheibler
 
Inteligência Artificial e suas aplicações - A experiência do TECPAR
Inteligência Artificial e suas aplicações - A experiência do TECPARInteligência Artificial e suas aplicações - A experiência do TECPAR
Inteligência Artificial e suas aplicações - A experiência do TECPARBruno Campagnolo
 

Destaque (14)

Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12
 
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
 
Data Mining
Data MiningData Mining
Data Mining
 
La visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCULa visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCU
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Apresentação data mining
Apresentação data miningApresentação data mining
Apresentação data mining
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Análise de Problemas Big Data
Análise de Problemas Big DataAnálise de Problemas Big Data
Análise de Problemas Big Data
 
Control social 2016 - la visión de la cámara de diputados.
Control social 2016 -  la visión de la cámara de diputados.Control social 2016 -  la visión de la cámara de diputados.
Control social 2016 - la visión de la cámara de diputados.
 
Design thinking 2016 - Herramientas
Design thinking 2016 -  HerramientasDesign thinking 2016 -  Herramientas
Design thinking 2016 - Herramientas
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Entendo Business Intelligence
Entendo Business IntelligenceEntendo Business Intelligence
Entendo Business Intelligence
 
Inteligência Artificial e suas aplicações - A experiência do TECPAR
Inteligência Artificial e suas aplicações - A experiência do TECPARInteligência Artificial e suas aplicações - A experiência do TECPAR
Inteligência Artificial e suas aplicações - A experiência do TECPAR
 

Semelhante a Big Data Analytics - Data Science - Aplicação e Tecnologia

Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2alexculpado
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
Big Data e oportunidades de negócios
Big Data e oportunidades de negóciosBig Data e oportunidades de negócios
Big Data e oportunidades de negóciosLaboratorium
 
24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?Diego Nogare
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???Alessandro Binhara
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas VertentesUnicamp
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week Hélio Silva
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dadoscardoso80
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 

Semelhante a Big Data Analytics - Data Science - Aplicação e Tecnologia (20)

Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Hackathon UOL
Hackathon  UOL Hackathon  UOL
Hackathon UOL
 
Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
Clusters
ClustersClusters
Clusters
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Big Data e oportunidades de negócios
Big Data e oportunidades de negóciosBig Data e oportunidades de negócios
Big Data e oportunidades de negócios
 
24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas Vertentes
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Big Data
Big DataBig Data
Big Data
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 

Big Data Analytics - Data Science - Aplicação e Tecnologia

  • 1.       Big  Data   Aplicação  e  tecnologia   07  de  junho  de  2014  
  • 2. Dilúvio  de  Dados  na  Ciência   Selfie  do  Opportunity  –  138  MB   Hubble  –  844  GB/mês   CERN  –  35  Petabytes/ano    
  • 3. O  que  muda  na  ciência  ?  
  • 4. E  aqui  não  está  diferente   1,2  bilhões  de  Likes/dia  
  • 5.
  • 6. E  os  volumes  con;nuarão  crescendo     •  Internet  das  Coisas  (IoT)  9,6  bilhões  de   disposiQvos  conectados   •  IoT  está  apenas  na  sua  infância   •  Até  2020  os  carros  conectados  irão  gerar     11  Petabytes  
  • 8. The  Nexus  Forces  -­‐  Gartner  
  • 9. O  Termo  Big  Data   Erik  Larson,  1989    na  Harper’s  Magazine:     “The  keepers  of  Big  Data  say  they  do  it  for  the   consumer's  benefit.  But  data  have  a  way  of  being  used   for  purposes  other  than  originally  intended.”     Aqueles  que  guardam  grandes  volumes  de  dados  dizem   que  o  fazem  em  bene`cio  do  consumidor.  Mas  há   formas  de  usá-­‐los  para  propósitos  diferentes  dos   originais.  
  • 10. O  que  você  diz  pelo  disposi;vo  móvel   Tipo  de  lugar  que  frequenta,  onde   circula  na  cidade   Inclinações  políQcas   Hábitos  de  compra,  de  consumo   de  entretenimento  etc.  
  • 11. E  o  que  empresas  e  governos  fazem?   •  Empresas  formam  perfis  para     –  IdenQficar  propensão  e  hábitos  de  consumo   –  Ofertar  produtos  e  serviços  próprios  e  de  terceiros   –  Melhorar  a  experiência  de  consumo   –  Engajar  e  fidelizar   –  GeomarkeQng   –  Criar  uma  fonte  rica  de  feedback  de  produtos  e  serviços   •  Governos   –  IdenQficar  ameaças  e  riscos  (terrorismo)   –  Mobilidade  urbana   –  Cidades  inteligentes  
  • 12. Relações  econômicas  baseadas  em  dados   Ad    para  esporQsta,   25-­‐35  anos,  classe   A,  zona  sul  de  SP.   Pago  $1  por   exposição  e  $2  por   conversão.     API   Aceito  /   TransmiQdo  para   500.000  perfis   API   Data  Broker   Organização   Banco  de  dados  logo   será  um  aQvo  assim   como  a  marca  
  • 13. Big  Data  Analy;cs   Big  Data  me  sugere  uma  questão  de  engenharia.     AnalyQcs,  por  outro  lado,  sobre  como  gerar  valor.  
  • 14. Big  Data  –  a  resposta  de  engenharia   Yahoo  Hadoop  Cluster   Dividir  para  conquistar  
  • 16. Ciência  de  dados  -­‐  requisitos  
  • 17. Drew  Conway’s  Data  Science  Venn   Diagram   hkp://drewconway.com/zia/2013/3/26/ the-­‐data-­‐science-­‐venn-­‐diagram  
  • 18. Perfil  do  Cien;sta  de  Dados     A  profissão  mais  sexy  do  século  21   •  Programador  em  várias  linguagens   •  Computação  avançada  para  processamento   distribuído,  massivo  e  paralelo   •  Modelagem  de  Dados  (relacional  e  não  relacional)   •  DBA  (administrador  de  banco  de  dados)   •  EstamsQco   •  MatemáQco   •  Designer  de  Visualização  e  ReporQng   •  Entender  o  Negócio  e  ter  domínio  do  Qpo  de   informação  que  está  lidando   hkp://hbr.org/2012/10/data-­‐scienQst-­‐the-­‐sexiest-­‐job-­‐of-­‐the-­‐21st-­‐century/ar/1    
  • 19. • Estabelece  hipóteses  1   • Coleta  e  normaliza  dados  2   • Processa  e  analisa  resultados  3   • Comunica  resultados  4   A;vidades  de  um  cien;sta  de  dados  
  • 20. •  Análise  Operacional  (estamsQca  descriQva)   •  Exploratória  (correlações,  business  insights)   •  Modelos  PrediQvos  (regressão)   •  Análise  de  redes  (grafos)   •  Análise  de  Metadados  (NSA)   Ciência  de  Dados  -­‐  zona  morna  
  • 21. Ciência  de  Dados  –  zona  quente   •  Machine  Learning  /  Aprendizado  de  Máquina   – Sistemas  de  recomendação  (Amazon,  Neplix  etc.)   – Search  Engine  (Google  Humingbird  /  PageRank)   – Análise  de  senQmento  e  categorização  de  texto   (processamento  da  linguagem  natural-­‐NLP)   – Segurança  (AnQ-­‐Fraude,  anQ-­‐spam,  vírus  etc.)   – Prevenção  ao  cancelamento  de  assinaturas   (customer  churn)   – Detecção  de  anomalias   – Visão  de  máquina  
  • 22. Machine  Learning  e  as  novas  fronteiras   •  Internet  das  Coisas   –  Segurança  patrimonial   –  Edi`cios  inteligentes   –  Consumo  de  eletricidade   –  Monitoramento  aQvo  em  processos  produQvos  (refinarias,  linhas  de   produção  etc.)   •  QuanQfied    Self   –  Administração  dos  níveis  glicêmicos  para  diabéQcos   –  Monitoramento  aQvo  e  intervenção  em  pacientes  de  risco   –  Frequência  cardíaca,  arritmias   •  Smart  CiQes   –  Distribuição  de  água   –  Mobilidade  urbana   –  Administração  de  áreas  de  risco   •  Prevenção  de  catástrofes  naturais  (deslizamento  de  terra,  sismos,  enchentes,   tsunamis  etc)  
  • 23.
  • 24. Ferramental  do  cien;sta  de  dados   •  R  e  RStudio   •  Python  /  iPhyton  (bibliotecas  scikit  learn,  nltk,   pandas  etc.)   •  Octave  /  MatLab   •  Linguagem  SQL  (acesso  a  Hadoop  e  bancos   colunares  de  alta  performance)   •  SAS   •  SPSS   •  Gephi    e  Neo4J  para  Grafos   •  etc  
  • 25. Informações  importantes   •  R,  Python  e  Octave  podem  tratar  dados  até  o   limite  da  máquina  onde  operam  (dependem   de  escalabilidade  verQcal)   •  Vários  meios  de  conexão  entre  R,  Python  e   Hadoop   •  Python  é  uma  linguagem  que  ganhou   habilidade  estamsQca     •  R  é  um  sotware  estamsQco  que  ganhou  uma   linguagem  de  programação  
  • 26. Empregos  em  Data  Science   hkp://www.indeed.com/jobtrends?q=Data-­‐science&relaQve=1   Indeed.com  searches  millions  of  jobs  from  thousands  of  job  sites.   This  job  trends  graph  shows  relaQve  growth  for  jobs  we  find  matching  your  search  terms.    
  • 27. Mercado  de  novas  possibilidades   Telecomunicação   • Perfil  de  Cliente   • Análise  e  OQmização  de  redes   U>lidades   • Smart  Meter  AnalyQcs   • Gerenciamento  dos  AQvos   Varejo   • Omni-­‐channel  MarkeQng   • Real-­‐Qme  promoQons   Transporte   • oQmização  logísQca   • congesQonamento  do   tráfego   Serviços   Financeiros   • Detecção  de  Fraude   • Visão  360°do  cliente   Midia  Digital   • Segmentação  de   anúncios  em  tempo  real   Saúde   • Análise  de  registros  médicos   • Monitoramento  de  doenças   Segurança   • Vigilância  MulQmodal   • Detecção  de  segurança   cibernéQca  
  • 28. Visão  de  BI  e  de  Data  Science   BI   Data  Science   PerspecQva   Olha  o  que  já  foi   Olha  o  que  virá   ExperQse   Usuário  no  negócio   CienQsta  de  dados   Questões   O  que  houve?   O  que  pode  acontecer?     E  se?  Será  que?   Olha   Para  dentro   Para  o  contexto   Análise   DescriQva   PrediQva   Resultado   DiagnósQco   PerspecQva   Números   Exatos   Aproximados  
  • 29. Somando  BI  e  Data  Science     •  Analista  do  Walmart  cruza  vendas  do  BI  com   dados  de  tempo  e  descobre  que  quando  há   alerta  de  furacões:   – Aumenta  muito  a  venda  de  cerveja  (inesperado)   – Aumenta  venda  de  mini-­‐tortas  de  morango  e   bolos  para  o  café  da  manhã  (inesperado)   •  Decisão:  reforçar  estoques  desses  itens  nas   lojas  que  estão  no  raio  de  ação  de  furacões.  
  • 30. Mais  informações     •  Linkedin:  Grupo  Big  Data  e  Machine  Learning  no  Brasil   •  MOOC’s  do  Coursera     –  Machine  Learning  –  Johns  Hopkins  University   –  Data  Science  –  Bill  Howe  –  Univ.  Washington   –  Machine  Learning  –  Stanford  –  Andrew  NG   –  Neural  Networks  for  Machine  Learning  –  Univ.  Toronto   –  CompuQng  for  Data  Analysis  –  Johns  Hopkins  University   –  Social  Network  Analysis  –  Univ.  Michigan     –  Core  concepts  in  Data  Analysis  –  Higher  School  of  Economics   •  Unicamp   •  UFSCar   –  Prof.:  Estevam  Rafael  Hruschka  Junior     (hkp://www2.dc.ufscar.br/~estevam/)  
  • 32. Obrigado   hkp://br.linkedin.com/in/helioss/   Hasta  la   vista,   baby.   Hélio  Silva