QMeeting 2015
BIG DATA: Data Science
Diogenes Justo
26/set/2015
SHORT BIO
Diógenes Justo
Mestre em Economia Aplicada (UFRGS)
MBE Economia (UFRGS).
Especialista em Banking (FGV).
Especialista em Data Science (John Hopkins University / Coursera).
Bacharel em Matemática Aplicada e Computacional (UFRGS).
Cursos de especialização em Big Data, Machine Learning e Data Mining no MIT, Washington University,
University of Illinois e Stanford
PMO Manager da BMF&Bovespa - Profissional certificado PMP.
20 anos de experiência na área de TI, tendo atuado em desenvolvimento, infraestrutura, banco de
dados e B.I., além de projetos.
In the German military machines, the total number
of possible combinations for message encryptions
comes to a staggering figure in the quadrillions.
(The exact number? 158,962,555,217,826,360,000).
RECENTE HISTÓRIA
BIG DATA
91 95 98 99 01 02 03 04 05 12
NSF - Core
Technologies for
Advancing Big
Data Science
TENDÊNCIA
CARREIRAS MAIS DEMANDADAS
CLUSTER COMPUTING
CLUSTER COMPUTING
Min(CPU-CPU)?
Multi-Core
RASPBERRY PI CLUSTER
WSO2 Conference 2013, London UK
HADOOP + MAP REDUCE
Logistic regression in Hadoop and Spark
spark.apache.org
DATA MINING, BIG DATA, DATA SCIENCE...
Data Mining ≈ Big Data ≈
Predictive Analytics ≈
Data Science
J. Leskovec, A.Rajaraman, J.Ullman: Mining of Massive Datasets
http://www.mmds.org
WHAT IS BIG DATA?
thefinancialbrand.com (IBM Research)
[DEAN, 14]
DATA MINING, MACHINE LEARNING...
O QUE NÃO É O QUE É
● Algo novo ou moda
● Algo totalmente avesso a Business
Intelligence ou DatawareHouse
● Quem tem Hadoop/NoSQL tem Big
Data
● Big Data significa muitos dados
espalhados por aí (web)
● Um problema que, mais hora, menos hora,
apareceria; uns tiveram o problema primeiro
● Abrange e se utiliza de técnicas já desenvolvidas
de BI, DW, Data Mining, Machine Learning (e usa
novas)...
● Hadoop/NoSQL facilitam a solução de problemas
● Big Data significa muitos dados (in ou out),
complexos (estruturados e não), de forma
crescente
APLICAÇÕES
QUEM FAZ ACONTECER?
Pesquisa
Científica Zona de Perigo
DATA SCIENCE - PROCESSO
DESAFIOS...
- Demanda deve crescer muito nos próximos anos
- Faltam profissionais para iniciarem as demandas ou identificar
aplicações
- Preparar mão de obra
- Nas empresas: qual é mais difícil? Mat/Est, Programação ou Negócios
- Nas universidades e escolas: adaptação de ementas, professores
qualificados
- Trazer valor de soluções
- Foco na solução, benefícios e não nas tecnologias
Obrigado!
Diogenes Justo
diogenes.justo@gmail.com

Qmeeting 2015 Big Data

  • 1.
    QMeeting 2015 BIG DATA:Data Science Diogenes Justo 26/set/2015
  • 2.
    SHORT BIO Diógenes Justo Mestreem Economia Aplicada (UFRGS) MBE Economia (UFRGS). Especialista em Banking (FGV). Especialista em Data Science (John Hopkins University / Coursera). Bacharel em Matemática Aplicada e Computacional (UFRGS). Cursos de especialização em Big Data, Machine Learning e Data Mining no MIT, Washington University, University of Illinois e Stanford PMO Manager da BMF&Bovespa - Profissional certificado PMP. 20 anos de experiência na área de TI, tendo atuado em desenvolvimento, infraestrutura, banco de dados e B.I., além de projetos.
  • 3.
    In the Germanmilitary machines, the total number of possible combinations for message encryptions comes to a staggering figure in the quadrillions. (The exact number? 158,962,555,217,826,360,000).
  • 4.
  • 5.
  • 6.
    91 95 9899 01 02 03 04 05 12 NSF - Core Technologies for Advancing Big Data Science
  • 7.
  • 9.
  • 11.
  • 12.
  • 13.
    RASPBERRY PI CLUSTER WSO2Conference 2013, London UK
  • 14.
    HADOOP + MAPREDUCE Logistic regression in Hadoop and Spark spark.apache.org
  • 15.
    DATA MINING, BIGDATA, DATA SCIENCE... Data Mining ≈ Big Data ≈ Predictive Analytics ≈ Data Science J. Leskovec, A.Rajaraman, J.Ullman: Mining of Massive Datasets http://www.mmds.org
  • 16.
    WHAT IS BIGDATA? thefinancialbrand.com (IBM Research)
  • 17.
    [DEAN, 14] DATA MINING,MACHINE LEARNING...
  • 18.
    O QUE NÃOÉ O QUE É ● Algo novo ou moda ● Algo totalmente avesso a Business Intelligence ou DatawareHouse ● Quem tem Hadoop/NoSQL tem Big Data ● Big Data significa muitos dados espalhados por aí (web) ● Um problema que, mais hora, menos hora, apareceria; uns tiveram o problema primeiro ● Abrange e se utiliza de técnicas já desenvolvidas de BI, DW, Data Mining, Machine Learning (e usa novas)... ● Hadoop/NoSQL facilitam a solução de problemas ● Big Data significa muitos dados (in ou out), complexos (estruturados e não), de forma crescente
  • 19.
  • 26.
  • 28.
  • 29.
  • 31.
    DESAFIOS... - Demanda devecrescer muito nos próximos anos - Faltam profissionais para iniciarem as demandas ou identificar aplicações - Preparar mão de obra - Nas empresas: qual é mais difícil? Mat/Est, Programação ou Negócios - Nas universidades e escolas: adaptação de ementas, professores qualificados - Trazer valor de soluções - Foco na solução, benefícios e não nas tecnologias
  • 32.