Universidade Presbiteriana Mackenzie 
Faculdade de Computação e Informática 
Big Data, Analytics e o 
Cientista de Dados – um novo 
campo de trabalho se abre 
Profs. Drs. 
• Vivaldo José Breternitz 
• Leandro Augusto da Silva 
• Fábio Silva Lopes
Abordaremos hoje 
• Uma visão geral de Big Data 
• Analytics 
• O Cientista de Dados 
– características pessoais desejadas 
– formação
• Podemos chamar Big Data a tecnologia que 
reúne uma quantidade extraordinariamente 
grande de dados, em diferentes formatos e 
pode processa-la praticamente em tempo real, 
aumentando as possibilidades de uso imediato 
das informações assim geradas 
3
Detalhando um pouco 
• Every day, we create 2.5 quintillion bytes of 
data — so much that 90% of the data in the 
world today has been created in the last two 
years alone. 
• This data comes in different formats from 
everywhere: sensors used to gather climate 
information, posts to social media sites, 
digital pictures and videos, purchase 
transaction records, and cell phone GPS 
signals to name a few.
Da coleta para o consumo – um processo em fluxo contínuo…
Sobre Analytics: 
É uma disciplina multidimensional. 
Consiste em aplicar simultaneamente 
técnicas de Estatística, Programação e 
Mineração de Dados a um conjunto de 
dados, com o intuito de descobrir 
padrões significativos, não triviais. 
Os resultados descrevem, classificam, 
predizem cenários e servem de apoio a 
decisão na gestão de negócios.
Data Science: 
Estudo da extração de conhecimento a partir dos dados. 
Dados representam traços do mundo real. 
Gerar conhecimento é o desafio.
Analytics - Oportunidades:
Quem trabalha com Analytics? 
• Matemáticos 
• Profissionais de 
TI 
• Cientista de 
Dados 
• Curiosos 
Diagrama de Venn para Data Science
11
Cientista de Dados 
É o profissional que 
coordena o 
processo de 
exploração dos 
grandes volumes 
de dados que as 
organizações 
reúnem e 
organizam 
tentando obter 
informações 
úteis, quer acerca 
do que vem 
ocorrendo, quer 
acerca do futuro.
Skills para trabalhar com Analytics 
https://www.linkedin.com/pulse/article/20140903194459-57656293-the-data-science-skills-network
Características pessoais desejadas 
• Curiosidade e criatividade 
• Iniciativa e capacidade de enfrentar 
dificuldades 
Jonathan Goldman, a despeito do desinteresse e 
até oposição de superiores e colegas, 
conseguiu implementar no LinkedIn a 
funcionalidade “People You May Know“, que 
trouxe à empresa milhões de novas page views.
Características pessoais desejadas 
• Capacidade de comunicação com todos os demais 
envolvidos no processo, quer os técnicos, quer os 
usuários. 
• Capacidade de desenvolver soluções de forma 
incremental, gerando produtos inicialmente 
pequenos, mas que podem evoluir para soluções 
mais amplas. 
• Capacidade de “pensar fora da caixa”, partindo 
de situações do tipo “temos uma grande 
quantidade de dados, o que podemos fazer com 
eles?”.
Características pessoais desejadas 
“A Data Scientist is 
somebody who is 
inquisitive, who can stare 
at data and spot trends. 
It's almost like a 
Renaissance person who 
really wants to learn and 
bring change to an 
organization.“ 
Anjul Bhambhri, vice president of Big Data products at IBM 
16
Renaissance person? 
17 
A Renaissance 
person, also 
known as a 
"polymath", 
refers to a 
person with 
many talents or 
interests
• Profissionais com esse perfil são muito 
raros 
• Sua formação demanda muito tempo 
• Pesquisas da consultoria McKinsey 
dizem que, apenas nos USA, faltarão em 
2018 aproximadamente 190.000 desses 
profissionais. 
• Faltarão também cerca de 1,5 milhão de 
profissionais habilitados como usuários 
18
Esses profissionais não são os atuais 
“Analistas de Business Intelligence”, 
especialmente pelo grau de sofisticação das 
ferramentas utilizadas e da formação 
necessária 
Não havendo ainda formação específica 
para profissionais dessa área, tem sido 
comum a utilização de pessoas com 
formação e experiências diversas 
19
São necessários “T-shaped professionals” ou 
“especialistas generalistas”. 
A barra horizontal do “T” é a formação básica, que deve ser 
suficientemente ampla para que o profissional desenvolva as habilidades 
para influenciar pessoas, atuar em equipes multidisciplinares, vislumbrar 
oportunidades e encontrar soluções para problemas complexos. 
A barra vertical, caracteriza o 
aprofundamento nos temas ligados a 
BDA propriamente dito.
O Mack, em parceria com a IBM, 
trabalha para fechar esse gap 
• No segundo semestre lançamos um novo curso 
de pós graduação: Ciência de Dados: BIG 
DATA ANALYTICS, com ênfase em mineração 
e análise de dados. 
• Objetivo do curso: formar futuros CDO – 
Chief Data Officers 
21
Por falar em formação: uma 
visão do mercado americano 
22 
*ABD – All But Dissertation 
*
Salários: ainda não temos números confiáveis, 
• UK mas... 
• Graduates entering the industry can expect to be paid 
approximately £27k 
• An analyst with four years’ experience is likely to command 
£40k - £48k 
• Senior consultants will earn around £120k 
• Consultancy is a popular option and freelancers can 
potentially earn £500 per day. 
• USA 
• Median salary: US$117,500/year 
• Brasil 
• Iniciantes, com mestrado/doutorado: R$ 7k/mês 
• Nível senior, com mestrado/doutorado: R$ 15k/mês 
23
Falando de trabalho: 
www.fcioportunidades.blogspot.com 
24
Para 
quem 
quer 
saber 
mais: 
25
Para quem quer saber 
mais: 
26
E para que não aconteça isto 
27
vjbreternitz@mackenzie.br 
28

Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre

  • 1.
    Universidade Presbiteriana Mackenzie Faculdade de Computação e Informática Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre Profs. Drs. • Vivaldo José Breternitz • Leandro Augusto da Silva • Fábio Silva Lopes
  • 2.
    Abordaremos hoje •Uma visão geral de Big Data • Analytics • O Cientista de Dados – características pessoais desejadas – formação
  • 3.
    • Podemos chamarBig Data a tecnologia que reúne uma quantidade extraordinariamente grande de dados, em diferentes formatos e pode processa-la praticamente em tempo real, aumentando as possibilidades de uso imediato das informações assim geradas 3
  • 4.
    Detalhando um pouco • Every day, we create 2.5 quintillion bytes of data — so much that 90% of the data in the world today has been created in the last two years alone. • This data comes in different formats from everywhere: sensors used to gather climate information, posts to social media sites, digital pictures and videos, purchase transaction records, and cell phone GPS signals to name a few.
  • 6.
    Da coleta parao consumo – um processo em fluxo contínuo…
  • 7.
    Sobre Analytics: Éuma disciplina multidimensional. Consiste em aplicar simultaneamente técnicas de Estatística, Programação e Mineração de Dados a um conjunto de dados, com o intuito de descobrir padrões significativos, não triviais. Os resultados descrevem, classificam, predizem cenários e servem de apoio a decisão na gestão de negócios.
  • 8.
    Data Science: Estudoda extração de conhecimento a partir dos dados. Dados representam traços do mundo real. Gerar conhecimento é o desafio.
  • 9.
  • 10.
    Quem trabalha comAnalytics? • Matemáticos • Profissionais de TI • Cientista de Dados • Curiosos Diagrama de Venn para Data Science
  • 11.
  • 12.
    Cientista de Dados É o profissional que coordena o processo de exploração dos grandes volumes de dados que as organizações reúnem e organizam tentando obter informações úteis, quer acerca do que vem ocorrendo, quer acerca do futuro.
  • 13.
    Skills para trabalharcom Analytics https://www.linkedin.com/pulse/article/20140903194459-57656293-the-data-science-skills-network
  • 14.
    Características pessoais desejadas • Curiosidade e criatividade • Iniciativa e capacidade de enfrentar dificuldades Jonathan Goldman, a despeito do desinteresse e até oposição de superiores e colegas, conseguiu implementar no LinkedIn a funcionalidade “People You May Know“, que trouxe à empresa milhões de novas page views.
  • 15.
    Características pessoais desejadas • Capacidade de comunicação com todos os demais envolvidos no processo, quer os técnicos, quer os usuários. • Capacidade de desenvolver soluções de forma incremental, gerando produtos inicialmente pequenos, mas que podem evoluir para soluções mais amplas. • Capacidade de “pensar fora da caixa”, partindo de situações do tipo “temos uma grande quantidade de dados, o que podemos fazer com eles?”.
  • 16.
    Características pessoais desejadas “A Data Scientist is somebody who is inquisitive, who can stare at data and spot trends. It's almost like a Renaissance person who really wants to learn and bring change to an organization.“ Anjul Bhambhri, vice president of Big Data products at IBM 16
  • 17.
    Renaissance person? 17 A Renaissance person, also known as a "polymath", refers to a person with many talents or interests
  • 18.
    • Profissionais comesse perfil são muito raros • Sua formação demanda muito tempo • Pesquisas da consultoria McKinsey dizem que, apenas nos USA, faltarão em 2018 aproximadamente 190.000 desses profissionais. • Faltarão também cerca de 1,5 milhão de profissionais habilitados como usuários 18
  • 19.
    Esses profissionais nãosão os atuais “Analistas de Business Intelligence”, especialmente pelo grau de sofisticação das ferramentas utilizadas e da formação necessária Não havendo ainda formação específica para profissionais dessa área, tem sido comum a utilização de pessoas com formação e experiências diversas 19
  • 20.
    São necessários “T-shapedprofessionals” ou “especialistas generalistas”. A barra horizontal do “T” é a formação básica, que deve ser suficientemente ampla para que o profissional desenvolva as habilidades para influenciar pessoas, atuar em equipes multidisciplinares, vislumbrar oportunidades e encontrar soluções para problemas complexos. A barra vertical, caracteriza o aprofundamento nos temas ligados a BDA propriamente dito.
  • 21.
    O Mack, emparceria com a IBM, trabalha para fechar esse gap • No segundo semestre lançamos um novo curso de pós graduação: Ciência de Dados: BIG DATA ANALYTICS, com ênfase em mineração e análise de dados. • Objetivo do curso: formar futuros CDO – Chief Data Officers 21
  • 22.
    Por falar emformação: uma visão do mercado americano 22 *ABD – All But Dissertation *
  • 23.
    Salários: ainda nãotemos números confiáveis, • UK mas... • Graduates entering the industry can expect to be paid approximately £27k • An analyst with four years’ experience is likely to command £40k - £48k • Senior consultants will earn around £120k • Consultancy is a popular option and freelancers can potentially earn £500 per day. • USA • Median salary: US$117,500/year • Brasil • Iniciantes, com mestrado/doutorado: R$ 7k/mês • Nível senior, com mestrado/doutorado: R$ 15k/mês 23
  • 24.
    Falando de trabalho: www.fcioportunidades.blogspot.com 24
  • 25.
    Para quem quer saber mais: 25
  • 26.
    Para quem quersaber mais: 26
  • 27.
    E para quenão aconteça isto 27
  • 28.