SlideShare uma empresa Scribd logo
1 de 55
Baixar para ler offline
B ig Data, o que é iss o? O que é isso?
Rafaela Raganham 
● Formada em Sistemas de Informação, pela 
Faculdades Integradas do Brasil (Unibrasil). 
●MBA Business Intelligence (Positivo) 
● Palestrante FISL, FTSL, SFD e Solisc 
Desempenha funções de análise e 
desenvolvimento de sistemas desde 2008, 
atualmente trabalha na Ambiente Livre 
Tecnologia onde presta serviços de 
desenvolvimento, customizações e consultoria 
em sistemas open source.
Ecosistema
Todo mundo está falando sobre Big Data
Nossa sociedade está deixando para trás uma 
pegada digital. 
As pessoas estão vivendo em linha e todos estamos 
expressando nossas atitudes, gostos, desgostos, opiniões 
e perspectivas.
Indivíduos com smartphones e sites de redes sociais 
continuarão a impulsionar o crescimento de dados 
exponencialmente
• 90% dos dados no mundo de hoje foram criados nos 
últimos dois anos 
• Previsão IDC: O universo global de dados irá dobrar a 
cada dois anos, chegando a 40 mil exabytes ou de 40 
trilhões de GB até 2020 
• Internet Archive tem em torno de 2 petabytes de dados, 
e está crescendo a uma taxa de 20 terabytes por mês. 
• 30 bilhões de conteúdos foram adicionados ao 
Facebook 
• 2 bilhões de vídeos são vistos no Youtube 
• 2,5 quintilhões de bytes de dados é criado
● Então o que é BIG DATA ?!
"Big Data é a capacidade de uma empresa para armazenar, processar 
e acessar todos os dados de que necessita para funcionar, tomar 
decisões, reduzir riscos, e servir os clientes." - Forrester 
"Big Data, em geral, é definido como alto volume, velocidade e 
variedade ativos de informação que exigem formas eficazes e 
inovadoras de custos de processamento de informações para uma 
melhor percepção e tomada de decisão." - Gartner 
"Big data são os dados caracterizados por três atributos: volume, 
variedade e velocidade." - IBM 
"Big data são os dados caracterizados por quatro atributos principais: 
volume, variedade, velocidade e valor." - Oracle
Byte: um grão de arroz
Byte: um grão de arroz 
Kilobyte: xícara de arroz
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios com containers
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios com containers 
Petabyte: Estado de Manhattan
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios de containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios de containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios de containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios de containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA 
 
Hobbyist
Byte: um grão de arroz 
 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios com containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA 
Hobbyist 
Desktop
Byte: um grão de arroz 
 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios com containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA 
Hobbyist 
Desktop 
Internet
Byte: um grão de arroz 
 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios com containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA 
Hobbyist 
Desktop 
Internet 
Big Data
Byte: um grão de arroz 
Kilobyte: xícara de arroz 
Megabyte: 8 sacos de arroz 
Gigabyte: 3 caminhões de arroz 
Terabyte: 2 navios de containers 
Petabyte: Estado de Manhattan 
Exabyte: Costa oeste 
Zettabyte: Oceano Pacífico 
Yottabyte: A TERRA
Volume refere-se a grande 
quantidade de dados gerados a 
cada segundo. 
Isso faz com que a maioria dos 
conjuntos de dados sejam muito 
grandes para armazenar e 
analisar usando a tecnologia de 
banco de dados tradicional. 
Novas ferramentas de Big Data 
utilizam sistemas distribuídos de 
modo que podemos armazenar e 
analisar os dados entre bancos de 
dados que estão espalhados em 
qualquer lugar do mundo
Velocidade refere-se à velocidade 
com que os novos dados são 
gerados e a velocidade com que 
se move em torno de dados. 
Basta pensar em mensagens de 
mídia social que se tornam viral 
em segundos. A tecnologia nos 
permite agora a analisar os dados 
enquanto ele está sendo gerado 
(por vezes referido como 
inMemory analytics), sem nunca 
colocá-lo em bases de dados
Variedade refere-se aos diferentes 
tipos de dados que podemos agora 
utilizar. No passado, apenas eram 
usados dados estruturados 
cuidadosamente armazenados em 
bancos de dados relacionais. 
80% dos dados do mundo são 
não-estruturados (texto, imagens, 
vídeo, voz, etc) com grande 
tecnologia de dados, podemos 
agora analisar e reunir dados de 
diferentes tipos, tais como 
mensagens, conversas de mídia 
social, fotos, dados do sensor , 
vídeo ou gravações de voz.
Veracidade refere-se a 
confiabilidade dos dados. Com 
muitas formas de grandes 
qualidades e precisão dos dados 
são menos controláveis ( basta 
pensar em posts no Twitter com 
hash tags, abreviações, erros de 
digitação e linguagem coloquial, 
bem como a confiabilidade e a 
precisão do conteúdo), mas agora 
a tecnologia permite-nos trabalhar 
com este tipo de dados . 
Veracidade
Valor! Ter acesso a big data 
não é bom a menos que 
possamos transformá-lo em 
valor. As empresas estão 
começando a gerar valores 
incríveis com Big Data 
Valor
Compreensão e segmentação de clientes 
Entendimento e otimização de processos de negócios 
● Quantificação pessoal e otimização de desempenho 
● Melhorar a Saúde e Saúde Pública 
● Melhorando o desempenho Sports 
● Melhorar a Ciência e Investigação 
● Otimização de máquinas e dispositivos de desempenho 
● Melhorar a segurança e aplicação da lei. 
● 
● Melhorar e optimizar Cidades e Países 
● 
● Negociação financeira
• Compreensão e segmentação de clientes 
• 
• O grande objetivo, em muitos casos, é a criação de modelos 
preditivos 
• 
• → Empresas de seguros de automóveis entender o quão bem os 
seus clientes realmente podem conduzir 
• → Campanhas eleitorais do governo podem ser otimizada 
utilizando grandes análise de dados 
• 
• Entendimento e otimização de processos de negócios 
• Big data também é cada vez mais utilizada para otimizar 
processos de negócios. Os varejistas são capazes de otimizar 
suas ações com base em previsões geradas a partir de dados de 
mídia social, as tendências de pesquisa na web e previsões 
meteorológicas. 
•
● Quantificação pessoal e otimização de desempenho 
• 
• Podemos nos beneficiar dos dados gerados a partir de 
dispositivos portáteis, tais como relógios inteligentes ou pulseiras 
inteligentes 
• 
• A outra área em que nos beneficiamos com grandes análises de 
dados é encontrar o amor. A maioria dos sites de namoro online 
aplicam ferramentas de big data e algoritmos para nos encontrar 
os pefis mais adequados. 
• 
• Melhorar a Saúde e Saúde Pública 
• Técnicas de Big Data já estão sendo usados p ara monitorar bebês 
em uma unidade de bebê prematuro e doente especialista. Ao 
registrar e analisar cada batida do coração e padrão de cada bebê 
respirando, o aparelho foi capaz de desenvolver algoritmos que 
agora podem prever infecções 24 horas antes de qualquer 
sintoma físico aparecer
● Melhorando o desempenho Sports 
• 
• Usando a análise em vídeo que monitoram o desempenho de cada 
jogador em um jogo de futebol ou de beisebol nos permitem obter 
feedback (via smartphones e servidores em nuvem) nos jogos e 
como melhorá-los. Muitas equipes desportivas de elite também 
acompanham os atletas fora do ambiente esportivo - usando a 
tecnologia inteligente para monitorar a nutrição e sono, assim 
como as conversas de mídia social para monitorar o bem-estar 
emocional. 
• 
• 
• 
• 
• 
•
• Copa do Mundo 2014 - Seleção Alemanha 
Treino - Em 10 minutos de treino, 10 jogadores geram mais de 7 
milhões de dados que são processados em tempo real 
Jogo – Com o histórico de dados coletados nos treinos o técnico 
pode saber quando um jogador chegou ao seu limite físico 
Pós treino e jogo – Cada jogador recebe acesso a curtos clipes de 
sua participação nos jogos além do seu desempenho físico e média 
da equipe
→ Magazine Luiza investe em projeto de Big Data, a 
niciativa busca direcionar recomendações de produtos 
em tempo real para seus clientes. 
→ Netshoes - Mercado de e-commerce, que permitia e 
facilitava trabalhar com muita inteligência as 
informações 
→Petrobras - Otimização e Monitoramento da 
Produção 
Análise preditiva para a Logistica de Armazenamento 
→ Inpe
Um cientista de dados representa uma evolução do papel de negócios 
ou analista de dados 
O que define o cientista de dados e o que o diferencia é forte visão de 
negócios, juntamente com a capacidade de comunicar os resultados, 
tanto para negócios e líderes de TI de uma forma que pode influenciar 
a forma como uma organização se aproxima de um desafio 
empresarial. Bons cientistas de dados não vão apenas resolver 
problemas de negócios, eles vão escolher os problemas certos que 
têm o maior valor para a organização. 
Habilidades para um bom cientista de dados 
Curiosidade 
Criatividade 
Foco 
Atenção aos detalhes
O cientista de dados, vive em três mundos: 
● Negócios 
● TI 
● Matemática 
É possível visualizar no LinkedIn que muitas das vagas para 
“data scientist” requerem um “full stack engineer”, alguém que 
domina todo o processo de ciência de dados.
Muitos das melhores e mais 
conhecidas ferramentas de 
dados disponíveis são 
grandes projetos de código 
aberto. O mais conhecido 
deles é o Hadoop, o que 
está gerando toda uma 
indústria de serviços e 
produtos relacionados.
Hadoop 
MapReduce 
Cassandra 
Hbase 
MongoDB 
Mahout 
Pig 
Zookeeper
Como começar um projeto Big Data?
● Problema. Determine quais são os problemas que você pretende 
resolver. 
● Impacto. Entenda como esses problemas vão impactar no seu 
negócio. É a sua equipe que vai estar fazendo a entrada de dados e 
análise ? Como é que este problema afeta a sua organização? 
● Os critérios de sucesso. Como você mede o sucesso? Quais 
são as principais métricas que você precisa para acompanhar todo 
este processo? 
● Impacto. O que você precisa entender claramente é que se este 
problema fosse resolvido, o que significaria para sua empresa? Este é 
tipicamente um dos passos mais importantes, uma vez que ajuda a 
determinar o que, como e quando você deve avançar com este projeto
● Cloud. Decida onde a solução deve estar, se deve ser uma 
nuvem, solução híbrida, etc. 
● Requisitos de dados. Avalie sua exigência de dados e entenda 
quais dados são necessários para resolver este problema. É dados 
que você já tem? É de dados que você deve buscar? 
● Identificar lacunas. Você tem pessoal suficiente para resolver 
este problema? Eles são capazes de resolver este problema? Você 
vai precisar de hardware ou software? 
● Abordagem ágil. Comece com uma pré-produção ou uma 
implementação piloto. Defina os objetivos e metas e divida em 
partes gerenciáveis.
● http://www1.folha.uol.com.br/infograficos/2014/07/84881- 
futebol-bigdata.shtml 
● http://oss-institute.org/latest-news/781-4-hot-open-sourc 
e-big-data-projects 
● http://www.bigdata-startups.com/open-source-tools/ 
● http://www.itforum365.com.br/noticias/detalhe/19927/ha 
bilidades-para-um-bom-cientista-de-dados 
● http://pt.slideshare.net/dwellman/what-is-big-data-24401 
517 
● http://pt.slideshare.net/conniedinnella/what-is-big-data 
-28714627?related=1 
● http://www.ikanow.com/8-proven-steps-to-starting-a-big-d 
ata-analytics-project/
Contatos 
rafaela@ambientelivre.com.br 
Www.ambientelivre.com.br/blogs/rafaela 
Www.ambientelivre.com.br

Mais conteúdo relacionado

Mais procurados

Aula 1 - Inteligência Artificial
Aula 1 - Inteligência ArtificialAula 1 - Inteligência Artificial
Aula 1 - Inteligência ArtificialThaís Gaudencio
 
Internet das Coisas - Conectando você e tudo ao seu redor
Internet das Coisas - Conectando você e tudo ao seu redorInternet das Coisas - Conectando você e tudo ao seu redor
Internet das Coisas - Conectando você e tudo ao seu redorAndré Curvello
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBItiaquarius
 
Identificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesIdentificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesFelipe Pereira
 
Design Thinking - Metodologia para Inovação
Design Thinking - Metodologia para InovaçãoDesign Thinking - Metodologia para Inovação
Design Thinking - Metodologia para InovaçãoPaulo Oliveira
 
Transformacao digital
Transformacao digitalTransformacao digital
Transformacao digitalCharlley Luz
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dadosvini_campos
 
Introdução a Machine Learning
Introdução a Machine LearningIntrodução a Machine Learning
Introdução a Machine LearningMorvana Bonin
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
O que é Business Intelligence (BI)
O que é Business Intelligence (BI)O que é Business Intelligence (BI)
O que é Business Intelligence (BI)Marco Garcia
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoLuis Borges Gouveia
 
Aula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfAula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfMarcelo Silva
 
Tecnologias emergentes na sala de aula
Tecnologias emergentes na sala de aulaTecnologias emergentes na sala de aula
Tecnologias emergentes na sala de aulaCarlos Pinheiro
 
Inteligência artificial
Inteligência artificial Inteligência artificial
Inteligência artificial Ana Felizardo
 
Internet das Coisas - Conceitos, tecnologias e aplicações
Internet das Coisas - Conceitos, tecnologias e aplicaçõesInternet das Coisas - Conceitos, tecnologias e aplicações
Internet das Coisas - Conceitos, tecnologias e aplicaçõesFabio Souza
 
Aula 01 tics - tecnologia da informacao e comunicacao final
Aula 01   tics - tecnologia da informacao e comunicacao finalAula 01   tics - tecnologia da informacao e comunicacao final
Aula 01 tics - tecnologia da informacao e comunicacao finalGilberto Campos
 

Mais procurados (20)

Aula 1 - Inteligência Artificial
Aula 1 - Inteligência ArtificialAula 1 - Inteligência Artificial
Aula 1 - Inteligência Artificial
 
Internet das Coisas - Conectando você e tudo ao seu redor
Internet das Coisas - Conectando você e tudo ao seu redorInternet das Coisas - Conectando você e tudo ao seu redor
Internet das Coisas - Conectando você e tudo ao seu redor
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBI
 
Identificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesIdentificação e avaliação de oportunidades
Identificação e avaliação de oportunidades
 
Design Thinking - Metodologia para Inovação
Design Thinking - Metodologia para InovaçãoDesign Thinking - Metodologia para Inovação
Design Thinking - Metodologia para Inovação
 
Transformacao digital
Transformacao digitalTransformacao digital
Transformacao digital
 
Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Introdução a Machine Learning
Introdução a Machine LearningIntrodução a Machine Learning
Introdução a Machine Learning
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Cidades Inteligentes
Cidades InteligentesCidades Inteligentes
Cidades Inteligentes
 
O que é Business Intelligence (BI)
O que é Business Intelligence (BI)O que é Business Intelligence (BI)
O que é Business Intelligence (BI)
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceito
 
Aula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfAula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdf
 
Tecnologias emergentes na sala de aula
Tecnologias emergentes na sala de aulaTecnologias emergentes na sala de aula
Tecnologias emergentes na sala de aula
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Inteligência artificial
Inteligência artificial Inteligência artificial
Inteligência artificial
 
Internet das Coisas - Conceitos, tecnologias e aplicações
Internet das Coisas - Conceitos, tecnologias e aplicaçõesInternet das Coisas - Conceitos, tecnologias e aplicações
Internet das Coisas - Conceitos, tecnologias e aplicações
 
Aula 01 tics - tecnologia da informacao e comunicacao final
Aula 01   tics - tecnologia da informacao e comunicacao finalAula 01   tics - tecnologia da informacao e comunicacao final
Aula 01 tics - tecnologia da informacao e comunicacao final
 
Tecnologia
Tecnologia Tecnologia
Tecnologia
 

Destaque

Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataPsicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataLuciana Manfroi
 
Blogging and smart content management
Blogging and smart content managementBlogging and smart content management
Blogging and smart content managementSteven Zwerink
 
ARChem on the National Chemical Database Service Portal
ARChem on the National Chemical Database Service PortalARChem on the National Chemical Database Service Portal
ARChem on the National Chemical Database Service PortalSimBioSys_Inc
 
Raspberry Pi Hacks
Raspberry Pi HacksRaspberry Pi Hacks
Raspberry Pi HacksImad Rhali
 
Titulación universitaria versus empleo.
Titulación universitaria versus empleo.Titulación universitaria versus empleo.
Titulación universitaria versus empleo.José María
 
Vital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe
Vital Trends in Digital and Social in 2015 and Beyond by Dion HinchcliffeVital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe
Vital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe7Summits
 
Responsive design - no size, fits all
Responsive design - no size, fits allResponsive design - no size, fits all
Responsive design - no size, fits allJan-Willem van Veelen
 
Final 2014 food and health survey executive summary
Final 2014 food and health survey executive summaryFinal 2014 food and health survey executive summary
Final 2014 food and health survey executive summaryFood Insight
 
Xvi. морські мотиви
Xvi. морські мотивиXvi. морські мотиви
Xvi. морські мотивиOlga Lesenko
 
Founders Den App Store Optimization by Yann Kronberg
Founders Den App Store Optimization by Yann KronbergFounders Den App Store Optimization by Yann Kronberg
Founders Den App Store Optimization by Yann KronbergEdith Yeung
 
Periscope Session at #MayoClinicETF
Periscope Session at #MayoClinicETFPeriscope Session at #MayoClinicETF
Periscope Session at #MayoClinicETFLee Aase
 
Impacto de las tic en la educación (1)
Impacto de las tic en la educación (1)Impacto de las tic en la educación (1)
Impacto de las tic en la educación (1)yusmeily munoz
 
How to Create an Epic Presence on Facebook for your Nonprofit
How to Create an Epic Presence on Facebook for your NonprofitHow to Create an Epic Presence on Facebook for your Nonprofit
How to Create an Epic Presence on Facebook for your NonprofitJohn Haydon
 

Destaque (20)

Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big DataPsicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
Psicologia e Comportamento nas Redes Sociais: da Web 1.0 à Big Data
 
Big data apresentacao
Big data apresentacaoBig data apresentacao
Big data apresentacao
 
Blogging and smart content management
Blogging and smart content managementBlogging and smart content management
Blogging and smart content management
 
Calculating ledge profile 1997
Calculating ledge profile 1997Calculating ledge profile 1997
Calculating ledge profile 1997
 
ARChem on the National Chemical Database Service Portal
ARChem on the National Chemical Database Service PortalARChem on the National Chemical Database Service Portal
ARChem on the National Chemical Database Service Portal
 
Raspberry Pi Hacks
Raspberry Pi HacksRaspberry Pi Hacks
Raspberry Pi Hacks
 
Titulación universitaria versus empleo.
Titulación universitaria versus empleo.Titulación universitaria versus empleo.
Titulación universitaria versus empleo.
 
Plant based, heart healthy dishes
Plant based, heart healthy dishesPlant based, heart healthy dishes
Plant based, heart healthy dishes
 
Vital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe
Vital Trends in Digital and Social in 2015 and Beyond by Dion HinchcliffeVital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe
Vital Trends in Digital and Social in 2015 and Beyond by Dion Hinchcliffe
 
Responsive design - no size, fits all
Responsive design - no size, fits allResponsive design - no size, fits all
Responsive design - no size, fits all
 
RESUME
RESUMERESUME
RESUME
 
Final 2014 food and health survey executive summary
Final 2014 food and health survey executive summaryFinal 2014 food and health survey executive summary
Final 2014 food and health survey executive summary
 
Xvi. морські мотиви
Xvi. морські мотивиXvi. морські мотиви
Xvi. морські мотиви
 
Founders Den App Store Optimization by Yann Kronberg
Founders Den App Store Optimization by Yann KronbergFounders Den App Store Optimization by Yann Kronberg
Founders Den App Store Optimization by Yann Kronberg
 
Periscope Session at #MayoClinicETF
Periscope Session at #MayoClinicETFPeriscope Session at #MayoClinicETF
Periscope Session at #MayoClinicETF
 
Impacto de las tic en la educación (1)
Impacto de las tic en la educación (1)Impacto de las tic en la educación (1)
Impacto de las tic en la educación (1)
 
EXPEDIA-ORBITZ MERGER
EXPEDIA-ORBITZ MERGEREXPEDIA-ORBITZ MERGER
EXPEDIA-ORBITZ MERGER
 
How to Create an Epic Presence on Facebook for your Nonprofit
How to Create an Epic Presence on Facebook for your NonprofitHow to Create an Epic Presence on Facebook for your Nonprofit
How to Create an Epic Presence on Facebook for your Nonprofit
 
ЦТТМ и Фаблаб Политех (Fab Lab Polytech)
ЦТТМ и Фаблаб Политех (Fab Lab Polytech)ЦТТМ и Фаблаб Политех (Fab Lab Polytech)
ЦТТМ и Фаблаб Политех (Fab Lab Polytech)
 

Semelhante a Big Data, o que é isso?

Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 
Big data muito alem dos dados
Big data muito alem dos dadosBig data muito alem dos dados
Big data muito alem dos dadoscardoso80
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2alexculpado
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
AULA 11 - FUNDAMENTOS DE BIG DATA.pdfAULA 11 - FUNDAMENTOS DE BIG DATA.pdf
AULA 11 - FUNDAMENTOS DE BIG DATA.pdfMaraLuizaGonalvesFre
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big DataCarlos Barbieri
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e DesafiosFlávio Sousa
 
Big Data- 25/07/2017 - TI IASP
Big Data- 25/07/2017 - TI IASPBig Data- 25/07/2017 - TI IASP
Big Data- 25/07/2017 - TI IASPrcdbarros
 
Workshopdobem_data_driven_marketing
Workshopdobem_data_driven_marketingWorkshopdobem_data_driven_marketing
Workshopdobem_data_driven_marketingRegina Cantele
 

Semelhante a Big Data, o que é isso? (20)

Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Big data, e eu com isso?
Big data, e eu com isso?Big data, e eu com isso?
Big data, e eu com isso?
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
Big Data
Big DataBig Data
Big Data
 
Big data muito alem dos dados
Big data muito alem dos dadosBig data muito alem dos dados
Big data muito alem dos dados
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
AULA 11 - FUNDAMENTOS DE BIG DATA.pdfAULA 11 - FUNDAMENTOS DE BIG DATA.pdf
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
 
Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big Data
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Artigo big data_final
Artigo big data_finalArtigo big data_final
Artigo big data_final
 
Data is the new oil
Data is the new oilData is the new oil
Data is the new oil
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e Desafios
 
Big Data- 25/07/2017 - TI IASP
Big Data- 25/07/2017 - TI IASPBig Data- 25/07/2017 - TI IASP
Big Data- 25/07/2017 - TI IASP
 
Workshopdobem_data_driven_marketing
Workshopdobem_data_driven_marketingWorkshopdobem_data_driven_marketing
Workshopdobem_data_driven_marketing
 

Mais de Ambiente Livre

Low Code Data Science with Pentaho Machine Intelligence
Low Code Data Science with Pentaho Machine IntelligenceLow Code Data Science with Pentaho Machine Intelligence
Low Code Data Science with Pentaho Machine IntelligenceAmbiente Livre
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics. Ambiente Livre
 
Apache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataApache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataAmbiente Livre
 
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...Ambiente Livre
 
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration Ambiente Livre
 
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...Ambiente Livre
 
Metodologia Hacker de Ensino na Ambiente Livre
Metodologia Hacker de Ensino na Ambiente LivreMetodologia Hacker de Ensino na Ambiente Livre
Metodologia Hacker de Ensino na Ambiente LivreAmbiente Livre
 
Integrando o Drupal com o ECM Alfresco usando CMIS
Integrando o Drupal com o ECM Alfresco usando CMISIntegrando o Drupal com o ECM Alfresco usando CMIS
Integrando o Drupal com o ECM Alfresco usando CMISAmbiente Livre
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Ambiente Livre
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
SEBRAETEC - Inteligência Empresarial com CRM BI ECM e BPM
SEBRAETEC -  Inteligência Empresarial com CRM BI ECM e BPMSEBRAETEC -  Inteligência Empresarial com CRM BI ECM e BPM
SEBRAETEC - Inteligência Empresarial com CRM BI ECM e BPMAmbiente Livre
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoAmbiente Livre
 
Suporte a Geo-Mapping no Pentaho Report
Suporte a Geo-Mapping no Pentaho ReportSuporte a Geo-Mapping no Pentaho Report
Suporte a Geo-Mapping no Pentaho ReportAmbiente Livre
 

Mais de Ambiente Livre (20)

Low Code Data Science with Pentaho Machine Intelligence
Low Code Data Science with Pentaho Machine IntelligenceLow Code Data Science with Pentaho Machine Intelligence
Low Code Data Science with Pentaho Machine Intelligence
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
 
Apache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataApache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big Data
 
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...
 
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration
 
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
 
Metodologia Hacker de Ensino na Ambiente Livre
Metodologia Hacker de Ensino na Ambiente LivreMetodologia Hacker de Ensino na Ambiente Livre
Metodologia Hacker de Ensino na Ambiente Livre
 
Integrando o Drupal com o ECM Alfresco usando CMIS
Integrando o Drupal com o ECM Alfresco usando CMISIntegrando o Drupal com o ECM Alfresco usando CMIS
Integrando o Drupal com o ECM Alfresco usando CMIS
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
SEBRAETEC - Inteligência Empresarial com CRM BI ECM e BPM
SEBRAETEC -  Inteligência Empresarial com CRM BI ECM e BPMSEBRAETEC -  Inteligência Empresarial com CRM BI ECM e BPM
SEBRAETEC - Inteligência Empresarial com CRM BI ECM e BPM
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI Pentaho
 
Suporte a Geo-Mapping no Pentaho Report
Suporte a Geo-Mapping no Pentaho ReportSuporte a Geo-Mapping no Pentaho Report
Suporte a Geo-Mapping no Pentaho Report
 

Big Data, o que é isso?

  • 1. B ig Data, o que é iss o? O que é isso?
  • 2. Rafaela Raganham ● Formada em Sistemas de Informação, pela Faculdades Integradas do Brasil (Unibrasil). ●MBA Business Intelligence (Positivo) ● Palestrante FISL, FTSL, SFD e Solisc Desempenha funções de análise e desenvolvimento de sistemas desde 2008, atualmente trabalha na Ambiente Livre Tecnologia onde presta serviços de desenvolvimento, customizações e consultoria em sistemas open source.
  • 4. Todo mundo está falando sobre Big Data
  • 5. Nossa sociedade está deixando para trás uma pegada digital. As pessoas estão vivendo em linha e todos estamos expressando nossas atitudes, gostos, desgostos, opiniões e perspectivas.
  • 6.
  • 7. Indivíduos com smartphones e sites de redes sociais continuarão a impulsionar o crescimento de dados exponencialmente
  • 8. • 90% dos dados no mundo de hoje foram criados nos últimos dois anos • Previsão IDC: O universo global de dados irá dobrar a cada dois anos, chegando a 40 mil exabytes ou de 40 trilhões de GB até 2020 • Internet Archive tem em torno de 2 petabytes de dados, e está crescendo a uma taxa de 20 terabytes por mês. • 30 bilhões de conteúdos foram adicionados ao Facebook • 2 bilhões de vídeos são vistos no Youtube • 2,5 quintilhões de bytes de dados é criado
  • 9.
  • 10.
  • 11.
  • 12.
  • 13. ● Então o que é BIG DATA ?!
  • 14. "Big Data é a capacidade de uma empresa para armazenar, processar e acessar todos os dados de que necessita para funcionar, tomar decisões, reduzir riscos, e servir os clientes." - Forrester "Big Data, em geral, é definido como alto volume, velocidade e variedade ativos de informação que exigem formas eficazes e inovadoras de custos de processamento de informações para uma melhor percepção e tomada de decisão." - Gartner "Big data são os dados caracterizados por três atributos: volume, variedade e velocidade." - IBM "Big data são os dados caracterizados por quatro atributos principais: volume, variedade, velocidade e valor." - Oracle
  • 15.
  • 16. Byte: um grão de arroz
  • 17. Byte: um grão de arroz Kilobyte: xícara de arroz
  • 18. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz
  • 19. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz
  • 20. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios com containers
  • 21. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios com containers Petabyte: Estado de Manhattan
  • 22. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios de containers Petabyte: Estado de Manhattan Exabyte: Costa oeste
  • 23. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios de containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico
  • 24. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios de containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA
  • 25. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios de containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA Hobbyist
  • 26. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios com containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA Hobbyist Desktop
  • 27. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios com containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA Hobbyist Desktop Internet
  • 28. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios com containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA Hobbyist Desktop Internet Big Data
  • 29. Byte: um grão de arroz Kilobyte: xícara de arroz Megabyte: 8 sacos de arroz Gigabyte: 3 caminhões de arroz Terabyte: 2 navios de containers Petabyte: Estado de Manhattan Exabyte: Costa oeste Zettabyte: Oceano Pacífico Yottabyte: A TERRA
  • 30.
  • 31. Volume refere-se a grande quantidade de dados gerados a cada segundo. Isso faz com que a maioria dos conjuntos de dados sejam muito grandes para armazenar e analisar usando a tecnologia de banco de dados tradicional. Novas ferramentas de Big Data utilizam sistemas distribuídos de modo que podemos armazenar e analisar os dados entre bancos de dados que estão espalhados em qualquer lugar do mundo
  • 32. Velocidade refere-se à velocidade com que os novos dados são gerados e a velocidade com que se move em torno de dados. Basta pensar em mensagens de mídia social que se tornam viral em segundos. A tecnologia nos permite agora a analisar os dados enquanto ele está sendo gerado (por vezes referido como inMemory analytics), sem nunca colocá-lo em bases de dados
  • 33. Variedade refere-se aos diferentes tipos de dados que podemos agora utilizar. No passado, apenas eram usados dados estruturados cuidadosamente armazenados em bancos de dados relacionais. 80% dos dados do mundo são não-estruturados (texto, imagens, vídeo, voz, etc) com grande tecnologia de dados, podemos agora analisar e reunir dados de diferentes tipos, tais como mensagens, conversas de mídia social, fotos, dados do sensor , vídeo ou gravações de voz.
  • 34. Veracidade refere-se a confiabilidade dos dados. Com muitas formas de grandes qualidades e precisão dos dados são menos controláveis ( basta pensar em posts no Twitter com hash tags, abreviações, erros de digitação e linguagem coloquial, bem como a confiabilidade e a precisão do conteúdo), mas agora a tecnologia permite-nos trabalhar com este tipo de dados . Veracidade
  • 35. Valor! Ter acesso a big data não é bom a menos que possamos transformá-lo em valor. As empresas estão começando a gerar valores incríveis com Big Data Valor
  • 36.
  • 37. Compreensão e segmentação de clientes Entendimento e otimização de processos de negócios ● Quantificação pessoal e otimização de desempenho ● Melhorar a Saúde e Saúde Pública ● Melhorando o desempenho Sports ● Melhorar a Ciência e Investigação ● Otimização de máquinas e dispositivos de desempenho ● Melhorar a segurança e aplicação da lei. ● ● Melhorar e optimizar Cidades e Países ● ● Negociação financeira
  • 38. • Compreensão e segmentação de clientes • • O grande objetivo, em muitos casos, é a criação de modelos preditivos • • → Empresas de seguros de automóveis entender o quão bem os seus clientes realmente podem conduzir • → Campanhas eleitorais do governo podem ser otimizada utilizando grandes análise de dados • • Entendimento e otimização de processos de negócios • Big data também é cada vez mais utilizada para otimizar processos de negócios. Os varejistas são capazes de otimizar suas ações com base em previsões geradas a partir de dados de mídia social, as tendências de pesquisa na web e previsões meteorológicas. •
  • 39. ● Quantificação pessoal e otimização de desempenho • • Podemos nos beneficiar dos dados gerados a partir de dispositivos portáteis, tais como relógios inteligentes ou pulseiras inteligentes • • A outra área em que nos beneficiamos com grandes análises de dados é encontrar o amor. A maioria dos sites de namoro online aplicam ferramentas de big data e algoritmos para nos encontrar os pefis mais adequados. • • Melhorar a Saúde e Saúde Pública • Técnicas de Big Data já estão sendo usados p ara monitorar bebês em uma unidade de bebê prematuro e doente especialista. Ao registrar e analisar cada batida do coração e padrão de cada bebê respirando, o aparelho foi capaz de desenvolver algoritmos que agora podem prever infecções 24 horas antes de qualquer sintoma físico aparecer
  • 40. ● Melhorando o desempenho Sports • • Usando a análise em vídeo que monitoram o desempenho de cada jogador em um jogo de futebol ou de beisebol nos permitem obter feedback (via smartphones e servidores em nuvem) nos jogos e como melhorá-los. Muitas equipes desportivas de elite também acompanham os atletas fora do ambiente esportivo - usando a tecnologia inteligente para monitorar a nutrição e sono, assim como as conversas de mídia social para monitorar o bem-estar emocional. • • • • • •
  • 41. • Copa do Mundo 2014 - Seleção Alemanha Treino - Em 10 minutos de treino, 10 jogadores geram mais de 7 milhões de dados que são processados em tempo real Jogo – Com o histórico de dados coletados nos treinos o técnico pode saber quando um jogador chegou ao seu limite físico Pós treino e jogo – Cada jogador recebe acesso a curtos clipes de sua participação nos jogos além do seu desempenho físico e média da equipe
  • 42. → Magazine Luiza investe em projeto de Big Data, a niciativa busca direcionar recomendações de produtos em tempo real para seus clientes. → Netshoes - Mercado de e-commerce, que permitia e facilitava trabalhar com muita inteligência as informações →Petrobras - Otimização e Monitoramento da Produção Análise preditiva para a Logistica de Armazenamento → Inpe
  • 43.
  • 44. Um cientista de dados representa uma evolução do papel de negócios ou analista de dados O que define o cientista de dados e o que o diferencia é forte visão de negócios, juntamente com a capacidade de comunicar os resultados, tanto para negócios e líderes de TI de uma forma que pode influenciar a forma como uma organização se aproxima de um desafio empresarial. Bons cientistas de dados não vão apenas resolver problemas de negócios, eles vão escolher os problemas certos que têm o maior valor para a organização. Habilidades para um bom cientista de dados Curiosidade Criatividade Foco Atenção aos detalhes
  • 45. O cientista de dados, vive em três mundos: ● Negócios ● TI ● Matemática É possível visualizar no LinkedIn que muitas das vagas para “data scientist” requerem um “full stack engineer”, alguém que domina todo o processo de ciência de dados.
  • 46.
  • 47. Muitos das melhores e mais conhecidas ferramentas de dados disponíveis são grandes projetos de código aberto. O mais conhecido deles é o Hadoop, o que está gerando toda uma indústria de serviços e produtos relacionados.
  • 48. Hadoop MapReduce Cassandra Hbase MongoDB Mahout Pig Zookeeper
  • 49.
  • 50. Como começar um projeto Big Data?
  • 51. ● Problema. Determine quais são os problemas que você pretende resolver. ● Impacto. Entenda como esses problemas vão impactar no seu negócio. É a sua equipe que vai estar fazendo a entrada de dados e análise ? Como é que este problema afeta a sua organização? ● Os critérios de sucesso. Como você mede o sucesso? Quais são as principais métricas que você precisa para acompanhar todo este processo? ● Impacto. O que você precisa entender claramente é que se este problema fosse resolvido, o que significaria para sua empresa? Este é tipicamente um dos passos mais importantes, uma vez que ajuda a determinar o que, como e quando você deve avançar com este projeto
  • 52. ● Cloud. Decida onde a solução deve estar, se deve ser uma nuvem, solução híbrida, etc. ● Requisitos de dados. Avalie sua exigência de dados e entenda quais dados são necessários para resolver este problema. É dados que você já tem? É de dados que você deve buscar? ● Identificar lacunas. Você tem pessoal suficiente para resolver este problema? Eles são capazes de resolver este problema? Você vai precisar de hardware ou software? ● Abordagem ágil. Comece com uma pré-produção ou uma implementação piloto. Defina os objetivos e metas e divida em partes gerenciáveis.
  • 53. ● http://www1.folha.uol.com.br/infograficos/2014/07/84881- futebol-bigdata.shtml ● http://oss-institute.org/latest-news/781-4-hot-open-sourc e-big-data-projects ● http://www.bigdata-startups.com/open-source-tools/ ● http://www.itforum365.com.br/noticias/detalhe/19927/ha bilidades-para-um-bom-cientista-de-dados ● http://pt.slideshare.net/dwellman/what-is-big-data-24401 517 ● http://pt.slideshare.net/conniedinnella/what-is-big-data -28714627?related=1 ● http://www.ikanow.com/8-proven-steps-to-starting-a-big-d ata-analytics-project/
  • 54.