SlideShare uma empresa Scribd logo
1 de 117
Baixar para ler offline
Treinamento Hadoop
Parte 4
Alexandre Uehara
● Analista Desenvolvedor (E-commerce)
● Coordenador Trilha Big Data (TDC
2013)
http://www.thedevelopersconference.com.
br/tdc/2013/saopaulo/trilha-bigdata#programacao
● Geek e nerd, trabalha com Python,
Java, C, BigData, NoSQL, e outras
coisas mais que aparecem no dia a dia
Nossa
Agenda:
Dia 4!!!
Dia 1:
Introdução
Conceitos Básicos
Big Data
→ O que é?
→ 4 V's
→ Por que
agora?
→ Onde Usar?
→ Desafio
→ BI x Big Data
→Profissional de
Big Data
→ Ferramentas
→ Dicas
Dia 2 e 3:
Map Reduce e
Hadoop
→ História
(Google)
→ Conceito
MapReduce
→ Hadoop
→ Cases
Dia 4
Outras
Ferramentas
→ Ecossistema
→ Ferramentas
→ Distribuições
Hadoop
→ Hadoop na
Nuvem
→ NoSQL Tipos
→ NoSQL
Exemplos
→ Data Science
→ Machine
Learning
Dia 5, 6 e 7
Hands-on
→ Python
→ Hadoop
Não aguento!!!
Calma…
Último dia
teórico
Big data
Big data ferramenta
Big data Hadoopferramenta
Big data Hadoopferramenta
A partir dele
criou-se
Big data Hadoop
MapReduce
ferramenta
A partir dele
criou-se
Big data Hadoop
MapReduce
ferramenta
A partir dele
criou-se
Criou
Big data Hadoop
MapReduceGoogle
ferramenta
A partir dele
criou-se
Criou
Map Reduce
Google
FileSystem
Google Map
Reduce
Map Reduce
Google
FileSystem
Google Map
Reduce
Hadoop
Map Reduce
Google
FileSystem
Google Map
Reduce
Hadoop
Map Reduce
Hadoop
Map Reduce
Google
FileSystem
Google Map
Reduce
Hadoop
Map Reduce
HDFS
Hadoop
Map Reduce
Google
FileSystem
Google Map
Reduce
Hadoop
Map Reduce
HDFS
Hadoop
Hadoop
Commons
Map Reduce
● Decompõe tudo em ???
Map Reduce
● Decompõe tudo em Pares - chave :
valor
● Depois???
Map Reduce
● Decompõe tudo em Pares - chave :
valor
● Depois sumariza os resultados
Nó Master
Nó Slave
Nó Master
Nó Slave
● NameNode
Nó Master
Nó Slave
● NameNode
● SecondaryNameNode
Nó Master
Nó Slave
● NameNode
● SecondaryNameNode
● JobTracker
Nó Master
Nó Slave
● DataNode
●
● NameNode
● SecondaryNameNode
● JobTracker
Nó Master
Nó Slave
● DataNode
● TaskTracker
● NameNode
● SecondaryNameNode
● JobTracker
Por que um elefante amarelo?
Por que Hadoop?
Vamos….
vamos!!!
Ecossistema Hadoop
● Banco de Dados Hadoop
● Baseado no Google BigTable
● NoSQL - Orientado a
Colunas
● Leitura e Escrita em Real-
Time
● Funciona sobre o HDFS
● HSQL para quem sabe SQL
● Sistema de exportação de logs
contendo grande quantidade de dados
para o HDFS
● Um loader em tempo real para
transmissão de seus dados para o
Hadoop
● Armazena dados no HDFS e HBase
● Ferramenta de exportação de dados de
SGBDs
● Fornece transferência de dados
bidirecional entre o Hadoop e seu
banco de dados relacional
● Usa JDBC
● Biblioteca de algoritmos de
aprendizado de máquina (Machine
Learning) e data mining
● Principal objetivo: ser escalável para
manipular grandes volumes de dados
O Mahout é utilizado quando se é preciso
trabalhar com:
● Matrizes e vetores
● Estruturas esparsas e densas
● Agrupamento
● Cobertura
● K-Means
● Análise de densidade de funções
● Filtragem colaborativa
● "Coordenador" de serviços
● Permite que os processos
distribuídos em sistemas de grande
porte sincronizem informações um
com o outro sem falha, de modo que
todos os clientes que fazem
solicitações recebam dados
consistentes
● monitoramento e coleta de dados
de sistemas distribuídos
● Gerencia o fluxo de trabalho do
Hadoop
● um "Workflow scheduler"
Storm
● Para processamento em tempo real
distribuído
● Independente de linguagem
● Desenvolvido pelo Twitter
Converte queries SQL em Map
Reduce
Não foi desenhado para
OLTP ou real-time
● Criado pelo Yahoo!
● Linguagem de script
(alto nível) para
MapReduce
● Script com SQL
● A linguagem Pig é
chamada Pig Latin
● Problema:
● Exemplo Código PIG:
Users = load `users' as (name, age);
Fltrd = filter Users by age >= 18 and age <= 25;
Pages = load `pages' as (user, url);
Jnd = join Fltrd by name, Pages by user;
Grpd = group Jnd by url;
Smmd = foreach Grpd generate group,
COUNT(Jnd) as clicks;
Srtd = order Smmd by clicks desc;
Top5 = limit Srtd 5;
store Top5 into `top5sites';
Em 2010, tarefas MapReduce geradas pelo
Pig correspondiam a 70% das tarefas
executadas no Yahoo!
O Pig também é usado pelo Twitter,
LinkedIn, Ebay, AOL, etc.
Usos comuns:
● Processamento de logs de servidores web
● Construção de modelos de predição de
comportamento de usuários
● Processamento de imagens
● Construção de índices de páginas da web
● Pesquisa em conjuntos de dados “brutos”
http://thoughtworks.fileburst.com/assets/technology-radar-jan-2014-pt.pdf
Distribuições
Hadoop
2014 Forrester
Wave for Hadoop
● Custo acessível.
● 5 a 10 anos atrás era impossível
● Apenas para grandes empresas. Hoje startup, consegue
● Custo acessível.
● 5 a 10 anos atrás era
impossível
● Apenas para grandes
empresas. Hoje startup,
consegue
● Amazon Elastic MapReduce (Amazon
EMR)
● Distribui os dados e processa em um
cluster redimensionável de
instâncias do Amazon EC2
● Hive, Pig
● 2007
● Converteu para PDF todos seus os
artigos publicados entre 1851 e 1980
● O Hadoop foi utilizado para converter
4 TB de imagens TIFF em 11 milhões de
arquivos PDF
● Duração 24 horas
● 100 instâncias EC2 da Amazon
● Gerado 1,5 TB de arquivos PDF
● Custo aproximado: US$ 240,00
noSQL
Por que agora?
● Dados crescendo exponencialmente
● Dados não estruturados
● Arquitetura
Compressão 60% a 70% mais eficiente que nos
bancos orientados a linhas.
Principais benefícios
● Acesso rápido a dados (desde que você
possa manter tudo na memória);
● Rápida replicação de dados /
distribuídos por vários nós;
● Esquema flexível (você pode adicionar
novas colunas instantaneamente);
Que problemas
podem ser
resolvidos (ou as
pessoas acham que
podem resolver)
com a ajuda de
NoSQL e Big Data?
Que problemas
podem ser
resolvidos (ou as
pessoas acham que
podem resolver)
com a ajuda de
NoSQL e Big Data?
Mais
desempenho e
mais esquemas
flexíveis
SQL x NoSQL
● Consistência e
integridade
● Normalização para
evitar dados
redundantes
● Linguagem
padronizada de
consulta (SQL)
● Escalabilidade
● Tolerância a Falhas
● Modelo de
consistência fraco
Machine
Learning
É um ramo da inteligência
artificial, onde o aprendizado é
feito a partir de dados.
Machine Learning - como?
1. dados são obtidos e armazenados
2. um modelo de análise é criado
3. quando novos dados chegam, o modelo é
capaz de fazer predições uteis
Benchmark - Statistcs Programming Language
Linguagem R
● É a linguagem mais usada para Data Scientist (Pesquisa O'Reilley - Janeiro
2014)
● 70% dos Data Miners usam R (Pesquisa Rexer - Outubro 2013)
● R está na 15a posição das linguagens de programação mais
usadas (RedMonk ranking - Janeiro 2014)
● R está crescendo mais que qualquer outra linguagem de Data
Science (Pequisa KDNuggets - Agosto 2013)
● R é a linguagem número 1 no Google Search para Advanced
Analytics Software (Google Trends - Março 2014)
● R tem mais de 2 milhões de usuários no mundo (Estimativa Oracle - Fevereiro
2012)
Data
Scientist
As principais habilidades para os
cientistas de dados são:
● algoritmos,
● programas de back-end como JAVA,
● estatísticas Bayesiana,
● método de Monte Carlo,
● ferramentas como Hadoop para
dados massivos,
● negócios,
● estatísticas clássicas,
● manipulação de dados como SAS,
● programas de front-end como
HTML,
● modelos gráficos como análise
estrutural de redes sociais,
● machine learning como árvore de
decisões e clustering,
● matemática como álgebra linear,
● otimização,
● desenvolvimento do produto,
● design experiencial,
● simuladores,
● estatísticas espaciais,
● dados estruturados como SQL,
● marketing e pesquisa,
● sistemas administrativos,
● estatísticas temporais como
previsão,
● e dados não estruturados como
mineração de textos e
visualização de dados
Hadoop x SQL
Alexandre Uehara
@AleUehara
linkedin.com/in/aleuehara
uehara.alexandre@gmail.com
slideshare.net/aleuehara

Mais conteúdo relacionado

Mais procurados

Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 
Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Thiago Santiago
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceFelipe RENZ - MBA TI / Big
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passosSensedia
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 
Big Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveBig Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveFlavio Fonte, PMP, ITIL
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
 
Arquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataArquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataSandro Andrade
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
A importância do ecossistema Java em aplicações baseadas em Big Data
A importância do ecossistema Java em aplicações baseadas em Big DataA importância do ecossistema Java em aplicações baseadas em Big Data
A importância do ecossistema Java em aplicações baseadas em Big DataVinícius Barros
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 

Mais procurados (20)

Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
Seminário Hadoop
Seminário HadoopSeminário Hadoop
Seminário Hadoop
 
Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open source
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passos
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
Big Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveBig Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hive
 
Hadoop, Big Data e Cloud Computing
Hadoop, Big Data e Cloud ComputingHadoop, Big Data e Cloud Computing
Hadoop, Big Data e Cloud Computing
 
Proposta de arquitetura Hadoop
Proposta de arquitetura HadoopProposta de arquitetura Hadoop
Proposta de arquitetura Hadoop
 
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na práticaData Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na prática
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
 
Arquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataArquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigData
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
A importância do ecossistema Java em aplicações baseadas em Big Data
A importância do ecossistema Java em aplicações baseadas em Big DataA importância do ecossistema Java em aplicações baseadas em Big Data
A importância do ecossistema Java em aplicações baseadas em Big Data
 
Hadoop
HadoopHadoop
Hadoop
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
BigData MapReduce
BigData MapReduceBigData MapReduce
BigData MapReduce
 

Destaque

Qmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloQmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloRoberto Oliveira
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small dataRoberto Oliveira
 
Open Source na IBM (palestra efetuada no Comaer 2008)
Open Source na IBM (palestra efetuada no Comaer 2008)Open Source na IBM (palestra efetuada no Comaer 2008)
Open Source na IBM (palestra efetuada no Comaer 2008)Cezar Taurion
 
Visual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasVisual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasLuis__Rodrigues
 
Apresentação SpagoBI
Apresentação SpagoBIApresentação SpagoBI
Apresentação SpagoBIGrendene S/A
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Trabalho BI Qlikview
Trabalho BI QlikviewTrabalho BI Qlikview
Trabalho BI QlikviewJose Silva
 
Open Source Business Intelligence
Open Source Business IntelligenceOpen Source Business Intelligence
Open Source Business IntelligenceDaniel Rabelo
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauLeandro Guerra
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceIT4biz IT Solutions
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataMarco Garcia
 
R, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceR, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceLeandro Guerra
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauXpand IT
 
Slides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingSlides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingPapos na rede
 
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner SomativaCaso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner Somativastellasomativa
 

Destaque (20)

Qmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloQmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_Pablo
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Open Source na IBM (palestra efetuada no Comaer 2008)
Open Source na IBM (palestra efetuada no Comaer 2008)Open Source na IBM (palestra efetuada no Comaer 2008)
Open Source na IBM (palestra efetuada no Comaer 2008)
 
Visual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasVisual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentas
 
Apresentação SpagoBI
Apresentação SpagoBIApresentação SpagoBI
Apresentação SpagoBI
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Business intelligence com QlikView
Business intelligence com QlikViewBusiness intelligence com QlikView
Business intelligence com QlikView
 
Trabalho BI Qlikview
Trabalho BI QlikviewTrabalho BI Qlikview
Trabalho BI Qlikview
 
Open Source Business Intelligence
Open Source Business IntelligenceOpen Source Business Intelligence
Open Source Business Intelligence
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no Tableau
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big Data
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
Self Service BI com Power BI
Self Service BI com Power BISelf Service BI com Power BI
Self Service BI com Power BI
 
R, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceR, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business Intelligence
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with Tableau
 
Slides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingSlides Google Analytics - SEO Marketing
Slides Google Analytics - SEO Marketing
 
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner SomativaCaso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
 
Pentaho
PentahoPentaho
Pentaho
 

Semelhante a Big data Hadoop MapReduce ferramenta

Big Data Open Source com Hadoop
Big Data Open Source com HadoopBig Data Open Source com Hadoop
Big Data Open Source com HadoopAmbiente Livre
 
Interoperabilidade com BigData Hadoop para Windows Azure
Interoperabilidade com BigData Hadoop  para Windows AzureInteroperabilidade com BigData Hadoop  para Windows Azure
Interoperabilidade com BigData Hadoop para Windows AzureAlessandro Binhara
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDatatdc-globalcode
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...tdc-globalcode
 
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemAnálise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemOtávio Carvalho
 
Big data para programadores convencionais
Big data para programadores convencionaisBig data para programadores convencionais
Big data para programadores convencionaisRoberto Oliveira
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Ambiente Livre
 
Hadoop - primeiros passos
Hadoop - primeiros passosHadoop - primeiros passos
Hadoop - primeiros passosrhpinotti
 
Filesystem distribuído com hadoop!!!
Filesystem distribuído com hadoop!!! Filesystem distribuído com hadoop!!!
Filesystem distribuído com hadoop!!! Alessandro Binhara
 
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Vinícius Barros
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 

Semelhante a Big data Hadoop MapReduce ferramenta (20)

Big Data Open Source com Hadoop
Big Data Open Source com HadoopBig Data Open Source com Hadoop
Big Data Open Source com Hadoop
 
Hadoop
HadoopHadoop
Hadoop
 
Interoperabilidade com BigData Hadoop para Windows Azure
Interoperabilidade com BigData Hadoop  para Windows AzureInteroperabilidade com BigData Hadoop  para Windows Azure
Interoperabilidade com BigData Hadoop para Windows Azure
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
 
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemAnálise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
 
Big data e ecossistema hadoop
Big data e ecossistema hadoopBig data e ecossistema hadoop
Big data e ecossistema hadoop
 
Big data para programadores convencionais
Big data para programadores convencionaisBig data para programadores convencionais
Big data para programadores convencionais
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
 
Hadoop - primeiros passos
Hadoop - primeiros passosHadoop - primeiros passos
Hadoop - primeiros passos
 
Filesystem distribuído com hadoop!!!
Filesystem distribuído com hadoop!!! Filesystem distribuído com hadoop!!!
Filesystem distribuído com hadoop!!!
 
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
 
Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Hadoop
HadoopHadoop
Hadoop
 

Mais de Alexandre Uehara

TDC SP 2018 - Workshop Inovação Corporativa
TDC SP 2018 - Workshop Inovação CorporativaTDC SP 2018 - Workshop Inovação Corporativa
TDC SP 2018 - Workshop Inovação CorporativaAlexandre Uehara
 
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...Alexandre Uehara
 
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)Workshop Agile e Scrum para RH (ou qualquer outra área não TI)
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)Alexandre Uehara
 
Metodologia Ágil - Acelera Impacto
Metodologia Ágil - Acelera ImpactoMetodologia Ágil - Acelera Impacto
Metodologia Ágil - Acelera ImpactoAlexandre Uehara
 
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a Turma
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a TurmaMétodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a Turma
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a TurmaAlexandre Uehara
 
Case de Open Innovation no mundo Corporativo (1o. Encontro)
Case de Open Innovation no mundo Corporativo (1o. Encontro)Case de Open Innovation no mundo Corporativo (1o. Encontro)
Case de Open Innovation no mundo Corporativo (1o. Encontro)Alexandre Uehara
 
The Developers Conference (TDC) 2018 Florianópolis - Workshop Inovação
The Developers Conference (TDC) 2018 Florianópolis - Workshop InovaçãoThe Developers Conference (TDC) 2018 Florianópolis - Workshop Inovação
The Developers Conference (TDC) 2018 Florianópolis - Workshop InovaçãoAlexandre Uehara
 
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)Alexandre Uehara
 
The Developers Conference (TDC) 2018 Florianópolis - Análise de Negócios
The Developers Conference (TDC) 2018 Florianópolis - Análise de NegóciosThe Developers Conference (TDC) 2018 Florianópolis - Análise de Negócios
The Developers Conference (TDC) 2018 Florianópolis - Análise de NegóciosAlexandre Uehara
 
The Developers Conference (TDC) 2018 Florianópolis - Gestão de Produtos
The Developers Conference (TDC) 2018 Florianópolis - Gestão de ProdutosThe Developers Conference (TDC) 2018 Florianópolis - Gestão de Produtos
The Developers Conference (TDC) 2018 Florianópolis - Gestão de ProdutosAlexandre Uehara
 
Agile Trends 2018 - Agile não é só para TI
Agile Trends 2018 - Agile não é só para TIAgile Trends 2018 - Agile não é só para TI
Agile Trends 2018 - Agile não é só para TIAlexandre Uehara
 
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)Alexandre Uehara
 
Métodos Ágeis - ESPM 2018 (Inovação)
Métodos Ágeis - ESPM 2018 (Inovação)Métodos Ágeis - ESPM 2018 (Inovação)
Métodos Ágeis - ESPM 2018 (Inovação)Alexandre Uehara
 
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)Alexandre Uehara
 
Inovação - Google Campus 2018
Inovação - Google Campus 2018Inovação - Google Campus 2018
Inovação - Google Campus 2018Alexandre Uehara
 
Scrum para RH e Financeiro (Alelo)
Scrum para RH e Financeiro (Alelo)Scrum para RH e Financeiro (Alelo)
Scrum para RH e Financeiro (Alelo)Alexandre Uehara
 
Machine learning for dummies
Machine learning for dummiesMachine learning for dummies
Machine learning for dummiesAlexandre Uehara
 
Quero trabalhar com big data data science, como faço-
Quero trabalhar com big data   data science, como faço-Quero trabalhar com big data   data science, como faço-
Quero trabalhar com big data data science, como faço-Alexandre Uehara
 

Mais de Alexandre Uehara (20)

TDC SP 2018 - Workshop Inovação Corporativa
TDC SP 2018 - Workshop Inovação CorporativaTDC SP 2018 - Workshop Inovação Corporativa
TDC SP 2018 - Workshop Inovação Corporativa
 
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...
TDC SP 2018 - Eu trabalho na área de Inovação. Mas por que eu acho que ela te...
 
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)Workshop Agile e Scrum para RH (ou qualquer outra área não TI)
Workshop Agile e Scrum para RH (ou qualquer outra área não TI)
 
Metodologia Ágil - Acelera Impacto
Metodologia Ágil - Acelera ImpactoMetodologia Ágil - Acelera Impacto
Metodologia Ágil - Acelera Impacto
 
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a Turma
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a TurmaMétodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a Turma
Métodos Ágeis e Scrum - ESPM 2018 (Inovação) - 2a Turma
 
Case de Open Innovation no mundo Corporativo (1o. Encontro)
Case de Open Innovation no mundo Corporativo (1o. Encontro)Case de Open Innovation no mundo Corporativo (1o. Encontro)
Case de Open Innovation no mundo Corporativo (1o. Encontro)
 
The Developers Conference (TDC) 2018 Florianópolis - Workshop Inovação
The Developers Conference (TDC) 2018 Florianópolis - Workshop InovaçãoThe Developers Conference (TDC) 2018 Florianópolis - Workshop Inovação
The Developers Conference (TDC) 2018 Florianópolis - Workshop Inovação
 
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)
The Developers Conference (TDC) 2018 Florianópolis - Internet das Coisas (IoT)
 
The Developers Conference (TDC) 2018 Florianópolis - Análise de Negócios
The Developers Conference (TDC) 2018 Florianópolis - Análise de NegóciosThe Developers Conference (TDC) 2018 Florianópolis - Análise de Negócios
The Developers Conference (TDC) 2018 Florianópolis - Análise de Negócios
 
The Developers Conference (TDC) 2018 Florianópolis - Gestão de Produtos
The Developers Conference (TDC) 2018 Florianópolis - Gestão de ProdutosThe Developers Conference (TDC) 2018 Florianópolis - Gestão de Produtos
The Developers Conference (TDC) 2018 Florianópolis - Gestão de Produtos
 
Agile Trends 2018 - Agile não é só para TI
Agile Trends 2018 - Agile não é só para TIAgile Trends 2018 - Agile não é só para TI
Agile Trends 2018 - Agile não é só para TI
 
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)
Oxigênio - Inovação, Startups e Empreendedorismo (+Filmes)
 
Métodos Ágeis - ESPM 2018 (Inovação)
Métodos Ágeis - ESPM 2018 (Inovação)Métodos Ágeis - ESPM 2018 (Inovação)
Métodos Ágeis - ESPM 2018 (Inovação)
 
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)
Métodos Ágeis - Senac 2018 (Tecnologia para Marketing)
 
Inovação - Google Campus 2018
Inovação - Google Campus 2018Inovação - Google Campus 2018
Inovação - Google Campus 2018
 
Scrum para RH e Financeiro (Alelo)
Scrum para RH e Financeiro (Alelo)Scrum para RH e Financeiro (Alelo)
Scrum para RH e Financeiro (Alelo)
 
Fintech
FintechFintech
Fintech
 
Chatbot
ChatbotChatbot
Chatbot
 
Machine learning for dummies
Machine learning for dummiesMachine learning for dummies
Machine learning for dummies
 
Quero trabalhar com big data data science, como faço-
Quero trabalhar com big data   data science, como faço-Quero trabalhar com big data   data science, como faço-
Quero trabalhar com big data data science, como faço-
 

Big data Hadoop MapReduce ferramenta