SlideShare uma empresa Scribd logo
1 de 40
Baixar para ler offline
Sistemas Operacionais
Aula 11
Nauber Gois
MapReduce é um modelo de programação desenhado
para processar grandes volumes de dados em
paralelo, dividindo o trabalho em um conjunto de
tarefas independentes.
O leitor de entrada divide os dados em 'blocos' de
tamanhos adequados (na prática, normalmente de 16
MB para 128 MB) e o framework atribui um bloco para
cada função de mapeamento. O leitor lê os dados de
entrada de um sistema de armazenamento estável
(normalmente um sistema de arquivos distribuído ) e
gera pares chave / valor. Um exemplo comum seria ler
um diretório cheio de arquivos de texto e retornar cada
linha como um registro.
O modelo de programação MapReduce
consiste na construção de um programa
formado por duas operações basicas: map e
reduce. A operação de map recebe um par
chave/valor e gera um conjunto intermediário
de dados, também no formato chave/valor. A
operação de reduce é executada para cada
chave intermediária, com todos os conjuntos
de valores intermediários associados àquela
chave combinados. Em geral a operação de
map é usada para encontrar algo, e a
operação de reduce é usada para fazer a
sumarização do resultado.
Um exemplo de MapReduce
Vejamos um exemplo simples. Suponha que você tem cinco arquivos
e cada arquivo contém duas colunas (uma chave e um valor em
termos do Hadoop) que representam uma cidade e a temperatura
correspondente registrada nessa cidade para os vários dias de
medição. Claro que nós fizemos este exemplo muito simples assim
que é fácil de seguir. Você pode imaginar que uma aplicação real não
será tão simples, como é provável que contenha milhões ou até
bilhões de linhas, e eles podem não ser linhas bem formatadas em
tudo; Na verdade, não importa quão grande ou pequena a quantidade
de dados que você precisa para analisar, os princípios-chave que
estamos cobrindo aqui permanecem os mesmos. De qualquer
maneira, neste exemplo, a cidade é a chave e a temperatura é o valor.
Toronto, 20
Whitby, 25
Nova Iorque, 22
Roma, 32
Toronto, 4
Roma, 33
Nova Iorque, 18
De todos os dados coletados, queremos encontrar a temperatura
máxima para cada cidade em todos os arquivos de dados (observe
que cada arquivo pode ter a mesma cidade representada várias
vezes). Usando a estrutura MapReduce, podemos dividir isso em
cinco tarefas de mapa, onde cada mapeador trabalha em um dos
cinco arquivos e a tarefa de mapeador passa pelos dados e retorna
a temperatura máxima para cada cidade. Por exemplo, os resultados
produzidos a partir de uma tarefa de mapeador para os dados acima
ficariam assim:
(Toronto, 20) (Whitby, 25) (Nova Iorque, 22) (Roma, 33)
Create a table named test with a single column
family named cf. Verify its creation by listing all
tables and then insert some values.
Verify the data insert by running a scan of the table as
follows
Get a single row
Now, disable and drop your table. This will clean up all
done above.

Mais conteúdo relacionado

Semelhante a MapReduce e NoSQL

Semelhante a MapReduce e NoSQL (20)

BizTalk Server - Como funcionam os Mapas
BizTalk Server - Como funcionam os MapasBizTalk Server - Como funcionam os Mapas
BizTalk Server - Como funcionam os Mapas
 
Seminário Hadoop
Seminário HadoopSeminário Hadoop
Seminário Hadoop
 
NoSql e NewSql
NoSql e NewSqlNoSql e NewSql
NoSql e NewSql
 
Introdução ao no sql e mongodb
Introdução ao no sql e mongodbIntrodução ao no sql e mongodb
Introdução ao no sql e mongodb
 
BigData MapReduce
BigData MapReduceBigData MapReduce
BigData MapReduce
 
Cap07
Cap07Cap07
Cap07
 
Cap07
Cap07Cap07
Cap07
 
Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014
 
Memória Compartilhada Distribuída Conceitos e Algoritmos
Memória Compartilhada Distribuída Conceitos e AlgoritmosMemória Compartilhada Distribuída Conceitos e Algoritmos
Memória Compartilhada Distribuída Conceitos e Algoritmos
 
Pesquisa ppi 2
Pesquisa ppi 2Pesquisa ppi 2
Pesquisa ppi 2
 
Map, filter e reduce
Map, filter e reduceMap, filter e reduce
Map, filter e reduce
 
No sql std
No sql stdNo sql std
No sql std
 
Analise Algoritmos
Analise AlgoritmosAnalise Algoritmos
Analise Algoritmos
 
Módulo 5 Arquitetura de Computadores
Módulo 5 Arquitetura de ComputadoresMódulo 5 Arquitetura de Computadores
Módulo 5 Arquitetura de Computadores
 
Trabalho de sistemas operativos
Trabalho de sistemas operativosTrabalho de sistemas operativos
Trabalho de sistemas operativos
 
joane
joane joane
joane
 
Exemplos de uso de apache spark usando aws elastic map reduce
Exemplos de uso de apache spark usando aws elastic map reduceExemplos de uso de apache spark usando aws elastic map reduce
Exemplos de uso de apache spark usando aws elastic map reduce
 
Algoritmos - Aula 02 - Construcao de algoritmos
Algoritmos - Aula 02 - Construcao de algoritmosAlgoritmos - Aula 02 - Construcao de algoritmos
Algoritmos - Aula 02 - Construcao de algoritmos
 
Multithreaded tecnologia
Multithreaded tecnologia Multithreaded tecnologia
Multithreaded tecnologia
 
TDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ONTDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ON
 

Mais de Nauber Gois

Inteligencia artificial 13
Inteligencia artificial 13Inteligencia artificial 13
Inteligencia artificial 13Nauber Gois
 
Sistemas operacionais 14
Sistemas operacionais 14Sistemas operacionais 14
Sistemas operacionais 14Nauber Gois
 
Sistemas operacionais 13
Sistemas operacionais 13Sistemas operacionais 13
Sistemas operacionais 13Nauber Gois
 
Inteligencia artificial 12
Inteligencia artificial 12Inteligencia artificial 12
Inteligencia artificial 12Nauber Gois
 
Sistemas operacionais 12
Sistemas operacionais 12Sistemas operacionais 12
Sistemas operacionais 12Nauber Gois
 
Sistemas operacionais 10
Sistemas operacionais 10Sistemas operacionais 10
Sistemas operacionais 10Nauber Gois
 
Inteligencia artificial 11
Inteligencia artificial 11Inteligencia artificial 11
Inteligencia artificial 11Nauber Gois
 
Sistemas operacional 9
Sistemas operacional 9Sistemas operacional 9
Sistemas operacional 9Nauber Gois
 
Inteligencia artificial 10
Inteligencia artificial 10Inteligencia artificial 10
Inteligencia artificial 10Nauber Gois
 
Sistemas operacionais 8
Sistemas operacionais 8Sistemas operacionais 8
Sistemas operacionais 8Nauber Gois
 
Inteligencia artificial 9
Inteligencia artificial 9Inteligencia artificial 9
Inteligencia artificial 9Nauber Gois
 
Inteligencia artificial 8
Inteligencia artificial 8Inteligencia artificial 8
Inteligencia artificial 8Nauber Gois
 
Sist infgerenciais 8
Sist infgerenciais 8Sist infgerenciais 8
Sist infgerenciais 8Nauber Gois
 
Sist operacionais 7
Sist operacionais 7Sist operacionais 7
Sist operacionais 7Nauber Gois
 
Inteligencia artifical 7
Inteligencia artifical 7Inteligencia artifical 7
Inteligencia artifical 7Nauber Gois
 
Ssit informacoesgerenciais 5
Ssit informacoesgerenciais 5Ssit informacoesgerenciais 5
Ssit informacoesgerenciais 5Nauber Gois
 
Sistemas operacionais 6
Sistemas operacionais 6Sistemas operacionais 6
Sistemas operacionais 6Nauber Gois
 
Inteligencia artifical 6
Inteligencia artifical 6Inteligencia artifical 6
Inteligencia artifical 6Nauber Gois
 

Mais de Nauber Gois (20)

Ai health
Ai health Ai health
Ai health
 
Inteligencia artificial 13
Inteligencia artificial 13Inteligencia artificial 13
Inteligencia artificial 13
 
Sistemas operacionais 14
Sistemas operacionais 14Sistemas operacionais 14
Sistemas operacionais 14
 
Sistemas operacionais 13
Sistemas operacionais 13Sistemas operacionais 13
Sistemas operacionais 13
 
Inteligencia artificial 12
Inteligencia artificial 12Inteligencia artificial 12
Inteligencia artificial 12
 
Sistemas operacionais 12
Sistemas operacionais 12Sistemas operacionais 12
Sistemas operacionais 12
 
Sistemas operacionais 10
Sistemas operacionais 10Sistemas operacionais 10
Sistemas operacionais 10
 
Inteligencia artificial 11
Inteligencia artificial 11Inteligencia artificial 11
Inteligencia artificial 11
 
Sistemas operacional 9
Sistemas operacional 9Sistemas operacional 9
Sistemas operacional 9
 
Inteligencia artificial 10
Inteligencia artificial 10Inteligencia artificial 10
Inteligencia artificial 10
 
Sistemas operacionais 8
Sistemas operacionais 8Sistemas operacionais 8
Sistemas operacionais 8
 
Inteligencia artificial 9
Inteligencia artificial 9Inteligencia artificial 9
Inteligencia artificial 9
 
Inteligencia artificial 8
Inteligencia artificial 8Inteligencia artificial 8
Inteligencia artificial 8
 
Sist infgerenciais 8
Sist infgerenciais 8Sist infgerenciais 8
Sist infgerenciais 8
 
Sist operacionais 7
Sist operacionais 7Sist operacionais 7
Sist operacionais 7
 
Inteligencia artifical 7
Inteligencia artifical 7Inteligencia artifical 7
Inteligencia artifical 7
 
Beefataque
BeefataqueBeefataque
Beefataque
 
Ssit informacoesgerenciais 5
Ssit informacoesgerenciais 5Ssit informacoesgerenciais 5
Ssit informacoesgerenciais 5
 
Sistemas operacionais 6
Sistemas operacionais 6Sistemas operacionais 6
Sistemas operacionais 6
 
Inteligencia artifical 6
Inteligencia artifical 6Inteligencia artifical 6
Inteligencia artifical 6
 

MapReduce e NoSQL

  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20. MapReduce é um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes. O leitor de entrada divide os dados em 'blocos' de tamanhos adequados (na prática, normalmente de 16 MB para 128 MB) e o framework atribui um bloco para cada função de mapeamento. O leitor lê os dados de entrada de um sistema de armazenamento estável (normalmente um sistema de arquivos distribuído ) e gera pares chave / valor. Um exemplo comum seria ler um diretório cheio de arquivos de texto e retornar cada linha como um registro.
  • 21. O modelo de programação MapReduce consiste na construção de um programa formado por duas operações basicas: map e reduce. A operação de map recebe um par chave/valor e gera um conjunto intermediário de dados, também no formato chave/valor. A operação de reduce é executada para cada chave intermediária, com todos os conjuntos de valores intermediários associados àquela chave combinados. Em geral a operação de map é usada para encontrar algo, e a operação de reduce é usada para fazer a sumarização do resultado.
  • 22. Um exemplo de MapReduce Vejamos um exemplo simples. Suponha que você tem cinco arquivos e cada arquivo contém duas colunas (uma chave e um valor em termos do Hadoop) que representam uma cidade e a temperatura correspondente registrada nessa cidade para os vários dias de medição. Claro que nós fizemos este exemplo muito simples assim que é fácil de seguir. Você pode imaginar que uma aplicação real não será tão simples, como é provável que contenha milhões ou até bilhões de linhas, e eles podem não ser linhas bem formatadas em tudo; Na verdade, não importa quão grande ou pequena a quantidade de dados que você precisa para analisar, os princípios-chave que estamos cobrindo aqui permanecem os mesmos. De qualquer maneira, neste exemplo, a cidade é a chave e a temperatura é o valor. Toronto, 20 Whitby, 25 Nova Iorque, 22 Roma, 32 Toronto, 4 Roma, 33 Nova Iorque, 18
  • 23. De todos os dados coletados, queremos encontrar a temperatura máxima para cada cidade em todos os arquivos de dados (observe que cada arquivo pode ter a mesma cidade representada várias vezes). Usando a estrutura MapReduce, podemos dividir isso em cinco tarefas de mapa, onde cada mapeador trabalha em um dos cinco arquivos e a tarefa de mapeador passa pelos dados e retorna a temperatura máxima para cada cidade. Por exemplo, os resultados produzidos a partir de uma tarefa de mapeador para os dados acima ficariam assim: (Toronto, 20) (Whitby, 25) (Nova Iorque, 22) (Roma, 33)
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37. Create a table named test with a single column family named cf. Verify its creation by listing all tables and then insert some values.
  • 38. Verify the data insert by running a scan of the table as follows
  • 40. Now, disable and drop your table. This will clean up all done above.