Trabalho de Redes

Big Data
Por Marcio Mattos e Maria Luiza Vasconcelos
Indice
Introdução
 O que é
 Conceitos
 Aplicação
 Hadoop
 Conclusão
 Extra
 Bibliografia


1
Introdução
O objetivo do slide é apresentar os
conceitos básicos do Big Data e suas
aplicações.

2
O que é


De acordo com o site da IBM:

“Big data is being generated by
everything around us at all times. Every
digital process and social media
exchange produces it. Systems,
sensors and mobile devices transmit it.
Big data is arriving from multiple
sources at an alarming velocity, volume
and variety. ”
3
O que é
Podemos dizer que Big Data é
um termo usado para lidar com
dados em massa, além da
capacidade dos bancos de
dados comuns. Big Data trata
de muita informação com
velocidade e precisão.
4
Conceitos
Big Data é famoso pelos „Vs‟: volume,
velocidade, variedade.

5
Conceitos


Volume: Hoje a quantidade de dados
produzidos no mundo é absurdamente
grande.



Velocidade: Para manipular grandes
volumes é fundamental que o
processo seja veloz, até mesmo em
tempo real, caso contrário seria
caótico. Pense em cartão de crédito.
6
Conceitos


Variedade: Consequente do volume, a
variedade está em dados estruturados
(armazenados na Oracle por exemplo)
e não estruturados, oriundos de
diversas fontes.

7
Aplicação
O Big Data, além de lidar com muitos
dados variados, ele precisa de trabalhar
com o suporte de aplicação para esses
dados em constante crescimento.
Os Banco de Dados tradicionais
( MySQL e Oracle) não são flexiveis
suficiente para tal serviço.

8
Aplicação
Então o NoSQL foi criado (significa
“not only SQL” -Structured Query
Language). Ele é uma espécie de
banco de dados que possibilita o
armazenamento dos dados
inclusos no Big Data de maneira
flexível.
9
Aplicação
Não é porque o NoSQL foi criado
que os bancos de dados
tradicionais irão desaparecer.
Existem casos e casos, que nem
sempre o NoSQL é necessário,
como por exemplo em empresas
de pequeno porte.
10
Aplicação
Exemplos de empresas de NoSQL são
o Cassandra, o MongoDB, o Hbase,
entre outros.

11
Aplicação
Quando tratamos de Big Data, um
NoSQL sozinho não pode fazer todo o
serviço. É necessário portanto de uma
ferramenta que maneja o volume de
dados, como o Hadoop, que é o mais
conhecido.

12
Hadoop
O Hadoop é uma plataforma open
source desenvolvido pela Apache, que
processa e analisa grandes volumes de
dados, sejam eles estruturados ou não.
O que ele faz é basicamente dividir os
dados através em vários computadores,
usando modelos de programação
simples.

13
Hadoop
Hadoop casa-se bem com o Big Data
por vários motivos:
 Open source, que permite
customização e se torna suscetível à
melhorias;


Economico, visto que é gratuito;



Tolerante a falhas, com o recurso de
replicação de dados;
14
Hadoop


Ele é flexivel, permitindo o
processamento de quantidades
maiores de dados, acrescentando
computadores sem configurações
complexas.

15
Conclusão
Hoje o mundo está completamente
conectado e a todo instante surge uma
informação nova. Para acompanhar
tudo isso, a tecnologia tem que arrumar
maneiras eficientes. O Big Data foi uma
solução que promete facilitar ainda
mais o futuro da informação.

16
Extras


Video que explica por desenho o que
é Big Data:
http://www.youtube.com/watch?v=qD5
S6yZXaVI

TEDTalks:
http://www.youtube.com/watch?v=Zr02f
MBfuRA

Bibliografia
http://gta.ufrj.br/grad/12_1/bigdata/proc
essamento.html
http://www.ibm.com/big-data/us/en/
http://pt.wikipedia.org/wiki/Big_data
http://oglobo.globo.com/infograficos/big
data/
http://www.sas.com/offices/latinamerica/
brazil/solucoes/bigdata/
http://www.infowester.com/big-data.php

Big data

  • 1.
    Trabalho de Redes BigData Por Marcio Mattos e Maria Luiza Vasconcelos
  • 2.
    Indice Introdução  O queé  Conceitos  Aplicação  Hadoop  Conclusão  Extra  Bibliografia  1
  • 3.
    Introdução O objetivo doslide é apresentar os conceitos básicos do Big Data e suas aplicações. 2
  • 4.
    O que é  Deacordo com o site da IBM: “Big data is being generated by everything around us at all times. Every digital process and social media exchange produces it. Systems, sensors and mobile devices transmit it. Big data is arriving from multiple sources at an alarming velocity, volume and variety. ” 3
  • 5.
    O que é Podemosdizer que Big Data é um termo usado para lidar com dados em massa, além da capacidade dos bancos de dados comuns. Big Data trata de muita informação com velocidade e precisão. 4
  • 6.
    Conceitos Big Data éfamoso pelos „Vs‟: volume, velocidade, variedade. 5
  • 7.
    Conceitos  Volume: Hoje aquantidade de dados produzidos no mundo é absurdamente grande.  Velocidade: Para manipular grandes volumes é fundamental que o processo seja veloz, até mesmo em tempo real, caso contrário seria caótico. Pense em cartão de crédito. 6
  • 8.
    Conceitos  Variedade: Consequente dovolume, a variedade está em dados estruturados (armazenados na Oracle por exemplo) e não estruturados, oriundos de diversas fontes. 7
  • 9.
    Aplicação O Big Data,além de lidar com muitos dados variados, ele precisa de trabalhar com o suporte de aplicação para esses dados em constante crescimento. Os Banco de Dados tradicionais ( MySQL e Oracle) não são flexiveis suficiente para tal serviço. 8
  • 10.
    Aplicação Então o NoSQLfoi criado (significa “not only SQL” -Structured Query Language). Ele é uma espécie de banco de dados que possibilita o armazenamento dos dados inclusos no Big Data de maneira flexível. 9
  • 11.
    Aplicação Não é porqueo NoSQL foi criado que os bancos de dados tradicionais irão desaparecer. Existem casos e casos, que nem sempre o NoSQL é necessário, como por exemplo em empresas de pequeno porte. 10
  • 12.
    Aplicação Exemplos de empresasde NoSQL são o Cassandra, o MongoDB, o Hbase, entre outros. 11
  • 13.
    Aplicação Quando tratamos deBig Data, um NoSQL sozinho não pode fazer todo o serviço. É necessário portanto de uma ferramenta que maneja o volume de dados, como o Hadoop, que é o mais conhecido. 12
  • 14.
    Hadoop O Hadoop éuma plataforma open source desenvolvido pela Apache, que processa e analisa grandes volumes de dados, sejam eles estruturados ou não. O que ele faz é basicamente dividir os dados através em vários computadores, usando modelos de programação simples. 13
  • 15.
    Hadoop Hadoop casa-se bemcom o Big Data por vários motivos:  Open source, que permite customização e se torna suscetível à melhorias;  Economico, visto que é gratuito;  Tolerante a falhas, com o recurso de replicação de dados; 14
  • 16.
    Hadoop  Ele é flexivel,permitindo o processamento de quantidades maiores de dados, acrescentando computadores sem configurações complexas. 15
  • 17.
    Conclusão Hoje o mundoestá completamente conectado e a todo instante surge uma informação nova. Para acompanhar tudo isso, a tecnologia tem que arrumar maneiras eficientes. O Big Data foi uma solução que promete facilitar ainda mais o futuro da informação. 16
  • 18.
    Extras  Video que explicapor desenho o que é Big Data: http://www.youtube.com/watch?v=qD5 S6yZXaVI TEDTalks: http://www.youtube.com/watch?v=Zr02f MBfuRA 
  • 19.