Cassandra Trip Brasil

603 visualizações

Publicada em

0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
603
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
10
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Cassandra Trip Brasil

  1. 1. NoSQL & Cassandra Edward Ribeiro 2013
  2. 2. Agenda • Big Data • Cloud Computing • NoSQL • Teorema CAP • Cassandra – Arquitetura e Modelo de Dados
  3. 3. Os SGBDs relacionais reinam soberanos por mais de 30 anos...
  4. 4. Big Data
  5. 5. O que é Big Data? • “Uma coleção de dados tão grande e complexa que se torna difícil (N.E: as vezes impossível) processá-la usando ferramentas de bancos de dados atuais ou aplicações tradicionais de processamento de dados.” ● Genoma Humano ● Cliques em sites ● Redes sociais ● etc
  6. 6. O quão “Big” é Big Data? eBay possui: ● 4.000.000.000 de registros/dia ● 2.000.000.000.000 de registros em uma tabela de eventos ● 6 PB de dados compactados para 1.2 PB Fonte: 14th Int'l Workshop on High Perf Transaction Sys, 2011
  7. 7. OK, mas lembre-se...
  8. 8. Seu site é um grande sucesso Escalabilidade E agora???
  9. 9. A solução Academia Indústria
  10. 10. Computação em Nuvem
  11. 11. Computação em Nuvem
  12. 12. Data Centers
  13. 13. NoSQL
  14. 14. NoSQL ● Alta escalabilidade ● Partição de dados ● Scale Out > Scale Up ●Alta vazão (throughput) ●Sem Relational ● schemaless (alguns!) ●Sem Transações ACID (ainda!)
  15. 15. NoSQL ●Sem SQL ● MongoDB e Cassandra possuem ling. de consulta derivada, direta ou indiretamente, do SQL ●Arquitetura Distribuída ● Clusters LAN ● Hardware de prateleira
  16. 16. Teorema CAP
  17. 17. Cassandra ● Banco NoSQL de código fonte aberto criado pelo Facebook; ● Mantido pela fundação Apache e por empresas como DataStax http://www.slideshare.net/jbellis/cassandra-summit-2013- keynote
  18. 18. Cassandra - Quem usa? ● Twitter ● Netflix ● Nasa ● Adobe ● IBM ● etc
  19. 19. Cassandra - Desempenho
  20. 20. "Bigtable: A Distributed Storage System for Structured Data", Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber in OSDI'06: Seventh Symposium on Operating System Design and Implementation, Seattle, WA, November, 2006.
  21. 21. Cassandra – Modelo de Dados 1920011 FC: dados-pessoaisRowKey FC: acessos Família de Colunas Família de Colunas Nome: “Bruno” Idade: 11 a-2013-08-12Nome: “Bruno” a-2013-09-05 2000852 FC: dados-pessoais FC: acessos Nome: “Bruno” CPF: 1111111111111 a-2013-02-01Nome: “Gi” ...
  22. 22. Arquitetura Memtable Disco RAM Write Operation SSTable Files Read Operation Flush Log File
  23. 23. "Dynamo: amazon's highly available key-value store", Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall, Werner Vogels in SIGOPS Oper. Syst. Rev., New York, NY, USA, October, 2007.
  24. 24. Hashing Consistente ID = 23 ID = 90 ID = 203 ID = 350 ID = 112 100
  25. 25. É o fim dos SGBDs relacionais?

×