NoSQL e escalabilidade de bancos de dados não relacionais

•Transferir como ODP, PDF•

3 gostaram•1,121 visualizações

O documento discute os desafios e abordagens para escalabilidade horizontal e disponibilidade em bancos de dados não-relacionais. Aborda técnicas como replicação, particionamento e consistência eventual para permitir que sistemas de banco de dados suportem altos volumes de dados e requisições mantendo disponibilidade mesmo quando há falhas. Discutem-se as vantagens e desvantagens de sacrificar propriedades ACID em favor de disponibilidade.

NoSQL (Not Only SQL) Nico Steppat [email_address]

Non-Relational DBMS http://www.slideshare.net/chrisbaglieri/non-relational-databases-2143723

Arquitetura / Tiers

Exemplo Tiers

Escalando o sistema

Escalando o sistema

Escalando Application Tier

Escalando Database Tier

Escalando Database Tier ???

Escalabilidade Horizontal (Scale Out): Vertical (Scale Up):

Escalabilidade – Banco de Dados Relacionais Horizontal (Scale Out): Vertical (Scale Up):

Escalabilidade Vertical - Scale Up ,[object Object]

Limitado

Lento: ,[object Object]

Random-Acces

Escalabilidade Horizontal – Cache

Escalabilidade Horizontal – Replicação ,[object Object]

Síncrono, Assícrono

Read-Slave

Escalabilidade Horizontal – Replicação Multi-Slave ,[object Object]

Slaves – Leitura

Escrita??

Escalabilidade Horizontal – Replicação Multi-Master ,[object Object]

Escrita?

Escalabilidade Horizontal – Resumo ,[object Object]

Como escalar escritas?

TX distribuído não escala!

Escalabilidade Horizontal

Escalabilidade Horizontal – Shared Nothing

Shared Nothing - Sharding Scheme

Shared Nothing – Sharding Scheme

Escalabilidade Horizontal – Shared Nothing ,[object Object]

Normalização?

Integridade?

Chaves Compostas?

Alerações de esquema?

2-PC?

Mais conteúdo relacionado

Semelhante a NoSQL e escalabilidade de bancos de dados não relacionais

Amazon Redshift

Amazon Redshift

Amazon RedshiftJoao Gutheil

Introducao ao Amazon Redshift

Introducao ao Amazon Redshift

Introducao ao Amazon RedshiftAmazon Web Services LATAM

[24HOP] SQL Server em maquinas virtuais do Windows Azure

[24HOP] SQL Server em maquinas virtuais do Windows Azure

[24HOP] SQL Server em maquinas virtuais do Windows AzureVitor Tomaz

C-Store 7 years later

C-Store 7 years later

C-Store 7 years laterJulio Cesar Chaves

NoSQL: Perdas e Ganhos

NoSQL: Perdas e Ganhos

NoSQL: Perdas e GanhosMauricio De Diana

NoSQL, Base VS ACID e Teorema CAP

NoSQL, Base VS ACID e Teorema CAP

NoSQL, Base VS ACID e Teorema CAPAricelio Souza

DynamoDB - Uma Introdução

DynamoDB - Uma Introdução

DynamoDB - Uma IntroduçãoAmazon Web Services LATAM

Escalando para os primeiros 10 milhões de usuários

Escalando para os primeiros 10 milhões de usuários

Escalando para os primeiros 10 milhões de usuáriosAmazon Web Services LATAM

DBA Brasil 2.0 NOSql Apache Cassandra para DBAs

DBA Brasil 2.0 NOSql Apache Cassandra para DBAs

DBA Brasil 2.0 NOSql Apache Cassandra para DBAsRonaldo Leite Martins

MAC5855 - NoSQL

MAC5855 - NoSQL

MAC5855 - NoSQLMauricio De Diana

Inovacao em-escala-final

Inovacao em-escala-final

Inovacao em-escala-finalAmazon Web Services LATAM

SQLSat #127Felipe Ferreira

Material Seminário NoSQL

Material Seminário NoSQL

Material Seminário NoSQLLorran Pegoretti

Replicacao Object Sistemas

Replicacao Object Sistemas

Replicacao Object Sistemastaniamaciel

L'esprit de l'escalier

L'esprit de l'escalier

L'esprit de l'escalierGleicon Moraes

Começando com Amazon Redshift

Começando com Amazon Redshift

Começando com Amazon RedshiftAmazon Web Services LATAM

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...Amazon Web Services LATAM

Desenvolvendo para o Windows Azure e SQL Azure

Desenvolvendo para o Windows Azure e SQL Azure

Desenvolvendo para o Windows Azure e SQL AzureLuciano Condé

SQL over SMB3Fabio Hara

Seminário - NoSQL

Seminário - NoSQL

Seminário - NoSQLLorran Pegoretti

Semelhante a NoSQL e escalabilidade de bancos de dados não relacionais (20)

Amazon Redshift

Amazon Redshift

Amazon Redshift

Introducao ao Amazon Redshift

Introducao ao Amazon Redshift

Introducao ao Amazon Redshift

[24HOP] SQL Server em maquinas virtuais do Windows Azure

[24HOP] SQL Server em maquinas virtuais do Windows Azure

[24HOP] SQL Server em maquinas virtuais do Windows Azure

C-Store 7 years later

C-Store 7 years later

C-Store 7 years later

NoSQL: Perdas e Ganhos

NoSQL: Perdas e Ganhos

NoSQL: Perdas e Ganhos

NoSQL, Base VS ACID e Teorema CAP

NoSQL, Base VS ACID e Teorema CAP

NoSQL, Base VS ACID e Teorema CAP

DynamoDB - Uma Introdução

DynamoDB - Uma Introdução

DynamoDB - Uma Introdução

Escalando para os primeiros 10 milhões de usuários

Escalando para os primeiros 10 milhões de usuários

Escalando para os primeiros 10 milhões de usuários

DBA Brasil 2.0 NOSql Apache Cassandra para DBAs

DBA Brasil 2.0 NOSql Apache Cassandra para DBAs

DBA Brasil 2.0 NOSql Apache Cassandra para DBAs

MAC5855 - NoSQL

MAC5855 - NoSQL

MAC5855 - NoSQL

Inovacao em-escala-final

Inovacao em-escala-final

Inovacao em-escala-final

SQLSat #127

Material Seminário NoSQL

Material Seminário NoSQL

Material Seminário NoSQL

Replicacao Object Sistemas

Replicacao Object Sistemas

Replicacao Object Sistemas

L'esprit de l'escalier

L'esprit de l'escalier

L'esprit de l'escalier

Começando com Amazon Redshift

Começando com Amazon Redshift

Começando com Amazon Redshift

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...

Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...

Desenvolvendo para o Windows Azure e SQL Azure

Desenvolvendo para o Windows Azure e SQL Azure

Desenvolvendo para o Windows Azure e SQL Azure

SQL over SMB3

Seminário - NoSQL

Seminário - NoSQL

Seminário - NoSQL

NoSQL e escalabilidade de bancos de dados não relacionais

1. NoSQL (Not Only SQL) Nico Steppat [email_address]

2. Non-Relational DBMS http://www.slideshare.net/chrisbaglieri/non-relational-databases-2143723

3. Arquitetura / Tiers

4. Exemplo Tiers

5. Escalando o sistema

6. Escalando o sistema

7. Escalando Application Tier

8. Escalando Database Tier

9. Escalando Database Tier ???

10. Escalabilidade Horizontal (Scale Out): Vertical (Scale Up):

11. Escalabilidade – Banco de Dados Relacionais Horizontal (Scale Out): Vertical (Scale Up):

12.

14.

15. Random-Acces

16. Escalabilidade Horizontal – Cache

17.

18. Síncrono, Assícrono

20.

21. Slaves – Leitura

23.

25.

26. Como escalar escritas?

27. TX distribuído não escala!

28. Escalabilidade Horizontal

29. Escalabilidade Horizontal – Shared Nothing

30. Shared Nothing - Sharding Scheme

31. Shared Nothing – Sharding Scheme

32.

33. Normalização?

34. Integridade?

35. Chaves Compostas?

36. Alerações de esquema?

38.

39. Normalização?

40. Integridade?

41. Chaves Compostas?

42. Alerações de esquema?

43. 2-PC? Not Only SQL SQL

44.

45. Normalização Schema-free, Compression

46. Integridade Aplicação faz

47. Chaves Compostas ID simples

48. 2-PC T X Local, DLM, Consensus

49. Alerações de esquema? Ao vivo SQL

50.

51. Replicação

52. Gerenciamento

53. Consistência

54. Modelo de dados SQL

55.

56.

57. Cluster de bancos de dados

58. Partitição da Rede

59. Dr. Eric A. Brewer, 2000, PODC

60. Escalabilidade Horizontal – Shared-Disk

61.

62. Replicação

64. RDBMS qualquer

65.

66. ScaleDB (MySQL)

67. Amazon RDS (MySQL)

68.

69.

70.

72.

73. Project-Voldemort

74.

75.

76. Google File System http://labs.google.com/papers/bigtable.html

77.

78. Consensos / Paxos

80. BigTable (DLM) - GAE

81. Chubby (Paxos)

82. Zookeeper (Paxos)

83. Scalaris (Paxos)

84.

85.

86. Obrigado! [email_address]

Notas do Editor

Limitado (espaço + processamento) Criado há 25 anos atrais Fala da escalabilidade horizontal
Disco gigantesco RAC, ScaleDB, PGCluster II Componentes caros, configuracao nao simples, solucoes caros Muda nada para o DBA, modelo igual. Todas as funcoes continuem igual. É bacana, mas complexo. Cloud??
* Separando os dados em fatias * Table partitioning ou Functional Sharding * 3 bancos diferentes (recursos, tipos) * dbs menores são mais facil de gerenciar, sao simples e mais rapido - gasto!
Functional Sharding continuacao 3 Range based sharding ( nome do cliente, data, id) Separando mais ainda Espalhando as escritas mais ainda Separando hot e cold data (vendas) – bom e ruim Joins distribuidos? Normalização (exemplo endereco)?
Hash based, nao é mais functional Key para algum valor? Qual seria a estrutura desse valor? Escalabilidade linear!!!! Mesma tarefa para todos os shards
1) Joins são custosos, aplicacao fez já que cada componente só conhece os seus dados 2) Para evitar os joins podemos denormalizar (endereço). Parece loco 3) Não tem mais como garantir integridade pelo banco, o banco tem apenas fatias. Nao enxerga mais o outro lado. 4) Tem uma separacao funcional, chaves auxiliares faciltam muito o espalhamento. 5) esquema pode ser alterado ao vivo (dependendo do banco isso já é possivel) – mas aqui é mais facil, pq o modelo é mais facil. 6) podemos usar tx distribuido (JTA). nao vai ter tx distribuido (gargalho), desempenho da sua aplicacao é a soma do compenente mais devagar. A) Banco faz primeiramente a persistencia, nao tem mais o poder comun, perdeu varios funcoes comuns B) aplicacao assume mais responsibilidade para cuidar os dados. O banco é ainda relacional?
O desafio está na distribuicao dos dados, bds tradicionais nao foram concipados para isso. Foram concipados e creseram cuidadando os dados, dando garantias fortes. Aqui os bancos relacionais falham ou precisam de ajuda de um SAN – com tradeoff claro. Banco? É mais um armazenamento de chave-valor, um lugar onde vc associar uma chave como um valor. Modelo: key-blob, sempre suficiente bd foram otimizados para OLAP mas nao par OLTP Como replica os dados? Replication factor.... Como espalhar os dados (evitando quente e hot)? Consistent hashing ..... Como gerenciar o cluster? Passando configuracoes? Escalando o cluster elasticamente.
ACID é um modelo facil de programar cheio de garantias. É bom para nos programadores e desejavel. Replicação sincrona – consistente forte Replicação – aumenta a diponibilidade Piora com 2-phase-commit que tenta levar os mesmos garantias para o cluster.
Importante aqui: para o cliente o cluster é uma coisa só, é uma particicao de rede (nao dados) Cluster com os meus shards JBoss – partition cluster
Network partitions acontecem, e sao mais provaveis quanto maior o seu cluster. Datacenter separados, mas no mesmo datacenter – cabo quebrou, routeador queimou. Lidar com esses tipos de problema se chama „Toleranca referente as particioes na rede“
Brewer é da universidade Berkeley. „ estou criando com minha empresa um banco distribuitdo, e percibi seguinte ESCOLHE DOIS. acho que isso é um lei. Ou seja nao tem como fugir “ Fez o keynote na conferência „Principles of Distribiuted Computing“. 3 atributos arquiteturais para um sistema que é stateful e distribuido. É lei e já foi comprovado. Fala que essa regra é sobre garantias. É impossível garantir os tres.
Amazon RDS Fala do backup no S3, fala do downtime, fala do failure rate Nao tem garantia que isso nao acontessse, mas pode diminiur a chance. Administracao, qualidade dos componentes. Pode diminiur a chance que isso acontesse. Gastos!!! mas nao tem garantias. Cluster deve funcionar com hardware comun! Nosso design da banco deve funcionar pra qq tipo de hardware...
Nossos bancos tradicionais sao fortemente consistente e altamente disponiveis. Outro sistema com os mesmos propridades é um LDAP. Nunca serao partition tolerante.sistema para de funcionar.
Quanto maior o seu cluster mais provavel de partitions. Caro e complexo de evitar (nao tem garantais). Bancos tradicionais nao foram concipados para isso. Foram concipados para OLAP uns 25 anos atrais. ACID te dar garantias fortes que talvez nao funcionam no seu cluster. Carrinho – stateful Altamente disponivel – availability Cluster enorme – partition tolerante Escreve dois artigos famosos
Always writable Isso nao é locura e uma consequencia. Nao tem jeito. Dynamo é a base para varios servicos no amazon, s3 de mesmo jeito.