Bancos de dados No-SQL e afins

•

6 gostaram•1,304 visualizações

dcarneir

Apresentação para a Bluesoft sobre projetos de bancos de dados No-SQL

Tecnologia

Modelo de persistência que não utiliza SQL

Surgiu da necessidade de implementar soluções em que bancos de dados relacionais não se encaixam perfeitamente.

Horizontal – Mais máquinas ,[object Object],[object Object]

Objetivo principal: Quebrar sua tabelas, agrupando-as por dados semenhantes

Map step: o nó pricipal quebra a tarefa em partes e distribui para os outros nós processarem

Reduce step: o nó pai combina as respostas recebidas pelos outros, criando a resposta final do problema a ser resolvido

MapReduce (cont.) Exemplo - Contar o numero de vezes que cada palavra aparece em um conjunto de documentos: void map(String name, String document): // name: document name // document: document contents for each word w in document: EmitIntermediate(w, "1"); void reduce(String word, Iterator partialCounts): // word: a word // partialCounts: a list of aggregated partial counts int result = 0; for each pc in partialCounts: result += ParseInt(pc); Emit(AsString(result));

Tipos (cont.) Size Complexity Key-Value Wide-Column Document Graph 90% of use cases

Mais conteúdo relacionado

Destaque

Livropythonmysql 091022073751-phpapp01julianabdpaiva

Hoje eu sou um dbaLilian Barroso

TDC 2011 - Arquitetura de desfesa contra injeção de SQLLuis Asensio

Quer ser um excelente dbaVitor Fava

Introdução a estruturas de dados em pythonAlvaro Oliveira

Certificações em TI e o Mercado de Trabalhojcmarcussojr

Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosEduardo de Lucena Falcão

Curriculo2016Eduardo Candido

Apostila de banco de dados e sqlYara Santos

Aprenda a Programar Direito!Álvaro Justen

Introdução ao ORMLeonardo Lourenço Silva

Apostila de sql oracle (pt br)Sandro Freitas

Python + algoritmoFelipe Marcel

Tipos Abstratos de Dados e EncapsulamentoHelio Henrique L. C. Monte-Alto

Apostila OracleRicardo Terra

Apostila sql2013Messias de Oliviera Felix

Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Adolfo Guimaraes

Conhecendo o Visual Studio 11Leonardo Lourenço Silva

Destaque (18)

Livropythonmysql 091022073751-phpapp01

Hoje eu sou um dba

TDC 2011 - Arquitetura de desfesa contra injeção de SQL

Quer ser um excelente dba

Introdução a estruturas de dados em python

Certificações em TI e o Mercado de Trabalho

Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados

Curriculo2016

Apostila de banco de dados e sql

Aprenda a Programar Direito!

Introdução ao ORM

Apostila de sql oracle (pt br)

Python + algoritmo

Tipos Abstratos de Dados e Encapsulamento

Apostila Oracle

Apostila sql2013

Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...

Conhecendo o Visual Studio 11

Semelhante a Bancos de dados No-SQL e afins

NoSQL LivreJulio Viegas

No sql stdArthur Azevedo

NoSQL, Base VS ACID e Teorema CAPAricelio Souza

Mongo Db - PHP Day WorkshopDiego Sana

Seminário HadoopIvanilton Polato

Palestra Sobre RESTPaulo José Almeida

Java No Setor Público: Produtividade, Flexibilidade e Baixo CustoÉberli Cabistani Riella

PHP Conference 2017: Como melhorar seu código com Laravel CollectionsAryel Tupinambá

Mapeamento Objeto Relacional em PHP com Outlet ORMFábio Rehm

MAC5855 - NoSQLMauricio De Diana

Replicacao Object Sistemastaniamaciel

MongoDB - Performance e Escalabilidade para aplicações webRafael Nunes

Path to the future #5 - Melhores práticas de data warehouse no Amazon RedshiftAmazon Web Services LATAM

Avaliando o Apache Cassandra como cache distribuido no SPC Brasil - NoSQLBRJulio Viegas

NoSql e NewSqlSuzana Viana Mota

Amazon RedshiftJoao Gutheil

PHPMyadmin - IntroduçãoMarco Pinheiro

Cakephp 2.0 - O que mudouFelipe Vargas Rigo

Introdução ao ASP.NET 3.5 - Campus Party Brasil 2009Ramon Durães

Bancos de dados NoSQL (Not only sql)Rodrigo De Souza Valerio

Semelhante a Bancos de dados No-SQL e afins (20)

NoSQL Livre

No sql std

NoSQL, Base VS ACID e Teorema CAP

Mongo Db - PHP Day Workshop

Seminário Hadoop

Palestra Sobre REST

Java No Setor Público: Produtividade, Flexibilidade e Baixo Custo

PHP Conference 2017: Como melhorar seu código com Laravel Collections

Mapeamento Objeto Relacional em PHP com Outlet ORM

MAC5855 - NoSQL

Replicacao Object Sistemas

MongoDB - Performance e Escalabilidade para aplicações web

Path to the future #5 - Melhores práticas de data warehouse no Amazon Redshift

Avaliando o Apache Cassandra como cache distribuido no SPC Brasil - NoSQLBR

NoSql e NewSql

Amazon Redshift

PHPMyadmin - Introdução

Cakephp 2.0 - O que mudou

Introdução ao ASP.NET 3.5 - Campus Party Brasil 2009

Bancos de dados NoSQL (Not only sql)

Mais de dcarneir

Introdução ao desenvolvimento em hardwaredcarneir

Redshiftdcarneir

Bitcoindcarneir

Certificados digitaisdcarneir

Awkdcarneir

Shell Scriptingdcarneir

FLOSSdcarneir

IPv6dcarneir

Regexdcarneir

Mais de dcarneir (13)

Introdução ao desenvolvimento em hardware

Redshift

Bitcoin

Certificados digitais

Awk

Shell Scripting

FLOSS

IPv6

Regex

Bancos de dados No-SQL e afins

1. Persistência NOSQL e tecnologias afins Daniel Carneiro

3. Modelo de persistência que não utiliza SQL

4. Surgiu da necessidade de implementar soluções em que bancos de dados relacionais não se encaixam perfeitamente.

9. Distribuído

10. Performance

11. Suporte a grandes bases de dados

12. Schema-free

13. ”One size doesn't fit all”

14.

15. Objetivo principal: Quebrar sua tabelas, agrupando-as por dados semenhantes

16.

17.

18. by Key / Hash

19.

20. Map step: o nó pricipal quebra a tarefa em partes e distribui para os outros nós processarem

21. Reduce step: o nó pai combina as respostas recebidas pelos outros, criando a resposta final do problema a ser resolvido

22. MapReduce (cont.) Exemplo - Contar o numero de vezes que cada palavra aparece em um conjunto de documentos: void map(String name, String document): // name: document name // document: document contents for each word w in document: EmitIntermediate(w, "1"); void reduce(String word, Iterator partialCounts): // word: a word // partialCounts: a list of aggregated partial counts int result = 0; for each pc in partialCounts: result += ParseInt(pc); Emit(AsString(result));

23.

24. Wide Column Store

25. Document Store

26. Graph Store

27. Column Oriented Store

28. Tipos (cont.) Size Complexity Key-Value Wide-Column Document Graph 90% of use cases

29.

30. No index

31. No search

32.

33. Sucessor do DBM (1979)

34. Berkeley -> Sleepycat -> Oracle

35. Dual License

36.

37. Sucessor do GDBM

38. Melhor performance / threading / Armazenamento

39. LGPL

40.

41. Replication Multimaster

42. Auto Partition

43. 10-20K op/s

44.

45. Usa BerlekeyDB para persistência

46. 20-60k op/s

47.

48. Colunas possuem multiplos valores

49. Eventually Consistent

50.

51. Permite colunas com listas de valores

52. Colunas podem ser adicionadas dinamicamente

53. Colunas são indexadas automaticamente

54. Estrutura em árvore (EntityGroup)

55. Transação provida através de EntityGroup

56.

57. Serviço pago

58. Domains (Tables, max 100)

59. Colunas com listas de valores

60.

61. Thrift API

62. Table / Family:Column / Time

63.

64. Key / Column Family / Qualifier / Time

65. Thrift API

66.

67. Decentralized / Full Tolerant / Eventual Consistency

68. Java

69. Keyspace / Column Families (Table / Fixed) / SuperColumns / Columns

70. Thrift API

71.

72. Sem relacionamentos entre documentos

73. Transação em nível de documento

74. Modelo de replicação: ”Eventualmente Consistente”

75.

76. Interface RESTful / JSON

77. Map-Reduce

78.

79. Interface BSON / JSON

80. Dynamic Queries / Map-Reduce

81.

82. Busca por transposição

83. Graph Store A B C E D

84.

85. InfoGrid

86. VertexDB

87.

88. Dados são agrupados por colunas e não em linhas

89. Boa performance em DW

90.

91. MonetDB

92. LucidDB

93. Infobright

94. Ingres/Vectorwise

95.

96. Escalabilidade possui um preço

97. Não há um concenso ou padronizacao entre os projetos

98. Cada projeto foi concebido para resolver problemas particulares

99. Dúvidas Dúvidas ? Questões ? Angústias ?

100.

101. www.wikipedia.org

102. nosql-database.org

103. http://www.slideshare.net/jperras/nonrelational-databases-keyvalue-stores

104. http://www.codefutures.com/database-sharding

105. http://www.slideshare.net/emileifrem/nosql-east-a-nosql-overview-and-the-benefits-of-graph-databases

Notas do Editor

Eric Evans – Rackspace - DDD Johan Oskarsson – Last.fm – evento sobre bases open-source distribuídas Not Only Sql
Facebook – 40G Files, 10G Fotos, 1PiB, 5K page views /s, 36K qps, 1 DBA Ebay – 2PiB data Twitter – (Cassandra?) - 50 Mi Tweets/dia
- Comodity Hardware: EMT64, 16GB Ram, 6x15k RAID10 -> Para conseguir esses benefícios é necessário aplicacar as técnicas
- Dados são denormalizados - Particionamento do pai e dos filhos - Core tables são replicados - Pode ser combinado com particionamento vertical -> Para conseguir buscar os dados é necessário MapReduce
TODO Explicacao
Key/Value – HashTable
90% - Bilhoes de linhas
Key/Value Store Biblioteca stand-alone Versões mais novas possuem HA
Key Value Store Biblioteca stand-alone Servidor Tokyo Tyrant
Outros Redis Githut Data Partition 80-110k op/s Scalaris
Entity sem um pai é o root do EntityGroup Todo EntityGroup é operado em uma única operação
Vantagem: Interface REST pública
Yahoo
Melhor performance Sem transação
Twitter – mudou recentemente Facebook – Inbox - 600+ cores / 120+ TB disk space
Consultas mais fáceis Dados mais flexiveis Menos escalabilidade
Alta concorrencia
Futura HA SourceForge / GitHub
Entidades se relacionam Relacionamento podem ter atributos Traversal framework
Neo4j – java, scallable, embedded InfoGrid – restful, external data(ex. Rss, atom)
100x performance on ad-hoc
TODO

Bancos de dados No-SQL e afins

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (18)

Semelhante a Bancos de dados No-SQL e afins

Semelhante a Bancos de dados No-SQL e afins (20)

Mais de dcarneir

Mais de dcarneir (13)

Bancos de dados No-SQL e afins

Notas do Editor