SlideShare uma empresa Scribd logo
1 de 30
Um Middleware Semântico e com Suporte à
Tempo Real para o Acesso Integrado a
Bancos de Dados NoSQL
Luiz Henrique Zambom Santana
Prof. Dr. Ronaldo dos Santos Mello
Seminário de Andamento de Doutorado
Florianópolis, 14/06/2016
Agenda
Introdução
Motivação
Fundamentação teórica
Estado da arte
Taxonomia
Comparação
Proposta de solução
Rendezvous
Introdução
Os objetivos desse trabalho são:
Apoiar o desenvolvimento de aplicações cujo os dados tenham três
requisitos fundamentais:
Volume
Variedade
Velocidade
Para tal, será desenvolvido um middleware chamado Rendezvous
Acesso integrado aos bancos de dados NoSQL;
Motivação
Big Data
Roger Magoulas da O'reilly em 2005
dados influenciam seus requisitos de
desenvolvimento
3 V’s da Big Data (MANYIKA et al., 2011)
Variedade
Velocidade
Volume
Problema em aberto:
NoSQL
Carlo Strozzi em 1998 para seu SGBD que não tinha
interface SQL
Atualmente, descreve bancos de dados não
relacionais
Preparados Computação em Núvem
Altamente escaláveis
Distribuídos
Não aderem às ACID
NoSQL
“Not only SQL”
Sadalage e Fowler, 2012
http://martinfowler.com/books/nosql.html
“Relational Database will be a
footnote on database history”
Nathan Marz, 2014
http://goo.gl/WGXvPy
NoSQL
SQL and NoSQL will merge
“Not yet SQL”
Michael Stonebraker, 2015
https://www.youtube.com/watch?v=KRcecxdGxvQ
O consenso atual
NoSQL é um acrônimo para “Not Only SQL”
Existem quatro modelos principais:
chave-valor
colunar
documentos
grafos
NoSQL
“Sem tamanho único”
• “a panoply of data models, and
they typically operate on flexible
storage formats such as JSON”
(DUGGAN et al., 2015).
• “Increasingly, we see applications
that deploy multiple engines,
resulting in a need to join data
across systems” (DUGGAN et al.,
2015).
Persistência Poliglota (SADALAGE; FOWLER, 2012)
Tempo real
Em geral, os sistemas de
tempo real são definidos
por ter uma restrição
funcional de em relação ao
tempo de resposta
Na Big Data
especificamente, são
sistemas com uma baixa
latência, normalmente
menor a 1 segundo.
Tempo real
Em oposição ao MapReduce
Baixa latência para o Velocity da
Big Data (LIU; IFTIKHAR; XIE,
2014)
Entre os novos middlewares que
atendem esses requisitos estão:
Apache Kafka,
Apache Storm; e
Middleware
Pode ser visto como uma “cola” entre
aplicações;
Facilita a execução serviços distintos através
de uma única interface;
Pode também oferecer requisitos não
funcionais como segurança, distribuição,
escalabilidade e cache;
Diferentemente dos frameworks não é parte
do código das aplicações.
Web Semântica
Consultas complexas significado
Padrões bem definidos pela W3C
RDF
OWL
SPARQL
Permite a criação de sistemas que
lidem com a Variade da Big
Data
Integração de Banco de Dados
Longa história em pesquisa em banco de dados
Local-as-View vs. Global-as-View Vs.
Local-as-View Global-as-View
Trabalho Diferencial Limitação Taxonomia
DEY; FEKETE; RöHM, 2013 Transações entre NoSQL Limitado a chave-valor Federation
BÁNHALMI et al., 2013 Modelos intermediários
baseados em ontologia
Framework não escalável Schema
Unification
DHARMASIRI;
GOONETILLAKE, 2013
Middleware Sobrecarga, limitado a colunares e de
documentos
Federation
SILVA et al., 2014 Integração de múltiplos
NoSQL
Processo offline e dependente de
domínio
Aplicational
Integration
SERRANO; STROULIA, 2014 Modelo intermediário Local-
as-View baseado em
ontologia
Processo offline Schema
Unification
KIRAN; VIJAYAKUMAR, 2014 Modelos intermediários
baseados em ontologia
Processo offline Schema
Unification
KAUR; RANI, 2015 Paradigma MapReduce Framework, limitado a grafo e
documento e dependente de domínio
Aplicational
Integration
DUGGAN et al., 2015 Múltiplos níveis de abstração Ambientes complexos e dependente
de domínio
Federation
Taxonomia
Aplicational Integration Schema Unification Federation
BÁNHALMI et al., 2013 SERRANO; STROULIA, 2014 DEY; FEKETE; RöHM, 2013
SILVA et al., 2014 KIRAN; VIJAYAKUMAR, 2014 DHARMASIRI;
GOONETILLAKE, 2013
KAUR; RANI, 2015 DUGGAN et al., 2015
Aplicational Integration
(KAUR; RANI, 2015)
Schema Unification
(BÁNHALMI et al., 2013)
Federation (DUGGAN et al., 2015)
Proposta de solução
Middleware Rendezvous
Potencialmente distribuído
Entre as aplicações e bancos de
dados NoSQL
RDF e SPARQL com as aplicações
Proposta de solução
Modelo canônico
Baseado em grafos
Com quatro abstrações principais:
Schema
Data Element
Restriction
Value
Local-as-View
Exemplo transformação
Exemplo transformação (chave e valor)
Exemplo transformação (documento)
Estado atual do trabalho
entities:
user:
name:
type: [string]
source:['mongodb','cassandra']
username:
type: [string]
source: ['cassandra']
password:
type: [string]
source:['cassandra']
address:
type: [string]
source:['mongodb','cassandra']
email:
type: [string]
source: ['cassandra']
post:
body:
type: [string]
source: ['mongodb']
createdAt:
type: [date]
source: ['mongodb']
author:
type: [user]
source: [entity]
comment:
body:
type: [string]
source: ['mongodb']
createdAt:
type: [date]
source: ['mongodb']
parent:
type: [post]
source: [entity]
Executors
Manager
InsertInsert
InsertQuery
InsertGet
Plan
Value
1
Value
N
Plan
Value
1
Field
N
Expeditor
Planner
Get/
Query
Endpoint
Dictionary
Manager
Fast storage
{
“post”:
{“body”:”hello”}
}
Insert
Endpoint
Streaming
Solution
Asynchronous
service
_insert _query
rendezvous_id:
metadata_id:1
….
MongoDB
Semantic Access
rendezvous_id:
metadata_id:1
….
Cassandra
rendezvous_id:
metadata_id:1
….
Redis
Semantic
Dictionary
FederatorRendezvous
Application
Diferenciais da proposta
Acesso integrado, semântico e em tempo real a NoSQL
Arquitetura independente de domínio
Arquitetura independente de modelo e fornecedor
Middleware que facilita o trabalho de programação de aplicações
Potencialmente tão escalável quanto os NoSQL
Atividades futuras
Referências principais
DUGGAN, J. et al. The bigdawg polystore system. SIGMOD Rec., ACM, New
York, NY, USA, v. 44, n. 2, p. 11–16, ago. 2015. ISSN 0163-5808.
LIU, X.; IFTIKHAR, N.; XIE, X. Survey of real-time processing systems for big
data. In: Proceedings of the 18th International Database Engineering &
Applications Symposium. New York, NY, USA: ACM, 2014
MANYIKA, J. et al. Big data: The next frontier for innovation, competition, and
productivity. McKinsey Global Institute San Francisco, 2011.
SADALAGE, P. J.; FOWLER, M. NoSQL distilled: a brief guide to the emerging
world of polyglot persistence. [S.l.]: Pearson Education, 2012
Schätzle, Alexander, et al. "S2RDF: RDF Querying with SPARQL on Spark."
Referências principais
DEY, A.; FEKETE, A.; RöHM, U. Scalable transactions across heterogeneous nosql key-value data stores. Proc. VLDB
Endow., VLDB Endowment, v. 6, n. 12, p. 1434–1439, ago. 2013. ISSN 2150-8097.
BÁNHALMI, A. et al. Development of a novel semantic-based system integration framework. In: IEEE. Engineering of
Computer Based Systems (ECBS-EERC), 2013 3rd Eastern European Regional Conference on the. [S.l.], 2013. p.
18–24.
DHARMASIRI, H.; GOONETILLAKE, M. A federated approach on heterogeneous nosql data stores. In: IEEE. Advances
in ICT for Emerging Regions (ICTer), 2013 International Conference on. [S.l.], 2013. p. 234–239.
SILVA, D. L. D. et al. A computational framework for integrating and retrieving biodiversity data on a large scale. In:
Proceedings of the 2014 IEEE International Congress on Big Data. Washington, DC, USA: IEEE Computer Society,
2014. (BIGDATACONGRESS ’14), p. 786–787. ISBN 978-1-4799-5057-7.
SERRANO, D.; STROULIA, E. Towards a uniform data model in multi-database environments. In: Proceedings of 24th
Annual 48 International Conference on Computer Science and Software Engineering. Riverton, NJ, USA: IBM Corp.,
2014. (CASCON ’14), p. 347–350.

Mais conteúdo relacionado

Mais procurados

Bancos orientados a colunas (Cassandra)
Bancos orientados a colunas (Cassandra) Bancos orientados a colunas (Cassandra)
Bancos orientados a colunas (Cassandra) Otávio Santana
 
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...tdc-globalcode
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaDaniel Checchia
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
NoSQL: onde, como e por quê? Cassandra e MongoDB
NoSQL: onde, como e por quê? Cassandra e MongoDBNoSQL: onde, como e por quê? Cassandra e MongoDB
NoSQL: onde, como e por quê? Cassandra e MongoDBRodrigo Hjort
 
NoSQL Familia de Colunas Monografia
NoSQL Familia de Colunas MonografiaNoSQL Familia de Colunas Monografia
NoSQL Familia de Colunas MonografiaAugusto Giles
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureJoel Rodrigues
 
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDAOficina técnica da Infraestrutura Nacional de Dados Abertos - INDA
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDAnitaibezerra
 

Mais procurados (12)

Bancos orientados a colunas (Cassandra)
Bancos orientados a colunas (Cassandra) Bancos orientados a colunas (Cassandra)
Bancos orientados a colunas (Cassandra)
 
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...
Instalando arquitetura Lambda com Graphx e Elasticsearch 2.0 em uma aplicação...
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
NoSql e NewSql
NoSql e NewSqlNoSql e NewSql
NoSql e NewSql
 
Material Seminário NoSQL
Material Seminário NoSQLMaterial Seminário NoSQL
Material Seminário NoSQL
 
NoSQL: onde, como e por quê? Cassandra e MongoDB
NoSQL: onde, como e por quê? Cassandra e MongoDBNoSQL: onde, como e por quê? Cassandra e MongoDB
NoSQL: onde, como e por quê? Cassandra e MongoDB
 
NoSQL Familia de Colunas Monografia
NoSQL Familia de Colunas MonografiaNoSQL Familia de Colunas Monografia
NoSQL Familia de Colunas Monografia
 
Artigo Nosql
Artigo NosqlArtigo Nosql
Artigo Nosql
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft Azure
 
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na práticaData Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na prática
 
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDAOficina técnica da Infraestrutura Nacional de Dados Abertos - INDA
Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA
 

Destaque

Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...
Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...
Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...QMS Comunicación
 
Marketing To Millennials
Marketing To MillennialsMarketing To Millennials
Marketing To MillennialsTunheim
 
Opportunities and challenges provided by crosstalk between signalling pathway...
Opportunities and challenges provided by crosstalk between signalling pathway...Opportunities and challenges provided by crosstalk between signalling pathway...
Opportunities and challenges provided by crosstalk between signalling pathway...Anirudh Prahallad
 
Infrastructure Presentation
Infrastructure PresentationInfrastructure Presentation
Infrastructure Presentationaehsan
 
1-s2.0-S2211124715009225-main
1-s2.0-S2211124715009225-main1-s2.0-S2211124715009225-main
1-s2.0-S2211124715009225-mainAnirudh Prahallad
 
Store Support Operations - Training on MSC Application
Store Support Operations - Training on MSC ApplicationStore Support Operations - Training on MSC Application
Store Support Operations - Training on MSC ApplicationNag Arvind Gudiseva
 
Smart solution for Rental LED Screen 2016
Smart solution for Rental LED Screen 2016Smart solution for Rental LED Screen 2016
Smart solution for Rental LED Screen 2016Sam Teng
 
January 28 pre demo reading graphs
January 28        pre demo reading graphsJanuary 28        pre demo reading graphs
January 28 pre demo reading graphsJoel M. Valenzuela
 
Inspiring Leadership through Emotional Intelligence
Inspiring Leadership through Emotional IntelligenceInspiring Leadership through Emotional Intelligence
Inspiring Leadership through Emotional IntelligenceJoshua Machtinger
 

Destaque (17)

Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...
Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...
Los premios Cris ponen de manifiesto la necesidad de España de invertir en in...
 
Resume1
Resume1Resume1
Resume1
 
Marketing To Millennials
Marketing To MillennialsMarketing To Millennials
Marketing To Millennials
 
Opportunities and challenges provided by crosstalk between signalling pathway...
Opportunities and challenges provided by crosstalk between signalling pathway...Opportunities and challenges provided by crosstalk between signalling pathway...
Opportunities and challenges provided by crosstalk between signalling pathway...
 
Infrastructure Presentation
Infrastructure PresentationInfrastructure Presentation
Infrastructure Presentation
 
Chapter 5 Using Intercepts
Chapter 5 Using InterceptsChapter 5 Using Intercepts
Chapter 5 Using Intercepts
 
tareas
tareastareas
tareas
 
Sistema nervioso
Sistema nerviosoSistema nervioso
Sistema nervioso
 
1-s2.0-S2211124715009225-main
1-s2.0-S2211124715009225-main1-s2.0-S2211124715009225-main
1-s2.0-S2211124715009225-main
 
Store Support Operations - Training on MSC Application
Store Support Operations - Training on MSC ApplicationStore Support Operations - Training on MSC Application
Store Support Operations - Training on MSC Application
 
Smart solution for Rental LED Screen 2016
Smart solution for Rental LED Screen 2016Smart solution for Rental LED Screen 2016
Smart solution for Rental LED Screen 2016
 
Ziņu lapa 2016 / Nr.2 - EDIC Austrumlatgalē
Ziņu lapa 2016 / Nr.2 - EDIC Austrumlatgalē Ziņu lapa 2016 / Nr.2 - EDIC Austrumlatgalē
Ziņu lapa 2016 / Nr.2 - EDIC Austrumlatgalē
 
January 28 pre demo reading graphs
January 28        pre demo reading graphsJanuary 28        pre demo reading graphs
January 28 pre demo reading graphs
 
Exception Handling in Scala
Exception Handling in ScalaException Handling in Scala
Exception Handling in Scala
 
Tuberculosis
Tuberculosis Tuberculosis
Tuberculosis
 
Cassandra training
Cassandra trainingCassandra training
Cassandra training
 
Inspiring Leadership through Emotional Intelligence
Inspiring Leadership through Emotional IntelligenceInspiring Leadership through Emotional Intelligence
Inspiring Leadership through Emotional Intelligence
 

Semelhante a Acesso Integrado a Bancos NoSQL

NoSQL, MongoDB e MEAN
NoSQL, MongoDB e MEANNoSQL, MongoDB e MEAN
NoSQL, MongoDB e MEANOsmar Petry
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQLEric Silva
 
Cobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de DadosCobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de Dadoscris.finholdt
 
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008CharlesAlfenasmg
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014WANDERSON JONER
 
Análise comparativa entre SGBDs NoSQL no contexto de IoT
Análise comparativa entre SGBDs NoSQL no contexto de IoTAnálise comparativa entre SGBDs NoSQL no contexto de IoT
Análise comparativa entre SGBDs NoSQL no contexto de IoTAllexandre Sampaio
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Fernando Maia da Mota
 
Ver
VerVer
Vercsmp
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoadscsmp
 
Projeto Piloto de Web Semântica com Dados da Secretaria da Saúde
Projeto Piloto de Web Semântica com Dados da Secretaria da SaúdeProjeto Piloto de Web Semântica com Dados da Secretaria da Saúde
Projeto Piloto de Web Semântica com Dados da Secretaria da SaúdeinovaDay .
 
Utilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosUtilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosMarcos V. Saturno Ribeiro
 

Semelhante a Acesso Integrado a Bancos NoSQL (20)

NoSQL, MongoDB e MEAN
NoSQL, MongoDB e MEANNoSQL, MongoDB e MEAN
NoSQL, MongoDB e MEAN
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
 
Cobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de DadosCobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de Dados
 
Apresentação
ApresentaçãoApresentação
Apresentação
 
NoSQL
NoSQLNoSQL
NoSQL
 
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008
BANCO DE DADOS MONGODB VS BANCO DE DADOS SQL SERVER 2008
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Pesquisa sobre no sql
Pesquisa sobre no sqlPesquisa sobre no sql
Pesquisa sobre no sql
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
 
Análise comparativa entre SGBDs NoSQL no contexto de IoT
Análise comparativa entre SGBDs NoSQL no contexto de IoTAnálise comparativa entre SGBDs NoSQL no contexto de IoT
Análise comparativa entre SGBDs NoSQL no contexto de IoT
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
 
O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
Artigo oo em bd
Artigo   oo em bdArtigo   oo em bd
Artigo oo em bd
 
Ver
VerVer
Ver
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
 
O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
#1 Introdução ao MongoDB
#1   Introdução ao MongoDB#1   Introdução ao MongoDB
#1 Introdução ao MongoDB
 
Projeto Piloto de Web Semântica com Dados da Secretaria da Saúde
Projeto Piloto de Web Semântica com Dados da Secretaria da SaúdeProjeto Piloto de Web Semântica com Dados da Secretaria da Saúde
Projeto Piloto de Web Semântica com Dados da Secretaria da Saúde
 
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
 
Utilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosUtilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertos
 

Mais de Luiz Henrique Zambom Santana

Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...
Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...
Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...Luiz Henrique Zambom Santana
 
Apache Sedona: how to process petabytes of agronomic data with Spark
Apache Sedona: how to process petabytes of agronomic data with SparkApache Sedona: how to process petabytes of agronomic data with Spark
Apache Sedona: how to process petabytes of agronomic data with SparkLuiz Henrique Zambom Santana
 
De Arquiteto para Gerente: como debugar uma equipe
De Arquiteto para Gerente: como debugar uma equipeDe Arquiteto para Gerente: como debugar uma equipe
De Arquiteto para Gerente: como debugar uma equipeLuiz Henrique Zambom Santana
 
VoltDB: as vantagens e os desafios dos banco de dados NewSQL
VoltDB: as vantagens e os desafios dos banco de dados NewSQLVoltDB: as vantagens e os desafios dos banco de dados NewSQL
VoltDB: as vantagens e os desafios dos banco de dados NewSQLLuiz Henrique Zambom Santana
 
Uma visão sobre Fast-Data: Spark, VoltDB e Elasticsearch
Uma visão sobre Fast-Data: Spark, VoltDB e ElasticsearchUma visão sobre Fast-Data: Spark, VoltDB e Elasticsearch
Uma visão sobre Fast-Data: Spark, VoltDB e ElasticsearchLuiz Henrique Zambom Santana
 
Workload-Aware RDF Partitioning and SPARQL Query Caching for Massive RDF Gra...
Workload-Aware RDF Partitioning  and SPARQL Query Caching for Massive RDF Gra...Workload-Aware RDF Partitioning  and SPARQL Query Caching for Massive RDF Gra...
Workload-Aware RDF Partitioning and SPARQL Query Caching for Massive RDF Gra...Luiz Henrique Zambom Santana
 
A middleware for storing massive RDF graphs into NoSQL
A middleware for storing massive RDF graphs into NoSQLA middleware for storing massive RDF graphs into NoSQL
A middleware for storing massive RDF graphs into NoSQLLuiz Henrique Zambom Santana
 
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL Databases
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL DatabasesA Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL Databases
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL DatabasesLuiz Henrique Zambom Santana
 
Novidades do elasticsearch 2.0 e como usá-lo com PHP
Novidades do elasticsearch 2.0 e como usá-lo com PHPNovidades do elasticsearch 2.0 e como usá-lo com PHP
Novidades do elasticsearch 2.0 e como usá-lo com PHPLuiz Henrique Zambom Santana
 
Design of Experiments on Federator Polystore Architecture
Design of Experiments on Federator Polystore ArchitectureDesign of Experiments on Federator Polystore Architecture
Design of Experiments on Federator Polystore ArchitectureLuiz Henrique Zambom Santana
 
An Approach for RDF-based Semantic Access to NoSQL Repositories
An Approach for RDF-based Semantic Access to NoSQL RepositoriesAn Approach for RDF-based Semantic Access to NoSQL Repositories
An Approach for RDF-based Semantic Access to NoSQL RepositoriesLuiz Henrique Zambom Santana
 

Mais de Luiz Henrique Zambom Santana (20)

Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...
Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...
Perspectives on the use of data in Agriculture - Luiz Santana - Leaf Agricult...
 
Apache Sedona: how to process petabytes of agronomic data with Spark
Apache Sedona: how to process petabytes of agronomic data with SparkApache Sedona: how to process petabytes of agronomic data with Spark
Apache Sedona: how to process petabytes of agronomic data with Spark
 
De Arquiteto para Gerente: como debugar uma equipe
De Arquiteto para Gerente: como debugar uma equipeDe Arquiteto para Gerente: como debugar uma equipe
De Arquiteto para Gerente: como debugar uma equipe
 
VoltDB: as vantagens e os desafios dos banco de dados NewSQL
VoltDB: as vantagens e os desafios dos banco de dados NewSQLVoltDB: as vantagens e os desafios dos banco de dados NewSQL
VoltDB: as vantagens e os desafios dos banco de dados NewSQL
 
IBM Watson, Apache Spark ou TensorFlow?
IBM Watson, Apache Spark ou TensorFlow?IBM Watson, Apache Spark ou TensorFlow?
IBM Watson, Apache Spark ou TensorFlow?
 
Uma visão sobre Fast-Data: Spark, VoltDB e Elasticsearch
Uma visão sobre Fast-Data: Spark, VoltDB e ElasticsearchUma visão sobre Fast-Data: Spark, VoltDB e Elasticsearch
Uma visão sobre Fast-Data: Spark, VoltDB e Elasticsearch
 
Banco de dados nas nuvens - aula 3
Banco de dados nas nuvens - aula 3Banco de dados nas nuvens - aula 3
Banco de dados nas nuvens - aula 3
 
Banco de dados nas nuvens - aula 2
Banco de dados nas nuvens - aula 2Banco de dados nas nuvens - aula 2
Banco de dados nas nuvens - aula 2
 
Banco de dados nas nuvens - aula 1
Banco de dados nas nuvens - aula 1Banco de dados nas nuvens - aula 1
Banco de dados nas nuvens - aula 1
 
Workload-Aware RDF Partitioning and SPARQL Query Caching for Massive RDF Gra...
Workload-Aware RDF Partitioning  and SPARQL Query Caching for Massive RDF Gra...Workload-Aware RDF Partitioning  and SPARQL Query Caching for Massive RDF Gra...
Workload-Aware RDF Partitioning and SPARQL Query Caching for Massive RDF Gra...
 
A middleware for storing massive RDF graphs into NoSQL
A middleware for storing massive RDF graphs into NoSQLA middleware for storing massive RDF graphs into NoSQL
A middleware for storing massive RDF graphs into NoSQL
 
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL Databases
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL DatabasesA Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL Databases
A Workload-Aware Middleware for Storing Massive RDF Graphs into NoSQL Databases
 
Normalização
NormalizaçãoNormalização
Normalização
 
SQL Joins
SQL JoinsSQL Joins
SQL Joins
 
Consultas básicas em SQL
Consultas básicas em SQLConsultas básicas em SQL
Consultas básicas em SQL
 
Processamento em Big Data
Processamento em Big DataProcessamento em Big Data
Processamento em Big Data
 
Workshop de ELK - EmergiNet
Workshop de ELK - EmergiNetWorkshop de ELK - EmergiNet
Workshop de ELK - EmergiNet
 
Novidades do elasticsearch 2.0 e como usá-lo com PHP
Novidades do elasticsearch 2.0 e como usá-lo com PHPNovidades do elasticsearch 2.0 e como usá-lo com PHP
Novidades do elasticsearch 2.0 e como usá-lo com PHP
 
Design of Experiments on Federator Polystore Architecture
Design of Experiments on Federator Polystore ArchitectureDesign of Experiments on Federator Polystore Architecture
Design of Experiments on Federator Polystore Architecture
 
An Approach for RDF-based Semantic Access to NoSQL Repositories
An Approach for RDF-based Semantic Access to NoSQL RepositoriesAn Approach for RDF-based Semantic Access to NoSQL Repositories
An Approach for RDF-based Semantic Access to NoSQL Repositories
 

Acesso Integrado a Bancos NoSQL

  • 1. Um Middleware Semântico e com Suporte à Tempo Real para o Acesso Integrado a Bancos de Dados NoSQL Luiz Henrique Zambom Santana Prof. Dr. Ronaldo dos Santos Mello Seminário de Andamento de Doutorado Florianópolis, 14/06/2016
  • 2. Agenda Introdução Motivação Fundamentação teórica Estado da arte Taxonomia Comparação Proposta de solução Rendezvous
  • 3. Introdução Os objetivos desse trabalho são: Apoiar o desenvolvimento de aplicações cujo os dados tenham três requisitos fundamentais: Volume Variedade Velocidade Para tal, será desenvolvido um middleware chamado Rendezvous Acesso integrado aos bancos de dados NoSQL;
  • 5. Big Data Roger Magoulas da O'reilly em 2005 dados influenciam seus requisitos de desenvolvimento 3 V’s da Big Data (MANYIKA et al., 2011) Variedade Velocidade Volume Problema em aberto:
  • 6. NoSQL Carlo Strozzi em 1998 para seu SGBD que não tinha interface SQL Atualmente, descreve bancos de dados não relacionais Preparados Computação em Núvem Altamente escaláveis Distribuídos Não aderem às ACID
  • 7. NoSQL “Not only SQL” Sadalage e Fowler, 2012 http://martinfowler.com/books/nosql.html “Relational Database will be a footnote on database history” Nathan Marz, 2014 http://goo.gl/WGXvPy
  • 8. NoSQL SQL and NoSQL will merge “Not yet SQL” Michael Stonebraker, 2015 https://www.youtube.com/watch?v=KRcecxdGxvQ
  • 9. O consenso atual NoSQL é um acrônimo para “Not Only SQL” Existem quatro modelos principais: chave-valor colunar documentos grafos NoSQL
  • 10. “Sem tamanho único” • “a panoply of data models, and they typically operate on flexible storage formats such as JSON” (DUGGAN et al., 2015). • “Increasingly, we see applications that deploy multiple engines, resulting in a need to join data across systems” (DUGGAN et al., 2015).
  • 12. Tempo real Em geral, os sistemas de tempo real são definidos por ter uma restrição funcional de em relação ao tempo de resposta Na Big Data especificamente, são sistemas com uma baixa latência, normalmente menor a 1 segundo.
  • 13. Tempo real Em oposição ao MapReduce Baixa latência para o Velocity da Big Data (LIU; IFTIKHAR; XIE, 2014) Entre os novos middlewares que atendem esses requisitos estão: Apache Kafka, Apache Storm; e
  • 14. Middleware Pode ser visto como uma “cola” entre aplicações; Facilita a execução serviços distintos através de uma única interface; Pode também oferecer requisitos não funcionais como segurança, distribuição, escalabilidade e cache; Diferentemente dos frameworks não é parte do código das aplicações.
  • 15. Web Semântica Consultas complexas significado Padrões bem definidos pela W3C RDF OWL SPARQL Permite a criação de sistemas que lidem com a Variade da Big Data
  • 16. Integração de Banco de Dados Longa história em pesquisa em banco de dados Local-as-View vs. Global-as-View Vs. Local-as-View Global-as-View
  • 17. Trabalho Diferencial Limitação Taxonomia DEY; FEKETE; RöHM, 2013 Transações entre NoSQL Limitado a chave-valor Federation BÁNHALMI et al., 2013 Modelos intermediários baseados em ontologia Framework não escalável Schema Unification DHARMASIRI; GOONETILLAKE, 2013 Middleware Sobrecarga, limitado a colunares e de documentos Federation SILVA et al., 2014 Integração de múltiplos NoSQL Processo offline e dependente de domínio Aplicational Integration SERRANO; STROULIA, 2014 Modelo intermediário Local- as-View baseado em ontologia Processo offline Schema Unification KIRAN; VIJAYAKUMAR, 2014 Modelos intermediários baseados em ontologia Processo offline Schema Unification KAUR; RANI, 2015 Paradigma MapReduce Framework, limitado a grafo e documento e dependente de domínio Aplicational Integration DUGGAN et al., 2015 Múltiplos níveis de abstração Ambientes complexos e dependente de domínio Federation
  • 18. Taxonomia Aplicational Integration Schema Unification Federation BÁNHALMI et al., 2013 SERRANO; STROULIA, 2014 DEY; FEKETE; RöHM, 2013 SILVA et al., 2014 KIRAN; VIJAYAKUMAR, 2014 DHARMASIRI; GOONETILLAKE, 2013 KAUR; RANI, 2015 DUGGAN et al., 2015
  • 19. Aplicational Integration (KAUR; RANI, 2015) Schema Unification (BÁNHALMI et al., 2013) Federation (DUGGAN et al., 2015)
  • 20. Proposta de solução Middleware Rendezvous Potencialmente distribuído Entre as aplicações e bancos de dados NoSQL RDF e SPARQL com as aplicações
  • 21. Proposta de solução Modelo canônico Baseado em grafos Com quatro abstrações principais: Schema Data Element Restriction Value Local-as-View
  • 25. Estado atual do trabalho entities: user: name: type: [string] source:['mongodb','cassandra'] username: type: [string] source: ['cassandra'] password: type: [string] source:['cassandra'] address: type: [string] source:['mongodb','cassandra'] email: type: [string] source: ['cassandra'] post: body: type: [string] source: ['mongodb'] createdAt: type: [date] source: ['mongodb'] author: type: [user] source: [entity] comment: body: type: [string] source: ['mongodb'] createdAt: type: [date] source: ['mongodb'] parent: type: [post] source: [entity]
  • 27. Diferenciais da proposta Acesso integrado, semântico e em tempo real a NoSQL Arquitetura independente de domínio Arquitetura independente de modelo e fornecedor Middleware que facilita o trabalho de programação de aplicações Potencialmente tão escalável quanto os NoSQL
  • 29. Referências principais DUGGAN, J. et al. The bigdawg polystore system. SIGMOD Rec., ACM, New York, NY, USA, v. 44, n. 2, p. 11–16, ago. 2015. ISSN 0163-5808. LIU, X.; IFTIKHAR, N.; XIE, X. Survey of real-time processing systems for big data. In: Proceedings of the 18th International Database Engineering & Applications Symposium. New York, NY, USA: ACM, 2014 MANYIKA, J. et al. Big data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute San Francisco, 2011. SADALAGE, P. J.; FOWLER, M. NoSQL distilled: a brief guide to the emerging world of polyglot persistence. [S.l.]: Pearson Education, 2012 Schätzle, Alexander, et al. "S2RDF: RDF Querying with SPARQL on Spark."
  • 30. Referências principais DEY, A.; FEKETE, A.; RöHM, U. Scalable transactions across heterogeneous nosql key-value data stores. Proc. VLDB Endow., VLDB Endowment, v. 6, n. 12, p. 1434–1439, ago. 2013. ISSN 2150-8097. BÁNHALMI, A. et al. Development of a novel semantic-based system integration framework. In: IEEE. Engineering of Computer Based Systems (ECBS-EERC), 2013 3rd Eastern European Regional Conference on the. [S.l.], 2013. p. 18–24. DHARMASIRI, H.; GOONETILLAKE, M. A federated approach on heterogeneous nosql data stores. In: IEEE. Advances in ICT for Emerging Regions (ICTer), 2013 International Conference on. [S.l.], 2013. p. 234–239. SILVA, D. L. D. et al. A computational framework for integrating and retrieving biodiversity data on a large scale. In: Proceedings of the 2014 IEEE International Congress on Big Data. Washington, DC, USA: IEEE Computer Society, 2014. (BIGDATACONGRESS ’14), p. 786–787. ISBN 978-1-4799-5057-7. SERRANO, D.; STROULIA, E. Towards a uniform data model in multi-database environments. In: Proceedings of 24th Annual 48 International Conference on Computer Science and Software Engineering. Riverton, NJ, USA: IBM Corp., 2014. (CASCON ’14), p. 347–350.