9. 9
Qual o BIG Problem?
Execução de consultas complexas
Consultas Estruturadas sobre
múltiplas fontes
Respostas das consultas como sendo
a união dos múltiplos subgrafos de
todos os datasets que responderam a
13. 13
Data Warehousing
Os dados são coletados e armazenados em um
repositório central [Chaudhuri and Dayal ,1997]
Consultas são submetidas sobre o repositório central
Como se aplica em Linked Data?
15. 15
Data Warehousing
RDF Dumps de datasets relevantes para a aplicação
Proveniência dos Dados
Melhor performance
Muito tempo para recuperar os RDFs Dump
Maior tempo para carregar tais dumps
Dados desatualizados
Vantagens
desVantagens
16. 16
Consulta Federada (Sistemas de
Federação)
Baseada no processamento de consultas distribuídas
sobre múltiplas fonte de dados
Mediador:
recebe as consultas,
analisa,
decompõe em múltiplas sub consultas e
envia para o dataset capaz de responder à
consulta.
19. 19
SPARQL
1.0 1.1
Consulta Federada (Sistemas de
Federação)
Interface de
Consulta
Processador de
Consutlas
Consulta em
SPARQL 1.1
Interface de
Consulta
Reescrita de
Consultas
Consulta em
SPARQL 1.0
Sistema de Federação de
Consultas em
SPARQL 1.1
Interface de
Consulta
Processador de
Consutlas
Consulta em
SPARQL 1.0
SPARQL
Endpoint 1.0
21. 21
Fontes de Dados Linked Data do
Domínio Life Sciences
Find the Chemical equations and Reaction titles of
reactions related to only those drugs
which are approved along with average Molecular
Weight
23. 23
SELECT ?drugname ?indication
WHERE {
FROM <http://localhost/dbpedia.rdf>
{
? drug a dbpedia−owl:Drug .
? drug rdfs:label ?drugname .
? drug owl:sameAs ?drugbank .
}
FROM <http://localhost/drugbank.rdf>
{
? drugbank drugbank:indication ?indication .
}
}
SPARQL 1.0
24. 24
SELECT ?drugname ?indication
WHERE {
SERVICE <http://dbpedia.org/sparql>
{
? drug a dbpedia−owl:Drug .
? drug rdfs:label ?drugname .
? drug owl:sameAs ?drugbank .
}
SERVICE <http://www4.wiwiss.fu−berlin.de/drugbank/sparql> {
? drugbank drugbank:indication ?indication .
}
}
SPARQL 1.1
25. 25
Dados Atualizados
Não precisa de espaço adicional
Consultas Ad-Hoc
Consulta Transmitida via protocolos de Rede
Uso do operador de Junção
Dados desatualizados
Técnicas de paralelismo e otimização
Vantagens
desVantagens
Consulta Federada (Sistemas de
Federação)
26. 26
CaracterísticasData Warehousing
Universo de
Discurso (UoD)
Consulta Federada
Interface
Fontes Conhecidas
RDF Dumps SPARQL Endpoint
Acesso a dados
Originais
não sim
rápida Baixa/médiaVelocidade de
Acesso
Dados Armazenados
Comparação
27. 27
• [Bizer et al. 2009] BIZER C., HEATH T., BERNERS-LEE T. Linked data - the story so far.
INT. J. SEMANTIC WEB INF. SYST, 2009.
• [Bleiholder and Naumann, 2009] BLEIHOLDER, J AND NAUMANN, F. Data fusion. ACM
COMPUT. SURV. 41, 1, ARTICLE 1, JANUARY 2009.
• [Chaudhuri and Dayal ,1997] CHAUDHURI, D., DAYAL, U. An overview of data warehousing
and olap technology. SIGMOD RECORD, 26(1):65-74, 1997.
• [Correndo et al. 2010] CORRENDO, G., SALVADORES, M., MILLARD, I., GLASER, H AND
SHADBOLT, N. SPARQL query rewriting for implementing data integration over linked
data. IN PROCEEDINGS OF THE 2010 EDBT/ICDT WORKSHOPS (EDBT '10). 2010.
• [Franklin et al. 2005] FRANKLIN, M., HALEVY, A., MAIER, D. From Databases to
Dataspaces: A New Abstraction for Information Management. IN: SIGMOD ’05: ACM
SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 2005.
• [Haase et al. 2010] HAASE, P., MATH, T, AND ZILLER, M. An evaluation of approaches to
federated query processing over linked data. IN PROCEEDINGS OF THE 6TH
INTERNATIONAL CONFERENCE ON SEMANTIC SYSTEMS (I-SEMANTICS '10), ACM, NEW
YORK, NY, USA. 2010.
Referências
28. 28
• [Halevy et al. 2006] HALEVY, A., RAJARAMAN, A., ORDILLE, J.: Data integration: the
teenage years. IN: VLDB’06: 32ND INTERNATIONAL CONFERENCE ON VERY LARGE DATA
BASES, ACM, 2006.
• [Harting and Langegger 2010] HARTIG, O AND LANGEGGER, A. A DATABASE PERSPECTIVE
ON CONSUMING LINKED DATA ON THE WEB. DATENBANK-SPEKTRUM 10(2): 57-66. 2010.
• [Langegger et al. 2008] LANGEGGER, A., WÖß, W., BLÖCHL, M. A Semantic Web
Middleware for Virtual Data Integration on the Web. IN: PROCEEDINGS OF THE 5TH
EUROPEAN SEMANTIC WEB CONFERENCE (ESWC). VOLUME 5021 OF LECTURE NOTES IN
COMPUTER SCIENCE. SPRINGER VERLAG, PP. 493–507. 2008.
• [Lee et al. 2010] LEE, J., PARK, J., PARK, M., CHUNG, C AND MIN, J. An intelligent query
processing for distributed ontologies. J. SYST. SOFTW. 83, 1 (JANUARY 2010), 85-95.
2010.
• [Lóscio, 2003] LÓSCIO, B. F. Managing the Evolution of XML-based Mediation Queries.
PH.D. THESIS, FEDERAL UNIVERSITY OF PERNAMBUCO, BRAZIL, 2003.
• [Schwarte et al. 2011] Schwarte, A., Haase, P., Hose, K., Schenkel, R ., Schmidt, M:
FedX: A Federation Layer for Distributed Query Processing on Linked Open Data.
ESWC (2) 2011: 481-486
Referências