SlideShare uma empresa Scribd logo
1 de 27
Reescrita de Consultas em Federações de
Dados Interligados usando uma Abordagem
   pay-as-you-go para a Descoberta de
             Correspondências
                    Danusa Ribeiro
                     drbc@cin.ufpe.br
           Orientadora: Bernadette Farias Lóscio
                      bfl@cin.ufpe.br


                     Nível: Mestrado
           Ano de Ingresso no programa: 2012
       Época esperada de conclusão: Março de 2014


       Workshop de Teses e Dissertações – SBBD 2012
Agenda
 Introdução

 Motivação

 Caracterização da Contribuição

 Trabalhos Relacionados

 Estado Atual do Trabalho

 Referências




                Workshop de Teses e Dissertações – SBBD 2012
                                                               2
Introdução




        Workshop de Teses e Dissertações – SBBD 2012
                                                       3
Introdução

• Um dos principais desafios em Sistemas para
  Integração de Dados são:

   Reescrita de consultas




           Workshop de Teses e Dissertações – SBBD 2012
                                                          4
Introdução
                                 Um componente fundamental para a reescrita
                                 de consultas é conjunto de mapeamentos entre
                                 o esquema de mediação e os esquemas locais
                           Q

                        Esquema
                           de
                        Mediação


         Q + M1   Q + M2           Q + M3
    Q’            Q’’                  Q’’’

             A               B                    C




          Workshop de Teses e Dissertações – SBBD 2012
                                                                            5
Introdução




                                                  Atualizado em Setembro de 2011
                                              http://richard.cyganiak.de/2007/10/lod/


        Workshop de Teses e Dissertações – SBBD 2012
                                                                                   6
Introdução

• Arquiteturas de Aplicações LD
   Centralizada


   Navegação entre links


   Federada




               Workshop de Teses e Dissertações – SBBD 2012
                                                              7
Objetivos

Objetivo Geral: propor uma solução para o problema de reescrita de consultas
em federações de conjuntos de dados interligados (Linked Data).


Objetivos Específicos:
    Especificação de um processo pay-as-you-go para a geração de
       correspondências

     Especificação de um processo para reescrita de consultas em
      federações de dados interligados

     Desenvolvimento de um protótipo com funcionalidades para a
      extração de termos de uma consulta, reescrita de consulta e
      apresentação dos resultados

                 Workshop de Teses e Dissertações – SBBD 2012
                                                                               8
Definições Preliminares

• Federação de dados interligados I = {S, M, C} onde:
    S = {s1,...,sn}: conjunto de conjuntos de dados interligados


    M: esquema de mediação


    C = {c1,...,cn}: um conjunto de correspodências entre M e
      cada um dos conjuntos de dados




               Workshop de Teses e Dissertações – SBBD 2012
                                                                    9
Definição do Problema

Dada uma federação de dados interligados I = {S, M, C}, estamos
 interessados em propor uma solução para o seguinte problema:


dada uma consulta Q submetida em I de acordo com o esquema
de mediação M, como decompor Q em uma ou mais consultas a
   serem executadas sobre um ou mais conjuntos de dados si
 considerando que nem todas as correspondências necessárias
        para a reescrita de Q estão disponíveis em C ?




              Workshop de Teses e Dissertações – SBBD 2012
                                                                  10
Visão Geral da Abordagem
                                     Consulta Q
                                                       Extração de                                         Mediador
                                                         Termos
Ontologia de
 Mediação
                                                                                                  Visualização
                                             Busca de              Geração de Novas              dos Resultados
                                         Correspondências          Correspondência


     Repositório de
    Correspondências                                    Geração de                               Integração dos
                                                       Subconsultas                                Resultados



                                                                                                       Federação de Dados
   Ontologia Local I              Ontologia Local II              Ontologia Local N
                                                                                                          Interligados
                        SPARQL                          SPARQL                         SPARQL
                       Endpoint                        Endpoint                       Endpoint



                        RDF                                 RDF                        RDF


                                  Workshop de Teses e Dissertações – SBBD 2012
                                                                                                                       11
Caracterização da Contribuição

• Correspondências entre o esquema de mediação e os conjuntos
  de dados
    Pay-as-you-go


    As correspondências necessárias para o processo de
     reescrita de uma consulta Q serão identificadas no
     momento da execução da consulta e de acordo com as
     propriedades que estão sendo consultados por Q




              Workshop de Teses e Dissertações – SBBD 2012
                                                                12
Caracterização da Contribuição
<owl:Class rdf:ID="Person">
   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>
   <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/>
   <rdfs:isDefinedBy rdf:resource="&base;"/>
</owl:Class>
<owl:DatatypeProperty rdf:ID="full-name">
<rdfs:domain rdf:resource="#Person"/>                                DBLP

<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”
rdfs:label="Surname”>
   <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
   <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf-
   schema#Literal"/>
   <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/>
</rdf:Property>                                                     DBpedia
                  Workshop de Teses e Dissertações – SBBD 2012
                                                                              13
Caracterização da Contribuição
<owl:Class rdf:ID="Person">
   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>
   <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/>
   <rdfs:isDefinedBy rdf:resource="&base;"/>
</owl:Class>
<owl:DatatypeProperty rdf:ID="full-name">
<rdfs:domain rdf:resource="#Person"/>                                DBLP

<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”
rdfs:label="Surname”>
   <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
   <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf-
   schema#Literal"/>
   <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/>
</rdf:Property>                                                     DBpedia
                  Workshop de Teses e Dissertações – SBBD 2012
                                                                              14
Caracterização da Contribuição
<owl:Class rdf:ID="Person">
   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>
   <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/>
   <rdfs:isDefinedBy rdf:resource="&base;"/>
</owl:Class>
<owl:DatatypeProperty rdf:ID="full-name">
<rdfs:domain rdf:resource="#Person"/>                                DBLP

<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”
rdfs:label="Surname”>
   <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
   <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf-
   schema#Literal"/>
   <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/>
</rdf:Property>                                                     DBpedia
                  Workshop de Teses e Dissertações – SBBD 2012
                                                                              15
Um exemplo

• Para ilustrar a abordagem proposta:
   – Seja I = {S, M, C} uma federação de dados interligados
     construída sobre o domínio de dados bibliográficos, onde:

       S = {DBLP, ACM, DBpedia}

       M = {Ontologia de Mediação}

       C =




              Workshop de Teses e Dissertações – SBBD 2012
                                                                 16
Um exemplo

  Classes        Propriedades
Publication Identifier, Title, Abstract
  Person       Name, Biography,
               HomePage, Author
University    Name, Address, Country

Classes e Propriedades da Ontologia de
               Mediação




                                                 Ontologia de Mediação


                   Workshop de Teses e Dissertações – SBBD 2012
                                                                         17
Um exemplo

• Seja a consulta q1 : “Retorne os títulos dos artigos publicados
  pelo autor Alon Y. Halevy. Além disso, recupere a homepage
  do autor bem como uma breve apresentação sobre o mesmo”

              SELECT ?title, ?homepage, ?bio
              WHERE {
                   ?publication Title ?title .
                   ?publication Author ?author .
                   ?author HomePage ?homepage .
                   ?author Biography ?bio .
                   ?author Name “Alon Y. Halevy” .
              }


               Workshop de Teses e Dissertações – SBBD 2012
                                                                    18
Um exemplo

 i. Extração dos termos da consulta
      – {Title, Author, HomePage, Biography e Name}


  ii. Identificação de correspondências
Ontologia de Mediação      ACM             DBLP                  DBpedia
        Name          akt:full-name    akt:full-name   dbpedia:name, foaf:surname,
                                                             foaf:givenName
     Biography              -               -                  rdf:comment
     HomePage               -               -           foaf:page, foaf:homepage
        Title          akt:has-title   akt:has-title                 -




                   Workshop de Teses e Dissertações – SBBD 2012
                                                                                     19
Um exemplo
                   Consulta q1                                    Resultado
PREFIX                                                Binding                 Value
akt:<http://www.aktors.org/ontology/portal#>      1   ?title                  Guest Editorial
PREFIX akts:                                      2   ?title                  Answering queries using views
           iii. Geração de subconsultas (reescrita)
<http://www.aktors.org/ontology/support#>         3   ?title                  Queries independent of updates
SELECT DISTINCT ?title WHERE {                    4   ?title                  Logic-based techniques in data…
?publication akt:has-title ?title .
?publication akt:has-author ?author .             5   ?title                  MiniCon: A scalable algorithm …
?author akt:full-name "Alon Y. Halevy".}Limit 5
                   Consulta q2                                    Resultado
PREFIX akt:                                           Binding                 Value
<http://www.aktors.org/ontology/portal#>          1   ?title                  Equivalence, Query-Reachability …
PREFIX akts:                                      2   ?title                  Constraints and Redundancy in…
<http://www.aktors.org/ontology/support#>         3   ?title                  Exploiting Irrelevance…
SELECT DISTINCT ?title WHERE {                    4   ?title                  Queries Independent of Updates.
?publication akt:has-title ?title .
?publication akt:has-author ?author .             5   ?title                  Query Optimization by…
?author akt:full-name "Alon Y. Halevy".}Limit 5
                   Consulta q3                                    Resultado
PREFIX foaf: <http://xmlns.com/foaf/0.1/>             Binding                   Value
PREFIX dbpedia: <http://dbpedia.org/resource/>    1   ?homepage                 http://alonhalevy.blogspot.com/
SELECT DISTINCT ?homepage, ?bio WHERE {
?y dbpedia-owl:wikiPageExternalLink ?homepage .
?y rdfs:comment ?bio .                                ?bio                      Alon Yitzchack Halevy is..
?y rdf:type foaf:Person .
?y dbpprop:name "Halevy, Alon Y."@en}




                                 Workshop de Teses e Dissertações – SBBD 2012
                                                                                                                  20
Um exemplo

iv. Integração dos resultados

Biography Alon Yitzchack Halevy is a renowned Israeli-American
          computer scientist and a leading researcher in the area of
          data integration. …
HomePage http://en.wikipedia.org/wiki/Alon_Y._Halevy
Title     Guest Editorial, Answering queries using views, Queries
          independent of updates…




                  Workshop de Teses e Dissertações – SBBD 2012
                                                                       21
Trabalhos Relacionados

• [Markis et al. 2012] SPARQL-RW: Transparent Query Access
  over Mapped RDF Data Sources
   – reescrita de consultas SPARQL
   – integrar dados RDF


• [Lee et al. 2010] An intelligent query processing for
  distributed ontologies
   – reescrita de consultas SPARQL
   – Integrar dados Linked Data




              Workshop de Teses e Dissertações – SBBD 2012
                                                             22
Próximos Passos

• Especificação dos processos para:
   – Extração dos termos da consulta
   – Geração de correspondências
   – Geração das subconsultas (reescrita)


• Caracterização dos Mapeamentos entre as Múltiplas
  Ontologias


• Definição de um cenário para a realização de testes


               Workshop de Teses e Dissertações – SBBD 2012
                                                              23
Contribuições

i.   Uma metodologia para geração incremental de
     correspondências entre ontologias a partir do uso das
     propriedades providas por OWL, RDF, RDFS, SKOS


ii. Especificação do processo de reescrita de consultas SPARQL
    em federações de conjuntos de dados interligados


iii. Implementação de um protótipo para validação das
     abordagens propostas



               Workshop de Teses e Dissertações – SBBD 2012
                                                                 24
Referências
•   [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data -
    the story so far. Int. J. Semantic Web Inf. Syst, 2009.
•   [Franklin et al. 2005] Franklin, M., Halevy, A., Maier, D. “From Databases to
    Dataspaces: A New Abstraction for Information Management”. In: SIGMOD
    ’05: ACM SIGMOD international conference on Management of Data
    (2005).
•   [Halevy et al. 2006a] Halevy, A., Rajaraman, A., Ordille, J.: “Data
    integration: the teenage years”. In: VLDB’06: 32nd International Conference
    on Very Large Data Bases, ACM (2006).
•   [Herschel & Heese 2005] Herschel, S., Heese, R. “Humboldt Discoverer: A
    Semantic P2P index for PDMS”. In: Proc. of the International Workshop
    Data Integration and the Semantic Web, Porto, Portugal, 2005.




                   Workshop de Teses e Dissertações – SBBD 2012
                                                                                    25
Referências
•   [Lee et al. 2009] Lee, J., Park, J. H., Park, M. J., Chung, C. W., Min, J. K.
    (2010). “An intelligent query processing for distributed ontologies”, Journal
    of Systems and Software, Volume 83, Issue 1, January 2010, Pages 85-95.
•   [Lóscio 2003] Lóscio, B. F. “Managing the Evolution of XML-based
    Mediation Queries”. Ph.D. Thesis, Federal University of Pernambuco,
    Brazil, 2003.
•   [Makris et al. 2012] Makris, K., Bikakis, N., Giodasis, N., Christodoulakis, S.
    (2012). “SPARQL-RW: Transparent Query Access over Mapped RDF Data
    Sources”. EDBT, 2012., Berlin, Germany.
•   [Mendes et al. 2012] Pablo N. M., Hannes, M., Bizer, C. (2012). Sieve:
    linked data quality assessment and fusion. In Proceedings of the 2012 Joint
    EDBT/ICDT Workshops (EDBT-ICDT '12), ACM, New York, NY.




                   Workshop de Teses e Dissertações – SBBD 2012
                                                                                      26
Obrigada!!!
      drbc@cin.ufpe.br



      Agradecimentos



Workshop de Teses e Dissertações – SBBD 2012
                                               27

Mais conteúdo relacionado

Mais procurados

Fundamentos de banco de dados 03 arquitetura 3 esquemas e indep de dados
Fundamentos de banco de dados   03 arquitetura 3 esquemas e indep de dadosFundamentos de banco de dados   03 arquitetura 3 esquemas e indep de dados
Fundamentos de banco de dados 03 arquitetura 3 esquemas e indep de dados
Rafael Pinheiro
 
Enhanced Publication aspects in Thesis and Dissertations
Enhanced Publication aspects in Thesis and DissertationsEnhanced Publication aspects in Thesis and Dissertations
Enhanced Publication aspects in Thesis and Dissertations
Fernando de Assis Rodrigues
 

Mais procurados (20)

Banco de Dados - Part01
Banco de Dados - Part01Banco de Dados - Part01
Banco de Dados - Part01
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dados
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Ebook - Metadados para estratégias de conteúdo
Ebook - Metadados para estratégias de conteúdoEbook - Metadados para estratégias de conteúdo
Ebook - Metadados para estratégias de conteúdo
 
Banco De Dados
Banco De DadosBanco De Dados
Banco De Dados
 
2-Modelo de banco de dados
2-Modelo de banco de dados2-Modelo de banco de dados
2-Modelo de banco de dados
 
Modelos de base de dados
Modelos de base de dadosModelos de base de dados
Modelos de base de dados
 
Fundamentos de banco de dados 03 arquitetura 3 esquemas e indep de dados
Fundamentos de banco de dados   03 arquitetura 3 esquemas e indep de dadosFundamentos de banco de dados   03 arquitetura 3 esquemas e indep de dados
Fundamentos de banco de dados 03 arquitetura 3 esquemas e indep de dados
 
Aula 4 banco de dados
Aula 4   banco de dados Aula 4   banco de dados
Aula 4 banco de dados
 
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
 
Metadados
MetadadosMetadados
Metadados
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS
 
Aulas TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
Aulas TSI33A - Banco de Dados I (TSI UTFPR-Toledo)Aulas TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
Aulas TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
 
Introdução BD
Introdução BDIntrodução BD
Introdução BD
 
Bancodedados
BancodedadosBancodedados
Bancodedados
 
Metadados com XML
Metadados com XMLMetadados com XML
Metadados com XML
 
Metadados
MetadadosMetadados
Metadados
 
Enhanced Publication aspects in Thesis and Dissertations
Enhanced Publication aspects in Thesis and DissertationsEnhanced Publication aspects in Thesis and Dissertations
Enhanced Publication aspects in Thesis and Dissertations
 
Apresentação Final de Banco de Dados
Apresentação Final de Banco de DadosApresentação Final de Banco de Dados
Apresentação Final de Banco de Dados
 
Data WareHOuse
Data WareHOuseData WareHOuse
Data WareHOuse
 

Semelhante a Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências

Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Andre Sidou
 
1º trabalho base dados
1º trabalho base dados1º trabalho base dados
1º trabalho base dados
essa
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
Karla Okada
 
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas ColaborativosApresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Mozart Dornelles Claret
 
Trabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetosTrabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetos
eneck
 
Cobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de DadosCobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de Dados
cris.finholdt
 
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
edigley
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
csmp
 

Semelhante a Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências (20)

Resenha de artigo - Query Processing over Data Warehouse using Relational Dat...
Resenha de artigo - Query Processing over Data Warehouse using Relational Dat...Resenha de artigo - Query Processing over Data Warehouse using Relational Dat...
Resenha de artigo - Query Processing over Data Warehouse using Relational Dat...
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)
 
Tcc versao final-15-12
Tcc versao final-15-12Tcc versao final-15-12
Tcc versao final-15-12
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
 
1º trabalho base dados
1º trabalho base dados1º trabalho base dados
1º trabalho base dados
 
Workshop MongoDB
Workshop MongoDBWorkshop MongoDB
Workshop MongoDB
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
 
Db mapeamento relacional
Db mapeamento relacionalDb mapeamento relacional
Db mapeamento relacional
 
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas ColaborativosApresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
 
BANCO DE DADOS.pptx
BANCO DE DADOS.pptxBANCO DE DADOS.pptx
BANCO DE DADOS.pptx
 
Alinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLAlinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQL
 
Apostila de Banco dados
Apostila de Banco dadosApostila de Banco dados
Apostila de Banco dados
 
Apostila de banco de dados da ucg
Apostila de banco de dados da ucgApostila de banco de dados da ucg
Apostila de banco de dados da ucg
 
Trabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetosTrabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetos
 
Cobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de DadosCobo, Cristiane Brandão. Especialização Banco de Dados
Cobo, Cristiane Brandão. Especialização Banco de Dados
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...
 
SQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigDataSQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigData
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
 

Último

Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
TailsonSantos1
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
sh5kpmr7w7
 

Último (20)

aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
A Revolução Francesa. Liberdade, Igualdade e Fraternidade são os direitos que...
A Revolução Francesa. Liberdade, Igualdade e Fraternidade são os direitos que...A Revolução Francesa. Liberdade, Igualdade e Fraternidade são os direitos que...
A Revolução Francesa. Liberdade, Igualdade e Fraternidade são os direitos que...
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
 
Camadas da terra -Litosfera conteúdo 6º ano
Camadas da terra -Litosfera  conteúdo 6º anoCamadas da terra -Litosfera  conteúdo 6º ano
Camadas da terra -Litosfera conteúdo 6º ano
 
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
 
Conflitos entre: ISRAEL E PALESTINA.pdf
Conflitos entre:  ISRAEL E PALESTINA.pdfConflitos entre:  ISRAEL E PALESTINA.pdf
Conflitos entre: ISRAEL E PALESTINA.pdf
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.
 
6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx
 
Sistema de Bibliotecas UCS - Cantos do fim do século
Sistema de Bibliotecas UCS  - Cantos do fim do séculoSistema de Bibliotecas UCS  - Cantos do fim do século
Sistema de Bibliotecas UCS - Cantos do fim do século
 
M0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptxM0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptx
 
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
 
GÊNERO CARTAZ - o que é, para que serve.pptx
GÊNERO CARTAZ - o que é, para que serve.pptxGÊNERO CARTAZ - o que é, para que serve.pptx
GÊNERO CARTAZ - o que é, para que serve.pptx
 
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdfPROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
 
Cartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptxCartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptx
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéis
 

Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências

  • 1. Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências Danusa Ribeiro drbc@cin.ufpe.br Orientadora: Bernadette Farias Lóscio bfl@cin.ufpe.br Nível: Mestrado Ano de Ingresso no programa: 2012 Época esperada de conclusão: Março de 2014 Workshop de Teses e Dissertações – SBBD 2012
  • 2. Agenda  Introdução  Motivação  Caracterização da Contribuição  Trabalhos Relacionados  Estado Atual do Trabalho  Referências Workshop de Teses e Dissertações – SBBD 2012 2
  • 3. Introdução Workshop de Teses e Dissertações – SBBD 2012 3
  • 4. Introdução • Um dos principais desafios em Sistemas para Integração de Dados são:  Reescrita de consultas Workshop de Teses e Dissertações – SBBD 2012 4
  • 5. Introdução Um componente fundamental para a reescrita de consultas é conjunto de mapeamentos entre o esquema de mediação e os esquemas locais Q Esquema de Mediação Q + M1 Q + M2 Q + M3 Q’ Q’’ Q’’’ A B C Workshop de Teses e Dissertações – SBBD 2012 5
  • 6. Introdução Atualizado em Setembro de 2011 http://richard.cyganiak.de/2007/10/lod/ Workshop de Teses e Dissertações – SBBD 2012 6
  • 7. Introdução • Arquiteturas de Aplicações LD  Centralizada  Navegação entre links  Federada Workshop de Teses e Dissertações – SBBD 2012 7
  • 8. Objetivos Objetivo Geral: propor uma solução para o problema de reescrita de consultas em federações de conjuntos de dados interligados (Linked Data). Objetivos Específicos:  Especificação de um processo pay-as-you-go para a geração de correspondências  Especificação de um processo para reescrita de consultas em federações de dados interligados  Desenvolvimento de um protótipo com funcionalidades para a extração de termos de uma consulta, reescrita de consulta e apresentação dos resultados Workshop de Teses e Dissertações – SBBD 2012 8
  • 9. Definições Preliminares • Federação de dados interligados I = {S, M, C} onde:  S = {s1,...,sn}: conjunto de conjuntos de dados interligados  M: esquema de mediação  C = {c1,...,cn}: um conjunto de correspodências entre M e cada um dos conjuntos de dados Workshop de Teses e Dissertações – SBBD 2012 9
  • 10. Definição do Problema Dada uma federação de dados interligados I = {S, M, C}, estamos interessados em propor uma solução para o seguinte problema: dada uma consulta Q submetida em I de acordo com o esquema de mediação M, como decompor Q em uma ou mais consultas a serem executadas sobre um ou mais conjuntos de dados si considerando que nem todas as correspondências necessárias para a reescrita de Q estão disponíveis em C ? Workshop de Teses e Dissertações – SBBD 2012 10
  • 11. Visão Geral da Abordagem Consulta Q Extração de Mediador Termos Ontologia de Mediação Visualização Busca de Geração de Novas dos Resultados Correspondências Correspondência Repositório de Correspondências Geração de Integração dos Subconsultas Resultados Federação de Dados Ontologia Local I Ontologia Local II Ontologia Local N Interligados SPARQL SPARQL SPARQL Endpoint Endpoint Endpoint RDF RDF RDF Workshop de Teses e Dissertações – SBBD 2012 11
  • 12. Caracterização da Contribuição • Correspondências entre o esquema de mediação e os conjuntos de dados  Pay-as-you-go  As correspondências necessárias para o processo de reescrita de uma consulta Q serão identificadas no momento da execução da consulta e de acordo com as propriedades que estão sendo consultados por Q Workshop de Teses e Dissertações – SBBD 2012 12
  • 13. Caracterização da Contribuição <owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/> </owl:Class> <owl:DatatypeProperty rdf:ID="full-name"> <rdfs:domain rdf:resource="#Person"/> DBLP <rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname” rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/> </rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 13
  • 14. Caracterização da Contribuição <owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/> </owl:Class> <owl:DatatypeProperty rdf:ID="full-name"> <rdfs:domain rdf:resource="#Person"/> DBLP <rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname” rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/> </rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 14
  • 15. Caracterização da Contribuição <owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/> </owl:Class> <owl:DatatypeProperty rdf:ID="full-name"> <rdfs:domain rdf:resource="#Person"/> DBLP <rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname” rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/> </rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 15
  • 16. Um exemplo • Para ilustrar a abordagem proposta: – Seja I = {S, M, C} uma federação de dados interligados construída sobre o domínio de dados bibliográficos, onde: S = {DBLP, ACM, DBpedia} M = {Ontologia de Mediação} C = Workshop de Teses e Dissertações – SBBD 2012 16
  • 17. Um exemplo Classes Propriedades Publication Identifier, Title, Abstract Person Name, Biography, HomePage, Author University Name, Address, Country Classes e Propriedades da Ontologia de Mediação Ontologia de Mediação Workshop de Teses e Dissertações – SBBD 2012 17
  • 18. Um exemplo • Seja a consulta q1 : “Retorne os títulos dos artigos publicados pelo autor Alon Y. Halevy. Além disso, recupere a homepage do autor bem como uma breve apresentação sobre o mesmo” SELECT ?title, ?homepage, ?bio WHERE { ?publication Title ?title . ?publication Author ?author . ?author HomePage ?homepage . ?author Biography ?bio . ?author Name “Alon Y. Halevy” . } Workshop de Teses e Dissertações – SBBD 2012 18
  • 19. Um exemplo i. Extração dos termos da consulta – {Title, Author, HomePage, Biography e Name} ii. Identificação de correspondências Ontologia de Mediação ACM DBLP DBpedia Name akt:full-name akt:full-name dbpedia:name, foaf:surname, foaf:givenName Biography - - rdf:comment HomePage - - foaf:page, foaf:homepage Title akt:has-title akt:has-title - Workshop de Teses e Dissertações – SBBD 2012 19
  • 20. Um exemplo Consulta q1 Resultado PREFIX Binding Value akt:<http://www.aktors.org/ontology/portal#> 1 ?title Guest Editorial PREFIX akts: 2 ?title Answering queries using views iii. Geração de subconsultas (reescrita) <http://www.aktors.org/ontology/support#> 3 ?title Queries independent of updates SELECT DISTINCT ?title WHERE { 4 ?title Logic-based techniques in data… ?publication akt:has-title ?title . ?publication akt:has-author ?author . 5 ?title MiniCon: A scalable algorithm … ?author akt:full-name "Alon Y. Halevy".}Limit 5 Consulta q2 Resultado PREFIX akt: Binding Value <http://www.aktors.org/ontology/portal#> 1 ?title Equivalence, Query-Reachability … PREFIX akts: 2 ?title Constraints and Redundancy in… <http://www.aktors.org/ontology/support#> 3 ?title Exploiting Irrelevance… SELECT DISTINCT ?title WHERE { 4 ?title Queries Independent of Updates. ?publication akt:has-title ?title . ?publication akt:has-author ?author . 5 ?title Query Optimization by… ?author akt:full-name "Alon Y. Halevy".}Limit 5 Consulta q3 Resultado PREFIX foaf: <http://xmlns.com/foaf/0.1/> Binding Value PREFIX dbpedia: <http://dbpedia.org/resource/> 1 ?homepage http://alonhalevy.blogspot.com/ SELECT DISTINCT ?homepage, ?bio WHERE { ?y dbpedia-owl:wikiPageExternalLink ?homepage . ?y rdfs:comment ?bio . ?bio Alon Yitzchack Halevy is.. ?y rdf:type foaf:Person . ?y dbpprop:name "Halevy, Alon Y."@en} Workshop de Teses e Dissertações – SBBD 2012 20
  • 21. Um exemplo iv. Integração dos resultados Biography Alon Yitzchack Halevy is a renowned Israeli-American computer scientist and a leading researcher in the area of data integration. … HomePage http://en.wikipedia.org/wiki/Alon_Y._Halevy Title Guest Editorial, Answering queries using views, Queries independent of updates… Workshop de Teses e Dissertações – SBBD 2012 21
  • 22. Trabalhos Relacionados • [Markis et al. 2012] SPARQL-RW: Transparent Query Access over Mapped RDF Data Sources – reescrita de consultas SPARQL – integrar dados RDF • [Lee et al. 2010] An intelligent query processing for distributed ontologies – reescrita de consultas SPARQL – Integrar dados Linked Data Workshop de Teses e Dissertações – SBBD 2012 22
  • 23. Próximos Passos • Especificação dos processos para: – Extração dos termos da consulta – Geração de correspondências – Geração das subconsultas (reescrita) • Caracterização dos Mapeamentos entre as Múltiplas Ontologias • Definição de um cenário para a realização de testes Workshop de Teses e Dissertações – SBBD 2012 23
  • 24. Contribuições i. Uma metodologia para geração incremental de correspondências entre ontologias a partir do uso das propriedades providas por OWL, RDF, RDFS, SKOS ii. Especificação do processo de reescrita de consultas SPARQL em federações de conjuntos de dados interligados iii. Implementação de um protótipo para validação das abordagens propostas Workshop de Teses e Dissertações – SBBD 2012 24
  • 25. Referências • [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data - the story so far. Int. J. Semantic Web Inf. Syst, 2009. • [Franklin et al. 2005] Franklin, M., Halevy, A., Maier, D. “From Databases to Dataspaces: A New Abstraction for Information Management”. In: SIGMOD ’05: ACM SIGMOD international conference on Management of Data (2005). • [Halevy et al. 2006a] Halevy, A., Rajaraman, A., Ordille, J.: “Data integration: the teenage years”. In: VLDB’06: 32nd International Conference on Very Large Data Bases, ACM (2006). • [Herschel & Heese 2005] Herschel, S., Heese, R. “Humboldt Discoverer: A Semantic P2P index for PDMS”. In: Proc. of the International Workshop Data Integration and the Semantic Web, Porto, Portugal, 2005. Workshop de Teses e Dissertações – SBBD 2012 25
  • 26. Referências • [Lee et al. 2009] Lee, J., Park, J. H., Park, M. J., Chung, C. W., Min, J. K. (2010). “An intelligent query processing for distributed ontologies”, Journal of Systems and Software, Volume 83, Issue 1, January 2010, Pages 85-95. • [Lóscio 2003] Lóscio, B. F. “Managing the Evolution of XML-based Mediation Queries”. Ph.D. Thesis, Federal University of Pernambuco, Brazil, 2003. • [Makris et al. 2012] Makris, K., Bikakis, N., Giodasis, N., Christodoulakis, S. (2012). “SPARQL-RW: Transparent Query Access over Mapped RDF Data Sources”. EDBT, 2012., Berlin, Germany. • [Mendes et al. 2012] Pablo N. M., Hannes, M., Bizer, C. (2012). Sieve: linked data quality assessment and fusion. In Proceedings of the 2012 Joint EDBT/ICDT Workshops (EDBT-ICDT '12), ACM, New York, NY. Workshop de Teses e Dissertações – SBBD 2012 26
  • 27. Obrigada!!! drbc@cin.ufpe.br Agradecimentos Workshop de Teses e Dissertações – SBBD 2012 27