Linked Data: da Web de Documentos para a Web de Dados

1.847 visualizações

Publicada em

Publicada em: Tecnologia
0 comentários
4 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.847
No SlideShare
0
A partir de incorporações
0
Número de incorporações
261
Ações
Compartilhamentos
0
Downloads
69
Comentários
0
Gostaram
4
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Linked Data: da Web de Documentos para a Web de Dados

  1. 1. Linked Data:!da Web de Documentos para a Web de Dados! Bernadette Farias Lóscio bfl@cin.ufpe.br
  2. 2. motivação ! ! Era uma vez …! 2
  3. 3. motivação Vários dados que viviam isolados em ilhas de informação. <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....>Os dados eram guardados em arquivos e tinham muitos problemas de redundância entre si. 3
  4. 4. motivação Um belo dia, para resolver esses problemas, os dados resolveram se organizar em bancos de dados. Médico! Paciente! Disciplinas! Prof! Enferm.! Cursos! Livro! Editora! Autor! 4
  5. 5. motivação Com o passar do tempo, os bancos de dados foram se organizando em grupos e daí surgiram os sistemas de bancos de dados distribuídos e as federações de bancos de dados. 5
  6. 6. motivação E os anos foram passando… … até que um dia, Tim Berners Lee teve uma ideia brilhante e criou a World Wide Web. 6
  7. 7. motivação O volume de dados digitais cresceu imensamente e a Web tornou-se um espaço global de informações. Páginas html! <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> WWW! 7
  8. 8. motivação Hoje, aos vinte e poucos anos, a Web já não é mais a mesma… Além de ser um espaço global de informações, ela está se transformando em uma Web de dados.microformatos! Páginas html! <....> <....> xml! rdf! <....> <....> <....> <....> <....> <....> <....> <....> <....> <....> WWW! 8
  9. 9. motivação Bancos de dados podem ser publicados na Web Disciplinas! Prof! Cursos! 9
  10. 10. motivaçãoPorém… nem todos os dados podem ser encontrados por meio dos mecanismos de busca não é possível especificar consultas complexas sobre os dados assim como no tempo dos arquivos, os dados na Web ainda vivem isolados uns dos outros :-( 10
  11. 11. motivação Dados podem ser combinados por meio das Web APIs e dos mashups mashup! Web API! Web API! Web API! Onde encontrar Web APIs? http://www.programmableweb.com 11
  12. 12. motivaçãoPorém… as APIs oferecem interfaces proprietárias mashups são baseados em um conjunto fixo de fontes de dados não se pode “linkar” dados de APIs diferentes 12
  13. 13. motivação O que fazer para transformar a Web em um verdadeiro espaço global de dados? aumentar a estrutura do conteúdo da Web? prover significado para os dados? estabelecer padrões para a publicação de dados e criação de links entre eles? 13
  14. 14. web semântica Então, mais uma vez, Tim Berners Lee teve outra ideia revolucionária: a Web Semântica! “The Semantic Web is the extension of the World Wide Web that enables people to share content beyond the boundaries of applications and websites. It has been described in rather different ways: as a utopic vision, as a web of data, or merely as a natural paradigm shift in our daily use of the Web.” semanticweb.org 14
  15. 15. web semântica Na Web Semântica, os dados estão mais ricos, são associados a vocabulários e possuem um significado. 15
  16. 16. web semântica Assim, os dados não precisam mais viver isolados e podem ser compartilhados por diversas aplicações :-) Os dados, agora chamados de recursos, são únicos e possuem a sua própria identificação na Web! 16
  17. 17. web semântica A Web Semântica é uma ideia muito interessante, mas como os recursos são representados? Como representar os dados dos bds ou das páginas html para que eles possam ser compartilhados na Web? 17
  18. 18. rdf – resource description framework id! title! author! year! genre! 01! Mar Morto! Jorge Amado! 1936! romance! 02! A Estrada do Mar! Jorge Amado! 1938! poem! 03! O mundo da Paz! Jorge Amado! 1951! trips! 04! O Quinze! Rachel de Queiroz! 1930! romance! 05! Tieta do Agreste! Jorge Amado! 1977! romance! Literatura brasileira
  19. 19. rdf – resource description framework Os dados podem ser distribuídos em: Linhas Colunas Células
  20. 20. rdf – resource description framework 03! O mundo da Paz! Jorge Amado! 1951! trips! 02! A Estrada do Mar! Jorge Amado! 1938! poem!1! 01! Mar Morto! Jorge Amado! 1936! romance! 2! 04! O Quinze! 1930! Rachel de Queiroz! romance! 3! 05! Tieta do Agreste! Jorge Amado! 1977! romance! Distribuição por linha
  21. 21. rdf – resource description framework eita... Cadê o esquema? Quem é o quê? 03! O mundo da Paz! Jorge Amado! 1951! 02! A Estrada do Mar! Jorge Amado! 1938! trips! poem! 1! 01! Mar Morto! Jorge Amado! 1936! romance! 2! 04! O Quinze! Rachel de Queiroz! 1930! romance!title! 05! Tieta do Agreste! Jorge Amado! 1977! romance! 3!
  22. 22. rdf – resource description framework title! 1! author! 2! Jorge Amado! Mar Morto! Jorge Amado! A Estrada do Mar! O mundo da Paz! Jorge Amado! O Quinze! 3! Rachel de Queiroz! Jorge Amado! Tieta do Agreste! year! genre! 1936! romance! 1938! poem! 1951! trips! 1930! romance!Distribuição por coluna 1977! romance!
  23. 23. rdf – resource description framework ... e agora??? Quem é quem? 1! title! Id! author! Jorge Amado! Mar Morto! Jorge Amado! A Estrada do Mar! Jorge Amado! O mundo da Paz! year! genre! 2! Rachel de Queiroz! Jorge Amado! O Quinze! Tieta do Agreste! 1936! romance! 1938! poem! 1951! trips! 1930! romance! 1977! romance! 3!
  24. 24. rdf – resource description framework title! 2! author!row 3! O mundo da Paz! row 1! Jorge Amado! genre! 1! row 2! poem! year! genre! 3! row 5! 1977! row 1! romance! Distribuição por célula
  25. 25. rdf – resource description framework poxa... Complicou mais ainda :-( Como eu vou saber “quem é o quê” e “quem é quem” ?
  26. 26. rdf – resource description framework Quer dizer então que eu preciso ter uma maneira global para referenciar As linhas sujeito! As colunas predicado! E os valores objeto!
  27. 27. rdf – resource description framework 27
  28. 28. rdf – resource description framework “RDF is a standard model for data interchange on the Web. RDF has features that facilitate data merging even if the underlying schemas differ, and it specifically supports the evolution of schemas over time without requiring all the data consumers to be changed.” http://www.w3.org/RDF/ 28
  29. 29. rdf – resource description framework Nós precisamos de triplas! subject! predicate! object! Row 5! genre! romance! Row 2! title! A Estrada do Mar! Row 2! year! 1938! Row 4! author! Rachel de Queiroz! Row 3! genre! trips!
  30. 30. rdf – resource description framework Várias triplas podem fazer referência a uma mesma entidade! subject! predicate! object! Jorge Amado! Wrote! Mar Morto! Zelia Gattai! Married! Jorge Amado! Jorge Amado! Lived in! Salvador! Salvador! Is in! Bahia! Bahia! Part of! Brazil! Ceará! Part of! Brazil! Jorge Amado! Wrote! Tieta do Agreste!
  31. 31. rdf – resource description framework Triplas podem ser representadas por meio de grafos Zelia Gattai! Salvador! married! isIn! livedIn! Jorge Amado! Bahia! wrote! partOf! wrote! Mar Morto! Brazil! Tieta do Agreste! partOf! Ceará!
  32. 32. rdf – resource description framework E tem mais... Triplas de fontes diferentes podem ser combinadas em um mesmo grafo!
  33. 33. rdf – resource description framework fonte 1! Zelia Gattai! Salvador! married! isIn! livedIn! Jorge Amado! Bahia! wrote! wrote! partOf! Mar Morto! Brazil! Tieta do Agreste! partOf! Ceará!
  34. 34. rdf – resource description frameworkfonte 2! Tocaia Grande! Seara Vermelha! A Estrela do Mar! Jorge Amado! wrote! wro te! O Mundo da Paz! wrote! wrote! Capitães da Areia! Mar Morto! Tieta do Agreste!
  35. 35. rdf – resource description frameworkfonte 3! Rio Grande do Norte! Ceará! Maranhão! partOf! Alagoas! Brazil! partOf! part Of! Paraíba! partOf! partOf! Piauí! Bahia! Pernambuco!
  36. 36. rdf – resource description framework Grafo combinado! Zelia Gattai! Salvador! married! isIn! livedIn! Bahia! Jorge Amado! wro te! partOf! Mar Morto! Brazil! part Of! Tieta do Agreste! Ceará! Seara Vermelha! wro Maranhão! A Estrela do Mar! part wrote! te! Of! wrote! Alagoas! partOf! O Mundo da Paz! partOf! Paraíba! part Capitães da Areia! Of Piauí! ! Tocaia Grande! Pernambuco! Rio Grande do Norte!
  37. 37. rdf – resource description framework blz :-) Mas como os grafos são combinados? Como saber que os nós em conjuntos de dados diferentes são correspondentes? fonte 1 ! fonte 2! ?! Jorge Amado! =! Jorge Amado!
  38. 38. rdf – resource description framework URIs (Uniform Resource Identifiers) podem ser usados para identificação única de recursos. URI é qualquer identificador único (ex: cpf, isbn, URL).
  39. 39. rdf – resource description framework Jorge Amado? Ahhhh todo mundo conhece! autor! fundação!
  40. 40. rdf – resource description framework Por meio das URIs cada recurso pode ter um identificador global e único na Web! Assim uma coisa é uma coisa e outra coisa é outra coisa ;-) www.websemantica.com.br/exemplosLit#JorgeAmado! www.websemantica.com.br/exemplosFound#JorgeAmado!
  41. 41. web semântica Finalmente aplicações Web podem fazer referência a mesma “coisa”! Basta referenciar o mesmo URI! Aplicação 1! Aplicação n! Aplicação 2! www.websemantica.com.br/exemplosLit#JorgeAmado!
  42. 42. rdf – resource description framework hmmmmm.... mas esse URI é muito grande... pode ficar difícil de manipular :-( Será que tem como simplificar? Sim! Por meio dos namespaces! namespace: identifier!
  43. 43. rdf – resource description framework www.websemantica.com.br/exemplosLit#! subject! predicate! object! lit : Jorge Amado! lit : wrote! lit : Mar Morto! lit : Jorge Amado! lit : wrote! lit : Tieta do Agreste! lit : Jorge Amado! lit : wrote! lit : Capitães da Areia! lit : Jorge Amado! lit : wrote! lit : Seara Vermelha! lit : Jorge Amado! lit : wrote! lit :O Mundo da Paz! Livros de Jorge Amado com qnames
  44. 44. rdf – resource description framework www.websemanticaUFC.com.br/exemplosGeo#! subject! predicate! object! geo: Bahia! geo: partOf! geo: Brazil! geo: Piauí! geo: partOf! geo: Brazil! geo: Ceará! geo: partOf! geo: Brazil! geo: Maranhão! geo: partOf! geo: Brazil! geo: Paraíba! geo: partOf! geo: Brazil! Informações geográficas com qnames
  45. 45. rdf – resource description framework subject! predicate! object! lit : Jorge Amado! lit : wrote! lit : Mar Morto! lit : Jorge Amado! lit : wrote! lit : Tieta do Agreste! bio : Zélia Gattai! bio : married! lit : Jorge Amado! bio : Zélia Gattai! bio : livedWith! lit : Jorge Amado! lit : Jorge Amado! bio : livedIn! geo: Slavador! geo : Salvador! geo : isIn! geo: Bahia! geo: Bahia! geo: partOf! geo: Brazil! geo: Ceará! geo: partOf! geo: Brazil! triplas com namespaces variados
  46. 46. resumindo... recurso RDF URI 46
  47. 47. linked data tá certo… mas e o linked data? Onde ele entra nessa história toda? 47
  48. 48. linked data Conjunto de melhores práticas para a publicação de dados estruturados na Web. “Linked Data is about using the Web to connect related data that wasnt previously linked, or using the Web to lower the barriers to linking data currently linked using other methods.” linkeddata.org ”A term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web using URIs and RDF.” wikipedia 48
  49. 49. linked data Link RDF! RDF! RDF! Link RDF! Link RDF! RDF! RDF! RDF! Link RDF! Link RDF! RDF! RDF! RDF! 49
  50. 50. princípios do linked data 1! Usar URIs como nomes para recursos 2! Usar URIs HTTP para que as pessoas possam encontrar esses nomes 3! Quando alguém procurar por uma URI, através dessa, providenciar informações úteis, por meio de RDFs 4! Incluir sentenças RDF que ligam para outras URIs de forma que eles possam descobrir mais recursos. 50
  51. 51. linked data dados linkados rdf: type! pd:cygr! foaf:Person! foaf: name! Richard Cyganiak! foaf: based_near! dbpedia:Berlin! dbpedia:Berlin = http://dbpedia.org/ resource/Berlin! 51
  52. 52. linked data dados linkados rdf: type! pd:cygr! foaf:Person! foaf: name! Richard Cyganiak! foaf: based_near! dp:population! 3.405.259! dbpedia:Berlin! skos:subject! dp:Cities_in_Germany! 52
  53. 53. linked data rdf: type! dados linkados pd:cygr! foaf:Person! foaf: name! Richard Cyganiak! foaf: based_near! dp:population! 3.405.259! dbpedia:Berlin! dbpedia:Hamburg! skos:subject! skos:subject! dp:Cities_in_Germany! dbpedia:Muenchen! skos:subject! 53
  54. 54. web de dados Finalmente, chegamos ao espaço global de dados, a Web de Dados, onde: qualquer pessoa pode publicar seus dados na Web de Dados itens de dados são conectados por links aplicações podem descobrir novas fontes navegando pelos links os dados são auto descritivos 54
  55. 55. web de dados poxa.... E isso já é realidade? Já existem dados na Web de Dados? Sim! 55
  56. 56. linking open data “The goal of the W3C SWEO Linking Open Data community project is to extend the Web with a data commons by publishing various open data sets as RDF on the Web and by setting RDF links between data items from different data sources.” http://www.w3.org/wiki/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData 56
  57. 57. linking open data 57
  58. 58. linking open data É importante saber que... os nós são conjuntos de dados publicados em formato Linked Data. o tamanho dos círculos corresponde ao número de triplas em cada conjunto de dados. as setas indicam a existência de pelo menos 50 ligações entre dois conjuntos de dados. uma ligação (link) é uma tripla RDF, onde sujeito e objeto estão em namespaces de conjuntos de dados diferentes. 58
  59. 59. publicando dados na nuvem do LOP Dicas importantes: Usar URIs HTTP para tudo. Defina seus URIs em um namespace HTTP qu e fique sob seu controle. Usar URIs curtos e que possam ser facilmente lembrados Existem várias outras regras para a escolha de uma boa URI em http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ 59
  60. 60. publicando dados na nuvem do LOP Dicas importantes: Dê preferência aos vocabulários conhecidos. Friend-of-a-Friend (FOAF): para descrever pessoas. Semantically-Interlinked Online Communities (SIOC): vocabulários para representar comunidades online. Description of a Project (DOAP): vocabulários para descrever projetos. Music Ontology: providencia termos para descrever artistas, albuns e trilhas sonoras. Creative Commons (CC): descrever termos de licença. 60
  61. 61. publicando dados na nuvem do LOP “DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other data sets on the Web to Wikipedia data.” http://dbpedia.org 61
  62. 62. aplicações BBC Music beta site. http://www.bbc.co.uk 62
  63. 63. aplicações http://en.wikipedia.org/wiki/Amy_Winehouse 63
  64. 64. aplicações http://musicbrainz.org/artist/dfe9a7c4-8cf2-47f4-9dcb- d233c2b86ec3 64
  65. 65. aplicações http://www.geonames.org 65
  66. 66. aplicações 66
  67. 67. aplicações 67
  68. 68. aplicações http://sig.ma/ 68
  69. 69. aplicações 69
  70. 70. aplicações 70
  71. 71. aplicações Agora é com vocês ;-) Que tal uma sugestão de aplicação? 71
  72. 72. considerações finais A Web de Dados é mais um passo na evolução da Web e no gerenciamento de dados. Soluções existentes podem ser adaptadas e novas soluções precisam ser desenvolvidas. O que será que vai acontecer daqui pra frente? Ideias? Sugestões? 72
  73. 73. ! …e ficamos por aqui!!Este não é o fim, mas apenas o começo!! ! Obrigada!! 73
  74. 74. referências BIZER, C., HEATH, T., LEE, T. B., Linked data - the story so far. International Journal on Semantic Web and Information Systems (IJSWIS), 2009. BRIN, S., PAGE, L., The Anatomy of a Large-Scale Hypertextual Web Search Engine, 1998. Computer Networks and ISDN Systems, 30(1-7): 107-117. CAMPOS M. L. (2010): GT-LinkedDataBR – Exposição, compartilhamento e conexão de recursos de dados abertos na Web (Linked Open Data). Disponível em http://www.rnp.br/pd/gts2010-2011/ gt_linkeddatabr.html HEATH, T., BIZER, C., Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool, 2011. 74
  75. 75. referências JACOBS, I., WALSH, N., Architecture of the World Wide Web, Volume One, 2004. http://www.w3.org/TR/webarch/. KLYNE, G., CARROL, J. J., Resource Description Framework (RDF): Concepts and Abstract Syntax - W3C Recommendation, 2004. http:// www.w3.org/TR/rdf-concepts/. LEE, T. B., Linked Data - Design Issues, 2006. http://www.w3.org/ DesignIssues/LinkedData.html NOWACK, B., PAGGR: Linked Data widgets and dashboards, Web Semantics: Science, Services and Agents on the World Wide Web, Volume 7, Issue 4, Semantic Web challenge 2008, December 2009, Pages 272-277, ISSN 1570-8268 http://racionalp2p.wordpress.com/2011/04/06/tim-berners-lee-a-web- esta-sendo-ameacada-de-varias-formas/ 75

×