Introducao a Web Semantica

9.702 visualizações

Publicada em

Introduçao à Web Semântica. Semana de Informática do CES (Juiz de Fora/MG/Br), setembro 2009

Publicada em: Tecnologia, Educação

Introducao a Web Semantica

  1. 1. Ely Edison Matos ely.matos@ufjf.edu.br Analista de TI, UFJF XIX Semana de Informática e Telecomunicações CES/JF - setembro2009 Web Semântica Web 3.0
  2. 2. Agenda Web 1.0? Web 2.0? Qual o problema? Quais as soluções? Quero saber mais!
  3. 3. Cada linguagem tem sua própria sintaxe e semântica Sintaxe estuda a gramática Semântica estuda o significado
  4. 4. Sintaxe é como você diz algo Sintaxe é como você diz algo Semântica é o que algo significa Semântica é o que algo significa sintaxes diferentes mesma semântica x += y x = x + y sintaxes diferentes mesma semântica x += y x = x + y
  5. 5. Sintaxe e semântica estão relacionadas à comunicação
  6. 6. Internet
  7. 7. web documentos páginas hyperlinks
  8. 8. Esta é a Web 1.0
  9. 9. Os autores começaram a usar Ajax Então…
  10. 10. As pessoas começaram a compartilhar fotos e vídeos
  11. 11. As pessoas começaram a interargir criando redes sociais
  12. 12. As pessoas começaram a publicar conteúdo em blogs
  13. 13. As pessoas começaram contribuir em wikis
  14. 14. tags e RSS As pessoas começaram a usar
  15. 15. Esta é a Web 2.0
  16. 16. Qual o problema ?
  17. 17. Páginas Web são escritas em HTML
  18. 18. HTML descreve estrutura e apresentação da informação ou seja a sintaxe não a semântica
  19. 19. Uma página HTML
  20. 20. Que informação nós vemos?
  21. 21. Que informação as máquinas vêem?
  22. 22. Se os computadores puderem entender o significado da informação ...
  23. 23. Eles poderão aprender sobre o que estamos interessados e nos ajudar a encontrar o que realmente queremos
  24. 24. Este é o campo da Web Semântica
  25. 25. Esta é a Web 3.0
  26. 26. A Web de hoje é uma Web de documentos
  27. 27. A Web Semântica é uma Web de coisas
  28. 28. ídolo patrocínio produto competição jogo localização
  29. 29. Exemplo?
  30. 30. Quais as soluções ?
  31. 31.  Incrementa aWorldWideWeb  Representa a informação daWeb de forma compreensível por máquinas  Possibilita…  …buscar com objetivo  …percorrer os dados  … usar agentesautomatizados
  32. 32. WWW Web Semântica Páginas Dados
  33. 33. 2009: Onde estamos? Aqui
  34. 34. 2009: Onde estamos? As tecnologias da Web Semântica não são uma ferramenta mágica para descobrir novos remédios (ou para salvar o mundo…) Ainda há termos confusos e conflitantes no campo da Web Semântica, cada um sendo considerado “correto”. Não há grande disponibilidade de pessoas com as habilidades necessárias para projetar e construir soluções em Web Semântica. Ainda não existem padrões para temas como privacidade, confiança, probabilidade e outros elementos da visão da Web Semântica.
  35. 35. A Web Semântica pode nos ajudar a Baseado no exemplo apresentado por Ivan Herman
  36. 36. 1. Mapear os vários dados em uma representação abstrata de dados  Tornar os dados independentes de sua representação interna… 2. Combinar as representações resultantes 3. Fazer consultas no conjunto total • Consultas que não são possíveis nos data sets individuais
  37. 37. ID Author Title Publisher Year ISBN0-00-651409-X id_xyz The Glass Palace id_qpr 2000 ID Name Home page id_xyz Ghosh, Amitav http://www.amitavghosh.com ID Publisher Name City id_qpr Harper Collins London Books Authors Publishers
  38. 38. A B D E 1 ID Titre Original 2 ISBN0 2020386682 A13 ISBN-0-00-651409-X 3 6 ID Auteur 7 ISBN-0-00-651409-X A12 11 12 13 Traducteur Le Palais des miroirs Nom Ghosh, Amitav Besse, Christianne
  39. 39. Mesma URI = Mesmo Recurso
  40. 40. Um usuário do data set “F” pode agora perguntar algo como: “Qual o título da versão original de Le Palais des mirroirs?” Esta informação não está no data set “F”... …mas pode ser recuperada depois da fusão com o data set “A”!
  41. 41. Nós “sabemos” que a:author e f:auteur são a mesma coisa Mas a fusão automática não sabe disto! Vamos acrescentar alguma informação extra aos dados fundidos: a:author same as f:auteur Ambos identificam uma Person
  42. 42. Um usuário do data set “F” pode perguntar agora: “Qual é a homepage do autor de Le Palais des mirroirs?” A informação não está no data set “F” nem está no data set “A”… …mas se tornou disponível através: Da fusão dos data sets “A” e “F” Da adição de 3 declarações simples de “junção”
  43. 43. Podemos integrar novas informações de outras fontes em nosso data set e.g. informação adicional sobre o autor Amitav Ghosh Talvez a maior fonte de conhecimento público seja a Wikipedia
  44. 44. Pode ser, mas de fato, não deveria ser… O que aconteceu por meios automáticos é feito diariamente pelos usuários da Web! A diferença? Um pouco de rigor extra, para que as máquinas possam fazer isto também
  45. 45.  Combinamos diferentes datasets que ▪ ...podem ser internos ou estar em algum lugar da Web ▪ ...são de formatos diferentes (RDBMS, Excel spreadsheet, (X)HTML, etc) ▪ ...têm diferentes nomes para as mesmas relações  Pudemos combinar os datasets porque algumas URIs são idênticas ▪ i.e. o ISBNs no nosso exemplo  Pudemos adicionar algumas informações adicionais simples (a “cola”) para ajudar a fundir os datasets  O resultado? Respostas para perguntas que não poderiam ser feitas antes!
  46. 46. São as tecnologias da Web Semântica que tornam esta integração possível
  47. 47. RDF é Resource Description Framework
  48. 48. RDF é O Modelo de Dados da Web Semântica
  49. 49. RDF identifica as coisas usando URIs (Uniform Resource Identifiers)
  50. 50. RDF usa declarações simples (Triplas) para descrever as relações Coisa-Propriedade-Valor Sujeito-Predicado-Objeto
  51. 51. RDF representação em grafo “Ely Matos trabalha na UFJF” “Ely Matos tem o email ely.matos@ufjf.edu.br” “O campus da UFJF está localizado em Juiz de Fora” Ely Matos UFJF trabalhafor Ely Matos ely.matos@ufjf.edu.br temEmail UFJF localizadoEm Juiz de Fora
  52. 52. RDF representação em grafo Ely Matos UFJF trabalha ely.matos@ufjf.edu.br temEmail localizadoEm Juiz de Fora Minas Gerais moraEm cidadeDe
  53. 53. SPARQL é SPARQL Protocol And RDF Query Language
  54. 54. SPARQL é A linguagem de consulta da Web Semântica
  55. 55. Por que SPARQL? Obter informação de dados estruturados e semi- estruturados Explorar dados através da descoberta de relacionamentos desconhecidos Consultar e pesquisar com uma visão integrada de diferentes fontes de dados Reunir diferentes aplicações através da transformação de um vocabulário em outro 1 2 3 4
  56. 56. Quais automóveis fazem mais de 10Km por litro, têm custo dentro do orçamento do meu departamento e podem ser comprados em uma concessionária localizada até 15 Km de um dos meus empregados? SELECT ?automobile WHERE { ?automobile a ex:Car ; epa:mpg ?mpg ; ex:dealer ?dealer . ?employee a ex:Employee ; geo:loc ?loc . ?dealer geo:loc ?dealerloc . FILTER(?mpg > 25 && geo:dist(?loc, ?dealerloc) <= 10) . } Web dashboard SPARQL query Employee Directory ERP / Budget System Web Dealer 1 Dealer 2 Dealer 3 EPA Fuel Efficiency Spreadsheet SPARQL Query Engine
  57. 57. Exemplo de SPARQL Encontrar todos os países sem litoral com uma população maior que 15 milhões de habitantes. PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/> SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER ( ?population > 15000000 && langMatches(lang(?country_name), "EN") ) . } ORDER BY DESC(?population) Consultando a Wikipedia...(http://dbpedia.org/sparql)
  58. 58. (Alguns) Datasets SPARQL’áveis
  59. 59. Mas... Nada do que vimos até agora se aproxima da visão a longo prazo da Web Semântica
  60. 60. Do conhecimento explícito para o inferido RDFS OWL RIF
  61. 61. Ontologias  Vocabulário de termos  Novos termos formados a partir dos existentes  A Semântica é formalmente especificada  Também registra os relacionamentos entre termos
  62. 62. RDFS é RDF Schema
  63. 63. RDF Schema Vocabulário (definição de termos) e.g. define um relacionamento “dose prescrita” Schema (definição de tipos) “dose prescrita” relaciona “tratamento” e “dosagem” Taxonomia (definição de hierarquias) Qualquer “médico” é um “profissional médico”
  64. 64. OWL é Web Ontology Language
  65. 65. OWL Identidade igual/diferente “author” e “auteur” são a mesma relação dois recursos com o mesmo “ISBN” são o mesmo “book” Definições de tipo mais expressivas Um “cycle” é um “vehicle” com pelo menos uma “wheel” Uma “bicycle” é um “cycle” com exatamente duas “wheels” Definições de relações mais expressivas “irmãoDe” é uma relação simétrica O valor de “diaDaSemana” deve ser um de “segunda”, “terça”, “quarta”, “quinta”, “sexta”, “sábado”, “domingo”
  66. 66. O que podemos fazer com OWL? Consistência Há alguma contradição neste modelo? Classificação Quais são os tipos inferidos deste recurso? Correção Há alguma classe nesta ontologia que não pode ter membros?
  67. 67. RIF é Rules Interchange Format
  68. 68. RIF Representação padrão para intercâmbio de conjuntos de regras lógicas e de negócio Regras lógicas Um cliente se torna um cliente "Gold" assim que suas compras acumuladas durante o ano corrente alcancem $5000 Regras de produção Para compras acima de $1000, clientes "Gold" recebem um desconto de 10% do total da conta
  69. 69. Ontologias públicas reusáveis Measurement Units Ontology The Event Ontology FOAF
  70. 70. Linked Data é Um conjunto de 4 regras simples para publicação de dados RDF na Web Desenvolvido porTim Berners-Lee em 2006
  71. 71. The LOD “cloud”, Maio 2007
  72. 72. The LOD “cloud”, Março 2008
  73. 73. The LOD “cloud”, Setembro 2008
  74. 74. The LOD “cloud”, Março 2009
  75. 75. RDFa é RDF in attributes
  76. 76. RDFa provê um conjunto de atributos XHTML que expressam dados RDF
  77. 77. Exemplo: Alice in Semantic Wonderland Alice é uma blogger que publica artigos em http://example.com/alice
  78. 78. Ela quer declarar a licença do seu trabalho
  79. 79. Ela quer especificar o título e o autor de um artigo, mas estes atributos não existem em XHTML
  80. 80. Ela pode usar o vocabulário Dublin Core
  81. 81. Ela quer registrar os créditos de Bob quando ela posta as fotos tiradas por ele
  82. 82. Ela quer mostrar seu nome, email e telefone Ela pode usar o vocabulário Friend-of-a-Friend (FOAF)
  83. 83. Quem está usando RDFa? STW Thesaurus for Economics
  84. 84. “I have a dream for theWeb in which computers become capable of analyzing all the data on the Web” Tim Berners-Lee, 1999 Inventor of theWeb
  85. 85. A Web Semântica Está Realmente Acontecendo HOJE
  86. 86. Quer saber mais ?
  87. 87. www.w3c.org
  88. 88. semanticweb.org
  89. 89. linkeddata.org
  90. 90. rdfa.info
  91. 91. wikipedia.org
  92. 92. Livros A Semantic Web Primer Grigoris Antoniou e Frank van Harmelen Segunda Edição Web Semântica A Internet do Futuro Karin Breitman Editora LTC
  93. 93. Obrigado! Ely Edison Matos ely.matos@ufjf.edu.br Analista de TI, UFJF XIX Semana de Informática e Telecomunicações CES/JF - setembro2009

×