Introducao a Web Semantica

9.475 visualizações

Publicada em

Introduçao à Web Semântica. Semana de Informática do CES (Juiz de Fora/MG/Br), setembro 2009

Publicada em: Tecnologia, Educação
1 comentário
27 gostaram
Estatísticas
Notas
Sem downloads
Visualizações
Visualizações totais
9.475
No SlideShare
0
A partir de incorporações
0
Número de incorporações
597
Ações
Compartilhamentos
0
Downloads
563
Comentários
1
Gostaram
27
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • We will use a simplistic example to introduce the main Semantic Web concepts
    We take, as an example area, data integration
  • This time, stored in a spreadsheet!
  • Courtesy W3C SWEO group, http://linkeddata.org/docs/eswc2007-poster-linking-open-data.pdf
  • Courtesy of Richard Cyganiak, http://richard.cyganiak.de/2007/10/lod/
  • Courtesy of Chris Bizer, http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-05.html
  • Introducao a Web Semantica

    1. 1. Ely Edison Matos ely.matos@ufjf.edu.br Analista de TI, UFJF XIX Semana de Informática e Telecomunicações CES/JF - setembro2009 Web Semântica Web 3.0
    2. 2. Agenda Web 1.0? Web 2.0? Qual o problema? Quais as soluções? Quero saber mais!
    3. 3. Cada linguagem tem sua própria sintaxe e semântica Sintaxe estuda a gramática Semântica estuda o significado
    4. 4. Sintaxe é como você diz algo Sintaxe é como você diz algo Semântica é o que algo significa Semântica é o que algo significa sintaxes diferentes mesma semântica x += y x = x + y sintaxes diferentes mesma semântica x += y x = x + y
    5. 5. Sintaxe e semântica estão relacionadas à comunicação
    6. 6. Internet
    7. 7. web documentos páginas hyperlinks
    8. 8. Esta é a Web 1.0
    9. 9. Os autores começaram a usar Ajax Então…
    10. 10. As pessoas começaram a compartilhar fotos e vídeos
    11. 11. As pessoas começaram a interargir criando redes sociais
    12. 12. As pessoas começaram a publicar conteúdo em blogs
    13. 13. As pessoas começaram contribuir em wikis
    14. 14. tags e RSS As pessoas começaram a usar
    15. 15. Esta é a Web 2.0
    16. 16. Qual o problema ?
    17. 17. Páginas Web são escritas em HTML
    18. 18. HTML descreve estrutura e apresentação da informação ou seja a sintaxe não a semântica
    19. 19. Uma página HTML
    20. 20. Que informação nós vemos?
    21. 21. Que informação as máquinas vêem?
    22. 22. Se os computadores puderem entender o significado da informação ...
    23. 23. Eles poderão aprender sobre o que estamos interessados e nos ajudar a encontrar o que realmente queremos
    24. 24. Este é o campo da Web Semântica
    25. 25. Esta é a Web 3.0
    26. 26. A Web de hoje é uma Web de documentos
    27. 27. A Web Semântica é uma Web de coisas
    28. 28. ídolo patrocínio produto competição jogo localização
    29. 29. Exemplo?
    30. 30. Quais as soluções ?
    31. 31.  Incrementa aWorldWideWeb  Representa a informação daWeb de forma compreensível por máquinas  Possibilita…  …buscar com objetivo  …percorrer os dados  … usar agentesautomatizados
    32. 32. WWW Web Semântica Páginas Dados
    33. 33. 2009: Onde estamos? Aqui
    34. 34. 2009: Onde estamos? As tecnologias da Web Semântica não são uma ferramenta mágica para descobrir novos remédios (ou para salvar o mundo…) Ainda há termos confusos e conflitantes no campo da Web Semântica, cada um sendo considerado “correto”. Não há grande disponibilidade de pessoas com as habilidades necessárias para projetar e construir soluções em Web Semântica. Ainda não existem padrões para temas como privacidade, confiança, probabilidade e outros elementos da visão da Web Semântica.
    35. 35. A Web Semântica pode nos ajudar a Baseado no exemplo apresentado por Ivan Herman
    36. 36. 1. Mapear os vários dados em uma representação abstrata de dados  Tornar os dados independentes de sua representação interna… 2. Combinar as representações resultantes 3. Fazer consultas no conjunto total • Consultas que não são possíveis nos data sets individuais
    37. 37. ID Author Title Publisher Year ISBN0-00-651409-X id_xyz The Glass Palace id_qpr 2000 ID Name Home page id_xyz Ghosh, Amitav http://www.amitavghosh.com ID Publisher Name City id_qpr Harper Collins London Books Authors Publishers
    38. 38. A B D E 1 ID Titre Original 2 ISBN0 2020386682 A13 ISBN-0-00-651409-X 3 6 ID Auteur 7 ISBN-0-00-651409-X A12 11 12 13 Traducteur Le Palais des miroirs Nom Ghosh, Amitav Besse, Christianne
    39. 39. Mesma URI = Mesmo Recurso
    40. 40. Um usuário do data set “F” pode agora perguntar algo como: “Qual o título da versão original de Le Palais des mirroirs?” Esta informação não está no data set “F”... …mas pode ser recuperada depois da fusão com o data set “A”!
    41. 41. Nós “sabemos” que a:author e f:auteur são a mesma coisa Mas a fusão automática não sabe disto! Vamos acrescentar alguma informação extra aos dados fundidos: a:author same as f:auteur Ambos identificam uma Person
    42. 42. Um usuário do data set “F” pode perguntar agora: “Qual é a homepage do autor de Le Palais des mirroirs?” A informação não está no data set “F” nem está no data set “A”… …mas se tornou disponível através: Da fusão dos data sets “A” e “F” Da adição de 3 declarações simples de “junção”
    43. 43. Podemos integrar novas informações de outras fontes em nosso data set e.g. informação adicional sobre o autor Amitav Ghosh Talvez a maior fonte de conhecimento público seja a Wikipedia
    44. 44. Pode ser, mas de fato, não deveria ser… O que aconteceu por meios automáticos é feito diariamente pelos usuários da Web! A diferença? Um pouco de rigor extra, para que as máquinas possam fazer isto também
    45. 45.  Combinamos diferentes datasets que ▪ ...podem ser internos ou estar em algum lugar da Web ▪ ...são de formatos diferentes (RDBMS, Excel spreadsheet, (X)HTML, etc) ▪ ...têm diferentes nomes para as mesmas relações  Pudemos combinar os datasets porque algumas URIs são idênticas ▪ i.e. o ISBNs no nosso exemplo  Pudemos adicionar algumas informações adicionais simples (a “cola”) para ajudar a fundir os datasets  O resultado? Respostas para perguntas que não poderiam ser feitas antes!
    46. 46. São as tecnologias da Web Semântica que tornam esta integração possível
    47. 47. RDF é Resource Description Framework
    48. 48. RDF é O Modelo de Dados da Web Semântica
    49. 49. RDF identifica as coisas usando URIs (Uniform Resource Identifiers)
    50. 50. RDF usa declarações simples (Triplas) para descrever as relações Coisa-Propriedade-Valor Sujeito-Predicado-Objeto
    51. 51. RDF representação em grafo “Ely Matos trabalha na UFJF” “Ely Matos tem o email ely.matos@ufjf.edu.br” “O campus da UFJF está localizado em Juiz de Fora” Ely Matos UFJF trabalhafor Ely Matos ely.matos@ufjf.edu.br temEmail UFJF localizadoEm Juiz de Fora
    52. 52. RDF representação em grafo Ely Matos UFJF trabalha ely.matos@ufjf.edu.br temEmail localizadoEm Juiz de Fora Minas Gerais moraEm cidadeDe
    53. 53. SPARQL é SPARQL Protocol And RDF Query Language
    54. 54. SPARQL é A linguagem de consulta da Web Semântica
    55. 55. Por que SPARQL? Obter informação de dados estruturados e semi- estruturados Explorar dados através da descoberta de relacionamentos desconhecidos Consultar e pesquisar com uma visão integrada de diferentes fontes de dados Reunir diferentes aplicações através da transformação de um vocabulário em outro 1 2 3 4
    56. 56. Quais automóveis fazem mais de 10Km por litro, têm custo dentro do orçamento do meu departamento e podem ser comprados em uma concessionária localizada até 15 Km de um dos meus empregados? SELECT ?automobile WHERE { ?automobile a ex:Car ; epa:mpg ?mpg ; ex:dealer ?dealer . ?employee a ex:Employee ; geo:loc ?loc . ?dealer geo:loc ?dealerloc . FILTER(?mpg > 25 && geo:dist(?loc, ?dealerloc) <= 10) . } Web dashboard SPARQL query Employee Directory ERP / Budget System Web Dealer 1 Dealer 2 Dealer 3 EPA Fuel Efficiency Spreadsheet SPARQL Query Engine
    57. 57. Exemplo de SPARQL Encontrar todos os países sem litoral com uma população maior que 15 milhões de habitantes. PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/> SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER ( ?population > 15000000 && langMatches(lang(?country_name), "EN") ) . } ORDER BY DESC(?population) Consultando a Wikipedia...(http://dbpedia.org/sparql)
    58. 58. (Alguns) Datasets SPARQL’áveis
    59. 59. Mas... Nada do que vimos até agora se aproxima da visão a longo prazo da Web Semântica
    60. 60. Do conhecimento explícito para o inferido RDFS OWL RIF
    61. 61. Ontologias  Vocabulário de termos  Novos termos formados a partir dos existentes  A Semântica é formalmente especificada  Também registra os relacionamentos entre termos
    62. 62. RDFS é RDF Schema
    63. 63. RDF Schema Vocabulário (definição de termos) e.g. define um relacionamento “dose prescrita” Schema (definição de tipos) “dose prescrita” relaciona “tratamento” e “dosagem” Taxonomia (definição de hierarquias) Qualquer “médico” é um “profissional médico”
    64. 64. OWL é Web Ontology Language
    65. 65. OWL Identidade igual/diferente “author” e “auteur” são a mesma relação dois recursos com o mesmo “ISBN” são o mesmo “book” Definições de tipo mais expressivas Um “cycle” é um “vehicle” com pelo menos uma “wheel” Uma “bicycle” é um “cycle” com exatamente duas “wheels” Definições de relações mais expressivas “irmãoDe” é uma relação simétrica O valor de “diaDaSemana” deve ser um de “segunda”, “terça”, “quarta”, “quinta”, “sexta”, “sábado”, “domingo”
    66. 66. O que podemos fazer com OWL? Consistência Há alguma contradição neste modelo? Classificação Quais são os tipos inferidos deste recurso? Correção Há alguma classe nesta ontologia que não pode ter membros?
    67. 67. RIF é Rules Interchange Format
    68. 68. RIF Representação padrão para intercâmbio de conjuntos de regras lógicas e de negócio Regras lógicas Um cliente se torna um cliente "Gold" assim que suas compras acumuladas durante o ano corrente alcancem $5000 Regras de produção Para compras acima de $1000, clientes "Gold" recebem um desconto de 10% do total da conta
    69. 69. Ontologias públicas reusáveis Measurement Units Ontology The Event Ontology FOAF
    70. 70. Linked Data é Um conjunto de 4 regras simples para publicação de dados RDF na Web Desenvolvido porTim Berners-Lee em 2006
    71. 71. The LOD “cloud”, Maio 2007
    72. 72. The LOD “cloud”, Março 2008
    73. 73. The LOD “cloud”, Setembro 2008
    74. 74. The LOD “cloud”, Março 2009
    75. 75. RDFa é RDF in attributes
    76. 76. RDFa provê um conjunto de atributos XHTML que expressam dados RDF
    77. 77. Exemplo: Alice in Semantic Wonderland Alice é uma blogger que publica artigos em http://example.com/alice
    78. 78. Ela quer declarar a licença do seu trabalho
    79. 79. Ela quer especificar o título e o autor de um artigo, mas estes atributos não existem em XHTML
    80. 80. Ela pode usar o vocabulário Dublin Core
    81. 81. Ela quer registrar os créditos de Bob quando ela posta as fotos tiradas por ele
    82. 82. Ela quer mostrar seu nome, email e telefone Ela pode usar o vocabulário Friend-of-a-Friend (FOAF)
    83. 83. Quem está usando RDFa? STW Thesaurus for Economics
    84. 84. “I have a dream for theWeb in which computers become capable of analyzing all the data on the Web” Tim Berners-Lee, 1999 Inventor of theWeb
    85. 85. A Web Semântica Está Realmente Acontecendo HOJE
    86. 86. Quer saber mais ?
    87. 87. www.w3c.org
    88. 88. semanticweb.org
    89. 89. linkeddata.org
    90. 90. rdfa.info
    91. 91. wikipedia.org
    92. 92. Livros A Semantic Web Primer Grigoris Antoniou e Frank van Harmelen Segunda Edição Web Semântica A Internet do Futuro Karin Breitman Editora LTC
    93. 93. Obrigado! Ely Edison Matos ely.matos@ufjf.edu.br Analista de TI, UFJF XIX Semana de Informática e Telecomunicações CES/JF - setembro2009

    ×