Descrição de recursos em wikis semânticos: dados em RDF para Linked Data
Jaider Andrade Ferreira
Mestrando em Ciência da Informação
Orientadora: Plácida L. V. A. da C. Santos
1. Descrição de recursos
em wikis semânticos
Dados em RDF
para Linked Data
Jaider Andrade Ferreira
Mestrando em Ciência da Informação
Orientadora: Plácida Santos
2. Conteúdo
O A Ciência da Informação e a atividade de descrição de
recursos
O A Web
O A Web Semântica
O As tecnologias da Web Semântica
O URI, XML, RDF, OWL...
O Linked Data
O Wikis
O Wikis semânticos
O Semantic MediaWiki (SMW)
3. A Ciência da Informação e a atividade de
descrição de recursos
O “A representação da informação é necessária em
qualquer ambiente para proporcionar uma
recuperação mais eficiente” (SANTOS; ALVES, 2009)
O Qualquer ambiente? Sim: analógico e digital
O Nesse sentido, os desenvolvedores da Web tem
procurado construir estruturas e tecnologias que
possibilitem a atribuição de metadados aos recursos,
melhorando, desse modo, a recuperação de informações
em ambientes digitais
4. Metadados
O Metadados são informações estruturadas
que descrevem, explicam, proveem a
localização ou, de alguma forma, tornam
mais fácil a recuperação, a utilização ou o
gerenciamento de recursos (NISO, 2004, p. 1).
5. Da Web para...
O Nesse contexto, há uma tendência a uma maior
estruturação das informações disponibilizadas na
Web.
O Estruturação essa que diz respeito à representação ou à
descrição de recursos (informacionais ou não).
O Da necessidade de estruturar e de descrever
semanticamente o conteúdo das páginas ou mesmo de
representar e de descrever semanticamente uma
entidade não presente no ambiente digital, surge o
projeto da Web Semântica.
6. ... a Web Semântica
O Da Web de documentos linkados para a Web de dados
linkados, ou Web das coisas
O Da Web legível por humanos para a Web legível por
máquinas
O Dos links sem tipos para os links tipados
O Para que isso ocorra, é necessária a criação de uma
estrutura comum (modelos conceituais, tecnologias, práticas,
etc.) que permita que os dados sejam compartilhados e
reutilizados entre aplicações, empresas e comunidades
e para eles que possam ser processados automaticamente
por distintas ferramentas de software.
7. Tecnologias da Web Semântica
Principais tecnologias:
O URI
O XML
O RDF
O RDFS
O OWL
O SPARQL
8. Tecnologias da Web Semântica
O As tecnologias da Web Semântica podem ser utilizadas
em várias áreas de aplicação, por exemplo:
O Na integração de dados
O Na descoberta, na classificação e na busca por recursos
O Na catalogação de recursos e em serviços de catalogação
O Na análise e na representação do conhecimento
O Na construção de agentes de software inteligentes
O Na descrição de direitos de propriedade intelectual
O Nas rede sociais
(SW-FAQ, 2009)
10. Como o ser humano descreve os
recursos?
O A maneira mais comum de descrever um recurso é
utilizando-se da linguagem, ou seja, realizando
declarações, sentenças, afirmações.
11. Como o ser humano descreve os
recursos?
O Assim, classificamos os recursos...
O Joãozinho é um ser humano
O Ser humano é um mamífero
O Mamífero é um animal
O Etc.
(relações hierárquicas do tipo “é um(a)”)
12. Como o ser humano descreve os
recursos?
O ... e atribuímos propriedades a eles:
O Joãozinho tem 23 anos
O Joãozinho mora em Marília
O Joãozinho estuda na Unesp
O Etc.
(relações associativas, não hierárquicas)
13. Declarações
O De um ponto de vista linguístico, podemos considerar
que as declarações são constituídas de três partes:
O Sujeito
O Predicado
O Objeto
14. Declarações e descrições
O De um ponto de vista informacional:
O Recurso (objeto, coisa, entidade a ser descrita)
O Propriedade (atributo, característica, metadado)
O Valor (valor da propriedade)
15. Intercâmbio de (meta)dados
O O RDF é uma infraestrutura que permite a codificação,
o intercâmbio e o reuso de metadados estruturados.
O Essa infraestrutura permite a interoperabilidade de
metadados através da concepção de mecanismos que
suportam convenções comuns de semântica, de sintaxe e
de estrutura.
(MILLER, 1998)
16. Resource Description Framework
O Um mecanismo para a representação semântica que se
baseia em um simples, porém poderoso, modelo de
dados.
17. Grafo
O Um documento RDF está estruturado em forma de um
grafo direcionado, isto é, um conjunto de nós que são
ligados por arestas direcionadas (setas).
21. Identificadores
O Entidades precisam ser identificadas.
O Na Web Semântica os identificadores são os URIs
Identificador X Identificador Z
Identificador Y
22. URI
O URI (Uniform Resource Identifier) é uma sequência de
caracteres que identifica (dá nome a) um recurso
físico ou abstrato.
O Obs.: URL (Uniform Resource Locator) é um tipo de URI
que, além de identificar, localiza um recurso disponível na
Web.
O URI http://dbpedia.org/resource/Brazil
O URL http://dbpedia.org/page/Brazil
23. URI
O É o URI que torna o recurso único e não confundível com
outros recursos.
O O RDF pode descrever qualquer objeto que tenha uma clara
identidade no contexto de uma dada aplicação: livros, pessoas,
locais, editoras, eventos, relacionamentos entre essas coisas,
conceitos abstratos...
Enfim, qualquer coisa.
O Tais recursos podem, obviamente, não ser recuperados online
e, portanto, seus URIs são usados exclusivamente para fins
de identificação.
O Tais URIs são feitos para as máquinas referenciarem algum
recurso, não para humanos buscarem informações
24. Declarações
O Em RDF podemos fazer dois tipos de declarações.
Podemos dizer que:
1. Um recurso possui alguma relação com outro recurso:
O URI do recurso | URI da propriedade | URI do valor
O Ex: Jaider | conhece | Fabrício
2. Um recurso possui alguma relação com um valor literal:
O URI do recurso | URI da propriedade | Valor literal
O Ex: Jaider | tem como idade | 23 anos
26. Vocabulários
O Adicionalmente, o RDF Schema, uma extensão do RDF,
proporciona um meio para a publicação tanto de
vocabulários legíveis por humanos quanto de
vocabulários legíveis por máquinas.
O Vocabulário, nesse contexto, é definido como um
conjunto de propriedades ou termos descritivos, isto
é, elementos de metadados, definidos por uma
comunidade de descrição de recursos.
27. Vocabulários
O Exemplos:
O DC: http://dublincore.org (descrição geral)
O FOAF: http://xmlns.com/foaf/spec (pessoas)
O SIOC: http://www.w3.org/Submission/sioc-related (pessoas)
O VoID: http://www.w3.org/TR/void (datasets)
O Schema.org: http://schema.org/Book (geral)
O vCARD: http://www.w3.org/TR/vcard-rdf (contatos)
O Geo: http://www.w3.org/2003/01/geo (localizações)
O Bio: http://vocab.org/bio/0.1 (biografia)
29. Linked Data
O Um método de publicação de dados estruturados
interligados.
O Esse método utiliza tecnologias da Web Semântica como
RDF e URIs.
O Ao invés de esses dados serem utilizados apenas para a
visualização por humanos, eles estão dispostos de um
modo que possibilita a leitura automática por
computadores.
O Isso possibilita que os dados de diferentes fontes sejam
interligados e consultados.
30. Princípios do Linked Data
1. Utilizar URIs para representar coisas
2. Utilizar URIs do tipo HTTP para que essas coisas
possam ser referenciadas e lidas por pessoas e
máquinas
3. Fornecer informações úteis sobre as coisas quando seus
URIs são utilizados, e para essa tarefa, utilizar padrões
como RDF e SPARQL
4. Incluir links para outras coisas relacionadas (utilizando
URIs) quando publicar dados na Web
(BERNERS-LEE, 2006)
32. Wiki
O Um software wiki
cria
O um site wiki
O Um site wiki
é composto por
O páginas wiki
O Páginas wiki
são escritas
O de acordo com uma sintaxe wiki
O Páginas wiki
são criadas
O por uma comunidade wiki
O Uma comunidade wiki
segue uma
O prática wiki
que é embasada em uma
O Filosofia wiki
...
33. Exemplo
O Software wiki: MediaWiki
O (mediawiki.org)
O Site wiki: Wikipédia
O (pt.wikipedia.org)
O Página wiki: Brasil
O (pt.wikipedia.org/wiki/Brasil)
O Sintaxe wiki: '''Brasil'''
O (pt.wikipedia.org/wiki/Ajuda:Guia_de_edição)
O Comunidade wiki: Usuários, Editores, Administradores, etc.
O (pt.wikipedia.org/wiki/WP:Portal_comunitário)
O Prática wiki: Políticas (para o conteúdo e para a formatação de
páginas wiki, para o comportamento dos editores do site wiki, etc.)
O (pt.wikipedia.org/wiki/WP:Lista_de_políticas)
O Filosofia wiki: Princípios gerais, princípios que remontam a origem
dos wikis (1995)
34. Wikis semânticos
O Um wiki semântico pode ser definido como
um software wiki que se utiliza de tecnologias da
Web Semântica para incorporar conhecimento formalizado, conteúdo,
estruturas e links nas páginas wiki.
O conhecimento formalizado é representado utilizando padrões da
Web Semântica e é, portanto, acessível e reutilizável por aplicações Web.
(BUFFA et al., 2007)
35. Wikis semânticos
O AceWiki (2008)
O BOWiki (2008)
O COW (2006)
O Freebase (2005)
O Gnowsis Wiki (2006)
O Graphingwiki (2006)
O IkeWiki (2006)
O Kaukolu (2006)
O Kawawiki (2005)
O KnowWE (2010)
O Makna (2006)
O MultiMakna (2006)
O MewKISS (2005)
O OntoWiki (2006)
O OpenRecord (2006)
O Platypus (2004)
O Rhizome (2005)
O Semantic MediaWiki (2005)
O SemperWiki (2005)
O SHAWN (2005)
O ShyWiki (2011)
O SweetWiki (2006)
O SWiki (2005)
O Swooki (2008)
O TaOPis (2008)
O Topincs Wiki (2006)
O wikiCalc (2007)
O WikSAR (2006)
O Ylvi (2006)
36. Semantic MediaWiki
O O Semantic MediaWiki é um software
livre, de código aberto, disponível como
uma extensão do software MediaWiki.
O É um sistema wiki melhorado com
tecnologias da Web Semântica que
possibilita aos usuários anotar
semanticamente o conteúdo com
informações explícitas legíveis por
máquinas.
O O Semantic MediaWiki coleta os dados
semânticos por meio das anotações
semânticas que os usuários, cientes ou
não, adicionam ao texto das páginas
wiki.
37. Semantic MediaWiki
O ... é um wiki semântico para dados estruturados
O ... é implementado como uma extensão do MediaWiki
O ... é um software livre, de código aberto
O ... é escrito em PHP e JavaScript e suporta o MySQL como
gerenciador de banco de dados além de gerenciadores de
banco de dados RDF (triple stores) como um
armazenamento secundário
38. Semantic MediaWiki
O ... está bem estabelecido e estável
O criado em 2005
O é utilizado em centenas de sites
O é bem documentado (em inglês)
O http://semantic-mediawiki.org
O possui um evento que acontece duas vezes ao ano na
Europa e nos Estados Unidos (SMWCon)
O é uma das maiores extensões do MediaWiki
O Código, desenvolvedores, usuários, etc.
39. Semantic MediaWiki
Possibilita:
O O armazenamento e o gerenciamento de dados
O A navegação e a visualização de dados
O A busca por páginas baseada nos dados armazenados
O A formatação de dados
O A exportação de dados
40. O modelo de dados do
Semantic MediaWiki
O Dados: pares de propriedade-valor atribuídas às páginas
O Exemplo (página – propriedade - valor)
O Brasil | tem capital | Brasília
O Jaider | nasceu em | 1990
O Dom Casmurro | tem autor | Machado de Assis
41. Utilizando o Semantic MediaWiki
O Os dados são registrados na página que representa o que
se pretende descrever. Exemplo:
O Página: Brasil
O Conteúdo da página: [[tem capital::Brasília]]
42. Extensões do Semantic MediaWiki
O Semantic Forms
O Formulários para o preenchimento dos dados
O Semantic Result Formats
O Vários formatos de saída para a exibição e o intercâmbio de
dados
O Maps e Semantic Maps
O Gerencia e consulta dados sobre locais geográficos
O Semantic Drilldown
O Para a navegação facetada dos dados
O Semantic Watchlist
O Para enviar notificações quando os dados são modificados
O ...
43. Em síntese...
O A Ciência da Informação trata da representação e da descrição de
recursos
O A Web (principal ambiente digital informacional) está passando
por grandes desenvolvimentos, rumo a Web Semântica
O A Web Semântica é composta por várias tecnologias (URI, XML,
RDF, RDFS, OWL, RIF, etc.) que visam representar e descrever uma
realidade de maneira interoperável
O A Web Semântica é projetada para forncecer “um pouco mais” de
significado (semântica) para as máquinas
O Linked Data é um conjunto de práticas para a publicação de dados
estruturados na Web Semântica
O Linked Data exige a utilização de RDF
O Wikis semânticos fornecem meios para a descrição de recursos e
para a publicação de dados estruturados em RDF na Web Semântica.
O O wiki semântico mais utilizado é o Semantic MediaWiki.
44. Referências
O BERNERS-LEE, Tim. Linked Data. 2006. Disponível em:
<http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 20 mar. 2013.
O BUFFA, Michel et al. SweetWiki: A semantic wiki. Journal of Web Semantics: Science, Services and
Agents on the World Wide Web, [S.l.], Elsevier, v. 6, n. 1, p. 84-97, 2007. Disponível em:
<http://dx.doi.org/10.1016/j.websem.2007.11.003>. Acesso em: 25 jun. 2011.
O KRÖTZSCH. Semantic MediaWiki - An introduction. Oxford: SMWCon, 2012. Disponível em:
<http://semantic-
mediawiki.org/wiki/File:20121024_SMWCon_Fall_Markus_Kr%C3%B6tzsch_Semantic_MediaWiki_-
_An_Introduction.pdf>. Acesso em: 20 mar. 2013.
O MILLER, Eric. An Introduction to the Resource Description Framework. D-Lib Magazine, v. 4, n. 5, May
1998. Disponível em: <http://www.dlib.org/dlib/may98/miller/05miller.html>. Acesso em: 16 set. 2012.
O NISO. Understanding Metadata. Bethesda: NISO Press, 2004. Disponível em:
<http://www.niso.org/publications/press/UnderstandingMetadata.pdf>. Acesso em: 23 set. 2012.
O SANTOS, Plácida Leopoldina Ventura Amorim da Costa; ALVES, Rachel Cristina Vesú. Metadados e Web
Semântica para estruturação da Web 2.0 e Web 3.0. DataGramaZero, Rio de Janeiro, v. 10, n. 6, dez. 2009.
Disponível em: <http://www.dgz.org.br/dez09/Art_04.htm>. Acesso em: 25 jun. 2011.
O SW-FAQ. W3C Semantic Web Frequently Asked Questions. 2009. Disponível em:
<http://www.w3.org/2001/sw/SW-FAQ>. Acesso em: 20 mar. 2013.