Este documento discute a Web Semântica e Linked Data. Explica como os dados estão publicados na Web atualmente e as deficiências dessa abordagem. Apresenta como ontologias, URIs e RDF podem ser usados para ligar dados de diferentes fontes e torná-los mais facilmente integráveis. Também descreve SPARQL como uma linguagem para consultar dados RDF e exemplos de aplicações que usam Linked Data.
2. Web de Documentos X Web de
Dados
Web 1.0
Documentos
Conteúdo
HTML descreve estrutura e apresentação da informação, ou seja, a
sintaxe, não a semântica.
Web 2.0
AJAX
Redes Sociais
3. Web de Documentos X Web de
Dados
Navegadores HTML
Hiperlinks
URIs, HTTP, HTML
Navegadores RDF (Resource
Description Framework)
Links RDF
URIs, HTTP, RDF, SPARQL
Web de Documentos Web de Dados
4. Como os dados estão publicados na
Web?
Banco de Dados Relacionais
XML
CSV
XLS
5. Deficiências da Web
Web baseada em HTML
Apenas descrições sintáticas
Grande cobertura porem com baixa precisão
Diferentes formatos
Diferentes modelos de dados
Não há vínculo entre fontes de dados diferentes
DIFICULDADE PARA INTEGRAR OS DADOS
8. Mas como Ligar os Dados ?
Utilização de ontologias.
As boas práticas para a publicação de dados são importantes.
Dê nome às coisas usando URIs.
As URIs serão solicitadas, devolva uma informação útil em RDF.
9. Ontologia
Na filosofia: Ciência de descrever os tipos de entidades no Mundo e como
estão relacionadas.
Na Web: Conjunto de conceitos dentro de um domínio e os relacionamentos
entre estes.
É necessário descrever :
CONCEITOS
RECURSOS
PROPRIEDADES
RELACIONAMENTOS
10. URI
Uniform Resource Identifier
Usada para identificar de forma única um recurso na Internet
http://pt.wikipedia.org/wiki/URI#Exemplos_de_ref_URI
"http" é o nome do 'conjunto',
"pt.wikipedia.org" é a 'autoridade',
"/wiki/URI" é o 'caminho' apontando para este artigo
"#Exemplos_de_ref_URI" é um 'fragmento' apontando para esta seção
11. RDF
Resource Description Framework
A descrição do arquivo é adequado à situações nas quais a informação
precisa ser processada por software em vez de serem somente exibidas
para pessoas.
RDF é baseado na ideia de identificar coisas usando
identificadores Web (Uniform Resource Identifiers ) e descrevê-las em
termos de propriedades simples com seus valores. Essa ideia permite ao
RDF representar afirmações sobre recursos na forma de um Grafo.
12. RDF: padrão W3C para descrição
dos recurso Web
Em RDF uma descrição de um recurso é representada
como uma série triplas. As três partes dessa tripla são :
sujeito
predicado
objeto
13. SPARQL
Linguagem de Consulta de alto nível para recuperação de informações
contidas em grafos RDF.
Protocolo usado para enviar consultas e recuperar resultados através do
protocolo HTTP.
Fontes Linked Data tipicamente fornecem um SPARQL Endpoint que é um
serviço Web com suporte ao protocolo SPARQL.
Uma consulta (retornar o título do livro identificado pelo URI):
14. Linked Data
Descreve métodos de publicação de dados estruturados de modo que
possam ser interligados e tornar-se mais útil.
Ele baseia-se em tecnologias da Web padrão, tais como HTTP, RDF e
URIs, mas ao invés de usá-los para servir páginas web para leitores
humanos, estende-se a eles para compartilhar informações de uma maneira
que podem ser lidos automaticamente por computadores.
Permitindo que os dados de diferentes fontes sejam conectados e
consultados.