3. WEB ATUAL E COMO
MELHORÁ-LA?
Thursday, October 24, 13
4. Web Atual
•
Apresentação dos conteúdos
•
Formatação, não significado
•
Pouca ou nenhuma estruturação
Thursday, October 24, 13
5. Conteúdo na Web
•
Vários elementos na página
•
Fotos, vídeos e animações
•
Qual a relação entre eles?
•
Quem é mencionado no texto?
•
Quem, Quando, Onde...
Thursday, October 24, 13
6. COMO ISSO AFETA
TAREFAS COMUNS?
Busca por Gols do Roberto Carlos no Maracanã
Thursday, October 24, 13
9. Problemas
•
Busca feita por palavras
•
Contexto indefinido (como fotos e vídeos se
relacionam com o texto?)
•
Ambiguidade (qual Roberto Carlos?)
Thursday, October 24, 13
12. Web Semântica
“I have a dream for the web in which computers
become capable of analyzing all the data on the
web - the content, links, and transactions
between people and computers.”
Tim Berners-Lee
Thursday, October 24, 13
19. Tópicos num domínio D,
Usando uma linguagem L,
Devedzic, 2004
Thursday, October 24, 13
20. Tópicos num domínio D,
Usando uma linguagem L,
Uma ontologia é um catálogo de tipos
de coisas em D
Devedzic, 2004
Thursday, October 24, 13
21. Tópicos num domínio D,
Usando uma linguagem L,
Uma ontologia é um catálogo de tipos
de coisas em D
Tipos são representados em termos de
conceitos e relações em L.
Devedzic, 2004
Thursday, October 24, 13
24. Por que Construir e usar
Ontologias?
•
Compartilhar conhecimento (interoperabilidade)
•
Vocabulários padronizados (reuso)
•
Informação processável por máquina
Thursday, October 24, 13
25. Engenharia de Ontologias
•
Identificar os indivíduos
•
Descrever seus atributos
•
Agrupar os indivíduos em classes
•
Enumerar as relações entre indivíduos
•
Definir regras (restrições, axiomas) sobre classes,
atributos e relações
Thursday, October 24, 13
28. <Jogador>
é um
<Time>
está no
elenco
<Neymar>
é um
<Barcelona>
mandante
<Partida>
é um
<Santos>
visitante
<BarcelonaXSantos:02082013>
é uma
local
<Camp Nou>
Thursday, October 24, 13
data
“02/08/2013”
29. Triplas e Grafos
•
Bancos de triplas são bancos de grafo
especializados que funcionam com a restrição
<sujeito, predicado, objeto>
•
Simplifica a entrada e consulta de dados
Thursday, October 24, 13
30. Contrução de Ontologias
•
Linguagens
•
OWL (Web Ontology Language)
•
RDF (Resource Description Framework)
•
SPARQL (SPARQL Protocol and RDF Query Language)
Thursday, October 24, 13
42. SPARQL
•
Linguagem definida pelo W3C para consultas em
bases RDF
•
Permite consultas federadas
•
Sintaxe baseada em SQL
Thursday, October 24, 13
43. Estrutura da consulta
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
44. Estrutura da consulta
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
45. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
46. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
47. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
o que retornar
48. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
o que retornar
49. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
o que retornar
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
de que grafos
50. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
o que retornar
# definição de datasets
FROM ...
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
de que grafos
51. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
o que retornar
# definição de datasets
FROM ...
de que grafos
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
o que consultar
(matching)
52. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
o que retornar
# definição de datasets
FROM ...
de que grafos
# padrão para consulta
WHERE { ...
}
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
o que consultar
(matching)
53. Estrutura da consulta
abreviação de URIs
# declaração e prefixos
PREFIX esportes: <http://semantica.globo.com/esportes/>
# cláusula de resultado
SELECT ...
o que retornar
# definição de datasets
FROM ...
de que grafos
# padrão para consulta
WHERE { ...
}
o que consultar
(matching)
# modificadores de consulta
ORDER BY ...
Thursday, October 24, 13
pós-processamento
55. Exemplo de Consulta
Selecionar os 100 primeiros predicados e
objetos da classe dbpedia:SoccerPlayer
PREFIX dbpedia: <http://dbpedia.org/ontology/>
SELECT *
FROM <http://dbpedia.org>
WHERE {
dbpedia:SoccerPlayer ?p ?o
}
LIMIT 100
Thursday, October 24, 13
57. Exemplo de Consulta
Selecionar todas as instâncias da classe
dbpedia:SoccerPlayer e seus nomes
PREFIX dbpedia: <http://dbpedia.org/ontology/>
SELECT ?soccerPlayer ?name
FROM <http://dbpedia.org>
WHERE {
?soccerPlayer a dbpedia:SoccerPlayer ;
rdfs:label ?name .
}
Thursday, October 24, 13
60. Linked Data
•
Rede de dados, co-refenciados
•
Endpoints SPARQL abertos
•
Identificadores únicos (URIs) para conceitos
•
URIs derreferenciáveis
•
Bases de dados de referência
Thursday, October 24, 13
61. Linked Data
•
Repositório de uso geral
•
•
DBPedia (conceitos extraídos da Wikipedia)
Repositório sobre domínios específicos
•
GeoNames
•
MusicBrainz
•
legislation.data.gov.uk
Thursday, October 24, 13
76. Buscas Semânticas
•
Encontram e analisam meta-informação
•
•
•
HTML 5 microdata, RDFa
Repositórios de triplas
Relacionam informações em sites diferentes
•
Dado que usem vocabulários padrão
Thursday, October 24, 13
94. Números
•
98% das matérias do GE e EGO são anotadas
•
+ 8 MIL páginas de tópico
Thursday, October 24, 13
95. Conhecimento Único
•
Menos duplicidade dos dados
•
Simplificação do uso e da manutenção dos
dados
•
Agilidade na recuperação dos dados
Thursday, October 24, 13
97. CMS
•
Metadados com significado (diferente de tags)
•
CMS se adapta a ontologia
•
Extrator automático de indivíduos
•
Suggest de anotação
•
Menor esforço editorial
Thursday, October 24, 13
99. O Que Estamos Fazendo
•
API hipermídia: simplificando uso de semântica
•
Ontologias mais focadas: de produtos para
domínios
•
Modelagem com equivalências a ontologias
como a DBPedia
Thursday, October 24, 13
100. API Hipermídia
•
Diminuir complexidade da arquitetura
•
Reduzir necessidade de queries SPARQL
•
Gerenciamento de dados (deduplicação,
validação, integração com dados externos)
•
Ponto único de acesso ao banco de triplas
Thursday, October 24, 13
134. Futuro
•
Navegação sugerida por inferência
•
Potencialização de SEO (schema.org automático)
•
Sugestão de anotação
•
Conteúdo mais rico, com atualização frequente
•
Conectado com dados abertos (DBPedia,
dados.gov.br)
Thursday, October 24, 13
140. Resultados
•
Tráfego originado por motores de busca: + 30%
•
Taxa de cliques no Yahoo!: + 15%
•
Aumento significativo do Google PageRank
Thursday, October 24, 13
149. Resultados
•
Proliferação de links relevantes: potencialização de SEO
•
Reuso das informações: menor desperdício de pessoal
•
Navegação interligada e escalável para toda a BBC
Thursday, October 24, 13
151. Ações Realizadas
•
Anotação e indexação do conteúdo baseado em indivíduos
•
Ontologia pública
•
Interligação com repositórios de dados externos
•
Adição de metadados: Open Graph
Thursday, October 24, 13
152. NYT Index Abstract
Jenny Brown, owner of
Woodstock (NY) Farm
Animal Sanctuary, forms
special bond with Albie, goat
that probably escaped from
New York City
slaughterhouse; Albie injured
leg in escape and it had to be
amputated; Brown had leg
amputated as child; wears
artificial leg and wants to also
get one for Albie; photos (M)
Thursday, October 24, 13
✓ Assuntos: Livestock; Goats;
Amputation; Prosthesis; Legs
✓ Organizações: Woodstock
Farm Animal Sanctuary
✓ Lugares: Woodstock (NY);
New York City
✓ Pessoas: Santos, Fernanda;
Brown, Jenny