Dicionário de Genealogia, autor Gilber Rubim Rangel
Web Semântica e Inteligência Artificial
1. Um papo sobre!
Web Semântica!
Eduardo Nicola F. Zagari!
zagari em abril com br!
NIH - Núcleo de Engenharia e Pesquisa!
Abril Digital!
São Paulo, 09/11/2009!
2. Sumário!
Apresentação do NIH!
Introdução!
Abordagens!
Aplicações!
Tecnologias para Anotação de Conteúdo: RDF,
Microformatos, RDFa, OWL, SPARQL!
NLP e Extração de Entidades!
Considerações Finais!
Eduardo Nicola Zagari!
3. NIH!
• Monitorar de forma sistemática novas
técnicas, linguagens, interfaces, arcabouços e
sistemas computacionais utilizados na Web que
possam ser implantados em nossos produtos;!
• Desenvolver Novos Serviços de Inteligência
Computacional, de Infraestrutura de Backend
e de Interfaces Visuais para nossos produtos;!
• Investigar novas soluções algorítmicas,
técnicas e de interfaces para problemas das
novas features, proposta, prototipação e
avaliação das mesmas e!
• Disseminar dentro da ABD os conhecimentos
adquiridos na área, através de Tech Talks e/ou
treinamentos.!
Eduardo Nicola Zagari!
4. NIH!
Bibliotecas compartilhadas por serviços
(Runner, HTMLParsing, Instrumentation, Stats
etc)!
Flash Cassino, Veja Lua, Handler-Uploader de
Imagens!
Classificador Automático!
Super Robot!
NER, Visualização de Grandes Massas de
Dados!
Eduardo Nicola Zagari!
5. NIH!
Definição
na
Wikipedia:!
a term used to describe
persistent social, corporate
or institutional culture that
avoids using or buying
already existing products,
research or knowledge
because of its different
origins. It is normally used
in a pejorative sense.
a term and label developed
in the computer industry
referring to organizations
incapable of using
technology from other
organizations.
Eduardo Nicola Zagari!
6. Introdução!
No começo, existia a Web e as pessoas
gostavam de surfar por suas páginas, trocar
e-mails, fazer programas para suas
empresas... A vida era boa... !
Só que um dia, as “pessoas” começaram a
gostar tanto dela, que resolveram usar seu
conteúdo de novas formas... !
Mas a Web foi feita para compartilhar
documentos e não os dados internos de suas
páginas... E estas “pessoas” ficaram tristes...!
Aí surge a Web Semântica... e “elas” voltarão
a ser felizes em breve! :-)!
Eduardo Nicola Zagari!
7. Web Semântica!
Múltiplas faces: !
uma plataforma tecnológica de metadados da
Web!
Eduardo Nicola Zagari!
8. (Plataforma Tecnológica)!
Computadores devem estar aptos a saber:!
o que uma determinada requisição
significa;!
sobre o que são dados e documentos
particulares;!
o relacionamento entre tudo isto.!
Eduardo Nicola Zagari!
9. (Evolução das Aplicações)!
Processamento de Dados!
Processamento de Informação!
Processamento de Conhecimento!
Processamento Inteligente!
Eduardo Nicola Zagari!
10. Web Semântica!
Múltiplas faces: !
uma plataforma tecnológica de metadados da
Web!
um movimento social de “abertura de
dados” (open-source data)!
uma nova encarnação da Inteligência Artificial
clássica!
Eduardo Nicola Zagari!
11. (Web Semântica e
Inteligência Artificial)!
Segundo
Sir Tim Beners-Lee:!
Habilidade da máquina de resolver
problemas ‘bem definidos’, realizando
operações ‘bem definidas’ em dados
existentes ‘bem definidos’!
mas...!
Eduardo Nicola Zagari!
12. (Inteligência Artificial)!
Alan Turing, 1956!
IA Forte e IA Fraca!
Sistemas Especialistas, Redes Neuronais,
Lógica Fuzzy!
Inverno da IA - Aprendizado de Máquinas,
Robótica, Visão Computacional!
Algoritmos Genéticos, Computação Bio-
inspirada!
Eduardo Nicola Zagari!
13. Web Semântica!
Um passo além da onda iniciada em 2004, a
Web Colaborativa (Web 2.0)!
Web 3.0 ?!
Web Semântica, Cloud Computing,
Ubiqüidade, WRTAp!
Eduardo Nicola Zagari!
14. As 3 ondas da Web!
rwx!
rw!
r! tec + soc!
soc.!
tec.!
Fonte: Semantic Web
de Jeffrey Pollockext!
Eduardo Nicola Zagari!
15. Web Semântica! Com os computadores
entendendo os conteúdos,
eles teoricamente estarão
aptos a resolver problemas
que hoje estão fora de
Objetivo:! alcance
Interligar conteúdos publicados na Web!
A associação deve ser perceptível tanto
pelo homem (manualmente) como pela
máquina (automática)!
Problema:!
Atribuição de significado (sentido) aos
conteúdos...!
Eduardo Nicola Zagari!
16. Abordagens!
Bottom-up (Clássica):!
Anotação de informação nas páginas,
usando RDF, para que seja “legível” por
máquinas!
Top-down (Conhecimento semântico vertical):!
Alavancagem de informações em páginas
web já existentes, como estão, para
extrair significado automaticamente!
reconhecimento de nomes e verbos
cotidianos!
Eduardo Nicola Zagari!
17. Aplicações!
Desktop Web Semântico (Browsers (Glue),
Emails, Gerenciador de Janelas)!
Blogging Semântico (Zemanta)!
Wikis Semânticas!
Máquinas de Busca Semânticas!
Redes Sociais Semânticas!
Eduardo Nicola Zagari!
21. Dapper!
adição de
anotação
semântica
em páginas
já
existentes!
(bottom-up
tool)!
Eduardo Nicola Zagari!
22. Tecnologias de Anotação!
RDF - Resource Description Framework!
RDFa e Microformatos!
SPARQL!
OWL!
Eduardo Nicola Zagari!
23. RDF!
Linguagem usada para descrever dados,
metadados e até mesmo outras linguagens de
dados!
Formato de grafo de dados! Grafo!
Árvore!
Eduardo Nicola Zagari!
24. RDF!
Usa triplas: {Recurso, Predicado, Objeto}!
Empregado em RSS e FOAF!
Idéia básica!
cada item de dado deve ter um
identificador Web único (URI)!
atributo central do modelo: relacionamento
de URIs entre itens de dados!
Eduardo Nicola Zagari!
25. Um Grafo RDF Simples!
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://bike.zagari.org/">
<dc:title>Viagens com a Magrela</dc:title>
</rdf:Description>
<rdf:Description rdf:about="http://bike.zagari.org/">
<dc:creator
rdf:resource="http://zagari.org/foaf.rdf#me"/>
</rdf:Description>
</rdf:RDF>
Eduardo Nicola Zagari!
27. RDFa e Microformatos!
Web -> HTML !
-> Linguagem de dados não estruturada!
Microformatos e RDFa!
Forma de codificar dados dentro de
documentos HTML e XHTML!
Eduardo Nicola Zagari!
32. RDFa!
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN"
"http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
version="XHTML+RDFa 1.0" xml:lang="en">
<head>
<title>John's Home Page</title>
<base href="http://example.org/john-d/" />
<meta property="dc:creator" content="Jonathan Doe" />
</head>
<body>
<h1>John's Home Page</h1>
<p>My name is <span property="foaf:nick">John D</span> and I like
<a href="http://www.neubauten.org/" rel="foaf:interest"
xml:lang="de">Einstürzende Neubauten</a>.
</p>
<p>
My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite
book</span> is the inspiring <span about="urn:ISBN:0752820907"><cite
property="dc:title">Weaving the Web</cite> by
<span property="dc:creator">Tim Berners-Lee</span></span>
</p>
</body>
</html>
Eduardo Nicola Zagari!
33. RDFa x Microformato!
Microformato especifica:!
a sintaxe para embutir os dados dentro do
documento HTML!
um vocabulário de termos específicos para
cada tipo de informação (eventos, contatos,
localização geográfica etc)!
RDFa especifica apenas a sintaxe:!
especificação de termos é independente!
Eduardo Nicola Zagari!
34. SPARQL"!
SPARQL (Simple) Protocol and RDF Query
Language!
Permite realizar queries em grafos de dados
RDF!
É determinístico!
Eduardo Nicola Zagari!
36. OWL!
Web Ontology Language!
Linguagem para definir e instanciar ontologias
na Web!
Pode incluir descrições de classes, suas
respectivas propriedades e relacionamentos!
É uma extensão de RDF para permitir a
representação da semântica de modelos de
dados mais complexos!
Eduardo Nicola Zagari!
38. Bottom-Up!
Desafios Técnicos!
Bottom-Up!
Como criar os documentos de descrição de
dados?!
Algoritmo de NLP?!
Manual?!
Quem os geraria? Centralizado (Google-like)
ou os próprios sites? Qual a motivação?!
No caso da abordagem distribuída, como fica
a questão de padronização?!
Eduardo Nicola Zagari!
39. Bottom-Up!
Desafios Científicos!
Problema NP-completo!
Lidar com a Incerteza!
Representação precisa dos fatos!
Eduardo Nicola Zagari!
40. Bottom-Up versus !
Top-Down!
Por estes aspectos, a abordagem Top-Down
apresenta-se mais interessante que a
Bottom-Up, mas...!
Eduardo Nicola Zagari!
41. Top-Down!
Primeiro, é uma abordagem simplista e não a
Web Semântica como ela foi pensada!
Um conjunto de apps e serviços web que
geram valor a partir de semânticas simples!
Nem sempre chegam a resultados corretos,
devido à ambiguidade!
Eduardo Nicola Zagari!
42. Bottom-Up e Top-Down!
Desafios de Negócio!
Qual o real valor para o usuário?!
Redução de tempo? !
Quais as aplicações que podem ser
construídas no topo da Web Semântica?!
Eduardo Nicola Zagari!
43. NLP e NER!
NLP!
Subárea de IA e da linguística que estuda
os problemas da geração e compreensão
automática de linguas humanas naturais!
NER:!
ramo do processamento de linguagem
natural que procura extrair e classificar as
entidades mencionadas em um texto
escrito em linguagem natural.!
Eduardo Nicola Zagari!
46. Considerações Finais!
Web Semântica: a bola da vez!
Ponto de inflexão!
Abordagem por Segmentos!
Eduardo Nicola Zagari!
47. Considerações Finais!
Big Player?!
Aplicações inovadoras (killer apps)!
Agentes Inteligentes / máquinas de
inferência !
Conteúdo relevante e de alta qualidade:
gerência de conteúdo => inteligência social!
Eduardo Nicola Zagari!
48. Referências!
RDF. W3C, http://www.w3.org!
RDF, Microformats, OWL, SPARQL. Wikipedia, http://en.wikipedia.org/wiki/Main_Page!
The Road to the Semantic Web. Alex Iskold, !
http://www.readwriteweb.com/archives/semantic_web_road.php!
Semantic Web Patterns: A Guide to Semantic Technologies. Alex Iskold, !
http://www.readwriteweb.com/archives/semantic_web_patterns_a_guide_redux.php!
Semantic Web FOR DUMmIES. Jeff rey T. Pollock, Wiley Publishing, Inc.!
WEB 2.0 AND BEYOND - Understanding the New Online Business Models, Trends, and
Technologies. Tom Funk, Praeger Publishers!
Semantic Web: Difficulties with the Classic Approach. Alex Iskold!
http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php!
Top-Down: A New Approach to the Semantic Web. Alex Iskold, !
http://www.readwriteweb.com/archives/the_top-down_semantic_web.php!
Eduardo Nicola Zagari!
49. Web Semântica!
Eduardo Nicola F. Zagari!
zagari em abril com br!
Ekke Ekke Ekke Ptang Zoo Boing - Núcleo de Engenharia e Pesquisa !
Abril Digital!