SlideShare uma empresa Scribd logo
1 de 7
Baixar para ler offline
A Web Semântica

Um novo formato de conteúdo web que é compreedido pelos computadores irá desencadear
uma revolução de novas possibilidades.
                                       Por Tim Berners-Lee, James Hendler and Ora Lassila
                              Traduzido por Adelson Luiz, Diego Alves, José Elves e Raquel Carsi


O sistema de entretenimento estava transmitindo os Beatles quot;We Can Work it Outquot; quando o telefone
tocou. Quando Pete atendeu, seu telefone diminuiu o som ao enviar uma mensagem para todos os
outros dispositvos no local que tinham controle de volume. Sua irmã, Lucy, estava do outro lado da
linha em um consultório: quot;Nossa mãe precisa consultar um especialista para fazer uma série de sessões
de fisioterapia. Quinzenalmente ou algo assim. Eu vou usar meu agente para marcar a consulta. Pete
imediatamente concordou em compartilhar o motoristaquot;.

No consultório, Lucy instruiu seu agente web semântico através do navegador de seu handheld. O
agente prontamente mostrou informação sobre o tratamento prescrito de sua mãe pelo agente do
médico, procurou várias listas de provedores e checou os únicos planos para o seguro da mãe dentro de
20-milhas de distância de sua casa e com uma taxa entre excelente e muito bom nos serviços de taxas
confiáveis. Ele então começou a tentar encontrar um ponto entre os horários das consultas disponíveis
(fornecidos pelos agentes dos provedores individuais através de seus Web sites) e os horários ocupados
de Pete e Lucy. (As palavras-chaves enfatizadas indicam termos cuja semântica ou significado foram
definidos pelo agente através da Web Semântica.)

Em alguns minutos, o agente apresentou-lhes um plano. Pete não gostou do plano do Hospital da
Universidade que era do outro lado da cidade, partindo da casa de sua mãe e ele teria que dirigir na
volta durante o horário de pico do trânsito. Ele configurou seu agente para refazer a pesquisa com
preferências estritas sobre locação e horário. O agente da Lucy, tendo total confiança no agente de Pete
no contexto da presente tarefa, automaticamente deu suporte fornecendo certificados e atalhos de
accesso para os dados que já tinha ordenado completamente.

Quase instantaneamente, o novo plano foi apresentado: uma clínica muito mais próxima e horários mais
cedo, mas haviam duas notas de aviso. Primeiro, Pete precisaria reagendar alguns de seus
compromissos menos importantes. Ele checou quais deles não seriam problema. A outra era algo sobre
a falha lista da companhia de seguros ao incluir este provedor de fisioterapia: quot;O tipo de serviço e o
status do plano de seguros solidamente verificado por outros meios.quot; o agente o tranquilizou.
quot;(Detalhes?)quot;

Lucy registrou sua aprovação quase no mesmo instante em que Pete estava murmurando, quot;Poupe-me
dos detalhesquot;, e foi tudo ajustado. (É claro que Pete não conseguiu resistir aos detalhes e mais tarde, à
noite, ele mandou seu agente explicar como ele tinha encontrado aquele provedor embora não
estivesse na lista.)

Expressando o significado

Pete e Lucy podiam usar seus agentes para executar todas essas tarefas graças não a web de hoje mas
a Web Semântica que a web vai incluir amanhã. A maior parte do conteúdo web hoje é destinado para a
leitura humana e não para os programas de computadores manipularem significativamente.
Computadores podem com habilidade analisar gramaticalmente as páginas web para processamento
rotineiro e planejado, um cabeçalho aqui, um link para uma outra página ali, mas em geral
computadores não têm um modo confiável de processar a semântica: quot;Esta é a página principal da
Clínica de Fisioterapia de Hartman and Strauss, este link vai para o currículo do Dr. Hartmanquot;.

A Web Semântica vai trazer estrutura para o conteúdo significativo das páginas web, criando um
ambiente onde agentes de software passeando de página em página possam prontamente executar
tarefas muito complexas para os usuários. Tal agente vindo para a página web da clínica saberá não
apenas que a página tem palavras-chaves tais como quot;tratamento, medicina, fisioterapiaquot; (como pode
ser visto atualmente) mas também que o Dr. Hartman trabalha na clínica nas segundas, quartas e
sextas e que o certificado leva uma data no formato aaaa-mm-dd e que retorna a hora do
compromisso. E saberá tudo isso sem precisar de inteligência artificial na escala do Hal de 2001 ou do
C-3PO de Star Wars. Esta semântica foi convertida para página web quando o gerente do consultório
(que nunca usou Comp Sci 101) manipulou-a para o formato usando software disponível para escrever
páginas web semânticas, juntamente com fontes listadas no site da Associação de Fisioterapia.

A Web Semântica não é uma Web separada, mas uma extensão da atual, em que a informação é dada
com significado bem definido, permitindo que os computadores e as pessoas trabalhem em cooperação.
Os primeiros passos para tecer a Web Semântica para a estrutura da web atual estão já em curso. Em
um futuro próximo, isso nos guiará para novas e significativas funcionalidades, enquanto as máquinas
irão se tornar muito melhores para processar e compreender os dados que elas apenas mostram no
presente.

A propriedade essencial da Web é a sua universalidade. O poder de um link hipertexto é que quot;qualquer
coisa pode ser ligada a qualquer coisaquot;. A tecnologia Web, apesar disso, não deve fazer discriminação
entre o rascunho do projeto e a representação refinada, entre informação comercial e acadêmica ou
entre culturas, línguas, mídias, e muitos outros . A informação varia ao longo de muitos caminhos. Uma
desses é a diferença entre a informação produzida primariamente para consumo humano e aquela
produzida principalmente para máquinas. No fim da escala nós temos de tudo, desde comerciais de TV
de 5 segundos a poesia. No extremo oposto, nós temos banco de dados, programas e saídas de sensor.
Até agora, a Web tem evoluido mais rapidamente como uma ferramenta de documentos para as
pessoas mais do que para dados e informações que podem ser processadas automaticamente. A Web
Semântica visa tornar-se isso.

Assim como a Internet, a Web Semântica será tão descentralizada quanto possível. Tais sistemas geram
muita empolgação em todos os níveis, de grandes corporações a usuários individuais e fornecem
benefícios que são difíceis ou impossíveis de predizer um avanço. Descentralização requer
compromisso: a Web precisava lançar fora o ideal de total consistência de todas as suas interconexões,
profetizando mensagem de má reputação quot;Error 404: Não encontradoquot; mas permitindo crescimento do
seu exponencial incontrolável.

Representação de Conhecimento

Para a web semântica funcionar, computadores devem ter acesso a coleções estruturadas de
informação e conjuntos de regras de inferência que podem ser usadas para conduzir raciocínio
automatizado. Pesquisadores de inteligência artificial começaram a estudar tais sistemas muito antes
da Web ser criada. Representação de conhecimento, como essa tecnologia é frequentemente chamada,
está atualmente em um estado parecido com o do hipertexto antes do advento da Web: é obviamente
uma boa idéia, existem algumas demonstrações muito satisfatórias, mas ainda não mudou o mundo.
Contem o as fontes das aplicações importantes, mas para obter sua plena capacidade ela deve ser
conectada              em              um                sistema            global            único.

Os sistemas de representação de conhecimento tradicionais tem sido tipicamente centralizados,
requerendo que todos compartilhem exatamente da mesma definição de conceitos comuns tais como
quot;paiquot; ou quot;veículoquot;. Mas o controle central está sufocando, aumentando o tamanho e o escopo de tal
forma que o sistema irá se tornar incontrolável.

Além disso, estes sistemas geralmente limitam cuidadosamente as perguntas que podem ser feitas a
fim de que o computador possa responder com segurança ou sob qualquer condição. O problema é
similar ao teorema matemático de Godel: qualquer sistema que é suficientemente complexo para ser
útil também inclui questões sem resposta, como versões sofisticas do paradoxo básico quot;Esta sentença é
falsaquot;. Para evitar tais problemas, os sistemas de representação de conhecimento tradicionais
geralmente tinham cada qual seu próprio reduzido e peculiar conjunto de regras para fazer inferências
sobre seus dados. Por exemplo, um sistema de genealogia, agindo em um banco de dados de árvores
de famílias, inclui o papel quot;a esposa de um tio é uma tiaquot;. Mesmo que os dados pudessem ser
transferidos de um sistema para o outro, os papéis, existentes em um formulário completamente
diferente, usualmente não poderiam.

Os pesquisadores da Web Semântica, em contraste, aceitam que as questões parodoxas e sem resposta
são o preço que deve ser pago para conquistar a versatilidade. Nós fazemos a linguagem com as regras
tão expressivas quanto necessárias para permitir que a Web raciocine tão amplamente quando
desejado. Esta filosofia é similar a da web convencional: cedo no desenvolvimento web, caluniadores
que apontaram que ela nunca podia ser uma biblioteca bem organizada; sem um banco de dados
central e uma estrutura de árvore, ninguém nunca teria certeza de encontrar tudo. Eles estavam certos.
Mas o poder expressivo do sistema criou quantidades vastas de informação disponíveis e mecanismos
de busca (os quais pareceram bastante impraticáveis uma década atrás) agora produzem notavelmente
índices completos de uma grande quantidade de material. O desafio da Web Semântica, apesar disso, é
prover uma linguagem que expresse não somente dados e regras para raciocínio sobre os dados mas
também que permita regras de qualquer sistema de representação de conhecimento existente a ser
exportado para a Web.

Adicionar lógica para a Web significa utilizar regras para fazer inferências, escolher cursos de ações e
responder perguntas. É a tarefa da comunidade da Web Semântica no momento. Uma mistura de
decisões matemáticas e de engenharia complicam essa tarefa. A lógica deve ser poderosa o suficiente
para descrever complexas propriedades de objetos, mas não tão poderosa que os agentes possam ser
enganados por perguntas cosideradas um paradoxo. Felizmente, a grande maioria das informações que
nós queremos é expressa ao longo das linhas de quot;um parafuso com cabeça hexagonal é um tipo de
parafusoquot;, que são facilmente escritas em línguas existentes com um pequeno vocabulário extra.

Duas importantes tecnologias para o desenvolvimento da Web Semântica já estão em vigor: XML
(Extensible Markup Language) e a RDF (Resource Description Framework). XML permite que todos criem
suas próprias tags, labels ocultos tais como rótulos, anotações nas páginas da Web ou seções de textos
em uma página. Scripts, ou programas, podem fazer uso dessas tags de sofisticadas maneiras, mas
quem for escrever o script tem que saber quais as tags que a página está utilizando e como. Em
resumo, o XML permite aos usuários adicionar estrutura arbritária aos seus documentos, mas nada diz
sobre o que significam as estruturas.

A Web Semântica permitirá que máquinas compreendam a semântica de documentos e dados, e não
discursos                      e                     escritas                     humanas.

O significado é expresso por RDF, que a codifica em um conjuntos de tuplas, cada uma das tuplas sendo
como o sujeito, verbo e objeto de uma frase elementar. Estas tuplas podem ser escritos usando tags
XML. Em RDF, um documento que faz afirmações de coisas paticulares (pessoas, páginas Web ou
qualquer que seja) têm propriedades (tais como quot;é irmã dequot;, quot;é o autor dequot;) com certos valores (outra
pessoa, outra página da Web). Esta estrutura torna-se um caminho natural para descrever a grande
maioria dos dados processados por máquinas. Sujeito e objeto são cada um identificados por uma URI
(Universal Resource Identifier), assim como é utilizado em um link de uma página da Web. (URLs,
Uniform Resource Locators, são o tipo mais comum de URI.) Os verbos são também identificados por
URIs, que permite a qualquer pessoa definir um novo conceito, um novo verbo, apenas pela definição de
um URI para ele em algum lugar da web.

Linguagem humana é prospera quando se utiliza o mesmo termo para dizer coisas um pouco diferentes,
mas sem automatização. Imagine que eu aluguei um serviço de um palhaço mensageiro para entregar
balões para meus clientes nos seus aniversários. Infelizmente, o serviço transfere o endereço do meu
banco de dados para seu banco de dados, não sabendo que o quot;endereçoquot; no meu banco é para onde as
contas são enviadas e que muitos deles são do escritório dos caixas correios. Meus palhaços
contratados acabam entretendo um número de funcionários dos Correios, que não é necessariamente
uma coisa má, mas certamente não foi o efeito pretendido. Utilizar uma URL diferente para cada
conceito, resolve esse problema. Um endereço que é um endereço de correspondência pode ser
distinguido de um que seja uma rua, e ambos podem ser distinguidas a partir de um endereço que é um
discurso.

As tuplas de formulários RDF entrelaçam informações com assuntos relacionados. Já que RDF usa URIs
para codificar essas informações em um documento, as URIs asseguram que os conceitos não são
apenas palavras em um documento, mas estão vinculados a uma única definição que cada um pode
encontrar na web. Por exemplo, imagine que temos acesso a uma variedade de bases de dados com
informações sobre pessoas, incluindo os seus endereços. Se queremos encontrar pessoas que vivem em
um determinado código postal, precisamos saber quais são os campos em cada banco de dados que
representam nomes e que representam CEPs. RDF pode especificar que quot;(o campo 5 na base de dados
A) (é um campo do tipo) (CEP),quot; usando URIs ao invés de frases para cada termo.

Ontologias

Evidentemente que este não é o fim da história, pois duas bases de dados podem utilizar identificadores
diferentes para o que de fato vai ser o mesmo conceito, como um código postal. Um programa que
queira comparar ou combinar informações através de duas base de dados têm que saber que os dois
termos estão sendo usados para designar a mesma coisa. Idealmente, o programa deve ter uma
maneira de descobrir esses significados comuns para qualquer que seja a bases de dados.

Uma solução para este problema é fornecida pelo terceiro componente básico da Web Semântica, as
coleções de informação chamadass ontologias. Em filosofia, uma ontologia é uma teoria sobre a
natureza da existência; ontologia como uma disciplina estuda tais teorias. Inteligência Artificial e
Buscadores Web têm opcionalmente termos para seu próprio entendimento e para eles uma ontologia é
um documento ou arquivo que define formalmente as relações entre os termos. A mais típica espécie
de ontologia para a Web tem uma taxonomia e um conjunto de regras de inferência.

A taxonomia define classes de objetos e relações entre elas. Por exemplo, um endereço pode ser
definido como um tipo de localização, os códigos de uma cidade podem ser definidos apenas para as
localizações, e assim por diante. Classes, subclasses e as relações entre as entidades são uma
ferramenta muito poderosa para a utilização na web. Podemos manifestar um grande número de
relações entre entidades, atribuindo propriedades para classes e permitindo que as subclasses herdem
tais propriedades. Se códigos de cidades devem ser do tipo cidade e as cidades têm, geralmente, Web
sites, podemos discutir o Web site associado ao código da cidade, mesmo se não houver uma base de
dados que ligue o código da cidade a um web site.

As regras de inferência em ontologia fornecem suprimentos de energia adicional. Uma ontologia pode
expressar a regra quot;Se um código de cidade está associado com um código de estado, e um endereço
está associado a um código de estadoquot;. Um programa poderia então deduzir facilmente, por exemplo,
que um endereço Universidade Cornell, em Ithaca, deve estar no estado de Nova York, que está em os
E.U. e, portanto, devem ser formatados para os padrões dos E.U. O computador não quot;compreendequot;
verdadeiramente qualquer uma desta informações, mas agora pode manipular estes termos de maneira
muito mais eficaz de forma que sejam úteis e significativos para o usuário humano.

Com ontologia em páginas da Web, as soluções para a terminologia (e outros) problemas começam a
surgir. O significado dos termos ou códigos XML usados em uma página da Web pode ser definido por
indicações a partir da página de uma ontologia. Evidentemente, os mesmos problemas de antes surgem
agora se eu apontar para uma ontologia que define endereços como contendo um código postal e se
você apontar para uma que usa o código postal. Este tipo de confusão pode ser resolvido se ontologias
(ou outros serviços da Web) fornecerem relações de equivalência: uma ou ambas das nossas ontologias
podem conter a informação de que o meu código postal é equivalente ao seu código postal.

Nosso sistema de envio de palhaços para entreter os meus clientes é parcialmente resolvido quando as
duas bases de dados apontam para diferentes definições de endereço. O programa, usando URIs
distintas para os diferentes endereços, não irá confundir os mesmos e, de fato, terá de descobrir que os
conceitos são relacionados a todos. O programa poderia, então, usar um serviço que tem uma lista de
endereços postais (definido na primeira ontologia) e convertê-la em uma lista de endereços físicos (a
segunda ontologia), reconhecendo e eliminando caixas de correios e outros endereços impróprios.

Ontologias podem melhorar o funcionamento da Web em muitos aspectos. Elas podem ser usadas em
uma forma simples para melhorar a precisão das pesquisas na Web. O programa de pesquisa pode
olhar apenas para as páginas que se referem a uma noção precisa, em vez de todas as palavras-chaves.
Mais aplicações avançadas usarão ontologias para relacionar as informações sobre uma página
associada ao conhecimento das estruturas e regras de inferência. Um exemplo de uma página com essa
utilização está online em http://www.cs.umd.edu/~Hendler. Se você entrar na página, você verá a
página da Web normal intitulada quot;Dr. James A. Hendler”. Como um homem, você pode facilmente
encontrar o link para uma breve nota biográfica e ler aí que Hendler recebeu seu Ph.D. na Universidade
de Brown. Um programa de computador, tentando encontrar tais informações, no entanto, teria de ser
muito complexo para adivinhar que esta informação pode estar em uma biografia e de compreender a
linguagem inglesa utilizada.

Para computadores, a página está ligada a uma página de ontologia que definem informações sobre
departamentos de informática. Por exemplo, os professores ligados às universidades geralmente têm
doutorados. Outras marcações na página (não mostradas pelo browser) utilizam os conceitos da
ontologia para especificar que Hendler recebeu seu Ph.D. da entidade descrita na URI http://www.
brown.edu. Computadores podem achar que Hendler é um membro de um determinado projeto de
pesquisa, tem um determinado endereço de e-mail, e assim por diante. Toda essa informação é
facilmente processada por um computador e poderia ser utilizada para responder as questões (como
ou onde o Dr. Hendler recebeu seu diploma), que atualmente exige um humano para filtrar o conteúdo
de várias páginas transformado por um motor de busca.

Além disso, esta marcação torna muito mais fácil desenvolver programas que podem resolver
problemas complicados cujas respostas não residem em uma única página da Web. Suponha que você
deseja encontrar a Sra. Cook que conheceu em um comércio de conferência do ano passado. Você não
lembra seu primeiro nome, mas lembra que ela trabalhava para um dos seus clientes e que seu filho era
um aluno em sua universidade. Um programa inteligente de pesquisa pode filtrar as páginas de todas
as pessoas cujo nome é quot;Cookquot; (todas as páginas relacionadas a cozinheiros, cozinhar, as Ilhas Cook e
assim por diante), ncontrar as primeiras que mencionam que querem trabalhar para uma empresa que
está na sua lista de clientes e seguindo os links para outras páginas da Web, rastrear qualquer caso em
que os seus filhos estejam na mesma escola, no local certo.

Agentes

 O verdadeiro poder da Web Semântica será realizado quando as pessoas criarem muitos programas
que coletam conteúdo da Web a partir de diversas fontes, processarem a informação e fizerem o
intercâmbio dos resultados com outros programas. A eficácia de tais softwares agentes aumentará
exponencialmente enquanto mais conteúdos legíveis da Web e mais serviços automatizados (incluindo
outros agentes) ficarem disponíveis. A Web Semântica promove esta sinergia: mesmo s agentes que
não foram expressamente concebidos para trabalhar em conjunto, podem transferir dados entre si
quando os dados vêm com semântica.

Uma importante faceta do funcionamento dos agentes será a troca de quot;provasquot; escrita na Web
Semântica (inferências lógicas feitas utilizando regras e informações, tais como as especificadas pelas
ontologias). Por exemplo, suponha que as informações de contato da Sra. Cook foram localizadas por
um    serviço    online,  e   para    sua     grande   surpresa   ele   coloca-lá  como     sendo   de
Johannesburg. Naturalmente, você quer ver isto, solicita o serviço para o seu computador para uma
prova de sua resposta, que fornece prontamente, traduzindo a sua lógica interna para a Web
Semântica. Um motor de inferência no seu computador facilmente verifica que esta Sra. Cook
corresponde a uma verdade que você estava procurando, e pode mostrar-lhe as páginas da Web, se
você ainda tem dúvidas. Embora eles ainda estejam longe do melhor do potencial da Web Semântica,
alguns programas já podem trocar provas desta forma, utilizando as atuais versões preliminares da
língua unificadora.

 Outra característica fundamental serão as assinaturas digitais, que são blocos de dados criptografados
e os agentes que os computadores podem utilizar para verificar que as informações anexas foram
fornecidas por uma fonte confiável. Você quer ter a certeza de que uma declaração enviada para o seu
programa de contabilidade de que você deve dinheiro a um varejista on-line não é uma falsificação
gerada pelo computador de um adolescente na porta ao lado. Agentes devem ser céticos das
afirmações que lêem sobre a Web Semântica até terem verificado as fontes de informação.

 Muitos serviços automatizados baseados na Web existem sem semântica, mas outros programas tais
como agentes não têm formas de localizar um que irá executar uma função específica. Este processo,
denominado serviço de descoberta, só pode acontecer quando existe uma linguagem comum para
descrever um serviço de forma que permite que outros agentes compreendam tanto a função oferecida
como possam tirar partido da mesma. Serviços e agentes podem anunciar a sua função, por exemplo,
depositando tais descrições em diretórios análogos às páginas amarelas.

Alguns esquemas de baixo nível de serviços de descoberta estão atualmente disponíveis, tais como o
Universal Plug and Play da Microsoft , que tem seu foco na conexão de diferentes tipos de dispositivos,
e o Jini da Sun Microsystems , que é uma tecnologia utilizada para conexão de serviços. Estas
iniciativas, entretanto, atacam o problema a nível estrutural ou sintático e confiam pesadamente na
padronização de um predeterminado grupo de funcionalidades descritas. A padronização só pode ir tão
longe,    porque    nós    não  podemos      prever  todas    as   futuras   necessidades    possíveis.

Projetada corretamente, a Web Semântica pode ajudar na evolução do conhecimento humano como um
todo.
A Web Semântica, em contrapartida, é mais flexível. Os agentes consumidores e o produtores podem
chegar a uma compreensão compartilhada através da troca de ontologias, que fornecem o vocabulário
necessário para a discussão. Agentes compiladores aumentam sua capacidade de raciocínio quando
descobrem novas ontologias. A semântica também torna mais simples tirar vantagem de um serviço
que consome parcialmente uma solicitação.

Um processo típico envolverá a criação de uma cadeia de valores na qual subconjuntos de informações
são passadas de em agente para outro. Cada valor adicionado para construir a resposta final solicitada
pelo usuário final. Não se engane: para criar automaticamente complicadas cadeias de valores sob
demanda, alguns agentes irão explorar tecnologias de inteligência artificial além da web semântica.
Mas a semântica web irá fornecer a base e a estrutura para fazer tais tecnologia mais viáveis.

Colocar todas estas características juntas resultam nas habilidades exibidas pelos agentes de Pete e
Lucy no cenário exibido neste artigo. Os agentes teriam delegado tarefas de forma fragmentada para
outros serviços e descoberto outros agentes através de um serviço de publicidade. Por exemplo, eles
poderia ter usado um serviço confiável para ter uma lista de fornecedores e determinar quais deles
estão em plano seguro para um determinado curso e plano de tratamento. A lista de fornecedores seria
fornecida por um outro serviço de pesquisa, etc. Estas atividades formadas por cadeias na qual grandes
quantidades de dados distribuídos por toda web (e quase sem valor neste formulário) foram
progressivamente reduzidas para uma pequena quantidade de dados de alto valor para Pete e Lucy, um
plano de compromissos para ajustar seus horários e requisitos.

Na próxima etapa, a web semântica vai sair do virtual e entrar no nosso mundo físico. URIs podem
apontar para qualquer coisa, incluindo entidades físicas, o que significa que podemos usar a linguagem
RDF para descrever dispositivos como telefones celulares e TVs. Esses dispositivos podem anunciar as
funcionalidades que eles podem fazer e como são controlados como agentes de software. Sendo muito
mais flexíveis do que esquemas de baixo nível como Universal Plug and Play, tal abordagem abre um
mundo de possibilidades emocionantes.

 Por exemplo, hoje o que é chamado de automação de casa requer cuidadosas configurações para
aparelhos trabalharem em conjunto. As descrições semânticas de capacidades do dispositivo e a
funcionalidade permite-nos alcançar tais níveis de automação sem a mínima intervenção humana. Um
exemplo trivial ocorre quando Peter responde pelo telefone e o som estéreo é voltado para baixo. Em
vez de ter que programar cada aparelho especifico, poderia programar a função para cobrir todos os
dispositivos no local e assim ter um controle de volume da TV, do DVD Player e o media player que está
no laptop que ele trouxe para casa do trabalho esta noite.

 Os primeiros passos concretos já foram colhidos nesta área, com trabalhos de desenvolvimento de um
padrão para descrever as capacidades funcionais de dispositivos (tais como tamanhos de tela) e
preferência do usuário. Construído sobre RDF, este padrão é denominado Composite
Capability/Preference Profile (CC/PP). Inicialmente ele irá permitir que telefones celulares e outros
atípicos clientes Web descrevam suas características para que o conteúdo da Web possa ser adaptado
para eles na navegação. Mais tarde quando for acrescentada todas as versatilidades da linguagem para
o tratamento da ontologia e da lógica. Dispositivos poderiam automaticamente procurar e se solicitar a
serviços e outros dispositivos para aumentar suas informações ou funcionalidades. Não é difícil imaginar
sua web ativa consultar no forno microondas a comida congelada, a através do site do fabricante passar
os parâmetros para cozimento.

Evolução do Conhecimento

A web semântica não é apenas a ferramenta para realizar tarefas individuais como as que discutimos
aqui até agora. Além disso, a web semântica pode acompanhar a evolução humana como um todo.

O esforço humano é travado em uma tensão entre eficácia dos pequenos grupos agindo de forma
independente e a necessidade de um melhor entrosamento com a comunidade em geral. Um pequeno
grupo pode inovar rápido e com eficiência, mas isso produz uma sub cultura cujos conceitos não são
compreendidos pelos outros. Coordenar as ações de um grande grupo, entretanto, é dolorosamente
lento e exige muita comunicação. O mundo trabalho em todo o espectro entre estes extremos, com
uma tendência para iniciar a partir de uma pequena idéia e avançar para uma maior compreensão ao
longo do tempo.
Um processo inicial é a junção de subcultivos quando uma idéia comum e mais ampla é necessária.
Muitas vezes, dois grupos independentes desenvolvem conceitos muito semelhantes, descrever a
relação entre eles traz muitos benefícios. Como um dicionário Finlandês-Inglês, ou a tabela de
conversão de pesos e medidas, as relações permitem comunicação e colaboração mesmo quando a
comunalidade do conceito (ainda) não levou a uma comunalidade dos termos.

A Web Semântica nomeia cada conceito simples por uma URI e permite que qualquer pessoa expresse
novos conceitos com o mínimo de esforço. Sua linguagem lógica e unificadora permitirá que estes
conceitos sejam progressivamente ligados em uma web universal. Esta estrutura vai abrir o
conhecimento e o funcionamento da humanidade à analise significativa por agentes de software,
proporcionando uma nova classe de ferramentas que podemos usufruir, trabalhar e aprender com elas
juntos.

Outras informações:

 Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its
Inventor. Tim Berners-Lee, with Mark Fischetti. Harper San Francisco, 1999.
Uma versão mais elaborada deste artigo está disponível no site da Scientific American, com links e
materiais adicionais.

World Wide Web Consortium (W3C): www.w3.org/

W3C Semantic Web Activity: www.w3.org/2001/sw/

An introduction to ontologies: www.SemanticWeb.org/knowmarkup.html

Simple HTML Ontology Extensions Frequently Asked Questions (SHOE FAQ):
www.cs.umd.edu/projects/plus/SHOE/faq.html

DARPA Agent Markup Language (DAML) home page: www.daml.org/

Mais conteúdo relacionado

Destaque

Carta de un hombre a las mujeres
Carta de un hombre a las mujeresCarta de un hombre a las mujeres
Carta de un hombre a las mujerescentrowebs
 
Sobrinos, primos y demás familia
Sobrinos, primos y demás familiaSobrinos, primos y demás familia
Sobrinos, primos y demás familiaAster
 
Portfolio diego dg
Portfolio diego dgPortfolio diego dg
Portfolio diego dgdiegodg
 
Festa del Xai
Festa del XaiFesta del Xai
Festa del Xaiafarjas
 
power point sobre plantes Rhian i Alba
power point sobre plantes Rhian i Albapower point sobre plantes Rhian i Alba
power point sobre plantes Rhian i Albarhiannnnn
 
Mood Board
Mood BoardMood Board
Mood Boardp105
 
性騷擾
性騷擾性騷擾
性騷擾clinic
 
憲法大學評鑑辦法整理
憲法大學評鑑辦法整理憲法大學評鑑辦法整理
憲法大學評鑑辦法整理clinic
 

Destaque (14)

Carta de un hombre a las mujeres
Carta de un hombre a las mujeresCarta de un hombre a las mujeres
Carta de un hombre a las mujeres
 
Nathalie Collage
Nathalie CollageNathalie Collage
Nathalie Collage
 
Sobrinos, primos y demás familia
Sobrinos, primos y demás familiaSobrinos, primos y demás familia
Sobrinos, primos y demás familia
 
Portfolio diego dg
Portfolio diego dgPortfolio diego dg
Portfolio diego dg
 
Festa del Xai
Festa del XaiFesta del Xai
Festa del Xai
 
power point sobre plantes Rhian i Alba
power point sobre plantes Rhian i Albapower point sobre plantes Rhian i Alba
power point sobre plantes Rhian i Alba
 
Sua fotografia
Sua fotografiaSua fotografia
Sua fotografia
 
Mood Board
Mood BoardMood Board
Mood Board
 
性騷擾
性騷擾性騷擾
性騷擾
 
Portfolio
PortfolioPortfolio
Portfolio
 
Feria de libros Trujillo 2009
Feria de libros Trujillo 2009Feria de libros Trujillo 2009
Feria de libros Trujillo 2009
 
Protesto
ProtestoProtesto
Protesto
 
憲法大學評鑑辦法整理
憲法大學評鑑辦法整理憲法大學評鑑辦法整理
憲法大學評鑑辦法整理
 
El maltrato al usuario de la guagua
El maltrato al usuario de la guaguaEl maltrato al usuario de la guagua
El maltrato al usuario de la guagua
 

Semelhante a Web Semântica

Web Semântica Apresentação de Slides
Web Semântica Apresentação de SlidesWeb Semântica Apresentação de Slides
Web Semântica Apresentação de Slidesgestao
 
Historia Da Internet2
Historia Da Internet2Historia Da Internet2
Historia Da Internet2justyou
 
Historia Da Internet2
Historia Da Internet2Historia Da Internet2
Historia Da Internet2weltstar
 
História Da Internet!!
História Da Internet!!História Da Internet!!
História Da Internet!!7maio
 
PHP - Capítulo 01
PHP - Capítulo 01PHP - Capítulo 01
PHP - Capítulo 01fdorado
 
Universidade rural de pernambuco
Universidade rural de pernambucoUniversidade rural de pernambuco
Universidade rural de pernambucoJéssica Melo
 
Cloud computing, web semântica e internet de coisas: dados e utilização
Cloud computing, web semântica e internet de coisas: dados e utilizaçãoCloud computing, web semântica e internet de coisas: dados e utilização
Cloud computing, web semântica e internet de coisas: dados e utilizaçãoVanissa Wanick
 
Apresentando web 1.0
Apresentando web 1.0Apresentando web 1.0
Apresentando web 1.0Sarah Menezes
 
2 sis cai sistema de controle de acesso a internet
2 sis cai sistema de controle de acesso a internet2 sis cai sistema de controle de acesso a internet
2 sis cai sistema de controle de acesso a internetricardo17754
 
Introdução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de buscaIntrodução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de buscaAlexandre Grolla
 
Interne1[1]
Interne1[1]Interne1[1]
Interne1[1]verinha7
 

Semelhante a Web Semântica (20)

Web Semântica Apresentação de Slides
Web Semântica Apresentação de SlidesWeb Semântica Apresentação de Slides
Web Semântica Apresentação de Slides
 
Comercio Eletronico
Comercio EletronicoComercio Eletronico
Comercio Eletronico
 
Nova Genesis - Internet do Futuro
Nova Genesis - Internet do FuturoNova Genesis - Internet do Futuro
Nova Genesis - Internet do Futuro
 
Historia Da Internet2
Historia Da Internet2Historia Da Internet2
Historia Da Internet2
 
Historia Da Internet2
Historia Da Internet2Historia Da Internet2
Historia Da Internet2
 
História Da Internet!!
História Da Internet!!História Da Internet!!
História Da Internet!!
 
PHP - Capítulo 01
PHP - Capítulo 01PHP - Capítulo 01
PHP - Capítulo 01
 
Internet
InternetInternet
Internet
 
Universidade rural de pernambuco
Universidade rural de pernambucoUniversidade rural de pernambuco
Universidade rural de pernambuco
 
Cloud computing, web semântica e internet de coisas: dados e utilização
Cloud computing, web semântica e internet de coisas: dados e utilizaçãoCloud computing, web semântica e internet de coisas: dados e utilização
Cloud computing, web semântica e internet de coisas: dados e utilização
 
A Criação da Web
A Criação da WebA Criação da Web
A Criação da Web
 
Web_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web SemânticaWeb_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web Semântica
 
Apresentando web 1.0
Apresentando web 1.0Apresentando web 1.0
Apresentando web 1.0
 
2 sis cai sistema de controle de acesso a internet
2 sis cai sistema de controle de acesso a internet2 sis cai sistema de controle de acesso a internet
2 sis cai sistema de controle de acesso a internet
 
84 412-aula01informaticapf
84 412-aula01informaticapf84 412-aula01informaticapf
84 412-aula01informaticapf
 
Funcionamento da Internet
Funcionamento da InternetFuncionamento da Internet
Funcionamento da Internet
 
Introdução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de buscaIntrodução a web semântica, ontologia e máquinas de busca
Introdução a web semântica, ontologia e máquinas de busca
 
Interne1[1]
Interne1[1]Interne1[1]
Interne1[1]
 
Internet
InternetInternet
Internet
 
WEB 3.0
WEB 3.0WEB 3.0
WEB 3.0
 

Mais de raquelcarsi

Jdbc, JAVA DATABASE CONNECTIVITY
Jdbc, JAVA DATABASE CONNECTIVITYJdbc, JAVA DATABASE CONNECTIVITY
Jdbc, JAVA DATABASE CONNECTIVITYraquelcarsi
 
Laszlo, Framework focado em MVC
Laszlo, Framework focado em MVCLaszlo, Framework focado em MVC
Laszlo, Framework focado em MVCraquelcarsi
 
SSL,Secure Sockets Layer
SSL,Secure Sockets LayerSSL,Secure Sockets Layer
SSL,Secure Sockets Layerraquelcarsi
 
XP, Extreme Programming
XP, Extreme ProgrammingXP, Extreme Programming
XP, Extreme Programmingraquelcarsi
 
Apresentacao De Computador Sociedade
Apresentacao De Computador SociedadeApresentacao De Computador Sociedade
Apresentacao De Computador Sociedaderaquelcarsi
 
Mini Curso Java Day(Eliane Raquel)
Mini Curso Java Day(Eliane Raquel)Mini Curso Java Day(Eliane Raquel)
Mini Curso Java Day(Eliane Raquel)raquelcarsi
 

Mais de raquelcarsi (8)

Jdbc, JAVA DATABASE CONNECTIVITY
Jdbc, JAVA DATABASE CONNECTIVITYJdbc, JAVA DATABASE CONNECTIVITY
Jdbc, JAVA DATABASE CONNECTIVITY
 
Laszlo, Framework focado em MVC
Laszlo, Framework focado em MVCLaszlo, Framework focado em MVC
Laszlo, Framework focado em MVC
 
SSL,Secure Sockets Layer
SSL,Secure Sockets LayerSSL,Secure Sockets Layer
SSL,Secure Sockets Layer
 
XP, Extreme Programming
XP, Extreme ProgrammingXP, Extreme Programming
XP, Extreme Programming
 
Jboss Seam
Jboss SeamJboss Seam
Jboss Seam
 
Apresentacao De Computador Sociedade
Apresentacao De Computador SociedadeApresentacao De Computador Sociedade
Apresentacao De Computador Sociedade
 
Haskell
HaskellHaskell
Haskell
 
Mini Curso Java Day(Eliane Raquel)
Mini Curso Java Day(Eliane Raquel)Mini Curso Java Day(Eliane Raquel)
Mini Curso Java Day(Eliane Raquel)
 

Web Semântica

  • 1. A Web Semântica Um novo formato de conteúdo web que é compreedido pelos computadores irá desencadear uma revolução de novas possibilidades. Por Tim Berners-Lee, James Hendler and Ora Lassila Traduzido por Adelson Luiz, Diego Alves, José Elves e Raquel Carsi O sistema de entretenimento estava transmitindo os Beatles quot;We Can Work it Outquot; quando o telefone tocou. Quando Pete atendeu, seu telefone diminuiu o som ao enviar uma mensagem para todos os outros dispositvos no local que tinham controle de volume. Sua irmã, Lucy, estava do outro lado da linha em um consultório: quot;Nossa mãe precisa consultar um especialista para fazer uma série de sessões de fisioterapia. Quinzenalmente ou algo assim. Eu vou usar meu agente para marcar a consulta. Pete imediatamente concordou em compartilhar o motoristaquot;. No consultório, Lucy instruiu seu agente web semântico através do navegador de seu handheld. O agente prontamente mostrou informação sobre o tratamento prescrito de sua mãe pelo agente do médico, procurou várias listas de provedores e checou os únicos planos para o seguro da mãe dentro de 20-milhas de distância de sua casa e com uma taxa entre excelente e muito bom nos serviços de taxas confiáveis. Ele então começou a tentar encontrar um ponto entre os horários das consultas disponíveis (fornecidos pelos agentes dos provedores individuais através de seus Web sites) e os horários ocupados de Pete e Lucy. (As palavras-chaves enfatizadas indicam termos cuja semântica ou significado foram definidos pelo agente através da Web Semântica.) Em alguns minutos, o agente apresentou-lhes um plano. Pete não gostou do plano do Hospital da Universidade que era do outro lado da cidade, partindo da casa de sua mãe e ele teria que dirigir na volta durante o horário de pico do trânsito. Ele configurou seu agente para refazer a pesquisa com preferências estritas sobre locação e horário. O agente da Lucy, tendo total confiança no agente de Pete no contexto da presente tarefa, automaticamente deu suporte fornecendo certificados e atalhos de accesso para os dados que já tinha ordenado completamente. Quase instantaneamente, o novo plano foi apresentado: uma clínica muito mais próxima e horários mais cedo, mas haviam duas notas de aviso. Primeiro, Pete precisaria reagendar alguns de seus compromissos menos importantes. Ele checou quais deles não seriam problema. A outra era algo sobre a falha lista da companhia de seguros ao incluir este provedor de fisioterapia: quot;O tipo de serviço e o status do plano de seguros solidamente verificado por outros meios.quot; o agente o tranquilizou. quot;(Detalhes?)quot; Lucy registrou sua aprovação quase no mesmo instante em que Pete estava murmurando, quot;Poupe-me dos detalhesquot;, e foi tudo ajustado. (É claro que Pete não conseguiu resistir aos detalhes e mais tarde, à noite, ele mandou seu agente explicar como ele tinha encontrado aquele provedor embora não estivesse na lista.) Expressando o significado Pete e Lucy podiam usar seus agentes para executar todas essas tarefas graças não a web de hoje mas a Web Semântica que a web vai incluir amanhã. A maior parte do conteúdo web hoje é destinado para a leitura humana e não para os programas de computadores manipularem significativamente. Computadores podem com habilidade analisar gramaticalmente as páginas web para processamento rotineiro e planejado, um cabeçalho aqui, um link para uma outra página ali, mas em geral computadores não têm um modo confiável de processar a semântica: quot;Esta é a página principal da Clínica de Fisioterapia de Hartman and Strauss, este link vai para o currículo do Dr. Hartmanquot;. A Web Semântica vai trazer estrutura para o conteúdo significativo das páginas web, criando um ambiente onde agentes de software passeando de página em página possam prontamente executar tarefas muito complexas para os usuários. Tal agente vindo para a página web da clínica saberá não apenas que a página tem palavras-chaves tais como quot;tratamento, medicina, fisioterapiaquot; (como pode ser visto atualmente) mas também que o Dr. Hartman trabalha na clínica nas segundas, quartas e sextas e que o certificado leva uma data no formato aaaa-mm-dd e que retorna a hora do compromisso. E saberá tudo isso sem precisar de inteligência artificial na escala do Hal de 2001 ou do
  • 2. C-3PO de Star Wars. Esta semântica foi convertida para página web quando o gerente do consultório (que nunca usou Comp Sci 101) manipulou-a para o formato usando software disponível para escrever páginas web semânticas, juntamente com fontes listadas no site da Associação de Fisioterapia. A Web Semântica não é uma Web separada, mas uma extensão da atual, em que a informação é dada com significado bem definido, permitindo que os computadores e as pessoas trabalhem em cooperação. Os primeiros passos para tecer a Web Semântica para a estrutura da web atual estão já em curso. Em um futuro próximo, isso nos guiará para novas e significativas funcionalidades, enquanto as máquinas irão se tornar muito melhores para processar e compreender os dados que elas apenas mostram no presente. A propriedade essencial da Web é a sua universalidade. O poder de um link hipertexto é que quot;qualquer coisa pode ser ligada a qualquer coisaquot;. A tecnologia Web, apesar disso, não deve fazer discriminação entre o rascunho do projeto e a representação refinada, entre informação comercial e acadêmica ou entre culturas, línguas, mídias, e muitos outros . A informação varia ao longo de muitos caminhos. Uma desses é a diferença entre a informação produzida primariamente para consumo humano e aquela produzida principalmente para máquinas. No fim da escala nós temos de tudo, desde comerciais de TV de 5 segundos a poesia. No extremo oposto, nós temos banco de dados, programas e saídas de sensor. Até agora, a Web tem evoluido mais rapidamente como uma ferramenta de documentos para as pessoas mais do que para dados e informações que podem ser processadas automaticamente. A Web Semântica visa tornar-se isso. Assim como a Internet, a Web Semântica será tão descentralizada quanto possível. Tais sistemas geram muita empolgação em todos os níveis, de grandes corporações a usuários individuais e fornecem benefícios que são difíceis ou impossíveis de predizer um avanço. Descentralização requer compromisso: a Web precisava lançar fora o ideal de total consistência de todas as suas interconexões, profetizando mensagem de má reputação quot;Error 404: Não encontradoquot; mas permitindo crescimento do seu exponencial incontrolável. Representação de Conhecimento Para a web semântica funcionar, computadores devem ter acesso a coleções estruturadas de informação e conjuntos de regras de inferência que podem ser usadas para conduzir raciocínio automatizado. Pesquisadores de inteligência artificial começaram a estudar tais sistemas muito antes da Web ser criada. Representação de conhecimento, como essa tecnologia é frequentemente chamada, está atualmente em um estado parecido com o do hipertexto antes do advento da Web: é obviamente uma boa idéia, existem algumas demonstrações muito satisfatórias, mas ainda não mudou o mundo. Contem o as fontes das aplicações importantes, mas para obter sua plena capacidade ela deve ser conectada em um sistema global único. Os sistemas de representação de conhecimento tradicionais tem sido tipicamente centralizados, requerendo que todos compartilhem exatamente da mesma definição de conceitos comuns tais como quot;paiquot; ou quot;veículoquot;. Mas o controle central está sufocando, aumentando o tamanho e o escopo de tal forma que o sistema irá se tornar incontrolável. Além disso, estes sistemas geralmente limitam cuidadosamente as perguntas que podem ser feitas a fim de que o computador possa responder com segurança ou sob qualquer condição. O problema é similar ao teorema matemático de Godel: qualquer sistema que é suficientemente complexo para ser útil também inclui questões sem resposta, como versões sofisticas do paradoxo básico quot;Esta sentença é falsaquot;. Para evitar tais problemas, os sistemas de representação de conhecimento tradicionais geralmente tinham cada qual seu próprio reduzido e peculiar conjunto de regras para fazer inferências sobre seus dados. Por exemplo, um sistema de genealogia, agindo em um banco de dados de árvores de famílias, inclui o papel quot;a esposa de um tio é uma tiaquot;. Mesmo que os dados pudessem ser transferidos de um sistema para o outro, os papéis, existentes em um formulário completamente diferente, usualmente não poderiam. Os pesquisadores da Web Semântica, em contraste, aceitam que as questões parodoxas e sem resposta são o preço que deve ser pago para conquistar a versatilidade. Nós fazemos a linguagem com as regras tão expressivas quanto necessárias para permitir que a Web raciocine tão amplamente quando desejado. Esta filosofia é similar a da web convencional: cedo no desenvolvimento web, caluniadores que apontaram que ela nunca podia ser uma biblioteca bem organizada; sem um banco de dados
  • 3. central e uma estrutura de árvore, ninguém nunca teria certeza de encontrar tudo. Eles estavam certos. Mas o poder expressivo do sistema criou quantidades vastas de informação disponíveis e mecanismos de busca (os quais pareceram bastante impraticáveis uma década atrás) agora produzem notavelmente índices completos de uma grande quantidade de material. O desafio da Web Semântica, apesar disso, é prover uma linguagem que expresse não somente dados e regras para raciocínio sobre os dados mas também que permita regras de qualquer sistema de representação de conhecimento existente a ser exportado para a Web. Adicionar lógica para a Web significa utilizar regras para fazer inferências, escolher cursos de ações e responder perguntas. É a tarefa da comunidade da Web Semântica no momento. Uma mistura de decisões matemáticas e de engenharia complicam essa tarefa. A lógica deve ser poderosa o suficiente para descrever complexas propriedades de objetos, mas não tão poderosa que os agentes possam ser enganados por perguntas cosideradas um paradoxo. Felizmente, a grande maioria das informações que nós queremos é expressa ao longo das linhas de quot;um parafuso com cabeça hexagonal é um tipo de parafusoquot;, que são facilmente escritas em línguas existentes com um pequeno vocabulário extra. Duas importantes tecnologias para o desenvolvimento da Web Semântica já estão em vigor: XML (Extensible Markup Language) e a RDF (Resource Description Framework). XML permite que todos criem suas próprias tags, labels ocultos tais como rótulos, anotações nas páginas da Web ou seções de textos em uma página. Scripts, ou programas, podem fazer uso dessas tags de sofisticadas maneiras, mas quem for escrever o script tem que saber quais as tags que a página está utilizando e como. Em resumo, o XML permite aos usuários adicionar estrutura arbritária aos seus documentos, mas nada diz sobre o que significam as estruturas. A Web Semântica permitirá que máquinas compreendam a semântica de documentos e dados, e não discursos e escritas humanas. O significado é expresso por RDF, que a codifica em um conjuntos de tuplas, cada uma das tuplas sendo como o sujeito, verbo e objeto de uma frase elementar. Estas tuplas podem ser escritos usando tags XML. Em RDF, um documento que faz afirmações de coisas paticulares (pessoas, páginas Web ou qualquer que seja) têm propriedades (tais como quot;é irmã dequot;, quot;é o autor dequot;) com certos valores (outra pessoa, outra página da Web). Esta estrutura torna-se um caminho natural para descrever a grande maioria dos dados processados por máquinas. Sujeito e objeto são cada um identificados por uma URI (Universal Resource Identifier), assim como é utilizado em um link de uma página da Web. (URLs, Uniform Resource Locators, são o tipo mais comum de URI.) Os verbos são também identificados por URIs, que permite a qualquer pessoa definir um novo conceito, um novo verbo, apenas pela definição de um URI para ele em algum lugar da web. Linguagem humana é prospera quando se utiliza o mesmo termo para dizer coisas um pouco diferentes, mas sem automatização. Imagine que eu aluguei um serviço de um palhaço mensageiro para entregar balões para meus clientes nos seus aniversários. Infelizmente, o serviço transfere o endereço do meu banco de dados para seu banco de dados, não sabendo que o quot;endereçoquot; no meu banco é para onde as contas são enviadas e que muitos deles são do escritório dos caixas correios. Meus palhaços contratados acabam entretendo um número de funcionários dos Correios, que não é necessariamente uma coisa má, mas certamente não foi o efeito pretendido. Utilizar uma URL diferente para cada conceito, resolve esse problema. Um endereço que é um endereço de correspondência pode ser distinguido de um que seja uma rua, e ambos podem ser distinguidas a partir de um endereço que é um discurso. As tuplas de formulários RDF entrelaçam informações com assuntos relacionados. Já que RDF usa URIs para codificar essas informações em um documento, as URIs asseguram que os conceitos não são apenas palavras em um documento, mas estão vinculados a uma única definição que cada um pode encontrar na web. Por exemplo, imagine que temos acesso a uma variedade de bases de dados com informações sobre pessoas, incluindo os seus endereços. Se queremos encontrar pessoas que vivem em um determinado código postal, precisamos saber quais são os campos em cada banco de dados que representam nomes e que representam CEPs. RDF pode especificar que quot;(o campo 5 na base de dados A) (é um campo do tipo) (CEP),quot; usando URIs ao invés de frases para cada termo. Ontologias Evidentemente que este não é o fim da história, pois duas bases de dados podem utilizar identificadores
  • 4. diferentes para o que de fato vai ser o mesmo conceito, como um código postal. Um programa que queira comparar ou combinar informações através de duas base de dados têm que saber que os dois termos estão sendo usados para designar a mesma coisa. Idealmente, o programa deve ter uma maneira de descobrir esses significados comuns para qualquer que seja a bases de dados. Uma solução para este problema é fornecida pelo terceiro componente básico da Web Semântica, as coleções de informação chamadass ontologias. Em filosofia, uma ontologia é uma teoria sobre a natureza da existência; ontologia como uma disciplina estuda tais teorias. Inteligência Artificial e Buscadores Web têm opcionalmente termos para seu próprio entendimento e para eles uma ontologia é um documento ou arquivo que define formalmente as relações entre os termos. A mais típica espécie de ontologia para a Web tem uma taxonomia e um conjunto de regras de inferência. A taxonomia define classes de objetos e relações entre elas. Por exemplo, um endereço pode ser definido como um tipo de localização, os códigos de uma cidade podem ser definidos apenas para as localizações, e assim por diante. Classes, subclasses e as relações entre as entidades são uma ferramenta muito poderosa para a utilização na web. Podemos manifestar um grande número de relações entre entidades, atribuindo propriedades para classes e permitindo que as subclasses herdem tais propriedades. Se códigos de cidades devem ser do tipo cidade e as cidades têm, geralmente, Web sites, podemos discutir o Web site associado ao código da cidade, mesmo se não houver uma base de dados que ligue o código da cidade a um web site. As regras de inferência em ontologia fornecem suprimentos de energia adicional. Uma ontologia pode expressar a regra quot;Se um código de cidade está associado com um código de estado, e um endereço está associado a um código de estadoquot;. Um programa poderia então deduzir facilmente, por exemplo, que um endereço Universidade Cornell, em Ithaca, deve estar no estado de Nova York, que está em os E.U. e, portanto, devem ser formatados para os padrões dos E.U. O computador não quot;compreendequot; verdadeiramente qualquer uma desta informações, mas agora pode manipular estes termos de maneira muito mais eficaz de forma que sejam úteis e significativos para o usuário humano. Com ontologia em páginas da Web, as soluções para a terminologia (e outros) problemas começam a surgir. O significado dos termos ou códigos XML usados em uma página da Web pode ser definido por indicações a partir da página de uma ontologia. Evidentemente, os mesmos problemas de antes surgem agora se eu apontar para uma ontologia que define endereços como contendo um código postal e se você apontar para uma que usa o código postal. Este tipo de confusão pode ser resolvido se ontologias (ou outros serviços da Web) fornecerem relações de equivalência: uma ou ambas das nossas ontologias podem conter a informação de que o meu código postal é equivalente ao seu código postal. Nosso sistema de envio de palhaços para entreter os meus clientes é parcialmente resolvido quando as duas bases de dados apontam para diferentes definições de endereço. O programa, usando URIs distintas para os diferentes endereços, não irá confundir os mesmos e, de fato, terá de descobrir que os conceitos são relacionados a todos. O programa poderia, então, usar um serviço que tem uma lista de endereços postais (definido na primeira ontologia) e convertê-la em uma lista de endereços físicos (a segunda ontologia), reconhecendo e eliminando caixas de correios e outros endereços impróprios. Ontologias podem melhorar o funcionamento da Web em muitos aspectos. Elas podem ser usadas em uma forma simples para melhorar a precisão das pesquisas na Web. O programa de pesquisa pode olhar apenas para as páginas que se referem a uma noção precisa, em vez de todas as palavras-chaves. Mais aplicações avançadas usarão ontologias para relacionar as informações sobre uma página associada ao conhecimento das estruturas e regras de inferência. Um exemplo de uma página com essa utilização está online em http://www.cs.umd.edu/~Hendler. Se você entrar na página, você verá a página da Web normal intitulada quot;Dr. James A. Hendler”. Como um homem, você pode facilmente encontrar o link para uma breve nota biográfica e ler aí que Hendler recebeu seu Ph.D. na Universidade de Brown. Um programa de computador, tentando encontrar tais informações, no entanto, teria de ser muito complexo para adivinhar que esta informação pode estar em uma biografia e de compreender a linguagem inglesa utilizada. Para computadores, a página está ligada a uma página de ontologia que definem informações sobre departamentos de informática. Por exemplo, os professores ligados às universidades geralmente têm doutorados. Outras marcações na página (não mostradas pelo browser) utilizam os conceitos da ontologia para especificar que Hendler recebeu seu Ph.D. da entidade descrita na URI http://www. brown.edu. Computadores podem achar que Hendler é um membro de um determinado projeto de
  • 5. pesquisa, tem um determinado endereço de e-mail, e assim por diante. Toda essa informação é facilmente processada por um computador e poderia ser utilizada para responder as questões (como ou onde o Dr. Hendler recebeu seu diploma), que atualmente exige um humano para filtrar o conteúdo de várias páginas transformado por um motor de busca. Além disso, esta marcação torna muito mais fácil desenvolver programas que podem resolver problemas complicados cujas respostas não residem em uma única página da Web. Suponha que você deseja encontrar a Sra. Cook que conheceu em um comércio de conferência do ano passado. Você não lembra seu primeiro nome, mas lembra que ela trabalhava para um dos seus clientes e que seu filho era um aluno em sua universidade. Um programa inteligente de pesquisa pode filtrar as páginas de todas as pessoas cujo nome é quot;Cookquot; (todas as páginas relacionadas a cozinheiros, cozinhar, as Ilhas Cook e assim por diante), ncontrar as primeiras que mencionam que querem trabalhar para uma empresa que está na sua lista de clientes e seguindo os links para outras páginas da Web, rastrear qualquer caso em que os seus filhos estejam na mesma escola, no local certo. Agentes O verdadeiro poder da Web Semântica será realizado quando as pessoas criarem muitos programas que coletam conteúdo da Web a partir de diversas fontes, processarem a informação e fizerem o intercâmbio dos resultados com outros programas. A eficácia de tais softwares agentes aumentará exponencialmente enquanto mais conteúdos legíveis da Web e mais serviços automatizados (incluindo outros agentes) ficarem disponíveis. A Web Semântica promove esta sinergia: mesmo s agentes que não foram expressamente concebidos para trabalhar em conjunto, podem transferir dados entre si quando os dados vêm com semântica. Uma importante faceta do funcionamento dos agentes será a troca de quot;provasquot; escrita na Web Semântica (inferências lógicas feitas utilizando regras e informações, tais como as especificadas pelas ontologias). Por exemplo, suponha que as informações de contato da Sra. Cook foram localizadas por um serviço online, e para sua grande surpresa ele coloca-lá como sendo de Johannesburg. Naturalmente, você quer ver isto, solicita o serviço para o seu computador para uma prova de sua resposta, que fornece prontamente, traduzindo a sua lógica interna para a Web Semântica. Um motor de inferência no seu computador facilmente verifica que esta Sra. Cook corresponde a uma verdade que você estava procurando, e pode mostrar-lhe as páginas da Web, se você ainda tem dúvidas. Embora eles ainda estejam longe do melhor do potencial da Web Semântica, alguns programas já podem trocar provas desta forma, utilizando as atuais versões preliminares da língua unificadora. Outra característica fundamental serão as assinaturas digitais, que são blocos de dados criptografados e os agentes que os computadores podem utilizar para verificar que as informações anexas foram fornecidas por uma fonte confiável. Você quer ter a certeza de que uma declaração enviada para o seu programa de contabilidade de que você deve dinheiro a um varejista on-line não é uma falsificação gerada pelo computador de um adolescente na porta ao lado. Agentes devem ser céticos das afirmações que lêem sobre a Web Semântica até terem verificado as fontes de informação. Muitos serviços automatizados baseados na Web existem sem semântica, mas outros programas tais como agentes não têm formas de localizar um que irá executar uma função específica. Este processo, denominado serviço de descoberta, só pode acontecer quando existe uma linguagem comum para descrever um serviço de forma que permite que outros agentes compreendam tanto a função oferecida como possam tirar partido da mesma. Serviços e agentes podem anunciar a sua função, por exemplo, depositando tais descrições em diretórios análogos às páginas amarelas. Alguns esquemas de baixo nível de serviços de descoberta estão atualmente disponíveis, tais como o Universal Plug and Play da Microsoft , que tem seu foco na conexão de diferentes tipos de dispositivos, e o Jini da Sun Microsystems , que é uma tecnologia utilizada para conexão de serviços. Estas iniciativas, entretanto, atacam o problema a nível estrutural ou sintático e confiam pesadamente na padronização de um predeterminado grupo de funcionalidades descritas. A padronização só pode ir tão longe, porque nós não podemos prever todas as futuras necessidades possíveis. Projetada corretamente, a Web Semântica pode ajudar na evolução do conhecimento humano como um todo.
  • 6. A Web Semântica, em contrapartida, é mais flexível. Os agentes consumidores e o produtores podem chegar a uma compreensão compartilhada através da troca de ontologias, que fornecem o vocabulário necessário para a discussão. Agentes compiladores aumentam sua capacidade de raciocínio quando descobrem novas ontologias. A semântica também torna mais simples tirar vantagem de um serviço que consome parcialmente uma solicitação. Um processo típico envolverá a criação de uma cadeia de valores na qual subconjuntos de informações são passadas de em agente para outro. Cada valor adicionado para construir a resposta final solicitada pelo usuário final. Não se engane: para criar automaticamente complicadas cadeias de valores sob demanda, alguns agentes irão explorar tecnologias de inteligência artificial além da web semântica. Mas a semântica web irá fornecer a base e a estrutura para fazer tais tecnologia mais viáveis. Colocar todas estas características juntas resultam nas habilidades exibidas pelos agentes de Pete e Lucy no cenário exibido neste artigo. Os agentes teriam delegado tarefas de forma fragmentada para outros serviços e descoberto outros agentes através de um serviço de publicidade. Por exemplo, eles poderia ter usado um serviço confiável para ter uma lista de fornecedores e determinar quais deles estão em plano seguro para um determinado curso e plano de tratamento. A lista de fornecedores seria fornecida por um outro serviço de pesquisa, etc. Estas atividades formadas por cadeias na qual grandes quantidades de dados distribuídos por toda web (e quase sem valor neste formulário) foram progressivamente reduzidas para uma pequena quantidade de dados de alto valor para Pete e Lucy, um plano de compromissos para ajustar seus horários e requisitos. Na próxima etapa, a web semântica vai sair do virtual e entrar no nosso mundo físico. URIs podem apontar para qualquer coisa, incluindo entidades físicas, o que significa que podemos usar a linguagem RDF para descrever dispositivos como telefones celulares e TVs. Esses dispositivos podem anunciar as funcionalidades que eles podem fazer e como são controlados como agentes de software. Sendo muito mais flexíveis do que esquemas de baixo nível como Universal Plug and Play, tal abordagem abre um mundo de possibilidades emocionantes. Por exemplo, hoje o que é chamado de automação de casa requer cuidadosas configurações para aparelhos trabalharem em conjunto. As descrições semânticas de capacidades do dispositivo e a funcionalidade permite-nos alcançar tais níveis de automação sem a mínima intervenção humana. Um exemplo trivial ocorre quando Peter responde pelo telefone e o som estéreo é voltado para baixo. Em vez de ter que programar cada aparelho especifico, poderia programar a função para cobrir todos os dispositivos no local e assim ter um controle de volume da TV, do DVD Player e o media player que está no laptop que ele trouxe para casa do trabalho esta noite. Os primeiros passos concretos já foram colhidos nesta área, com trabalhos de desenvolvimento de um padrão para descrever as capacidades funcionais de dispositivos (tais como tamanhos de tela) e preferência do usuário. Construído sobre RDF, este padrão é denominado Composite Capability/Preference Profile (CC/PP). Inicialmente ele irá permitir que telefones celulares e outros atípicos clientes Web descrevam suas características para que o conteúdo da Web possa ser adaptado para eles na navegação. Mais tarde quando for acrescentada todas as versatilidades da linguagem para o tratamento da ontologia e da lógica. Dispositivos poderiam automaticamente procurar e se solicitar a serviços e outros dispositivos para aumentar suas informações ou funcionalidades. Não é difícil imaginar sua web ativa consultar no forno microondas a comida congelada, a através do site do fabricante passar os parâmetros para cozimento. Evolução do Conhecimento A web semântica não é apenas a ferramenta para realizar tarefas individuais como as que discutimos aqui até agora. Além disso, a web semântica pode acompanhar a evolução humana como um todo. O esforço humano é travado em uma tensão entre eficácia dos pequenos grupos agindo de forma independente e a necessidade de um melhor entrosamento com a comunidade em geral. Um pequeno grupo pode inovar rápido e com eficiência, mas isso produz uma sub cultura cujos conceitos não são compreendidos pelos outros. Coordenar as ações de um grande grupo, entretanto, é dolorosamente lento e exige muita comunicação. O mundo trabalho em todo o espectro entre estes extremos, com uma tendência para iniciar a partir de uma pequena idéia e avançar para uma maior compreensão ao longo do tempo.
  • 7. Um processo inicial é a junção de subcultivos quando uma idéia comum e mais ampla é necessária. Muitas vezes, dois grupos independentes desenvolvem conceitos muito semelhantes, descrever a relação entre eles traz muitos benefícios. Como um dicionário Finlandês-Inglês, ou a tabela de conversão de pesos e medidas, as relações permitem comunicação e colaboração mesmo quando a comunalidade do conceito (ainda) não levou a uma comunalidade dos termos. A Web Semântica nomeia cada conceito simples por uma URI e permite que qualquer pessoa expresse novos conceitos com o mínimo de esforço. Sua linguagem lógica e unificadora permitirá que estes conceitos sejam progressivamente ligados em uma web universal. Esta estrutura vai abrir o conhecimento e o funcionamento da humanidade à analise significativa por agentes de software, proporcionando uma nova classe de ferramentas que podemos usufruir, trabalhar e aprender com elas juntos. Outras informações: Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor. Tim Berners-Lee, with Mark Fischetti. Harper San Francisco, 1999. Uma versão mais elaborada deste artigo está disponível no site da Scientific American, com links e materiais adicionais. World Wide Web Consortium (W3C): www.w3.org/ W3C Semantic Web Activity: www.w3.org/2001/sw/ An introduction to ontologies: www.SemanticWeb.org/knowmarkup.html Simple HTML Ontology Extensions Frequently Asked Questions (SHOE FAQ): www.cs.umd.edu/projects/plus/SHOE/faq.html DARPA Agent Markup Language (DAML) home page: www.daml.org/