Este documento apresenta uma breve história da Web, desde a primeira geração (Web 1.0) até a terceira geração (Web Semântica). Também discute padrões abertos para a Web Semântica como RDF, OWL e ontologias, e como esses padrões podem ser usados para publicar dados abertos do governo de forma a permitir sua reutilização.
2. Título da Apresentação Uma breve história de Web; Web Semântica; Padrões Abertos para Web Semântica; Dados Abertos; Considerações Finais. Agenda
3. Uma breve história da Web Tim Berners-Lee, pesquisador do CERN, cria em 1991 a Web como a conhecemos hoje!
4. Primeira Geração ( Web 1.0) A principal característica nesta geração se identifica pela troca de dados entre máquinas distintas. Um dos exemplos da primeira geração internet é a ARPANet. Segunda Geração ( Web 2.0) Surge a World Wide Web (WWW) ou simplesmente Web . Atualmente a busca de informações na Web pode ser considerada sintática. Neste conceito, os computadores fazem apenas a apresentação da informação, porém o processo de interpretação fica a cabo dos seres humanos.” (Brietman,2005, pag.02) Terceira Geração ( Web 3.0) A terceira geração pode ser considerada geração da Web Semântica, ou seja, transformar os dados que estão na teia em elementos úteis, legíveis para as máquinas, como forma de obtenção de um resultado mais “limpo” ou semanticamente corretos. Uma breve história da Web
5. Web 1.0 Papéis de usuários produtor e consumidor de conteúdo bem definidos Web 2.0 Web mais interativa, com usuários assumindo papéis de produtores e consumidores de conteúdo; Web 3.0 ( Web Semântica) Futura extensão da Web 2.0 com metadados semânticos e mecanismos de inferência lógica Uma breve história da Web
6. Definições e conceitos Em maio de 2001 Tim Berners-Lee, aclamado como o criador da Internet, aliado com James Hendler e Ora Lassial, explicaram num artigo publicado na revista American Scientific com o titulo – The Semantic Web . O artigo explica que os computadores não só são capazes de apresentar a informação contida nas páginas Web, como também podem entender essa dita informação. Para completar o artigo The Semantic Web de Berbers-Lee, Ataíde (2005), completa: “A Web Semântica é utilizada pra reduzir a ambiguidade da linguagem natural.” Web Semântica
7. Definições e conceitos O linguista francês Michel Bréal (1883), utilizou semântica para designar a ciência que se dedica ao estudo das significações. Com isso semântica é a teoria que deve contemplar o estudo das regras gerais que condicionam o sentido dos enunciados. Portanto, “A Web Semântica não é uma Web separada, mas uma extensão da atual. Nela a informação é dada com um significado bem definido, permitindo melhor interação entre os computadores e as pessoas” (Berners-Lee,2001). Web Semântica
9. UNICODE Garante o uso padronizado do mesmo conjunto de caracteres. URI – Identificador Universal de Recursos Provê uma forma unívoca de identificação e localização de recursos; Ex: URL – documentos, imagens, músicas, etc; E-mail – pessoas. Padrões Abertos para Web Semântica
10. Metadados “ São dados que fazem referências a outros dados. São destinados ao consumo por máquinas” (Barreau,2003). Dublin Core ou DCMI ( Dublin Core Metadata Initiative ). Assunto ( subject ); Título ( title ); Criador ( creator ); Descrição( description ); Editor ( publischer ); Outro Agente ( contributo ); Data ( date ); Tipo de Objeto ( type ); Formato ( format ); Identificador ( identifier ); Ralacionameno ( relation ); Linguagem ( language ); Cobertura ( coverage ); Direitos ( rights ); Fonte ( source ). Padrões Abertos para Web Semântica
11.
12. XML ( Extensible Markup Language) É um subtipo de SGML ( Standard Generalized Markup Language ) que é capaz de descrever diverso tipos de dados; Linguagem de marcação para Web Semântica; Auto-descrição das informações (metadados); Padronizar a publicação e troca de dados entre aplicações Web . Padrões Abertos para Web Semântica
13. XMLS (XML Schema ) Permite restrições sobre um documento: Define os marcadores válidos; Define regras de validade para o conteúdo de cada bloco: O marcador <reunião> deve conter Exatamente um marcador <local>; 2 ou mais marcadores <pessoa>; O marcador <pessoa> deve conter Exatamente um marcador <nome> Define uma estrutura de dados. Padrões Abertos para Web Semântica
14. RDF ( Resource Description Framework ) É uma linguagem utilizada para representar informações na Internet e é uma especialização da linguagem XML; O RDF possui uma sintaxe concreta para prover uma semântica formal; Um padrão utilizado é o Dublin Core usado para representação da informação na forma de metadados [DUBLINCORE07]. Padrões Abertos para Web Semântica
15.
16.
17.
18. Ontologia “ A palavra ontologia vem do grego ontos (ser) + logos (palavra). O princípio do estudo surgiu na Grécia antiga pelo então filósofo Aristóteles (366 a.C. - 322 a.C), que fez a classificação das categorias, porém a definição de ontologia possui significados não tão distintos como na área da filosofia e na Web Semântica.” (Breitman,2005). Na filosofia ontologia, é a ciência do que é, dos tipos de estruturas do objeto, propriedades, eventos, processos e relacionamentos em todas as áreas da realidade. Padrões Abertos para Web Semântica
19. Ontologia Na Web Semântica, segundo Breitman(2005) “Ontologia é uma especificação formal e explícita de uma conceitualização compartilhada”. Segundo Ataíde (2005) “Uma ontolologia é um conjunto de termos hierárquicos estruturados para descrição de um domínio, que pode ser usado como um esqueleto fundamental para uma base de conhecimento.” Padrões Abertos para Web Semântica
20. Ontologia O consórcio W3C define ontologia como “a definição dos termos utilizados na descrição e na representação de uma área do conhecimento”. Assim o W3C coloca as ontologias no seguinte tipo de conceitos: Classe (ou “coisas”) no vários domínios de interesse; Relacionamentos entre as “coisas”; Propriedades (ou atributos) que essas “coisas” devem possuir. Padrões Abertos para Web Semântica
22. OWL ( Ontology Web Language ) Mais recente padrão no desenvolvimento de linguagens de ontologias endossado pelo World Wide Web Consortium [W3C07] para promover a visão da Web Semântica; É uma especialização de XML e, de fmode geral, é uma melhoria de RDF Schema , consequentemente de RDF, XML Schema e XML; Uma ontologia OWL pode descrever classes propriedades e suas instâncias, construindo relacionamentos entre essas informações gerando uma Web Semântica. Padrões Abertos para Web Semântica
23. OWL ( Ontology Web Language ) Padrões Abertos para Web Semântica
25. Dados Abertos ( Open Data ) Segundo o W3C, dados governamentais abertos são a “disponibilização de informações governamentais representadas em formato aberto e acessível de tal modo que possam ser reutilizadas, misturadas com informações de outras fontes, gerando novos significados”. Dados Abertos Governamentais Não são apenas a publicação na Web de informações ou tabelas de dados legíveis apenas por pessoas, mas sim a publicação de informações do setor público, disponibilizadas em formato bruto e aberto, compreensíveis logicamente, de modo a permitir sua reutilização em aplicações digitais desenvolvidas pelo governo, pela sociedade ou qualquer outro interessado no desenvolvimento desse tipo de aplicação. Dados Abertos
26. Dados governamentais geralmente são disponibilizados on-line normalmente por 3 motivos: 1. Aumentar a consciência cidadã das funções de governo para permitir maior responsabilidade; 2. Contribuir com informações valiosas sobre o mundo; 3. Permitir que o governo, o país e o mundo funcionem com mais eficiência. Dados Abertos
27. O especialista em políticas públicas, David Eaves, criou 3 leis para dados governamentais: 1. Se o dado não pode ser encontrado e indexado na Web , ele não existe; 2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; 3. Se algum dispositivo legal não permitir sua replicação, ele não é útil. Dados Abertos
28. Para satisfazer melhor cada um destes objetivos, uma das melhores opções é a utilização de técnicas de linked data. Linked Open Data (LOD) propõem o uso de padrões abertos, suportados pelo W3C, para exposição de dados na Web por meio de princípios simples, inspirados no sucesso da “Web de Documentos”, envolvendo padronização da semântica por trás dos dados. - Abertos: pode-se acessar linked data através de uma variedade ilimitada de aplicações e aplicativos, pois ela é expressa em formatos abertos, não-proprietários; - Modulares: os linked data podem ser combinados (agregados) com quaisquer outros linked . Nenhum planejamento antecipado é necessário para integrar essas fontes de dados, já que ambas utilizam os padrões de linked data ; - Escaláveis: É fácil adicionar mais linked data aos já existentes, mesmo quando os termos e definições utilizadas mudem ao longo do tempo . Dados Abertos
29. Um grupo de trabalho para governo aberto (OpenDataGov.org), estabelecido na Califórnia (EUA) em 2007, desenvolveu 8 princípios que devem ser respeitados para que dados governamentais que forem disponibilizados publicamente sejam considerados abertos: 1. Completos: Todos os dados públicos estão disponíveis. Dado público é o dado que não está sujeito a limitações válidas de privacidade, segurança ou controle de acesso. 2. Primários: Os dados são apresentados tais como os coletados na fonte, com o maior nível de granularidade e sem agregação ou modificação. 3. Atuais: Os dados são disponibilizados tão rapidamente quanto necessário. 4. Acessíveis: Os dados são disponibilizados para o maior alcance possível de usuários e para o maior conjunto possível de finalidades. 5. Compreensíveis por máquinas: Os dados são razoavelmente estruturados de modo a possibilidar processamento automatizado. 6. Não discriminatórios: Os dados são disponíveis para todos, sem nenhuma exigência. 7. Não proprietários: Os dados são disponíveis em formato sobre o qual nenhuma entidade detenha controle exclusivo. 8. Livres de licenças: Os dados não estão sujeitos a nenhuma restrição de direito autoral, patente, propriedade intelectual ou segredo industrial. Restrições sensatas relacionadas à privacidade, segurança e privilégios de acesso devem ser permitidas. Dados Abertos
30. O uso de Padrões Abertos é imprescindível para Web Semântica; O uso de Web Semêntica é imprescindível para Dados Abertos; O uso de Padrões Abertos é imprescindível para Dados Abertos; Baseado nesses conceitos e princípios alguns portais de dados abertos governamentais já são agrupados e publicados na Web : Estados Unidos, Inglaterra, Austrália, dentre outros são alguns exemplos; No Brasil algumas expectativas já acontecem. Um recente projeto de lei do executivo sobre acesso a informações defende a “gestão transparente da informação, propiciando amplo acesso e divulgação a ela”. Proposta: LinkedDataBR (RNP). Considerações Finais
31. "Dados governamentais abertos promovem o aumento do discurso civil, a melhoria do bem-estar público e o uso mais eficiente dos recursos públicos." OpenDataGov.org Perguntas?