O documento apresenta os fundamentos e princípios do Linked Data, incluindo (1) a utilização de URIs para identificar recursos, (2) o uso do HTTP para acessar essas URIs, (3) a disponibilização de informações úteis usando RDF ao acessar URIs, e (4) a inclusão de links para outros recursos. Também discute (2) os formatos e padrões usados como RDF, SPARQL e HTTP, e (3) estratégias para armazenamento de dados RDF.
Este documento fornece uma introdução aos princípios e tecnologias por trás dos Linked Data e da Web Semântica. Ele discute a motivação para estruturar dados na web, as limitações da web atual, e como RDF, URIs e links entre dados podem superar essas limitações e conectar ilhas de informação em um espaço global de dados.
O documento introduz os conceitos de semântica, Web Semântica e como ela pode ensinar computadores a entenderem o significado por trás dos recursos da Web através de ontologias, vocabulários controlados e descrições estruturadas dos recursos e suas relações usando RDF, OWL e SPARQL.
Web Semântica: Conceitos e Tecnologiassergiocrespo
O documento apresenta um resumo sobre web semântica, abordando suas principais tecnologias como ontologias, OWL e consultas. Discorre sobre a visão geral da web semântica, suas estruturas e aplicações, além de conceitos como ontologias, elementos, engenharia e bibliotecas de ontologias. Também explica as sublinguagens OWL como Lite, DL e Full, além de namespaces.
Uma grande dificuldade da World Wide Web atualmente ´e a incapacidade dos computadores de inferir sobre algo. Neste contexto, surge a
Web Semˆantica, cuja proposta est´a em dotar a informa¸c˜ao de um significado bem definido possibilitando a computadores e pessoas cooperarem
entre si. Para que isso se torne poss´ıvel, uma arquitetura de camadas foi
proposta pelo W3C, com a finalidade de direcionar tecnologias associadas
a Web Semˆantica. Apesar dela estar em um estado inicial de desenvolvimento, j´a se tem aplica¸c˜oes que foram projetadas utilizando o conceito de
camadas, ratificando o futuro da Web Semˆantica.
O documento discute a história da internet e da web semântica, incluindo: 1) A evolução da internet desde a década de 1960 com a criação da ARPANET; 2) Os desafios da web atual em organizar a grande quantidade de informações; 3) A proposta da web semântica para estruturar os dados e atribuir significado para melhor recuperação de informações.
Dados Ligados (Linked Data) CONSEGI 2011Pablo Mendes
A Web é um espaço global de informações baseado na idéia de estabelecer hiperlinks entre documentos. De forma semelhante, tecnologias de Dados Ligados (Linked Data) permitem o estabelecimento de links entre registros em bancos de dados, interconectando estes bancos em um espaço global de dados. Tecnologias de Dados Ligados vem sendo adotadas por um número crescente de provedores de dados, resultando em aproximadamente 20 bilhões de ítens de dados que incluem dados sobre entidades governamentais e geográficas, pessoas, companhias, comunidades online, filmes, músicas, livros e publicações científicas. Pablo Mendes apresentou em sua palestra uma visão geral sobre infraestrutura, técnicas e software livre que abordam questões críticas que surgem em tal Web de Dados Ligados. Durante sua apresentação, ele descreveu como as pesquisas no grupo WBSG da Freie Universität Berlin vem usando conhecimento extraído da Wikipedia para semear um ecossistema de dados, software e usuários da Web de forma a habilitar integração de dados em escala global, seguindo um estilo evolucionário pay-as-you-go (link por link) que distribui esforços e acumula recompensas.
Uma das conclusões da apresentação é que se compartilharmos dados interligados - ou ainda melhor, se compartilharmos mecanismos de interligação - através da Web, poderemos dividir tanto o esforço de interligar, quanto as recompensas de se realizar consultas por sobre dados interligados.
O documento descreve a história e conceitos fundamentais do RDF (Resource Description Framework). Em 3 frases:
1) O RDF foi desenvolvido pela W3C para permitir a descrição de recursos na web de forma estruturada através de declarações no formato de sujeito, predicado e objeto.
2) Ele visa permitir que as máquinas processem e entendam o significado dos dados na web semântica através de metadados expressos em RDF.
3) O RDF utiliza URIs para identificar recursos e descrevê-
Este documento fornece uma introdução aos princípios e tecnologias por trás dos Linked Data e da Web Semântica. Ele discute a motivação para estruturar dados na web, as limitações da web atual, e como RDF, URIs e links entre dados podem superar essas limitações e conectar ilhas de informação em um espaço global de dados.
O documento introduz os conceitos de semântica, Web Semântica e como ela pode ensinar computadores a entenderem o significado por trás dos recursos da Web através de ontologias, vocabulários controlados e descrições estruturadas dos recursos e suas relações usando RDF, OWL e SPARQL.
Web Semântica: Conceitos e Tecnologiassergiocrespo
O documento apresenta um resumo sobre web semântica, abordando suas principais tecnologias como ontologias, OWL e consultas. Discorre sobre a visão geral da web semântica, suas estruturas e aplicações, além de conceitos como ontologias, elementos, engenharia e bibliotecas de ontologias. Também explica as sublinguagens OWL como Lite, DL e Full, além de namespaces.
Uma grande dificuldade da World Wide Web atualmente ´e a incapacidade dos computadores de inferir sobre algo. Neste contexto, surge a
Web Semˆantica, cuja proposta est´a em dotar a informa¸c˜ao de um significado bem definido possibilitando a computadores e pessoas cooperarem
entre si. Para que isso se torne poss´ıvel, uma arquitetura de camadas foi
proposta pelo W3C, com a finalidade de direcionar tecnologias associadas
a Web Semˆantica. Apesar dela estar em um estado inicial de desenvolvimento, j´a se tem aplica¸c˜oes que foram projetadas utilizando o conceito de
camadas, ratificando o futuro da Web Semˆantica.
O documento discute a história da internet e da web semântica, incluindo: 1) A evolução da internet desde a década de 1960 com a criação da ARPANET; 2) Os desafios da web atual em organizar a grande quantidade de informações; 3) A proposta da web semântica para estruturar os dados e atribuir significado para melhor recuperação de informações.
Dados Ligados (Linked Data) CONSEGI 2011Pablo Mendes
A Web é um espaço global de informações baseado na idéia de estabelecer hiperlinks entre documentos. De forma semelhante, tecnologias de Dados Ligados (Linked Data) permitem o estabelecimento de links entre registros em bancos de dados, interconectando estes bancos em um espaço global de dados. Tecnologias de Dados Ligados vem sendo adotadas por um número crescente de provedores de dados, resultando em aproximadamente 20 bilhões de ítens de dados que incluem dados sobre entidades governamentais e geográficas, pessoas, companhias, comunidades online, filmes, músicas, livros e publicações científicas. Pablo Mendes apresentou em sua palestra uma visão geral sobre infraestrutura, técnicas e software livre que abordam questões críticas que surgem em tal Web de Dados Ligados. Durante sua apresentação, ele descreveu como as pesquisas no grupo WBSG da Freie Universität Berlin vem usando conhecimento extraído da Wikipedia para semear um ecossistema de dados, software e usuários da Web de forma a habilitar integração de dados em escala global, seguindo um estilo evolucionário pay-as-you-go (link por link) que distribui esforços e acumula recompensas.
Uma das conclusões da apresentação é que se compartilharmos dados interligados - ou ainda melhor, se compartilharmos mecanismos de interligação - através da Web, poderemos dividir tanto o esforço de interligar, quanto as recompensas de se realizar consultas por sobre dados interligados.
O documento descreve a história e conceitos fundamentais do RDF (Resource Description Framework). Em 3 frases:
1) O RDF foi desenvolvido pela W3C para permitir a descrição de recursos na web de forma estruturada através de declarações no formato de sujeito, predicado e objeto.
2) Ele visa permitir que as máquinas processem e entendam o significado dos dados na web semântica através de metadados expressos em RDF.
3) O RDF utiliza URIs para identificar recursos e descrevê-
O artigo fala sobre a Web Semântica e as melhorias que são possíveis serem feitas no HTML adicionando metadados, que são ocultos para o usuário mas altamente visíveis para os buscadores. Junto com o HTML5, aumenta o peso semântico no conteúdo, também propiciando um melhor resultado nas buscas e preparando o site para possíveis serviços da WEB no futuro
O documento discute a Web Semântica, incluindo suas vantagens sobre a Web atual, como a adição de significado aos dados através de ontologias e metadados. Isso permite buscas mais precisas e a ligação de dados entre diferentes sites e bases de dados. Exemplos como a BestBuy e a BBC mostram como isso pode melhorar o SEO e a reutilização de informações.
Este documento descreve um sistema para organizar e visualizar recursos de informação na Web usando metadados RDF e geometria hiperbólica. O sistema mapeia metadados de recursos da Agência de Informação Embrapa para gerar uma árvore hiperbólica, permitindo aos usuários navegar relações semânticas entre documentos. Os resultados sugerem que essa abordagem pode facilitar o acesso a informações relacionadas através de similaridades semânticas.
O documento discute como integrar a Web Semântica e a Web Social usando PHP. Ele explica o que é a Web Semântica e como garantir semântica na Web, além de como interpretar o significado dos dados usando identificação, definição, estrutura e consultas. Também aborda serviços Web, redes sociais online, ferramentas PHP e conclusões sobre como manipular padrões da Web Semântica e acessar recursos de redes sociais.
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Uma introdução aos conceitos da web semântica, mostrando conceitos de construção de uma Ontologia, apresentando o Schema.org e mostrando cases de sucesso de tais tecnologias.
A historia da internet - linha do tenpo Diego Lunna
O documento traça a linha do tempo do surgimento da internet desde 1957 até os dias atuais. Ele descreve como pesquisadores desenvolveram os primeiros protocolos de comunicação em rede na década de 1960 e como a internet chegou ao Brasil na década de 1980. Também destaca o surgimento de ferramentas importantes como o e-mail, HTTP, Google e redes sociais como Facebook e Twitter.
Diretórios foram criados para organizar recursos da Web quando seu conteúdo era pequeno o suficiente para coleta manual. Máquinas de busca rastreiam a Web para localizar e catalogar páginas e sites sem intervenção humana direta. O sucesso de um site está relacionado à sua quantidade de tráfego, e máquinas de busca levam isso em consideração ao classificar resultados.
Reformulação de consultas sparql no padrão linked dataLeonardo Ribeiro
Este documento discute a Web Semântica e Linked Data. Explica como os dados estão publicados na Web atualmente e as deficiências dessa abordagem. Apresenta como ontologias, URIs e RDF podem ser usados para ligar dados de diferentes fontes e torná-los mais facilmente integráveis. Também descreve SPARQL como uma linguagem para consultar dados RDF e exemplos de aplicações que usam Linked Data.
Crossref Content Registration in Brazilian Portuguese pt-1Crossref
Este documento fornece informações sobre o registro de conteúdo no Crossref, incluindo por que os editores se juntam, como criar identificadores DOI persistentes, como registrar diferentes tipos de conteúdo e metadados, e como manter os registros atualizados.
Obtendo Informação Útil em Dados Semi-Estruturados da WebLuiz Matos
Trata da Mineração Web, do uso dos microformatos e da ferramenta MicroMining - um ambiente web para a mineração de conteúdo de revisões usando o hReview. Foi realizado um exemplo prático com o Weka.
O documento discute sistemas de federação e abordagens para consultar múltiplos datasets de dados ligados. Apresenta duas abordagens principais: data warehousing, que armazena dados em um repositório central, e consultas federadas, que processam consultas distribuídas sobre várias fontes de dados. Consultas federadas têm vantagens como dados mais atualizados e uso de recursos de rede, enquanto data warehousing oferece melhor desempenho, mas dados podem ficar desatualizados.
Registering and adding to your metadata at Crossref - in PortugueseCrossref
Slides from Portuguese webinar given by Edilson Damasio on content registration and updating metadata at Crossref using different tools like Metadata Manager.
Este documento fornece uma introdução sobre serviços RESTful e mashups. Resume as seguintes informações essenciais:
1) Apresenta os conceitos fundamentais de arquitetura REST e como serviços RESTful funcionam;
2) Discutem a API JAX-RS para construir serviços RESTful em Java;
3) Explicam como consumir e testar serviços RESTful usando ferramentas como RESTClient, cURL e bibliotecas JavaScript;
4) Introduzem o conceito de mashups e como agregam conteúdo de v
O documento fornece uma visão geral da história, características e componentes da plataforma Java. Descreve a evolução da linguagem desde seu desenvolvimento inicial em 1991 até as principais versões lançadas. Explica também os principais mitos sobre Java e ressalta suas características como orientação a objetos, independência de plataforma, segurança e desempenho.
Um arquivo JAR agrupa várias classes Java em um único arquivo compactado para facilitar a distribuição de aplicações. Um JAR usa compressão zip para compactar classes e outros arquivos. Pode ser criado manualmente usando o programa jar ou ferramentas como Ant e Maven automatizam o processo de criação e publicação de JARs. O Eclipse também permite gerar JARs de forma simples através da opção Export.
O documento apresenta uma introdução ao PHP, abordando tópicos como sintaxe básica, variáveis, tipos de dados, estruturas de controle e funções. É apresentado o "Olá, Mundo" em PHP, comentários, comandos de saída, concatenação, variáveis, tipos numéricos, strings, arrays, laços, escopo e constantes.
O documento descreve como gerar documentação Javadoc para classes Java a partir de comentários no código e tags como @author, @param e @return. Explica que o Javadoc é gerado usando o comando javadoc na linha de comando ou no Eclipse e permite formatar a documentação usando HTML.
O documento descreve o Easy Rails, uma ferramenta que facilita a instalação e uso do framework Ruby on Rails em Windows e Linux. O Easy Rails é compacto, portátil, gratuito e não requer configurações complexas ou permissões administrativas, tornando o Rails acessível para estudantes e desenvolvedores com recursos limitados. O autor também discute projetos relacionados e agradece à comunidade por seu apoio.
O documento descreve como definir tipos de dados personalizados em Pascal usando a palavra-chave TYPE. Ele fornece exemplos de tipos definidos pelo usuário como matrizes, vetores, registros e cadeias de caracteres, e mostra como criá-los e usá-los em variáveis e procedimentos.
O documento resume a evolução dos sistemas de gerenciamento de dados, desde os primórdios dos bancos de dados até os sistemas atuais de grande escala. Começa com os modelos de rede e ISAM nos anos 1960, passa pelo modelo relacional e sistemas como System R e Ingres, a popularização dos SGBDs relacionais, e as limitações impostas pelas novas aplicações da Web. Apresenta então o renascimento dos sistemas de armazenamento chave-valor, projetos como Bigtable e Dynamo, e a categoria de sistemas
O documento discute conceitos de programação orientada a objetos em PHP, incluindo classes, objetos, herança, métodos estáticos e não estáticos, construtores, destrutores, visibilidade, constantes e exceções.
O documento fornece uma introdução à arquitetura da Web, incluindo protocolos TCP/IP e HTTP, comunicação cliente-servidor, endereços IP e portas. Também discute o funcionamento básico do servidor e cliente Web, URLs, e ferramentas como XAMPP para desenvolvimento local.
O artigo fala sobre a Web Semântica e as melhorias que são possíveis serem feitas no HTML adicionando metadados, que são ocultos para o usuário mas altamente visíveis para os buscadores. Junto com o HTML5, aumenta o peso semântico no conteúdo, também propiciando um melhor resultado nas buscas e preparando o site para possíveis serviços da WEB no futuro
O documento discute a Web Semântica, incluindo suas vantagens sobre a Web atual, como a adição de significado aos dados através de ontologias e metadados. Isso permite buscas mais precisas e a ligação de dados entre diferentes sites e bases de dados. Exemplos como a BestBuy e a BBC mostram como isso pode melhorar o SEO e a reutilização de informações.
Este documento descreve um sistema para organizar e visualizar recursos de informação na Web usando metadados RDF e geometria hiperbólica. O sistema mapeia metadados de recursos da Agência de Informação Embrapa para gerar uma árvore hiperbólica, permitindo aos usuários navegar relações semânticas entre documentos. Os resultados sugerem que essa abordagem pode facilitar o acesso a informações relacionadas através de similaridades semânticas.
O documento discute como integrar a Web Semântica e a Web Social usando PHP. Ele explica o que é a Web Semântica e como garantir semântica na Web, além de como interpretar o significado dos dados usando identificação, definição, estrutura e consultas. Também aborda serviços Web, redes sociais online, ferramentas PHP e conclusões sobre como manipular padrões da Web Semântica e acessar recursos de redes sociais.
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Uma introdução aos conceitos da web semântica, mostrando conceitos de construção de uma Ontologia, apresentando o Schema.org e mostrando cases de sucesso de tais tecnologias.
A historia da internet - linha do tenpo Diego Lunna
O documento traça a linha do tempo do surgimento da internet desde 1957 até os dias atuais. Ele descreve como pesquisadores desenvolveram os primeiros protocolos de comunicação em rede na década de 1960 e como a internet chegou ao Brasil na década de 1980. Também destaca o surgimento de ferramentas importantes como o e-mail, HTTP, Google e redes sociais como Facebook e Twitter.
Diretórios foram criados para organizar recursos da Web quando seu conteúdo era pequeno o suficiente para coleta manual. Máquinas de busca rastreiam a Web para localizar e catalogar páginas e sites sem intervenção humana direta. O sucesso de um site está relacionado à sua quantidade de tráfego, e máquinas de busca levam isso em consideração ao classificar resultados.
Reformulação de consultas sparql no padrão linked dataLeonardo Ribeiro
Este documento discute a Web Semântica e Linked Data. Explica como os dados estão publicados na Web atualmente e as deficiências dessa abordagem. Apresenta como ontologias, URIs e RDF podem ser usados para ligar dados de diferentes fontes e torná-los mais facilmente integráveis. Também descreve SPARQL como uma linguagem para consultar dados RDF e exemplos de aplicações que usam Linked Data.
Crossref Content Registration in Brazilian Portuguese pt-1Crossref
Este documento fornece informações sobre o registro de conteúdo no Crossref, incluindo por que os editores se juntam, como criar identificadores DOI persistentes, como registrar diferentes tipos de conteúdo e metadados, e como manter os registros atualizados.
Obtendo Informação Útil em Dados Semi-Estruturados da WebLuiz Matos
Trata da Mineração Web, do uso dos microformatos e da ferramenta MicroMining - um ambiente web para a mineração de conteúdo de revisões usando o hReview. Foi realizado um exemplo prático com o Weka.
O documento discute sistemas de federação e abordagens para consultar múltiplos datasets de dados ligados. Apresenta duas abordagens principais: data warehousing, que armazena dados em um repositório central, e consultas federadas, que processam consultas distribuídas sobre várias fontes de dados. Consultas federadas têm vantagens como dados mais atualizados e uso de recursos de rede, enquanto data warehousing oferece melhor desempenho, mas dados podem ficar desatualizados.
Registering and adding to your metadata at Crossref - in PortugueseCrossref
Slides from Portuguese webinar given by Edilson Damasio on content registration and updating metadata at Crossref using different tools like Metadata Manager.
Este documento fornece uma introdução sobre serviços RESTful e mashups. Resume as seguintes informações essenciais:
1) Apresenta os conceitos fundamentais de arquitetura REST e como serviços RESTful funcionam;
2) Discutem a API JAX-RS para construir serviços RESTful em Java;
3) Explicam como consumir e testar serviços RESTful usando ferramentas como RESTClient, cURL e bibliotecas JavaScript;
4) Introduzem o conceito de mashups e como agregam conteúdo de v
O documento fornece uma visão geral da história, características e componentes da plataforma Java. Descreve a evolução da linguagem desde seu desenvolvimento inicial em 1991 até as principais versões lançadas. Explica também os principais mitos sobre Java e ressalta suas características como orientação a objetos, independência de plataforma, segurança e desempenho.
Um arquivo JAR agrupa várias classes Java em um único arquivo compactado para facilitar a distribuição de aplicações. Um JAR usa compressão zip para compactar classes e outros arquivos. Pode ser criado manualmente usando o programa jar ou ferramentas como Ant e Maven automatizam o processo de criação e publicação de JARs. O Eclipse também permite gerar JARs de forma simples através da opção Export.
O documento apresenta uma introdução ao PHP, abordando tópicos como sintaxe básica, variáveis, tipos de dados, estruturas de controle e funções. É apresentado o "Olá, Mundo" em PHP, comentários, comandos de saída, concatenação, variáveis, tipos numéricos, strings, arrays, laços, escopo e constantes.
O documento descreve como gerar documentação Javadoc para classes Java a partir de comentários no código e tags como @author, @param e @return. Explica que o Javadoc é gerado usando o comando javadoc na linha de comando ou no Eclipse e permite formatar a documentação usando HTML.
O documento descreve o Easy Rails, uma ferramenta que facilita a instalação e uso do framework Ruby on Rails em Windows e Linux. O Easy Rails é compacto, portátil, gratuito e não requer configurações complexas ou permissões administrativas, tornando o Rails acessível para estudantes e desenvolvedores com recursos limitados. O autor também discute projetos relacionados e agradece à comunidade por seu apoio.
O documento descreve como definir tipos de dados personalizados em Pascal usando a palavra-chave TYPE. Ele fornece exemplos de tipos definidos pelo usuário como matrizes, vetores, registros e cadeias de caracteres, e mostra como criá-los e usá-los em variáveis e procedimentos.
O documento resume a evolução dos sistemas de gerenciamento de dados, desde os primórdios dos bancos de dados até os sistemas atuais de grande escala. Começa com os modelos de rede e ISAM nos anos 1960, passa pelo modelo relacional e sistemas como System R e Ingres, a popularização dos SGBDs relacionais, e as limitações impostas pelas novas aplicações da Web. Apresenta então o renascimento dos sistemas de armazenamento chave-valor, projetos como Bigtable e Dynamo, e a categoria de sistemas
O documento discute conceitos de programação orientada a objetos em PHP, incluindo classes, objetos, herança, métodos estáticos e não estáticos, construtores, destrutores, visibilidade, constantes e exceções.
O documento fornece uma introdução à arquitetura da Web, incluindo protocolos TCP/IP e HTTP, comunicação cliente-servidor, endereços IP e portas. Também discute o funcionamento básico do servidor e cliente Web, URLs, e ferramentas como XAMPP para desenvolvimento local.
PDO é uma interface para acesso a bancos de dados que suporta múltiplos bancos de dados, como MySQL, PostgreSQL e SQLite. Ele permite preparar consultas e executá-las de forma segura, além de oferecer conexões persistentes e parâmetros nomeados. Exemplos demonstram como se conectar ao MySQL usando PDO, executar consultas preparadas e inserir dados.
O documento fornece uma visão geral da linguagem de programação PHP, descrevendo sua história, características, popularidade e usos. PHP é uma linguagem interpretada e de script usada principalmente para desenvolvimento web e é uma das linguagens mais populares do mundo.
O documento discute conceitos de programação web em PHP, incluindo sessões, cookies, cabeçalhos HTTP, autenticação e autorização. Ele explica como sessões e cookies podem ser usados para armazenar informações do usuário e como funções como session_start() iniciam sessões.
O documento descreve o que é um coding dojo, que é um encontro onde programadores se reúnem para trabalhar em desafios de programação com o objetivo de aprender, praticar e ensinar. Os principais pontos são: aprendizado contínuo em ambiente colaborativo e não competitivo, prática de programação em pares e retrospectivas para melhoria.
O documento descreve as características e funcionalidades da linguagem de programação Ruby. Apresenta sua história, criador, implementações, tipos de dados suportados e estruturas de controle. Explica conceitos como orientação a objetos, variáveis, constantes, operadores, comentários e entrada/saída. Detalha a instalação do Ruby e como testá-lo usando o interpretador interativo IRB.
O documento descreve a arquitetura MVC (Modelo, Visão, Controlador) para desenvolvimento web em PHP. MVC separa a aplicação em três camadas: Modelo para dados, Visão para apresentação e Controlador para lidar com entradas do usuário. O documento também apresenta exemplos simples de implementação de MVC em PHP.
O documento discute o gerenciamento de memória pela máquina virtual Java, incluindo alocação de recursos, reciclagem, fragmentação, recolocação, compactação e gerenciamento automático. Também aborda o heap, com as gerações jovem e velha, e os algoritmos de coleta de lixo como paralelo, concorrente e compactante.
O documento discute o design responsivo para websites, propondo uma abordagem flexível com grid, imagens e media queries que permitem a adaptação do layout a diferentes telas. O design responsivo garante que a web seja acessível em qualquer dispositivo.
Paradigmas de Linguagens de Programação - Biblioteca de Classes e Frameworks Adriano Teixeira de Souza
Os frameworks fornecem infraestrutura de projeto que reduz o tempo para produção de aplicações, aumentando o reuso de design, código e testes. Frameworks definem a arquitetura e fluxo de execução das aplicações, liberando o desenvolvedor para estender o comportamento do framework.
O documento discute os princípios do Linked Data para publicação e compartilhamento de dados na Web. Ele explica como os Linked Data utilizam URIs para identificar recursos e o modelo RDF para estruturar as informações, permitindo a integração de dados de diferentes fontes através de links entre os recursos.
O documento apresenta os principais conceitos da Web Semântica, incluindo:
1) A Web Semântica visa estruturar as informações da web de forma a permitir que máquinas e pessoas trabalhem melhor em conjunto, compreendendo melhor o significado dos dados;
2) Isso é feito através de padrões como RDF, microdados e ontologias que vinculam e relacionam dados de forma semântica;
3) A Web Semântica permite correlacionar e agregar dados de diferentes locais da web.
O documento descreve os principais conceitos e tecnologias da Web Semântica, incluindo ontologias, RDF, OWL e microformatos, que visam dar significado semântico ao conteúdo da Web para que máquinas possam processá-lo e interpretá-lo.
Este documento apresenta uma introdução à disciplina de Web Semântica e Ontologias, descrevendo seu objetivo de permitir que máquinas entendam melhor os dados da web através da adição de semântica. Explica a diferença entre a web de documentos e a web de dados, e como a web semântica visa embutir significado nos dados para que computadores possam interpretá-los de forma mais precisa.
Palestra Dia da Liberdade dos Documentos - 2011-03-30UEPA
Este documento apresenta uma breve história da Web, desde a primeira geração (Web 1.0) até a terceira geração (Web Semântica). Também discute padrões abertos para a Web Semântica como RDF, OWL e ontologias, e como esses padrões podem ser usados para publicar dados abertos do governo de forma a permitir sua reutilização.
O documento introduz o conceito de Linked Data, que refere-se a um conjunto de práticas para publicar e conectar dados estruturados na Web de forma a criar uma "Web de Dados". O objetivo é organizar semanticamente os dados para permitir a leitura automática por agentes de software através da linguagem SPARQL. Os princípios do Linked Data incluem usar URIs para identificar recursos, usar URIs HTTP para que pessoas possam encontrar esses nomes, representar as informações no formato RDF e incluir links para outros recursos.
Microformats e Web Semântica, transformando seu site para web 3.0 - Road Show...Renato Bongiorno Bonfanti
O documento discute como adicionar semântica a sites através de microformatos, RDFa e GRDDL, permitindo que máquinas entendam melhor os dados. Ele explica que microformatos e RDFa permitem adicionar metadados a páginas HTML de forma fácil e que GRDDL permite converter esses dados para RDF.
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...Leandro Borges
O documento descreve a evolução dos sistemas de busca na internet, desde os primeiros buscadores até os atuais sistemas de big data. Também discute novas tecnologias emergentes como ontologias, linked data e web semântica.
O documento descreve o Resource Description Framework (RDF), incluindo sua definição como uma estrutura para codificar, trocar e reutilizar metadados estruturados usando URIs. O RDF usa declarações de sujeito, predicado e objeto para descrever recursos e suas propriedades, permitindo que os recursos sejam relacionados através de um grafo. Exemplos de uso do RDF e ferramentas para desenvolvimento também são discutidos.
Descrição de recursos em wikis semânticos: dados em RDF para Linked Data
Jaider Andrade Ferreira
Mestrando em Ciência da Informação
Orientadora: Plácida L. V. A. da C. Santos
O documento descreve a Web 3.0 como uma organização mais inteligente do conhecimento disponível na internet, onde as máquinas poderão entender melhor o contexto das informações usando tecnologias como XML, RDF e OWL. Isso trará benefícios como maior precisão em buscas e integração de informações.
O documento discute a Web 3.0 ou Web Semântica, que visa organizar e usar de forma inteligente o conhecimento disponível na Internet. Isso será possível representando os dados nos documentos de uma forma que as máquinas possam compreender, tornando as informações mais precisas e os sistemas de busca mais eficientes. Tecnologias como XML, RDF e OWL são essenciais para a Web Semântica.
1) Um web crawler é um programa que navega automaticamente pela web coletando informações de páginas como links, tags e palavras-chaves.
2) Crawlers para a web semântica coletam dados em formatos como RDF usando relacionamentos como rdfs:seeAlso ao invés de apenas hiperlinks HTML.
3) Exemplos de crawlers para a web atual incluem Googlebot, Scrapy e Nutch, enquanto LDSpider, Slug e OntoBroker são para a web semântica.
O documento discute a importância dos dados abertos e como eles podem ser usados para criar novas aplicações e insights. Ele explica como o governo brasileiro tem trabalhado para publicar e integrar dados abertos através de iniciativas como a INDA e o catálogo dados.gov.br. Também descreve as tecnologias e padrões como DCAT, RDF e SPARQL que permitem a interoperabilidade dos dados abertos.
Este documento discute as perspectivas da Web Semântica para a Biblioteconomia em 3 frases: Introduz a Web Semântica como uma proposta para tornar as informações compreensíveis por máquinas através de semântica. Discute como os conhecimentos da Biblioteconomia como catalogação e indexação evoluem para a Web Semântica através do uso de padrões como Dublin Core. Conclui que a Biblioteconomia e a Web Semântica objetivam aperfeiçoar a recuperação da informação para os usu
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem baseada em ontologias e dados ligados - Cristina Ribeiro, João Lopes, João Silva, João Castro, Ricardo Amorim
O documento discute os fundamentos da HTML5, incluindo tags semânticas, links descritivos, meta tags e formas de adicionar semântica a documentos HTML como RDFa, Microformats e Microdata. Apresenta exemplos dessas técnicas e discute como elas melhoram a acessibilidade e o desempenho de sites.
Projeto Piloto de Web Semântica com Dados da Secretaria da SaúdeinovaDay .
O documento descreve o projeto SPUK (SP + UK Project for Design Abertura) que tem como objetivo melhorar o ambiente de negócios em São Paulo por meio da transparência no governo estadual, se inspirando na experiência do Reino Unido. O projeto visa intensificar o programa de transparência do estado, gerenciando dados abertos para uso tanto por negócios quanto pela sociedade civil.
O documento discute técnicas para lidar com dados de alta dimensionalidade, incluindo redução de dimensionalidade linear como PCA e não-linear como Isomap. Exemplos demonstram como PCA pode ser usado para reduzir a dimensionalidade de imagens de rostos e documentos de texto, preservando a maior parte da variância. Métodos não-lineares são necessários quando os dados não são linearmente separáveis.
O documento discute o framework PHP CodeIgniter. Ele fornece uma estrutura leve e flexível para desenvolvimento web com foco em performance, baixo acoplamento e simplicidade. CodeIgniter usa arquitetura MVC, URLs amigáveis e diversos recursos como acesso a banco de dados e envio de email.
O documento descreve os principais aspectos de um framework MVC para desenvolvimento web. Ele fornece uma estrutura comum para elementos recorrentes em aplicações, como controle de acesso, banco de dados e visualização de páginas. A estrutura de diretórios padrão inclui configurações, controladores, modelos, visões e layouts. O arquivo index.php é o ponto de entrada para todas as requisições.
O documento discute várias opções para acessar o banco de dados MySQL no PHP, incluindo as extensões MySQL, MySQLi e PDO, além de bibliotecas como ADOdb e PEAR. Também apresenta exemplos básicos de conexão, seleção de banco de dados, execução de consultas e operações CRUD.
O documento apresenta exemplos de códigos PHP para gerar imagens dinâmicas e CAPTCHAs utilizando a biblioteca GD, incluindo uma função para escrever texto em imagens e códigos para criar imagens CAPTCHA com linhas e números aleatórios.
O documento discute conceitos importantes de programação web com PHP, incluindo sessões, cookies, cabeçalhos HTTP, autenticação e autorização. Sessões permitem armazenar informações do usuário no servidor para várias páginas. Cookies armazenam informações no navegador do usuário. Cabeçalhos HTTP controlam redirecionamentos e autenticação básica. Autenticação verifica a identidade do usuário e autorização controla o acesso a recursos.
Este documento fornece uma introdução às principais funcionalidades da linguagem PHP, incluindo:
1) Sintaxe básica como delimitadores de código, comentários e comandos de saída;
2) Variáveis, tipos de dados e operadores;
3) Estruturas de controle como condicionais e laços;
4) Funções.
O documento fornece uma introdução à arquitetura da Web, incluindo protocolos TCP/IP e HTTP, comunicação cliente-servidor, endereços IP e portas. Também discute o funcionamento básico do servidor e cliente Web, URLs, e ferramentas como XAMPP para desenvolvimento local.
O documento fornece uma visão geral da linguagem de programação PHP, descrevendo sua história, características, popularidade e usos. PHP é uma linguagem interpretada e de script usada principalmente para desenvolvimento web e é uma das linguagens mais populares atualmente.
A plataforma Java foi desenvolvida inicialmente pela Sun Microsystems como uma linguagem para dispositivos móveis e evoluiu para ser independente de plataforma. Sua arquitetura é baseada na máquina virtual Java (JVM) e na API Java. As principais características da plataforma Java incluem orientação a objetos, portabilidade, segurança e distribuição.
O documento fornece uma visão geral da linguagem de programação PHP, descrevendo sua história, características, popularidade e usos. PHP é uma linguagem interpretada e de script usada principalmente para desenvolvimento web e é uma das linguagens mais populares atualmente.
Este documento fornece estatísticas sobre a popularidade e uso extensivo da linguagem de programação Java. Ele destaca que Java é atualmente a linguagem mais popular segundo o índice Tiobe e fornece números sobre o uso de Java em computadores, celulares, servidores e outros dispositivos. O documento também recomenda recursos educacionais gratuitos sobre Java.
Este documento descreve um plano de curso para a disciplina de Programação Orientada a Objetos utilizando a linguagem Java. O curso visa ensinar conceitos básicos de POO como classes, objetos, encapsulamento, herança e polimorfismo utilizando Java. Os alunos aprenderão a desenvolver aplicações gráficas com acesso a bancos de dados relacionais usando a API Swing e JDBC.
O documento descreve as principais opções e métodos para acesso a bancos de dados MySQL utilizando a linguagem PHP, incluindo extensões como MySQL, MySQLi e PDO, além de bibliotecas como ADOdb e PEAR. Também apresenta exemplos de código para realizar operações básicas de CRUD (create, read, update e delete) em uma tabela de exemplo chamada "pessoas".
O documento discute conceitos de programação orientada a objetos em PHP, incluindo classes, objetos, herança, métodos, construtores, destrutores, visibilidade, operador de resolução de escopo, inicializações, membros de classe, constantes, classes abstratas, interfaces, métodos finais e clonagem de objetos.
1. Linked Data:
Construindo um Espaço
de Dados Global na Web
Regis Pires Magalhães
José Antônio F. de Macêdo
Vânia Maria Ponte Vidal
{regispires, jose.macedo, vvidal}@lia.ufc.br
2. Agenda
• Introdução
• Fundamentos de Linked Data
• Publicação de Linked Data
• Melhores práticas para publicação de
Linked Data
• Consumo de Linked Data
• Limitações e Desafios
• Conclusão
• Referências
5. Problemas
• As pessoas não estão interessadas em
documentos, mas em coisas que estão neles.
• As pessoas podem analisar os documentos para
extrair significado.
▫ As máquinas ainda não fazem isso de forma viável.
▫ HTML define a estrutura de um documento, mas
não explica o seu significado.
• Como permitir que máquinas compreendam os
dados publicados na Web?
▫ Precisamos de mecanismos para descrição
semantica dos dados
6. Como os dados estão publicados na
Web?
• Diversos modelos/formatos:
▫ HTML, Bancos de dados relacionais, XML, CSV,
XLS, PDF, ...
• Problemas:
▫ Diferentes formatos
▫ Diferentes modelos de dados
▫ Nomes diferentes com o mesmo significado
▫ Ausência de vínculos entre fontes de dados
diferentes
• Conclusão:
▫ Dificuldade para consumir e integrar os dados
8. Web Atual
“A Web atual deixou de ser apenas um espaço
global de documentos interligados e está se
tornando um enorme espaço global de dados
vinculados constituído de bilhões de triplas RDF
que cobrem os mais variados domínios.”
Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a
Global Data Space. Morgan & Claypool, 1st edition.
9. Linked Data
“O termo Linked Data se refere a um conjunto
das melhores praticas para publicação e conexão
de dados estruturados na Web.”
Bizer, C., Heath, T., and Berners-Lee, T. (2009).
Linked Data - The Story So Far.
10. Projeto Linking Open Data
• Esforço espontâneo e voluntário da comunidade
iniciado em janeiro de 2007.
• Objetivo principal:
▫ Desenvolver Linked Data a partir da identificação
de dados existentes sob licença livre e convertê-los
para RDF de acordo com os princípios do Linked
Data.
12. Linked Open Data Cloud – Set/2010
http://richard.cyganiak.de/2007/10/lod/
13. LOD – Outubro de 2010
• 207 conjuntos de dados
• Mais de 28 bilhões de triplas RDF
• Aproximadamente 395 milhões de links RDF
• Vários domínios
14. Workshop Linked Data on the Web
(LDOW)
• Importante iniciativa dentro da programação da
International World Wide Web Conference
(WWW) a partir de 2008.
18. Linked Data
“Linked Data é um conjunto de melhores práticas
para publicação e conexão de dados estruturados
na Web, permitindo estabelecer links entre itens
de diferentes fontes de dados para formar um
único espaço de dados global.”
Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a
Global Data Space. Morgan & Claypool, 1st edition.
19. Início
• O pontapé inicial para essas melhores práticas
foram os princípios de Linked Data
estabelecidos por Tim Berners Lee em 2006.
Tim Berners-Lee 2006
http://www.w3.org/DesignIssues/LinkedData.html
20. Princípios de Linked Data
1. Usar URIs como nomes para coisas.
2. URIs HTTP para que as pessoas possam
procurar (dereferenciar) esses nomes.
3. Quando alguém procurar uma URI, prover
informação útil, usando os padrões (RDF,
SPARQL).
4. Incluir links para outras URIs, de modo que
possam permitir a descoberta de mais
informação.
Tim Berners-Lee 2006
http://www.w3.org/DesignIssues/LinkedData.html
21. Boas práticas
• Os princípios foram estendidos por documentos
originados a partir das experiências da
comunidade de Linked Data, resultando em boas
práticas de publicação e consumo de Linked
Data.
• Documentos importantes:
▫ Bizer, C., Cyganiak, R., and Heath, T. (2007). How to
Publish Linked Data on the Web.
http://www4.wiwiss.fu-
berlin.de/bizer/pub/LinkedDataTutorial/.
▫ Sauermann, L. and Cyganiak, R. (2008). Cool URIs for
the Semantic Web. http://www.w3.org/TR/cooluris/.
22. Web de Dados
• Linked Data torna a Web um enorme banco de
dados global:
▫ O Espaço de Dados Global é chamado de Web de
Dados.
• A Web de Dados forma um imenso grafo global
constituído de bilhões de triplas RDF de várias
fontes cobrindo os mais variados domínios.
23. Web de Dados: características
• Genérica e pode conter qualquer tipo de dado;
• Qualquer pessoa pode publicar dados;
• Não há restrições para seleção de vocabulários;
• Dados são auto-descritos;
• Mecanismo padrão de acesso aos dados (HTTP) e
modelo de dados padrão (RDF) simplificam o acesso aos
dados;
• Aplicações que usam a Web de dados não se limitam a
um conjunto fixo de fontes de dados, podendo inclusive
descobrir novas fontes em tempo de execução.
24. Web de Documentos x Web de Dados
Web de Documentos Web de Dados
Navegadores HTML Navegadores RDF
Links HTML conectando Links RDF interligando dados
documentos
Mecanismo de identificação - URIs Mecanismo de identificação – URIs
Mecanismo de acesso – HTTP Mecanismo de acesso – HTTP
Formato de conteúdo – HTML Modelo de dados – RDF
– Linguagem de consulta – SPARQL
25. Padrões usados em Linked Data
• URIs – identificam objetos e conceitos,
permitindo que eles sejam dereferenciados
para obtenção de informações a seu respeito.
• HTTP – Mecanismo de acesso universal
• RDF – Modelo de dados descentralizado
comum baseado em grafo
• SPARQL – Linguagem e protocolo para
consulta sobre grafos RDF
26. Negociação de Conteúdo
http://www4.wiwiss.fu-berlin.de/factbook/resource/Russia
A(URI identifying the non-information resource Russia)
complete example of a HTTP session for dereferencing a URI identifying a non-information
http://www4.wiwiss.fu-berlin.de/factbook/data/Russia
resource is given in Appendix A.
(information resource with an RDF/XML representation describing Russia)
http://www4.wiwiss.fu-berlin.de/factbook/page/Russia
URI Aliases resource with an HTML representation describing Russia)
(information
27. URI Alias – owl:sameAs
prefix owl: <http://www.w3.org/2002/07/owl#>
Sujeito: http://www.w3.org/People/Berners-Lee/card#i
Predicado: http://www.w3.org/2002/07/owl#sameAs
Obj: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
Sujeito: http://dbpedia.org/resource/Tim_Berners-Lee
Predicado: http://www.w3.org/2002/07/owl#sameAs
Obj: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007
28. Padrões usados em Linked Data
▫ Modelo RDF
A utilização um modelo de dados comum torna
possível a implementação de aplicações genéricas
capazes de operar sobre o espaço de dados global
[Heath and Bizer 2011] .
Descentralizado, baseado em grafo e extensível,
com alto nível de expressividade e permitindo a
interligação entre conjuntos de dados através de
Links RDF.
Armazenamento através de grafo em memória,
arquivo texto ou RDF Triple Store.
30. browser dereferences this URI over the Web, asking for con
displays the retrieved information (click here to have Disco
that he is based near Berlin, using the DBpedia URI http://d
RDF for the non-information resource Berlin. As the surfer is inte
Link
dereference this URI by clicking on it. The browser now der
application/rdf+xml .
33. RDF: Formatos de Serialização
• RDF/XML
▫ Mais antigo e mais amplamente usado.
▫ Prolixo e pouco legível para o ser humano.
• N3 (Notation 3) [Berners-Lee 1998]
▫ Mais expressivo que RDF/XML.
• Turtle [Beckett 2007]
▫ Subconjunto de N3.
• N-Triples
▫ Subconjunto de N3 e Turtle
▫ Não possui alguns atalhos dos outros formatos como
recursos aninhados e URIs compactas
Termina ficando prolixo, mas simples para fazer parse.
• RDFa
▫ RDF embutido em HTML
• JSON
34. Grafo RDF e sua representação em
Turtle
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix ex: <http://example.org#> .
<http://scott.com/> dc:creator <http://scott.com/foaf.rdf#me> .
<http://scott.com/foaf.rdf#me> foaf:homepage <http://scott.com/> .
<http://scott.com/foaf.rdf#me> foaf:name "John Scott" .
<http://scott.com/foaf.rdf#me> foaf:mbox <mailto:js@gmx.com> .
Fonte: Langegger, A. (2010). A Flexible Architecture for Virtual Information Integration
based on Semantic Web Concepts. PhD thesis, J. Kepler University Linz.
35. RDFa
• Marcações semânticas adicionadas ao HTML:
<p xmlns:dc="http://purl.org/dc/elements/1.1/"
about="http://www.example.com/books/wikinomics">
No seu último livro
<i property="dc:title">Wikinomics</i>,
<span property="dc:author">Don Tapscott</span>
explica as mudanças profundas tecnológicas,
demográficas e de negócios.
Este livro será publicado em
<span property="dc:date" content="2006-10-01">October 2006</span>.
</p>
40. Grafo RDF usando vocabulario FOAF
Imagem: Langegger, A. (2010). A Flexible Architecture for Virtual Information Integration
based on Semantic Web Concepts. PhD thesis, J. Kepler University Linz.
41. Padrões usados em Linked Data
• Protocolo e Linguagem SPARQL
▫ Linguagem de consulta de alto nível
[Prud’hommeaux and Seaborne 2008] para
recuperação de informações contidas em grafos
RDF.
▫ Protocolo [Clark et al. 2008] usado para enviar
consultas e recuperar resultados através do
protocolo HTTP.
▫ Fontes Linked Data tipicamente fornecem um
SPARQL Endpoint que é um serviço Web com
suporte ao protocolo SPARQL.
45. Triple ou Quad Store?
• Normalmente Triple Stores são de fato Quad
Stores pois suportam Named Graphs.
• Named Graph é simplesmente uma coleção de
triplas RDF nomeada por uma URI que
identifica o grafo.
▫ Usado para manter a proveniência dos dados
RDF.
46. OpenLink Virtuoso RDF Triple Store
• Native RDF Store.
• Licença: Open source e proprietária.
• Servidor web e endpoint SPARQL.
• Suporta bilhões de triplas.
• Usado para armazenamento de DBpedia,
data.gov, etc.
47. AllegroGraph
• Alto desempenho
▫ Suporte a bilhões de triplas com bom
desempenho.
• Uso eficiente de memória.
• Suporta SPARQL, RDFS++ e Prolog reasoning.
• Tipos geo-espaciais e temporais nativos.
• Reasoning Geospatial e Temporal eficientes.
• Suporte a análise de redes sociais.
• Gerenciador de armazenamento em nuvem
(Amazon EC2)
48. OWLIM (http://www.ontotext.com/owlim)
• RDF Store (Native) proprietária.
• Implementado em Java.
• Compatível com Sesame e Jena.
• Suporte a reasoning robusto e transparente (RDFS, OWL Horst
and OWL 2 RL).
• Alta escalabilidade e excelente desempenho comparado a outras
alternativas.
• Extensões geo-espaciais eficientes.
• Versões:
▫ OWLIM-Lite – gratuito para qualquer uso.
Suporta dezenas de milhões de triplas.
▫ OWLIM-SE – gratuito para pesquisa e avaliação.
Suporta dezenas de bilhões de triplas.
▫ OWLIM-Enterprise – comercial.
Replication Cluster com balanceamento de carga e recuperação de
falhas.
49. RDF Benchmarks
http://www.w3.org/wiki/RdfStoreBenchmarking
• Comparam a performance de sistemas de
armazenamento que expõem SPARQL Endpoints,
sejam RDF Stores ou não.
• Berlin SPARQL Benchmark (BSBM)
▫ http://www4.wiwiss.fu-berlin.de/bizer/BerlinSPARQLBenchmark/
• Lehigh University Benchmark (LUBM)
▫ http://swat.cse.lehigh.edu/projects/lubm/
• SP²Bench SPARQL Performance Benchmark
(SP2B)
▫ http://dbis.informatik.uni-freiburg.de/index.php?project=SP2B
51. Publicação de Linked Data
• Publicar Linked Data: usar os princípios e
melhores práticas de Linked Data para
disponibilizar os dados na Web.
• Requisitos mínimos:
▫ Fornecer URIs dereferenciáveis para cada
entidade.
▫ Criar links RDF para outras fontes de dados.
• Desejável:
▫ Disponibilização de SPARQL Endpoints e dumps
dos dados.
52. Interface Linked Data
• Tratar requisições de URIs.
• Dereferenciar URIs.
• Tratar dos redirecionamentos 303 requeridos
pela arquitetura Web.
• Negociação de conteúdo entre descrições de um
mesmo recurso em diferentes formatos.
http://dblp.l3s.de/d2r/resource/authors/Marco_A._Casanova
http://dblp.l3s.de/d2r/page/authors/Marco_A._Casanova
http://dblp.l3s.de/d2r/data/authors/Marco_A._Casanova
53. Publicação de dados de fontes RDF
como Linked Data
• Fontes de dados que adotam o modelo RDF são
normalmente armazenadas em arquivo RDF ou
RDF Store.
54. Publicação de arquivos RDF como
Linked Data
• Simples
• Usado para arquivos pequenos
• RDF/XML
▫ Formato de serialização mais antigo e usado para
publicação de Linked Data.
55. Arquivo RDF no formato Turtle
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix : <http://lia.ufc.br/~regispires/researchers.rdf#> .
# The <> (the empty URI) means "this document".
<> a foaf:Document ;
dc:title "Researchers file" .
:ufc
a foaf:Organization ;
foaf:name "Universidade Federal do Ceará" .
:vania
a foaf:Person ;
foaf:name "Vânia Maria Ponte Vidal" ;
foaf:Organization :ufc ;
rdfs:sameAs <http://dblp.l3s.de/d2r/resource/authors/V%C3%A2nia_Maria_Ponte_Vidal>
56. Conversão de Turtle para RDF/XML
• Conversores on-line:
▫ Babel
http://simile.mit.edu/babel
▫ RDFConverter
http://www.mindswap.org/2002/rdfconvert/
58. Interface Linked Data
• Disponibilização de um arquivo RDF/XML:
▫ Possibilita o dereferenciamento de URIs
▫ Uso de RDF Links
• Não resolve:
▫ Redirecionamentos 303 e a negociação de
conteúdo.
• Fornecimento de interface Linked Data através
do serviço Pubby (http://www4.wiwiss.fu-
berlin.de/pubby/)
59. RDFa: RDF embutido em documento Web
• Textos e links legíveis ao ser humano
coexistindo com dados que poderão ser
processados pelas máquinas.
• Alterações centralizadas em um único
documento.
61. Publicação de dados de RDF Store
como Linked Data
• Tipicamente envolve:
▫ Disponibilização de interface Linked Data
▫ SPARQL Endpoint
• Servidor Joseki ou Fuseki pode ser usado como
SPARQL Endpoint de uma RDF Store.
• Pubby pode prover a interface Linked Data.
▫ Realiza consulta SPARQL usando o comando
DESCRIBE para obtenção do resultado em
formato RDF.
62. Publicação de dados de fontes não RDF
como Linked Data
• Dados publicados devem estar no modelo RDF ou
ser convertidos para ele.
• Abordagens para lidar com dados não RDF:
▫ Processo de Conversão (abordagem materializada)
Gerar RDF através de algum conversor
▫ Fornecer uma visão RDF (abordagem
virtualizada)
Acesso a dados que não estão no modelo RDF através
de um RDF Wrapper
Conversão dinâmica baseada em mapeamentos
estabelecidos entre o modelo nativo e o modelo RDF.
63. RDB-to-RDF Wrappers
• Criam visões RDF a partir de
mapeamentos entre as estruturas
relacionais e os grafos RDF.
▫ Triplify
▫ Plataforma D2RQ
▫ Virtuoso RDF Views
64. RDB-to-RDF Wrappers
• Triplify
▫ Converte os resultados de consultas SQL em RDF,
JSON e Linked Data.
▫ 3 bilhões de triplas do dataset LinkedGeoData
foram geradas pelo Triplify.
65. RDB-to-RDF Wrappers
• Triplify
▫ Simples. Menos de 500 linhas de código.
▫ Na maioria das aplicações Web apenas um pequeno
número de consultas (3 a 7) é suficiente para extrair as
informações relevantes.
▫ Já possui configurações prontas para triplificar dados
de várias aplicações Web populares (WordPress,
Drupal, Joomla!, OSCommerce, phpBB, Gallery, etc.).
Figura: http://triplify.org/About
66. RDB-to-RDF Wrappers
• Triplify – Arquivo de configuração
▫ Definição de consultas SQL com seleção dos dados que
serão publicados.
A primeira coluna deve conter identificador para gerar
URIs das instâncias.
Nomes de colunas serão usados para gerar URIs dos
predicados.
Ex: SELECT id,name AS 'foaf:name' FROM users
Os resultados da consulta contêm valores ou
referências para outras instâncias que serão usados
para gerar as triplas resultantes.
67. RDB-to-RDF Wrappers
• Plataforma D2RQ
▫ Fornece a infra-estrutura necessária para acessar
bancos de dados relacionais como grafos RDF
virtuais.
• Componentes
▫ Linguagem de mapeamento D2RQ
▫ Mecanismo D2RQ
▫ Servidor D2R
69. RDB-to-RDF Wrappers
• Virtuoso RDF Views
▫ Mapeia dados relacionais em RDF de forma
dinâmica.
▫ Os mapeamentos são escritos em uma linguagem
declarativa.
70. Visão Comparativa
Triplify D2R Server Virtuoso RDF
Views
Tecnologia PHP Java Middleware
Solution
SPARQL - Sim Sim
Endpoint
Linguagem de SQL RDF based RDF based
Mapeamento
Geração de Manual Semi-automático Manual
mapeamento
Escalabilidade Media – Alta Media Alta
(Não SPARQL)
Fonte: http://esw.w3.org/Rdb2RdfXG/StateOfTheArt
71. RDB2RDF
• Grupo de trabalho do W3C criado em 2009.
• Definição da linguagem R2RML
▫ R2RML: RDB to RDF Mapping Language
▫ Mapeamento de dados e esquemas relacionais para RDF
▫ Tende a substituir as soluções de mapeamento já
existentes.
• Direct Mapping of Relational Data to RDF
▫ http://www.w3.org/TR/rdb-direct-mapping/
▫ A partir de um banco de dados relacional, ele gera um
grafo RDF (direct graph).
▫ Define uma transformação simples, servindo de base
para transformações mais complexas.
▫ Provê um comportamento padrão para R2RML.
73. Processo StdTrip
• Guia usuários durante os estágios de modelagem
conceitual do processo RDB para RDF.
• Busca identificar possíveis correspondências
com vocabulários padrões existentes.
74. Processo StdTrip
• Conversão – transformação da estrutura do banco de
dados relacional em uma ontologia RDF.
• Alinhamento – obtenção de correspondências entre a
ontologia obtida na conversão e um conjunto de
vocabulários padrões.
• Seleção - listas de possíveis correspondências são
apresentadas para que o usuário selecione.
• Inclusão – para elementos que o processo não obteve
resultado, uma lista de possíveis correspondências de
outros vocabulários é apresentada.
75. Processo StdTrip
• Complementação – Se nada funciona, usuários são
direcionados às melhores práticas de publicação de
vocabulários RDF.
• Saída
▫ um arquivo de configuração que serve como a
parametrização de uma ferramenta RDB para
RDF.
▫ uma ontologia com os mapeamentos do esquema
do banco de dados original para vocabulários RDF
padrões.
76. Melhores práticas para publicação de
Linked Data
• Selecionar URIs adequadas
▫ Evitar URIs contendo algum detalhe de
implementação ou do ambiente em que estão
publicadas
▫ URIs relacionadas a um mesmo recurso
http://dblp.l3s.de/d2r/resource/V%C3%A2nia_Maria_Ponte_Vidal
http://dblp.l3s.de/d2r/page/V%C3%A2nia_Maria_Ponte_Vidal
http://dblp.l3s.de/d2r/data/V%C3%A2nia_Maria_Ponte_Vidal
77. Melhores práticas para publicação de
Linked Data
• Usar URIs dereferenciáveis.
• Utilizar URIs estáveis.
• Criar links para outras fontes de dados
78. RDF Links entre Datasets
4th Linked Data on the Web Workshop (LDOW 2011).
79. Melhores práticas para publicação de
Linked Data
• Publicação de Metadados
▫ Facilita a seleção dos dados relevantes.
▫ Devem ser fornecidos metadados sobre
proveniência e licenciamento dos dados.
▫ Também é recomendável a disponibilização de
metadados sobre a fonte de dados.
80. Suporte a Metadados
Visualização de dados
sobre um gene
providos pelo Pubby.
Inclui metadados de
proveniência.
Triplify, Pubby e D2R
Server possuem
suporte para
metadados.
Fonte:
Integrating Provenance into the
Web of Data
Olaf Hartig and Jun Zhao
81. Metadados de Licenciamento e
Proveniência
• Somente 18 (9,05 %) das 207 fontes de dados
fornecem informação de licença machine-
readable.
• Somente 50 (25.25 %) das fontes de dados
fornecem informação de proveniência
machine-readable.
82. Melhores práticas para publicação de
Linked Data
• Usar termos de vocabulários amplamente
usados.
▫ Objetivo: facilitar o processamento de Linked
Data pelas aplicações clientes
• Novos termos só devem ser definidos se não
forem encontrados em vocabulários já existentes
84. Melhores práticas para publicação de
Linked Data
• Estabelecer relações entre os termos de
vocabulários proprietários para termos de outros
vocabulários.
▫ Uso das propriedades owl:equivalentClass,
owl:equivalentProperty, rdfs:subClassOf,
rdfs:subPropertyOf.
85. Mapeamentos de Vocabulários
• Somente 9 (7,32%) de 123 fontes de dados que
usam termos proprietários fornecem
mapeamentos de termos para outros
vocabulários.
• Exemplo:
<http://xmlns.com/foaf/0.1/Person>
owl:equivalentClass
<http://dbpedia.org/ontology/Person> .
86. Melhores práticas para publicação de
Linked Data
• Explicitar formas de acesso adicional aos dados
▫ SPARQL endpoints e RDF dumps.
87. Melhores práticas para publicação de
Linked Data
• Estabelecer relações entre os termos de
vocabulários proprietários para termos de outros
vocabulários.
▫ Uso das propriedades owl:equivalentClass,
owl:equivalentProperty, rdfs:subClassOf,
rdfs:subPropertyOf.
88. Validação dos dados publicados como
Linked Data
• É necessário garantir que os dados realmente
estão de acordo com os princípios e melhores
práticas de Linked Data.
• Ferramentas
▫ W3C Validation Service
▫ Eyeball
▫ cURL
▫ Vapour
▫ Sindice Web Data Inspector
▫ Navegadores RDF
90. Consumo de Linked Data
• Ponto de partida
▫ URIs
▫ Palavras-chave
▫ Consultas SPARQL
• Tipos de Aplicações que consomem Linked Data
▫ Aplicações genéricas
▫ Aplicações de domínio específico
91. Aplicações genéricas para consumo de
Linked Data
• Navegadores RDF
• Mecanismos de Busca Linked Data
• Outras aplicações genéricas
92. Navegadores Linked Data
Permitem a navegação entre fontes de dados
seguindo links expressos como triplas RDF.
LOD Browser Switch
Explorator
Disco Hiperdata Browser
Marbles
Tabulator
LinkSailor
Graphite RDF Browser
98. Mecanismos de busca
• Rastreiam a Web seguindo links RDF e possibilitam
consultas sobre dados agregados.
Orientados a humanos – criados para usuários
humanos.
Orientados a aplicações – fornecem APIs para
descoberta de RDFs que referenciam certa URI o que
possuem determinada palavra chave.
102. Outras aplicações genéricas
• sameAs
▫ Serviço online de coreferenciamento
▫ Encontrar URIs de diferentes fontes de dados que
representam um mesmo conceito
• LDSpider
▫ Segue links para obter dados e os armazena em
arquivo RDF ou em RDF Store através de SPARQL
Update.
106. Talis Aspire
• Aplicação de gerenciamento de lista de recursos
voltada para professores e estudantes.
Quando o usuário cria listas, a aplicação produz
triplas RDF que são persistidas em um Linked Data
store.
Itens de uma lista são transparentemente ligados
(linked) a itens correspondentes de outras intituições.
107. Semantic Web Pipes (SWP)
Integração de dados sobre Tim Berners-Lee a partir de 3 fontes de dados
111. DBPedia Mobile • Exibe informações de
diversas fontes
(DBPedia, Revyu,
Flickr), baseado na
localização do usuário
obtida por GPS.
112. APIs para manipulação de Linked Data
• Sesame
• Jena
• Named Graphs API for Jena (NG4J)
• Semantic Web Client Library (SWClLib)
• ARQ2
113. Abordagens para execução de consultas
sobre múltiplas fontes de dados
• Abordagens Tradicionais
▫ Data warehousing
▫ Federação de consultas
• Abordagens Inovadoras
▫ Descoberta ativa baseada em federação de
consultas
▫ Consultas exploratórias (link traversal)
115. Limitações e Desafios
• Interfaces com o usuário precárias
• Desempenho insatisfatório nas consultas sobre
múltiplas fontes de dados.
• Tornar mais transparente a integração de dados
entre múltiplas fontes.
• Instabilidade no acesso a fontes.
• RDF Links quebrados.
• Descoberta de fontes de dados relevantes.
• Privacidade dos dados e restrições sobre eles.
• Explicitar os direitos de cópia e reprodução
sobre os dados.
116. Limitações e Desafios
• Mapeamento dos diversos vocabulários
existentes.
• Criação, edição e manutenção de Linked Data
por vários usuários.
• Manutenção de dados para evitar acesso a
informações que não estejam mais disponíveis.
• Detecção de inconsistências.
• Determinar as informações mais relevantes,
assim como detectar sua validade para melhorar
a qualidade da informação.
118. Conclusão
Potencial de revolucionar como os dados são
acessados e usados.
Sucesso de mashups, mas dificuldade para usar
muitas fontes de dados heterogêneas.
Linked Data permitem que aplicações usem fontes de
dados sem limites através de mecanismos de acesso
padronizados.
A intenção é aproveitar todo o potencial da Web
119. Conclusão
Slide from Tim Berners-Lee's TED talk in Feb 09
120. Referências
• Berners-Lee, T. (2006). Linked Data – Design Issues.
http://www.w3.org/DesignIssues/LinkedData.html.
• Bizer, C., Heath, T., and Berners-Lee, T. (2009). Linked Data - The Story So Far. Int. J. Semantic
Web Inf. Syst., 5(3):1–22. Disponível em: http://tomheath.com/papers/bizer-heath-berners-lee-
ijswis-linked-data.pdf
• Bizer, C., Cyganiak, R., and Heath, T. (2007). How to Publish Linked Data on the Web.
http://www4.wiwiss.fuberlin.de/bizer/pub/LinkedDataTutorial/.
• Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Morgan &
Claypool.
• Langegger, A. (2010). A Flexible Architecture for Virtual Information Integration based on
Semantic Web Concepts. PhD thesis, J. Kepler University Linz.
• Linking Open Data Project Wiki. Disponível em:
http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
• Intro Slides. 4th Linked Data on the Web Workshop (LDOW 2011).
• Introduction to Linked Data Slides. Consuming Linked Data Tutorial. (LDOW 2010)
• Prud’hommeaux, E. and Seaborne, A. (2008). SPARQL Query Language for RDF.
http://www.w3.org/TR/rdf-sparql-query/.
• Clark, K. G., Feigenbaum, L., and Torres, E. (2008). SPARQL Protocol for RDF.
http://www.w3.org/TR/rdf-sparql-protocol/.