O documento discute os princípios do Linked Data para publicação e compartilhamento de dados na Web. Ele explica como os Linked Data utilizam URIs para identificar recursos e o modelo RDF para estruturar as informações, permitindo a integração de dados de diferentes fontes através de links entre os recursos.
Reformulação de consultas sparql no padrão linked dataLeonardo Ribeiro
Este documento discute a Web Semântica e Linked Data. Explica como os dados estão publicados na Web atualmente e as deficiências dessa abordagem. Apresenta como ontologias, URIs e RDF podem ser usados para ligar dados de diferentes fontes e torná-los mais facilmente integráveis. Também descreve SPARQL como uma linguagem para consultar dados RDF e exemplos de aplicações que usam Linked Data.
O documento discute a história da internet e da web semântica, incluindo: 1) A evolução da internet desde a década de 1960 com a criação da ARPANET; 2) Os desafios da web atual em organizar a grande quantidade de informações; 3) A proposta da web semântica para estruturar os dados e atribuir significado para melhor recuperação de informações.
Palestra Dia da Liberdade dos Documentos - 2011-03-30UEPA
Este documento apresenta uma breve história da Web, desde a primeira geração (Web 1.0) até a terceira geração (Web Semântica). Também discute padrões abertos para a Web Semântica como RDF, OWL e ontologias, e como esses padrões podem ser usados para publicar dados abertos do governo de forma a permitir sua reutilização.
Este documento fornece uma introdução aos princípios e tecnologias por trás dos Linked Data e da Web Semântica. Ele discute a motivação para estruturar dados na web, as limitações da web atual, e como RDF, URIs e links entre dados podem superar essas limitações e conectar ilhas de informação em um espaço global de dados.
O documento discute sistemas de federação e abordagens para consultar múltiplos datasets de dados ligados. Apresenta duas abordagens principais: data warehousing, que armazena dados em um repositório central, e consultas federadas, que processam consultas distribuídas sobre várias fontes de dados. Consultas federadas têm vantagens como dados mais atualizados e uso de recursos de rede, enquanto data warehousing oferece melhor desempenho, mas dados podem ficar desatualizados.
1) O documento discute estratégias de conteúdo e metadados, incluindo tags, sitemaps e calendários editoriais.
2) É explicado que metadados organizam dados e ajudam a referenciar conteúdos complexos, economizando tempo.
3) Manter bons metadados é importante para montar estratégias de conteúdo e produzir conteúdo de forma eficiente.
Este documento discute os metadados, que são dados que descrevem outros dados. Os metadados fornecem informações sobre a origem, qualidade e utilidade de dados digitais. Padrões de metadados como Dublin Core ajudam a organizar e compartilhar metadados de forma consistente. O formato XML é útil para estruturar e armazenar metadados associados a documentos eletrônicos.
Reformulação de consultas sparql no padrão linked dataLeonardo Ribeiro
Este documento discute a Web Semântica e Linked Data. Explica como os dados estão publicados na Web atualmente e as deficiências dessa abordagem. Apresenta como ontologias, URIs e RDF podem ser usados para ligar dados de diferentes fontes e torná-los mais facilmente integráveis. Também descreve SPARQL como uma linguagem para consultar dados RDF e exemplos de aplicações que usam Linked Data.
O documento discute a história da internet e da web semântica, incluindo: 1) A evolução da internet desde a década de 1960 com a criação da ARPANET; 2) Os desafios da web atual em organizar a grande quantidade de informações; 3) A proposta da web semântica para estruturar os dados e atribuir significado para melhor recuperação de informações.
Palestra Dia da Liberdade dos Documentos - 2011-03-30UEPA
Este documento apresenta uma breve história da Web, desde a primeira geração (Web 1.0) até a terceira geração (Web Semântica). Também discute padrões abertos para a Web Semântica como RDF, OWL e ontologias, e como esses padrões podem ser usados para publicar dados abertos do governo de forma a permitir sua reutilização.
Este documento fornece uma introdução aos princípios e tecnologias por trás dos Linked Data e da Web Semântica. Ele discute a motivação para estruturar dados na web, as limitações da web atual, e como RDF, URIs e links entre dados podem superar essas limitações e conectar ilhas de informação em um espaço global de dados.
O documento discute sistemas de federação e abordagens para consultar múltiplos datasets de dados ligados. Apresenta duas abordagens principais: data warehousing, que armazena dados em um repositório central, e consultas federadas, que processam consultas distribuídas sobre várias fontes de dados. Consultas federadas têm vantagens como dados mais atualizados e uso de recursos de rede, enquanto data warehousing oferece melhor desempenho, mas dados podem ficar desatualizados.
1) O documento discute estratégias de conteúdo e metadados, incluindo tags, sitemaps e calendários editoriais.
2) É explicado que metadados organizam dados e ajudam a referenciar conteúdos complexos, economizando tempo.
3) Manter bons metadados é importante para montar estratégias de conteúdo e produzir conteúdo de forma eficiente.
Este documento discute os metadados, que são dados que descrevem outros dados. Os metadados fornecem informações sobre a origem, qualidade e utilidade de dados digitais. Padrões de metadados como Dublin Core ajudam a organizar e compartilhar metadados de forma consistente. O formato XML é útil para estruturar e armazenar metadados associados a documentos eletrônicos.
O documento discute os desafios da integração de dados de sistemas heterogêneos. Apresenta as abordagens de integração virtual e materializada e métodos como Global-As-View e Local-As-View para mapear esquemas de dados. Também discute como a Web aumentou a heterogeneidade de dados e a necessidade de semântica para integrar dados na Web.
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...Leandro Borges
O documento descreve a evolução dos sistemas de busca na internet, desde os primeiros buscadores até os atuais sistemas de big data. Também discute novas tecnologias emergentes como ontologias, linked data e web semântica.
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)Marcos Santos
O documento discute o conceito de Web 3.0, como uma extensão da Web atual que adiciona informações sobre o significado dos dados para facilitar a cooperação entre computadores e pessoas. Também aborda os conceitos de Linked/Open Data e como eles se relacionam com o tratamento de grandes volumes de dados heterogêneos (Big Data), utilizando técnicas como aprendizado de máquina.
O documento discute os fundamentos e a importância dos metadados para organizar informações digitais e facilitar a busca de informações relevantes. Explica que os metadados descrevem os recursos digitais e permitem localizá-los e avaliar sua relevância. Também define os principais tipos de metadados e como eles auxiliam na descoberta, organização, identificação e preservação de recursos digitais.
Interoperabilidade, metadados e outras coisitas maisMarcos Luis Mori
Este documento discute metadados e interoperabilidade. Ele inclui uma breve introdução sobre o palestrante e seu background, seguido por seções sobre tecnologia da web, interoperabilidade e o uso de metadados para localizar e acessar informações digitais.
O documento discute os conceitos e classificações de metadados, linguagens de metadados como Dublin Core e LOM, e padrões como METS para armazenamento de metadados técnicos.
Este documento descreve um sistema para organizar e visualizar recursos de informação na Web usando metadados RDF e geometria hiperbólica. O sistema mapeia metadados de recursos da Agência de Informação Embrapa para gerar uma árvore hiperbólica, permitindo aos usuários navegar relações semânticas entre documentos. Os resultados sugerem que essa abordagem pode facilitar o acesso a informações relacionadas através de similaridades semânticas.
O documento discute o histórico e conceitos de metadados, suas aplicações em diferentes formatos e o papel dos metadados na Web. Aborda o desenvolvimento do termo ao longo do tempo, os diversos significados atribuídos a ele em diferentes áreas, e como os metadados permitem a descrição, localização e recuperação de recursos digitais.
O documento resume a história e conceitos fundamentais de bancos de dados, desde as primeiras aplicações na década de 1960 até as tendências atuais. Aborda os principais modelos de banco de dados, a linguagem SQL e sistemas gerenciadores de bancos de dados.
O documento apresenta os principais conceitos do modelo relacional de banco de dados, incluindo relações, atributos, tuplas, chaves primárias, chaves estrangeiras e restrições de integridade. Explica como os dados são organizados em tabelas e como as relações entre as tabelas são implementadas através de chaves primárias e estrangeiras para garantir a integridade referencial.
Banco de Dados, Integração e Qualidade de DadosCeça Moraes
O documento discute sobre bancos de dados, integração de dados e qualidade de dados. Apresenta conceitos básicos de bancos de dados relacionais e sistemas gerenciadores de bancos de dados. Aborda também técnicas para integrar dados provenientes de múltiplas fontes na web e a importância da qualidade dos dados para sistemas de informação.
O documento discute a diferença entre dados e informações, define o que é um banco de dados e SGBD, e explica como os dados são armazenados em tabelas.
O documento fornece um resumo sobre metadados, incluindo: (1) Uma breve história do termo "metadados"; (2) Definições de metadados e como eles podem variar entre domínios; (3) Funções importantes de metadados como descrever recursos e facilitar a recuperação.
O documento define os conceitos de banco de dados, sistema de gerenciamento de banco de dados e projeto de banco de dados. Um banco de dados é uma coleção de dados inter-relacionados sobre um domínio. Um SGBD é um software que manipula as informações do banco de dados. O projeto de banco de dados define a organização das informações através da modelagem conceitual e lógica.
1) O documento descreve a crise do mercado imobiliário nos EUA conhecida como crise do subprime, que teve início com empréstimos de alto risco e levou à quebra de grandes bancos.
2) A crise se espalhou pelo mundo e causou uma grande recessão global, forçando governos a aprovarem pacotes de estímulo bilionários.
3) No Brasil, a crise teve menos impacto devido a medidas como o saneamento do setor bancário e a acumulação de reservas internacionais.
O documento fornece uma revisão trimestral da economia brasileira e internacional no primeiro trimestre de 2013. Apresenta informações sobre o PIB brasileiro, inflação, juros, crédito e inadimplência no Brasil, além de mercados internacionais e fusões e aquisições no país. Inclui também um artigo sobre riscos e oportunidades no setor de infraestrutura brasileiro.
Este documento fornece um resumo das principais informações operacionais e financeiras da Petrobras para os anos de 2007 e 2008. A Petrobras teve um desempenho sólido em 2008, com destaque para as descobertas de petróleo na camada pré-sal e lucro líquido recorde de R$ 33 bilhões. A companhia manteve altos níveis de investimento de R$ 53,3 bilhões, focados na exploração e produção, e possui reservas provadas de 15,08 bilhões de boe.
O documento descreve como o Wal-Mart usa tecnologia da informação para melhorar sua eficiência e competitividade no varejo. O Wal-Mart armazena grandes quantidades de dados de clientes e vendas em um banco de dados centralizado que usa para otimizar estoque, preços e relacionamentos com fornecedores. A tecnologia permite que o Wal-Mart ofereça preços mais baixos de forma consistente.
O documento fornece informações sobre crimes digitais e malware, incluindo vírus de computador. Discorre sobre conceitos jurídicos relacionados a crimes cibernéticos e tipos de softwares maliciosos como vírus, cavalos de tróia e spywares.
El documento describe las características fundamentales de las empresas. Indica que una empresa es una unidad económica que utiliza recursos humanos, financieros, técnicos y naturales para lograr un objetivo, ya sea lucrativo o sin fines de lucro. Además, clasifica las empresas según su actividad económica en los sectores primario, secundario y terciario, y según su tamaño en grandes y pequeñas y medianas empresas.
O documento discute os desafios da integração de dados de sistemas heterogêneos. Apresenta as abordagens de integração virtual e materializada e métodos como Global-As-View e Local-As-View para mapear esquemas de dados. Também discute como a Web aumentou a heterogeneidade de dados e a necessidade de semântica para integrar dados na Web.
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...Leandro Borges
O documento descreve a evolução dos sistemas de busca na internet, desde os primeiros buscadores até os atuais sistemas de big data. Também discute novas tecnologias emergentes como ontologias, linked data e web semântica.
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)Marcos Santos
O documento discute o conceito de Web 3.0, como uma extensão da Web atual que adiciona informações sobre o significado dos dados para facilitar a cooperação entre computadores e pessoas. Também aborda os conceitos de Linked/Open Data e como eles se relacionam com o tratamento de grandes volumes de dados heterogêneos (Big Data), utilizando técnicas como aprendizado de máquina.
O documento discute os fundamentos e a importância dos metadados para organizar informações digitais e facilitar a busca de informações relevantes. Explica que os metadados descrevem os recursos digitais e permitem localizá-los e avaliar sua relevância. Também define os principais tipos de metadados e como eles auxiliam na descoberta, organização, identificação e preservação de recursos digitais.
Interoperabilidade, metadados e outras coisitas maisMarcos Luis Mori
Este documento discute metadados e interoperabilidade. Ele inclui uma breve introdução sobre o palestrante e seu background, seguido por seções sobre tecnologia da web, interoperabilidade e o uso de metadados para localizar e acessar informações digitais.
O documento discute os conceitos e classificações de metadados, linguagens de metadados como Dublin Core e LOM, e padrões como METS para armazenamento de metadados técnicos.
Este documento descreve um sistema para organizar e visualizar recursos de informação na Web usando metadados RDF e geometria hiperbólica. O sistema mapeia metadados de recursos da Agência de Informação Embrapa para gerar uma árvore hiperbólica, permitindo aos usuários navegar relações semânticas entre documentos. Os resultados sugerem que essa abordagem pode facilitar o acesso a informações relacionadas através de similaridades semânticas.
O documento discute o histórico e conceitos de metadados, suas aplicações em diferentes formatos e o papel dos metadados na Web. Aborda o desenvolvimento do termo ao longo do tempo, os diversos significados atribuídos a ele em diferentes áreas, e como os metadados permitem a descrição, localização e recuperação de recursos digitais.
O documento resume a história e conceitos fundamentais de bancos de dados, desde as primeiras aplicações na década de 1960 até as tendências atuais. Aborda os principais modelos de banco de dados, a linguagem SQL e sistemas gerenciadores de bancos de dados.
O documento apresenta os principais conceitos do modelo relacional de banco de dados, incluindo relações, atributos, tuplas, chaves primárias, chaves estrangeiras e restrições de integridade. Explica como os dados são organizados em tabelas e como as relações entre as tabelas são implementadas através de chaves primárias e estrangeiras para garantir a integridade referencial.
Banco de Dados, Integração e Qualidade de DadosCeça Moraes
O documento discute sobre bancos de dados, integração de dados e qualidade de dados. Apresenta conceitos básicos de bancos de dados relacionais e sistemas gerenciadores de bancos de dados. Aborda também técnicas para integrar dados provenientes de múltiplas fontes na web e a importância da qualidade dos dados para sistemas de informação.
O documento discute a diferença entre dados e informações, define o que é um banco de dados e SGBD, e explica como os dados são armazenados em tabelas.
O documento fornece um resumo sobre metadados, incluindo: (1) Uma breve história do termo "metadados"; (2) Definições de metadados e como eles podem variar entre domínios; (3) Funções importantes de metadados como descrever recursos e facilitar a recuperação.
O documento define os conceitos de banco de dados, sistema de gerenciamento de banco de dados e projeto de banco de dados. Um banco de dados é uma coleção de dados inter-relacionados sobre um domínio. Um SGBD é um software que manipula as informações do banco de dados. O projeto de banco de dados define a organização das informações através da modelagem conceitual e lógica.
1) O documento descreve a crise do mercado imobiliário nos EUA conhecida como crise do subprime, que teve início com empréstimos de alto risco e levou à quebra de grandes bancos.
2) A crise se espalhou pelo mundo e causou uma grande recessão global, forçando governos a aprovarem pacotes de estímulo bilionários.
3) No Brasil, a crise teve menos impacto devido a medidas como o saneamento do setor bancário e a acumulação de reservas internacionais.
O documento fornece uma revisão trimestral da economia brasileira e internacional no primeiro trimestre de 2013. Apresenta informações sobre o PIB brasileiro, inflação, juros, crédito e inadimplência no Brasil, além de mercados internacionais e fusões e aquisições no país. Inclui também um artigo sobre riscos e oportunidades no setor de infraestrutura brasileiro.
Este documento fornece um resumo das principais informações operacionais e financeiras da Petrobras para os anos de 2007 e 2008. A Petrobras teve um desempenho sólido em 2008, com destaque para as descobertas de petróleo na camada pré-sal e lucro líquido recorde de R$ 33 bilhões. A companhia manteve altos níveis de investimento de R$ 53,3 bilhões, focados na exploração e produção, e possui reservas provadas de 15,08 bilhões de boe.
O documento descreve como o Wal-Mart usa tecnologia da informação para melhorar sua eficiência e competitividade no varejo. O Wal-Mart armazena grandes quantidades de dados de clientes e vendas em um banco de dados centralizado que usa para otimizar estoque, preços e relacionamentos com fornecedores. A tecnologia permite que o Wal-Mart ofereça preços mais baixos de forma consistente.
O documento fornece informações sobre crimes digitais e malware, incluindo vírus de computador. Discorre sobre conceitos jurídicos relacionados a crimes cibernéticos e tipos de softwares maliciosos como vírus, cavalos de tróia e spywares.
El documento describe las características fundamentales de las empresas. Indica que una empresa es una unidad económica que utiliza recursos humanos, financieros, técnicos y naturales para lograr un objetivo, ya sea lucrativo o sin fines de lucro. Además, clasifica las empresas según su actividad económica en los sectores primario, secundario y terciario, y según su tamaño en grandes y pequeñas y medianas empresas.
O documento apresenta os fundamentos e princípios do Linked Data, incluindo (1) a utilização de URIs para identificar recursos, (2) o uso do HTTP para acessar essas URIs, (3) a disponibilização de informações úteis usando RDF ao acessar URIs, e (4) a inclusão de links para outros recursos. Também discute (2) os formatos e padrões usados como RDF, SPARQL e HTTP, e (3) estratégias para armazenamento de dados RDF.
O documento descreve os principais conceitos e tecnologias da Web Semântica, incluindo ontologias, RDF, OWL e microformatos, que visam dar significado semântico ao conteúdo da Web para que máquinas possam processá-lo e interpretá-lo.
Descrição de recursos em wikis semânticos: dados em RDF para Linked Data
Jaider Andrade Ferreira
Mestrando em Ciência da Informação
Orientadora: Plácida L. V. A. da C. Santos
O documento discute a Web 3.0 ou Web Semântica, que visa organizar e usar de forma inteligente o conhecimento disponível na Internet. Isso será possível representando os dados nos documentos de uma forma que as máquinas possam compreender, tornando as informações mais precisas e os sistemas de busca mais eficientes. Tecnologias como XML, RDF e OWL são essenciais para a Web Semântica.
O documento descreve a Web 3.0 como uma organização mais inteligente do conhecimento disponível na internet, onde as máquinas poderão entender melhor o contexto das informações usando tecnologias como XML, RDF e OWL. Isso trará benefícios como maior precisão em buscas e integração de informações.
Microformats e Web Semântica, transformando seu site para web 3.0 - Road Show...Renato Bongiorno Bonfanti
O documento discute como adicionar semântica a sites através de microformatos, RDFa e GRDDL, permitindo que máquinas entendam melhor os dados. Ele explica que microformatos e RDFa permitem adicionar metadados a páginas HTML de forma fácil e que GRDDL permite converter esses dados para RDF.
1) O documento discute a Web Semântica, incluindo seus conceitos, tecnologias e aplicações. 2) A Web Semântica visa dar significado às informações na web para que computadores possam processá-las de forma autônoma. 3) Isso é feito através de ontologias e linguagens como RDF, RDFS e OWL que estruturam os dados e seus relacionamentos semânticos.
O documento discute a importância dos dados abertos e como eles podem ser usados para criar novas aplicações e insights. Ele explica como o governo brasileiro tem trabalhado para publicar e integrar dados abertos através de iniciativas como a INDA e o catálogo dados.gov.br. Também descreve as tecnologias e padrões como DCAT, RDF e SPARQL que permitem a interoperabilidade dos dados abertos.
O documento descreve o Resource Description Framework (RDF), incluindo sua definição como uma estrutura para codificar, trocar e reutilizar metadados estruturados usando URIs. O RDF usa declarações de sujeito, predicado e objeto para descrever recursos e suas propriedades, permitindo que os recursos sejam relacionados através de um grafo. Exemplos de uso do RDF e ferramentas para desenvolvimento também são discutidos.
Paulo Augusto Loncarovich Gomes - UNESP - Mestrado em Ciência da Informação e Tecnologia, Universidade Estadual Paulista Júlio de Mesquita Filho - Faculdade de Filosofia e Ciências - Campus de Marília - Av. Hygino Muzzi Filho, 737 - Campus Universitário 17525-900 - Marilia, SP - Brasil - Caixa-Postal: 181
e-mail: loncarovich@marilia.unesp.br
Apresentado em 31 de Agosto de 2009.
Este documento apresenta o professor Luis Fernando dos Santos Pires e sua experiência acadêmica e profissional. Ele possui graduações e pós-graduações em diversas áreas como Administração de Empresas, Análise e Desenvolvimento de Sistemas e Pedagogia. Atualmente é professor universitário e palestrante, além de diretor de uma empresa de educação. A aula 02 introduz conceitos de sistemas cliente/servidor, abordando tópicos como modelo cliente-servidor, componentes, protocolos, URL e domínios.
Introdução a modelagem de dados parte II - Banco de Dadosinfo_cimol
O documento discute os principais tipos de bancos de dados, incluindo hierárquicos, em rede, relacionais, orientados a objetos e objetos relacionais. Também descreve as arquiteturas de banco de dados centralizados, cliente-servidor, paralelos e distribuídos.
Introdução ao Banco de dados - Prof. Daniel BrandãoDaniel Brandão
O documento apresenta informações sobre o professor Daniel Brandão, incluindo sua formação acadêmica e experiência profissional. A ementa da disciplina Banco de Dados II é descrita, com os principais tópicos a serem abordados e as referências bibliográficas. Por fim, o documento lista os temas que serão discutidos ao longo do curso.
Anotacao Semântica em Documentos Não EstruturadosCelso Fontes
Este documento discute a anotação semântica em documentos não estruturados, comparando diferentes padrões como Microformatos, eRDF, RDFa e Microdata. Também apresenta ferramentas de anotação e extração semântica e discute como elas representam e armazenam anotações.
O documento apresenta os principais conceitos da Web Semântica, incluindo:
1) A Web Semântica visa estruturar as informações da web de forma a permitir que máquinas e pessoas trabalhem melhor em conjunto, compreendendo melhor o significado dos dados;
2) Isso é feito através de padrões como RDF, microdados e ontologias que vinculam e relacionam dados de forma semântica;
3) A Web Semântica permite correlacionar e agregar dados de diferentes locais da web.
Este documento apresenta uma introdução à disciplina de Web Semântica e Ontologias, descrevendo seu objetivo de permitir que máquinas entendam melhor os dados da web através da adição de semântica. Explica a diferença entre a web de documentos e a web de dados, e como a web semântica visa embutir significado nos dados para que computadores possam interpretá-los de forma mais precisa.
1) HTML é uma linguagem de marcação utilizada para produzir páginas na Web e foi criada por Tim Berners-Lee.
2) O W3C é um consórcio que desenvolve padrões para a Web, como HTML, XHTML e CSS. Seus padrões visam permitir acesso a sites por qualquer pessoa ou tecnologia.
3) Elementos HTML como tags, atributos e valores dão significado e estrutura ao conteúdo na Web.
O documento discute conceitos fundamentais de bancos de dados, incluindo razões para armazenar informações, história do armazenamento de dados, modelos de banco de dados, modelagem de dados usando o modelo entidade-relacionamento, e componentes-chave de bancos de dados como entidades, atributos e relacionamentos.
O documento introduz o conceito de Linked Data, que refere-se a um conjunto de práticas para publicar e conectar dados estruturados na Web de forma a criar uma "Web de Dados". O objetivo é organizar semanticamente os dados para permitir a leitura automática por agentes de software através da linguagem SPARQL. Os princípios do Linked Data incluem usar URIs para identificar recursos, usar URIs HTTP para que pessoas possam encontrar esses nomes, representar as informações no formato RDF e incluir links para outros recursos.
Semelhante a Palestra Introdução a Linked Data (20)
1. Rio de Janeiro, 5 de julho de 2013
Leonardo Souza
lsouza@amtera.com.br
2. Linked Data
● Conjunto de princípios, tecnologias e padrões da Web
para publicação, compartilhamento e reuso dos dados
em escala.
3. Motivação
● Explosão de informações. Nos dias de hoje encontramos facilmente
na web dados sobre o best seller mais vendido, previsão do tempo,
ingressos para o show do fim de semana, gastos do governo, dados
sobre pesquisas científicas, etc.
● Esses fatos nos remetem às seguintes questões:
– Como prover o reuso desses dados?
– Como descubro novos dados ou novas fontes?
– Como integrar essas fontes de dados distribuídas?
4. Histórico
● “Habemus Web”, Tim Berners-Lee criou a Web of Documents
– Sistema de documentos hipertexto interligados e
acessados através da internet. Esses documentos
podem conter textos, imagens, vídeos, recursos
multimídia em geral, nos quais os usuários podem
navegar através de hiperlinks.
● Deu origem a tecnologias essenciais da Web:
– Uniform Resource Locator (URL)
– HyperText Markup Language (HTML)
– HyperText Transfer Protocol (HTTP)
5. Estrutura
● Estrutura facilita o reuso. Quanto mais regular e definido for o
dado, mais fácil se torna a construção de ferramentas para
processamento automático.
● A linguagem HTML foi concebida para expressar a forma como
o dado é apresentado para o usuário. As aplicações precisam
de muito esforço para extrair o dado estruturado.
● Muitos sites são construídos a partir de dados estruturados
mas é muito difícil reconstruir a estrutura original do dado
através da página HTML.
6. Microformatos
● Os microformatos aliviam um pouco esse problema. São
metadados embutidos no HTML para dar significado as
entidades como pessoas, organizações, eventos, etc.
● Exemplo de uso do microformato hCard
<ul>
<li>Leonardo Souza</li>
<li>Amtera Semantic Technologies</li>
<li>+552198777081</li>
<li><a href="http://www.amtera.com.br">Site</a></li>
</ul>
<ul class=”vcard”>
<li class=”fn”>Leonardo Souza</li>
<li class=”org”>Amtera Semantic Technologies</li>
<li class=”tel”>+552198777081</li>
<li><a class=”url” href="http://www.amtera.com.br">Site</a></li>
</ul>
7. Microformatos
● Exemplo de uso do microformato geo:
The birds roosted at
<span class="geo">
<span class="latitude">52.48</span>,
<span class="longitude">-1.89</span>
</span>
● Outros microformatos: adr, geo, hCalendar, hAtom, hMedia,
hRecipe, hResume, etc;
● Microformatos são limitados. Em geral o vocabulário é
pequeno e não expressa bem as relações entre as entidades
descritas. Não são adequados para a publicação de dados em
geral.
8. Web API
● Dados publicados através de serviços web normalmente são
bem estruturados. O uso do protocolo HTTP é o padrão
utilizado;
● Empresas como a Amazon e Facebook expõem seus dados
através de serviços na web;
● Os formatos estruturados mais comuns são XML e JSON que
são suportados pela grande maioria das linguagens de
programação;
● Empresas como a Mashape facilitam a publicação e o acesso a
uma variedade de Web APIs em um marketplace;
● Com a explosão de APIs na web o número de aplicações que
integram várias fontes de dados (mashups) cresceu
rapidamente (ProgrammableWeb);
9. Web API
● A estruturação e padronização trazida pelas Web APIs são
benéficas mas demandam muito esforço de integração.
10. Hyperlinks
● As Web APIs trouxeram a estrutura necessária que facilita o
consumo dos dados de diferentes fontes, mas como ligamos os
dados de diferentes fontes?
● Documentos HTML referenciam outros documentos através do
elemento anchor que possui o atributo href. Esse é um padrão
da linguagem reconhecido pelos navegadores e que viabilizou
a web of documents;
● As Web APIs não possuem padrões equivalentes à âncora
HTML para ligar dados relacionados;
● Os identificadores disponibilizados através das Web APIs são
locais e não podem ser utilizados para ligar ou prover a
descoberta dos dados de forma global.
11. Rationale
● Documentos HTML não possuem a estrutura adequada para a
representação dos dados e seus relacionamentos;
● Os microformatos melhoram a representação dos dados
embutidos nos documentos HTML através de anotações
semânticas;
● Os microformatos possuem vocabulário limitado e não
representam adequadamente as relações.
● As Web APIs possuem estrutura adequada para a
representação dos dados;
● As Web APIs não possuem padrões equivalentes à âncora
HTML para ligar os dados relacionados e portanto não são
adequadas para a publicação e compartilhamento dos dados
de forma global.
12. Princípios Linked Data
● Proposto por Tim Berners-Lee [6]:
(1) Use URIs para dar nomes as coisas;
(2) Use HTTP URIs para que esses nomes possam ser
acessados;
(3) Quando uma URI é acessada, responda com dados
úteis, utilizando padrões da web;
(4) Inclua links para outras URIs para facilitar a
descoberta de novos dados;
13. Super Chave Primária
● A arquitetura Linked Data reutiliza a infraestrutura da web of documents e
os recursos identificados por uma HTTP URI podem ser pessoas, lugares,
eventos, relações, propriedades, documentos, etc;
● Entidades reais e conceitos do mundo são identificados universalmente,
temos uma super chave primária;
● As HTTP URIs não servem apenas como identificadores universais mas
também como o meio de acessar a informação que descreve o dado
identificado (dereference);
● http://dbpedia.org/resource/Tim_Berners-Lee
● O uso de HTTP URIs satisfaz os princípios 1 e 2;
15. RDF
● Dados publicados na Web devem seguir uma estrutura
padrão para permitir interoperabilidade entre as aplicações;
● Linked Data utiliza o modelo RDF [9] (Resource Description
Framework);
● RDF é um modelo de dados simples feito sob medida para a
arquitetura Web;
● RDF é uma recomendação W3C;
16. Modelo de dados RDF
● O modelo RDF representa o dado como uma série de enunciados
(statements) que descrevem recursos, tipicamente da web, na forma de
sujeito-predicado-objeto;
● Esses statements são chamados de triplas RDF;
● Uma coleção de triplas RDF podem ser visualizadas como um multigrafo
direcionado nomeado;
● Sujeito e predicado são sempre identificados por URIs;
● Objetos podem ou não ser identificados por URIs.
● Os predicados são representados por vocabulários que pode ser visto
como o schema do dado;
17. Vocabulários RDF
● Os vocabulários definem os conceitos e relações usados para
descrever um domínio ou área de conhecimento;
● Caracterizam os predicados que são usados para descrever os
dados e relações no modelo RDF;
● Vocabulários podem ser complexos com milhares de termos
(definições) ou bem simples com apenas dois termos;
● Vocabulários são representados pela linguagem RDF Schema.
18. RDF Schema - RDFS
● Conjunto de classes e propriedades, são elementos básicos para
construção dos vocabulários;
● RDF Schema está para o RDF assim como XML Schema está para o XML;
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base="http://www.animals.fake/animals#">
<rdfs:Class rdf:ID="animal" />
<rdfs:Class rdf:ID="horse">
<rdfs:subClassOf rdf:resource="#animal"/>
</rdfs:Class>
</rdf:RDF>
19. Tripla RDF
● Exemplo:
– Tim Berners-Lee inventou a World Wide Web
sujeito predicado objeto
http://dbpedia.org/resource/Tim_Berners-Lee
http://dbpedia.org/property/inventor
http://dbpedia.org/resource/World_Wide_Web
21. Linking Open Data - LOD
● Projeto W3C iniciado em 2007 com o objetivo de ligar dados de
fontes públicas e abertas;
– Wikipedia
– Wikibooks
– Geonames
– MusicBrainz
– Wordnet
– DBLP
● Interliga 295 datasets;
● 31 bilhões de triplas RDF
● 504 milhões de links RDF;
28. Tipos de triplas RDF
● Literal: Representa strings, inteiros, datas. Tipicamente usado para
descrever as propriedades de uma entidade (sujeito);
– dbpedia:Tim_Berners-Lee dbpedia-owl:birthDate "1955-06-08"^^xsd:date ;
– dbpprop:placeOfBirth "London, England"@en ;
● Links: Descrevem as relações entre duas entidades. Nesse caso três
URIs estão envolvidas.
29. Links
● Links de relacionamentos: Conectam fontes de dados distribuídas, podem
ligar com dados internos ou externos, equivalem às âncoras HTML na
arquitetura tradicional da web;
<http://richard.cyganiak.de/foaf.rdf#cygri>
foaf:based_near <http://ws.geonames.org/rdf?geonameId=2950159> .
● Links de identidade: Múltiplas HTTP URIs podem referenciar o mesmo
objeto, entidade ou pessoa, isso é permitido e incentivado na Web of Data,
assim podemos ter informações ou visões complementares sobre um
mesmo recurso da web, nessa arquitetura o ponto central de falha deixa de
existir;
dbpedia:Tim_Berners-Lee
owl:sameAs <http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007> .
30. Links
● Links de vocabulários [10]: Descrevem os tipos de relacionamentos. Auxiliam na
integração de diferentes fontes de dados. Em Linked Data o esquema é a fusão
da definição dos termos de diferentes vocabulários;
– A publicação de novos dados deve, sempre que possível, reusar
vocabulários consolidados (Foaf, Basic Geo, Gene Ontology, MeSH);
– O autor da publicação é livre para criar seu próprio vocabulário, para tal,
a URI do termo definido deve ser dereferenciável, e sempre que
possível mapeando para vocabulários externos equivalentes
(owl:sameAs, owl:equivalentProperty, owl:equivalentClass).
31. “Dereferenciando” URIs
● Qualquer HTTP URI deve ser “dereferenciável”;
● O usuário deve obter uma representação do dado ao acessar a URI através
do protocolo HTTP.
● Não importa se a URI identifica um documento HTML ou um conceito,
pessoa ou lugar do mundo;
● Content Negotiation [7]. Humanos obtêm documentos HTML e máquinas
documentos RDF;
– Accept: text/html
– Accept: application/rdf+xml
● Estratégias:
– 303 URI
– Hash URI
32. 303 URIs
● Infelizmente objetos reais não podem ser enviados através do
protocolo HTTP :(
● Ao invés de responder com o objeto real representado pela URI
o servidor HTTP responde o código 303 (see other [8]) que
indica a URI do documento que melhor descreve o objeto;
● O cliente faz uma segunda requisição HTTP para obter a
descrição do objeto;
35. Hash URI
$ curl --verbose -H "Accept: application/rdf+xml" -X GET "http://www.w3.org/2000/01/rdf-schema#type"
<rdf:RDF
xmlns:dc="http://purl.org/dc/elements/1.1/">
<owl:Ontology
rdf:about="http://www.w3.org/2000/01/rdf-schema#"
dc:title="The RDF Schema vocabulary (RDFS)"/>
<rdfs:Class rdf:about="http://www.w3.org/2000/01/rdf-schema#Resource">
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/2000/01/rdf-schema#"/>
<rdfs:label>Resource</rdfs:label>
<rdfs:comment>The class resource, everything.</rdfs:comment>
</rdfs:Class>
<rdfs:Class rdf:about="http://www.w3.org/2000/01/rdf-schema#Class">
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/2000/01/rdf-schema#"/>
<rdfs:label>Class</rdfs:label>
<rdfs:comment>The class of classes.</rdfs:comment>
<rdfs:subClassOf rdf:resource="http://www.w3.org/2000/01/rdf-schema#Resource"/>
</rdfs:Class>
…snip….
36. 303 x Hash
● 303 URIs
– Requer 2 requisições HTTP;
– Pode retornar apenas o documento que descreve o recurso, na
verdade a URI retornada pode apontar para qualquer coisa.
– Ideal para grandes base de dados, onde uma única descrição
para todos os objetos se tornaria impeditivo;
● Hash URIs
– Somente 1 requisição HTTP.
– A descrição de todos os recursos que compartilham a mesma
URI base são retornadas na requisição;
– Ideal para bases pequenas, tipicamente descrição de
vocabulários e ontologias, onde o cliente precisa da base inteira;
37. Hash URI
● Também é possível usar content negotiation com hash URIs;
38. Cool URIs
● É importante diferenciar o recurso web sendo descrito do documento web
que o descreve;
● http://www.example.com/id/alice
● Identifica Alice, a pessoa
● http://www.example.com/people/alice
● Página web da Alice
● http://www.example.com/data/alice
● Documento RDF que descreve Alice
<http://www.example.com/id/alice>
foaf:page <http://www.example.com/people/alice>;
rdfs:isDefinedBy <http://www.example.com/data/alice>;
a foaf:Person;
foaf:name "Alice";
foaf:mbox <mailto:alice@example.com>;
...
<html xmlns="http://www.w3.org/1999/xhtml"
lang="en">
<head>
<title>Alice's Homepage</title>
<link rel="alternate" type="application/rdf+xml"
title="RDF Representation"
href="http://www.example.com/data/alice" />
</head> ...
39. D2RServer
● Solução opensource para publicação de dados armazenados
em banco de dados relacional ;
● Suporte para Oracle, MySQL, PostgreSQL, SQL Server,
HSQLDB, Interbase/Firebird;
40. SPARQL
● SPARQL Protocol and RDF Query Language;
● Linguagem de consulta para recuperação e manipulação dos
dados armazenados como RDF;
● É uma recomendação do W3C;
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?email
WHERE {
?person a foaf:Person.
?person foaf:name ?name.
?person foaf:mbox ?email.
}
41. SPARQL (Exemplo)
● Consultando total de poços por operadora:
PREFIX amtera-owl: <http://data.amtera.com.br/anp/ontology/>
PREFIX dbpprop: <http://dbpedia.org/property/>
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>
PREFIX dbpedia: <http://dbpedia.org/resource/>
SELECT ?operadora count(DISTINCT ?poco)
WHERE {
?poco amtera-owl:Operadora ?operadora .
?poco amtera-owl:Bacia dbpedia:Campos_Basin .
}
GROUP BY ?operadora