SlideShare uma empresa Scribd logo
1 de 72
WEB SEMÂNTICA
   Renan Oliveira
AGENDA

•   Web atual: hipertexto

•   Web semântica

•   Ontologias

•   Modelagem de dados

•   Linked Open Data
WEB ATUAL


•   Apresentação do conteúdos

•   Formatação, não significado

•   Pouca ou nenhuma estruturação
CONTEÚDO MULTIMÍDIA

•   Vários elementos na página

•   Fotos, vídeos e animações

•   Qual a relação entre eles?

•   Quem é mencionado no texto?

•   Quem, Quando, Onde...
COMO ISSO AFETA
    ALGO COMUM?
Busca por Gols do Roberto Carlos no Maracanã
NA GLOBO.COM
E... NO GOOGLE
PROBLEMAS

•   Busca feita por palavras (dados, não informações)

•   Falta de contexto (como fotos e vídeos se relacionam com o texto?)

•   Ambiguidade (qual Roberto Carlos?)

•   Pouca relevância (gol???)
MELHORIAS


•   Registrar de forma precisa

•   Organizar corretamente

•   Transmitir significado
WEB SEMÂNTICA



“I have a dream for the web in which computers become
capable of analyzing all the data on the web - the content,
links, and transactions between people and computers.”
Tim Berners-Lee
HOMEM + MÁQUINA


•   Cada um desempenha seu melhor papel

•   Homem - desambiguar, relacionar e definir regras

•   Máquina - organizar, indexar e inferir
REGISTRAR INFORMAÇÃO


•   Produtor do conteúdo

•   Sabe o que, quem, quando, onde...

•   Resolve ambiguidade
GOL DO ROBERTO CARLOS
ONTOLOGIAS



• “Uma  ontologia é um modelo de dados que representa um
 conjunto de conceitos dentro de um domínio e os
 relacionamentos entre eles” - Wikipedia
MONTAGEM

•   Identificar os indivíduos

•   Descrever seus atributos

•   Agrupar os indivíduos em classes

•   Enumerar as relações entre indivíduos

•   Definir regras sobre atributos e relações
CONTRUÇÃO DE
                    ONTOLOGIAS

•   Linguagens para definir ontologias

    •   OWL (Web Ontology Language)

    •   RDF (Resource description framework)
REPRESENTAÇÃO EM TRIPLAS
VANTAGENS
•   Modelagem natural

    •   muito próximo da orientação a objetos

•   Expressividade

    •   representa qualquer relacionamento possível

    •   restrições, cardinalidade

•   Capacidade de inferência

    •   regras sobre as classes e relacionamentos
EXIBIR INFORMAÇÃO

•   HTML e XML não são suficientes

•   Estrutura, mas não significado

    <document type="progressive rock">
    <name>Another Brick in the Wall</name>
    <author>Roger Waters</author>
    </document>
REPRESENTAÇÃO
                    ESTRUTURADA
•   “Tags” com estrutura semântica

•   Padronização dos elementos

    <music type="rock">
    <title>Another Brick in the Wall</title>
    <composer>Roger Waters</composer>
    </music>
COMO PADRONIZAR?

•   Vocabulários controlados

•   Exemplo: Dublin Core Metadata Initiative (DCMI)

    •   termos com significado bem definido:

        •   title, creator, contributor, creator, ...
OUTROS VOCABULÁRIOS
•   FOAF (Friend of a Friend)

    •   informações sobre as pessoas

    •   orginalmente usado para redes sociais

•   Core Ontology for Multimedia (COMM)

    •   informações sobre arquivos de mídia

    •   dimensões, encoding, histórico de produção
XML USANDO DUBLIN CORE

      <music type="rock">
         <dc:title>
           Another Brick in the Wall
          </dc:title>
          <dc:creator>
           Roger Waters
          </dc:creator>
      </music>
HTML + RDFA

<span property="foaf:name">
 Roger Waters
</span>
 nasceu em
<span property="foaf:dateOfBirth" content="1943-09-06"
datatype="xsd:date">
 6 de setembro de 1943
</span>
SCHEMA.ORG


•   Iniciativa Google, Bing e Yahoo!

•   Gera Rich Snippet

•   Grande melhoria em SEO.
BENEFÍCIOS


•   Significado explícito

•   Sem ambiguidades

•   Entendido por máquinas de busca
LINKED DATA

•   Referências cruzadas globais

•   Embutidas em páginas HTML

    •   RDFa, schema.org

•   Identificadores único (URIs) para conceitos

•   Bases de dados de referência
LINKED OPEN DATA CLOUD
•   Repositório de uso geral

    •   DBPedia (conceitos extraídos da Wikipedia)

    •   FreeBase

•   Repositório sobre domínios específicos

    •   GeoNames

    •   MusicBrainz

•   Novos sites com autoridade sobre o domínio
BUSCAS SEMÂNTICAS

•   Encontram e analisam meta-informação

    •   tags com RDFa, microdata

    •   repositório de triplas

•   Relacionam informações em sites diferentes

•   Exemplo: Sindice e Google*
como usamos?
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
CONHECIMENTO
        ÚNICO
     Menor risco de duplicidade dos dados
Simplificação do uso e da manutenção dos dados
       Agilidade na recuperação dos dados
cita a entidade
            Materia                     Pessoa
ONTOLOGIA
TRIPLA
                      cita a entidade
            Matéria                     Romário
CASES RELEVANTES
    Modelos de uso da
     Web Semântica
•   Best Buy

•   BBC

•   New York Times
AÇÕES REALIZADAS


•   Uso da ontologia GoodRelations

•   Adição de metadados: RDFa
RESULTADOS ALCANÇADOS


•   Tráfego originado por motores de busca: + 30%

•   Taxa de cliques no Yahoo!: + 15%

•   Aumento significativo do Google PageRank
AÇÕES REALIZADAS


•   Ontologias públicas

•   Interligação com repositórios de dados externos

•   Criação de categorias e agregadores úteis
Domínios representados
Ontologias públicas
    utilizadas
Ontologia de programas
RESULTADOS ALCANÇADOS


•   Proliferação de links relevantes: potencialização de SEO

•   Reuso das informações: menor desperdício de pessoal

•   Navegação interligada e escalável para toda a BBC
AÇÕES REALIZADAS


•   Anotação e indexação do conteúdo baseado em indivíduos

•   Ontologia pública

•   Interligação com repositórios de dados externos

•   Adição de metadados: Open Graph
NYT Index Abstract
                              ✓ Assuntos: Livestock; Goats;
Jenny Brown, owner of          Amputation; Prosthesis; Legs
Woodstock (NY) Farm Animal
Sanctuary, forms special      ✓ Organizações:Woodstock Farm

bond with Albie, goat that     Animal Sanctuary
probably escaped from New
                              ✓ Lugares:Woodstock (NY); New
York City slaughterhouse;
                               York City
Albie injured leg in escape
and it had to be amputated;
                              ✓ Pessoas: Santos, Fernanda; Brown,
Brown had leg amputated as
Apresentação:
www.renanoliveira.net

Contato:
renan@corp.globo.com
@renan_oliveira

globo.com
Renan Oliveira

Mais conteúdo relacionado

Mais procurados

Deep Dive on Amazon Athena - AWS Online Tech Talks
Deep Dive on Amazon Athena - AWS Online Tech TalksDeep Dive on Amazon Athena - AWS Online Tech Talks
Deep Dive on Amazon Athena - AWS Online Tech TalksAmazon Web Services
 
Data saturday Oslo Azure Purview Erwin de Kreuk
Data saturday Oslo Azure Purview Erwin de KreukData saturday Oslo Azure Purview Erwin de Kreuk
Data saturday Oslo Azure Purview Erwin de KreukErwin de Kreuk
 
Data Mesh using Microsoft Fabric
Data Mesh using Microsoft FabricData Mesh using Microsoft Fabric
Data Mesh using Microsoft FabricNathan Bijnens
 
Data Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & AthenaData Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & AthenaAmazon Web Services
 
Architect’s Open-Source Guide for a Data Mesh Architecture
Architect’s Open-Source Guide for a Data Mesh ArchitectureArchitect’s Open-Source Guide for a Data Mesh Architecture
Architect’s Open-Source Guide for a Data Mesh ArchitectureDatabricks
 
What it means to be FAIR
What it means to be FAIRWhat it means to be FAIR
What it means to be FAIRSarah Jones
 
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...Jochem van Grondelle
 
FAIR Data-centric Information Architecture.pptx
FAIR Data-centric Information Architecture.pptxFAIR Data-centric Information Architecture.pptx
FAIR Data-centric Information Architecture.pptxBen Gardner
 
Driving Business Insights with a Modern Data Architecture AWS Summit SG 2017
Driving Business Insights with a Modern Data Architecture  AWS Summit SG 2017Driving Business Insights with a Modern Data Architecture  AWS Summit SG 2017
Driving Business Insights with a Modern Data Architecture AWS Summit SG 2017Amazon Web Services
 
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...Databricks
 
Kappa vs Lambda Architectures and Technology Comparison
Kappa vs Lambda Architectures and Technology ComparisonKappa vs Lambda Architectures and Technology Comparison
Kappa vs Lambda Architectures and Technology ComparisonKai Wähner
 
Data Platform Architecture Principles and Evaluation Criteria
Data Platform Architecture Principles and Evaluation CriteriaData Platform Architecture Principles and Evaluation Criteria
Data Platform Architecture Principles and Evaluation CriteriaScyllaDB
 
A Journey into Databricks' Pipelines: Journey and Lessons Learned
A Journey into Databricks' Pipelines: Journey and Lessons LearnedA Journey into Databricks' Pipelines: Journey and Lessons Learned
A Journey into Databricks' Pipelines: Journey and Lessons LearnedDatabricks
 
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...Denodo
 
Spline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingSpline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingVaclav Kosar
 
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017Amazon Web Services
 
How to govern and secure a Data Mesh?
How to govern and secure a Data Mesh?How to govern and secure a Data Mesh?
How to govern and secure a Data Mesh?confluent
 

Mais procurados (20)

Data modelling 101
Data modelling 101Data modelling 101
Data modelling 101
 
Deep Dive on Amazon Athena - AWS Online Tech Talks
Deep Dive on Amazon Athena - AWS Online Tech TalksDeep Dive on Amazon Athena - AWS Online Tech Talks
Deep Dive on Amazon Athena - AWS Online Tech Talks
 
Data saturday Oslo Azure Purview Erwin de Kreuk
Data saturday Oslo Azure Purview Erwin de KreukData saturday Oslo Azure Purview Erwin de Kreuk
Data saturday Oslo Azure Purview Erwin de Kreuk
 
Data Mesh using Microsoft Fabric
Data Mesh using Microsoft FabricData Mesh using Microsoft Fabric
Data Mesh using Microsoft Fabric
 
Data Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & AthenaData Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & Athena
 
Webinar Data Mesh - Part 3
Webinar Data Mesh - Part 3Webinar Data Mesh - Part 3
Webinar Data Mesh - Part 3
 
Architect’s Open-Source Guide for a Data Mesh Architecture
Architect’s Open-Source Guide for a Data Mesh ArchitectureArchitect’s Open-Source Guide for a Data Mesh Architecture
Architect’s Open-Source Guide for a Data Mesh Architecture
 
What it means to be FAIR
What it means to be FAIRWhat it means to be FAIR
What it means to be FAIR
 
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...
To mesh or mess up your data organisation - Jochem van Grondelle (Prosus/OLX ...
 
FAIR Data-centric Information Architecture.pptx
FAIR Data-centric Information Architecture.pptxFAIR Data-centric Information Architecture.pptx
FAIR Data-centric Information Architecture.pptx
 
Driving Business Insights with a Modern Data Architecture AWS Summit SG 2017
Driving Business Insights with a Modern Data Architecture  AWS Summit SG 2017Driving Business Insights with a Modern Data Architecture  AWS Summit SG 2017
Driving Business Insights with a Modern Data Architecture AWS Summit SG 2017
 
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...
Zipline: Airbnb’s Machine Learning Data Management Platform with Nikhil Simha...
 
Kappa vs Lambda Architectures and Technology Comparison
Kappa vs Lambda Architectures and Technology ComparisonKappa vs Lambda Architectures and Technology Comparison
Kappa vs Lambda Architectures and Technology Comparison
 
Data Platform Architecture Principles and Evaluation Criteria
Data Platform Architecture Principles and Evaluation CriteriaData Platform Architecture Principles and Evaluation Criteria
Data Platform Architecture Principles and Evaluation Criteria
 
A Journey into Databricks' Pipelines: Journey and Lessons Learned
A Journey into Databricks' Pipelines: Journey and Lessons LearnedA Journey into Databricks' Pipelines: Journey and Lessons Learned
A Journey into Databricks' Pipelines: Journey and Lessons Learned
 
Introduction to AWS Glue
Introduction to AWS GlueIntroduction to AWS Glue
Introduction to AWS Glue
 
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...
Data Catalog in Denodo Platform 7.0: Creating a Data Marketplace with Data Vi...
 
Spline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingSpline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured Streaming
 
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017
RDS Postgres and Aurora Postgres | AWS Public Sector Summit 2017
 
How to govern and secure a Data Mesh?
How to govern and secure a Data Mesh?How to govern and secure a Data Mesh?
How to govern and secure a Data Mesh?
 

Semelhante a Introdução a web semântica e o case da globo.com

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisRosana Lanzelotte
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaNaira Michelle Alves Pereira
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLOtávio Calaça Xavier
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeElvis Fusco
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Luiz Adolfo de Andrade
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documentoAlex Martins
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Thiago de Azeredo
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partiturasRosana Lanzelotte
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de ConteúdoPatricia De Cia
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaLuciano Ramalho
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informaçãoHenrique Fonseca
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasHelio Henrique L. C. Monte-Alto
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasSociedade da Informação
 

Semelhante a Introdução a web semântica e o case da globo.com (20)

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicais
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomia
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQL
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na Rede
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partituras
 
Saber avaliar a informação
Saber avaliar a informaçãoSaber avaliar a informação
Saber avaliar a informação
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de Conteúdo
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiência
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informação
 
Aula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.pptAula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.ppt
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologias
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e Ontologias
 
Palestra Introdução a Linked Data
Palestra Introdução a Linked DataPalestra Introdução a Linked Data
Palestra Introdução a Linked Data
 

Mais de Renan Moreira de Oliveira

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServiceRenan Moreira de Oliveira
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Renan Moreira de Oliveira
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosRenan Moreira de Oliveira
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaRenan Moreira de Oliveira
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveRenan Moreira de Oliveira
 

Mais de Renan Moreira de Oliveira (17)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
Data science Framework
Data science FrameworkData science Framework
Data science Framework
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Big data e a globo.com - 2017
Big data e a globo.com - 2017Big data e a globo.com - 2017
Big data e a globo.com - 2017
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 

Último

ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx2m Assessoria
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx2m Assessoria
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx2m Assessoria
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploDanilo Pinotti
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx2m Assessoria
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsDanilo Pinotti
 

Último (6)

ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 

Introdução a web semântica e o case da globo.com

  • 1. WEB SEMÂNTICA Renan Oliveira
  • 2. AGENDA • Web atual: hipertexto • Web semântica • Ontologias • Modelagem de dados • Linked Open Data
  • 3. WEB ATUAL • Apresentação do conteúdos • Formatação, não significado • Pouca ou nenhuma estruturação
  • 4. CONTEÚDO MULTIMÍDIA • Vários elementos na página • Fotos, vídeos e animações • Qual a relação entre eles? • Quem é mencionado no texto? • Quem, Quando, Onde...
  • 5. COMO ISSO AFETA ALGO COMUM? Busca por Gols do Roberto Carlos no Maracanã
  • 8. PROBLEMAS • Busca feita por palavras (dados, não informações) • Falta de contexto (como fotos e vídeos se relacionam com o texto?) • Ambiguidade (qual Roberto Carlos?) • Pouca relevância (gol???)
  • 9. MELHORIAS • Registrar de forma precisa • Organizar corretamente • Transmitir significado
  • 10. WEB SEMÂNTICA “I have a dream for the web in which computers become capable of analyzing all the data on the web - the content, links, and transactions between people and computers.” Tim Berners-Lee
  • 11. HOMEM + MÁQUINA • Cada um desempenha seu melhor papel • Homem - desambiguar, relacionar e definir regras • Máquina - organizar, indexar e inferir
  • 12. REGISTRAR INFORMAÇÃO • Produtor do conteúdo • Sabe o que, quem, quando, onde... • Resolve ambiguidade
  • 13. GOL DO ROBERTO CARLOS
  • 14. ONTOLOGIAS • “Uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre eles” - Wikipedia
  • 15. MONTAGEM • Identificar os indivíduos • Descrever seus atributos • Agrupar os indivíduos em classes • Enumerar as relações entre indivíduos • Definir regras sobre atributos e relações
  • 16. CONTRUÇÃO DE ONTOLOGIAS • Linguagens para definir ontologias • OWL (Web Ontology Language) • RDF (Resource description framework)
  • 18.
  • 19. VANTAGENS • Modelagem natural • muito próximo da orientação a objetos • Expressividade • representa qualquer relacionamento possível • restrições, cardinalidade • Capacidade de inferência • regras sobre as classes e relacionamentos
  • 20. EXIBIR INFORMAÇÃO • HTML e XML não são suficientes • Estrutura, mas não significado <document type="progressive rock"> <name>Another Brick in the Wall</name> <author>Roger Waters</author> </document>
  • 21. REPRESENTAÇÃO ESTRUTURADA • “Tags” com estrutura semântica • Padronização dos elementos <music type="rock"> <title>Another Brick in the Wall</title> <composer>Roger Waters</composer> </music>
  • 22. COMO PADRONIZAR? • Vocabulários controlados • Exemplo: Dublin Core Metadata Initiative (DCMI) • termos com significado bem definido: • title, creator, contributor, creator, ...
  • 23. OUTROS VOCABULÁRIOS • FOAF (Friend of a Friend) • informações sobre as pessoas • orginalmente usado para redes sociais • Core Ontology for Multimedia (COMM) • informações sobre arquivos de mídia • dimensões, encoding, histórico de produção
  • 24. XML USANDO DUBLIN CORE <music type="rock"> <dc:title> Another Brick in the Wall </dc:title> <dc:creator> Roger Waters </dc:creator> </music>
  • 25. HTML + RDFA <span property="foaf:name"> Roger Waters </span> nasceu em <span property="foaf:dateOfBirth" content="1943-09-06" datatype="xsd:date"> 6 de setembro de 1943 </span>
  • 26. SCHEMA.ORG • Iniciativa Google, Bing e Yahoo! • Gera Rich Snippet • Grande melhoria em SEO.
  • 27. BENEFÍCIOS • Significado explícito • Sem ambiguidades • Entendido por máquinas de busca
  • 28. LINKED DATA • Referências cruzadas globais • Embutidas em páginas HTML • RDFa, schema.org • Identificadores único (URIs) para conceitos • Bases de dados de referência
  • 29.
  • 30. LINKED OPEN DATA CLOUD • Repositório de uso geral • DBPedia (conceitos extraídos da Wikipedia) • FreeBase • Repositório sobre domínios específicos • GeoNames • MusicBrainz • Novos sites com autoridade sobre o domínio
  • 31. BUSCAS SEMÂNTICAS • Encontram e analisam meta-informação • tags com RDFa, microdata • repositório de triplas • Relacionam informações em sites diferentes • Exemplo: Sindice e Google*
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. CONHECIMENTO ÚNICO Menor risco de duplicidade dos dados Simplificação do uso e da manutenção dos dados Agilidade na recuperação dos dados
  • 49. cita a entidade Materia Pessoa ONTOLOGIA TRIPLA cita a entidade Matéria Romário
  • 50.
  • 51. CASES RELEVANTES Modelos de uso da Web Semântica
  • 52. Best Buy • BBC • New York Times
  • 53.
  • 54. AÇÕES REALIZADAS • Uso da ontologia GoodRelations • Adição de metadados: RDFa
  • 55.
  • 56.
  • 57. RESULTADOS ALCANÇADOS • Tráfego originado por motores de busca: + 30% • Taxa de cliques no Yahoo!: + 15% • Aumento significativo do Google PageRank
  • 58.
  • 59. AÇÕES REALIZADAS • Ontologias públicas • Interligação com repositórios de dados externos • Criação de categorias e agregadores úteis
  • 61. Ontologias públicas utilizadas
  • 63.
  • 64.
  • 65. RESULTADOS ALCANÇADOS • Proliferação de links relevantes: potencialização de SEO • Reuso das informações: menor desperdício de pessoal • Navegação interligada e escalável para toda a BBC
  • 66.
  • 67. AÇÕES REALIZADAS • Anotação e indexação do conteúdo baseado em indivíduos • Ontologia pública • Interligação com repositórios de dados externos • Adição de metadados: Open Graph
  • 68. NYT Index Abstract ✓ Assuntos: Livestock; Goats; Jenny Brown, owner of Amputation; Prosthesis; Legs Woodstock (NY) Farm Animal Sanctuary, forms special ✓ Organizações:Woodstock Farm bond with Albie, goat that Animal Sanctuary probably escaped from New ✓ Lugares:Woodstock (NY); New York City slaughterhouse; York City Albie injured leg in escape and it had to be amputated; ✓ Pessoas: Santos, Fernanda; Brown, Brown had leg amputated as
  • 69.
  • 70.
  • 71.

Notas do Editor

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. UM ROM&amp;#xC1;RIO ---- DADO CONSISTENTE NA NOSSA BASE\nDADO F&amp;#xC1;CIL DE USADO E MANTIDO\n\n
  58. PREDICADO CONECTA DUAS CLASSES\n
  59. ATORES: TIMES, T&amp;#xC9;CNICO, ETC...\nEVENTO: PARTIDA\nN&amp;#xC3;O TEM O JUIZ\n
  60. \n
  61. \n
  62. - Grande empresa varejo de eletronicos\n- Artigo semtech\n- benef&amp;#xED;cios da web sem&amp;#xE2;ntica\n\n\n
  63. good relations\n --&gt; vocabulario profissional e-commerce\n --&gt; amig&amp;#xE1;vel m&amp;#xE1;quina busca, mobile, exten&amp;#xE7;&amp;#xF5;es browser\nrdfa\n --&gt; anotar XHTML com sem&amp;#xE2;ntica\n --&gt; utilizado por m&amp;#xE1;quinas de busca, machine readable\n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. MUSIC BRAINZ - IMDB DA M&amp;#xDA;SICA\n
  71. DOM&amp;#xCD;NIO QUE INTERESSA A GLOBO.COM\n
  72. ESTOU PROCURANDO SOBRE NOT&amp;#xCD;CIAS DA CHINA\n
  73. P&amp;#xC1;GINA DE T&amp;#xD3;PICOS SOBRE A CHINA\n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n