WEBSEMÂNTICA HTML EQUIPE: ANA CARLA CERBINO ANA CAROLINA ARAUJO DANIELLE PALHANO DOUGLAS PINHEIRO UNIVERSIDADE FEDERAL DO PARÁ Instituto de Ciências Exatas e Naturais Faculdade de Computação Curso de Bacharelado em Ciência da Computação Disciplina: ELEMENTOS DA WEB SEMÂNTICA Professor:  ADAGENOR LOBATO RIBEIRO
HTML O QUE É HTML?
HTML HTML  (HyperText Markup Language - Linguagem de marcação de Hipertexto) LINGUAGEM   DE   MARCAÇÃO :São linguagens que combinam texto com informações extras sobre o texto. Essa informação extra pode ser representada por diversos símbolos ou palavras-chave diferentes, dependendo da linguagem de marcação com que estivermos trabalhando. HIPERTEXTO  :Texto suporte que acopla outros textos cujo acesso se dá através dos links que têm a função de conectar a construção de sentido, estendendo ou complementando o texto principal.
HTML SGML E HY TIME – PADRÕES HY TIME:PADRÃO PARA REPRESENTAÇÃO ESTRUTURADA DE HIPERMIDIA E INFORMAÇÃO BASEADA EM TEMPO. UM DOCUMENTO É VISTO COMO UM CONJUNTO DE EVENTOS CONCORRENTES DEPENDENTES DE TEMPO ( AUDIO, VIDEO ETC...), CONECTADOS POR WEBS OU HIPERLINKS.   SGML: STANDARD GENERALIZED MARKUP LANGUAGE  PADRÃO ISO 8879 DE FORMATAÇÃO DE TEXTOS. DTD - DOCUMENT TYPE DEFINITION - DEFINE AS REGRAS DE FORMATAÇÃO PARA UMA DADA CLASSE DE DOCUMENTOS.  HTML É DEFINIDO SEGUNDO UM DTD DE SGML. HTML É UMA APLICAÇÃO SGML;
HISTÓRICO 1992 : Definição da linguagem especificações formais, inspiradas nas propostas originais de Tim Berners-Lee em criar uma linguagem baseada em  SGML  para a  WEB.  1994 : É publicado o HTML 2.0 por um   grupo de trabalho da IETF   (comunidade internacional ampla e aberta (técnicos, agências, fabricantes, fornecedores, pesquisadores) preocupada com a evolução da arquitetura da  Internet  e seu perfeito funcionamento ).
HISTÓRICO 1995 e 1996 : Netscape e Internet Explorer definem seus próprios padrões e surge o HTML 3.2 baseado nas implementações correntes. OBS:  Desde 1996, as especificações HTML vêm sendo  mantidas, com o auxílio de fabricantes de software,  pela World Wide Web Consortium (W3C)   1997: O HTML 4.0 é desenvolvido separando a apresentação da estrutura com style sheets (folhas de estilo).
HISTÓRICO 1999 :  Definição do HTML 4.01 (suaves modificações da versão anterior). 2000: linguagem tornou-se também uma norma internacional ( ISO / IEC  15445:2000)   A partir de 2002:Foco no desenvolvimento do XHTML,especificação HTML baseada em XML.
PRINCIPAIS CARACTERÍSTICAS PORTABILIDADE:   Os  documentos  escritos  em  HTML  devem ter  aparência  semelhante  nas  diversas plataformas de trabalho.  FLEXIBILIDADE :  O usuário deve ter a liberdade de "costumizar" diversos elementos do documento, como o tamanho padrão da letra, as cores, etc.  TAMANHO REDUZIDO :  Os  documentos  devem ter  um  tamanho  reduzido,  a  fim  de economizar  tempo na transmissão através da Internet, evitando longos períodos de espera e congestionamento  na rede.
ESTRUTURA BÁSICA Tags Aprender HTML, é aprender a usar diversas tags; Rótulos; <tag></tag>;
Exemplos de Tags <b></b>; <br/> ou <br></br>; <h1></h1>; <i></i>;
Cascading Style Sheets – CSS Proposto pela World Wide Consortium; CSS1 lançada em 12/1996 com 60 propriedades; CSS2 lançada finalizada em 05/1998 = CSS2 + 70 propriedades.
Cascading Style Sheets – CSS Mecanismo simples para adicionar estilos; É um padrão de formatação (Web Standadrds) para páginas que permite ir além das limitações impostas pelo HTML;
O uso de folhas de estilo permite: Mais versatilidade; Maior controle sobre os atributos de uma página; A utilização de layers; Modificar com rapidez o layout de um site;
Recuperação de Informações Características das Informações Como são? E de onde vêem? Conjunto de informações extenso Dados semi-estrutrurados Diferentes formatos de descrição digital Informações em bases de dados Informações em tempo real (sensores, ...)
Recuperação de Informações Sistemas de busca das informações por palavras-chave/diretório Largamente utilizados Baixa relevância de resultados Difícil validação dos dados Navegação em domínio Indexação de documentos Procura de termos Organização dos resultados ( ranking )
Recuperação de Informações Exemplos de problemas: Estrutura do documento: .... <tr><td> AUTOR </td><td> Título </td><td> Ano </td></tr> <tr><td>Pedro Araujo</td><td>Java</td><td>2001</td></tr> <tr><td>Arthur Silva</td><td>XML</td><td>2000</td></tr> ....
Recuperação de Informações Exemplos de problemas: Significado do documento: .... <tr><td> </td><td> Titel </td><td> Year /td></tr> <tr><td> Vfgc hg  </td><td></td><td> jhfg kh </td></tr> <tr><td>HuoChe no</td><td>QiChe</td><td>v bijbn</td></tr> ....
Recuperação de Informações Exemplos de problemas: Formato dos elementos .... Data:  07/09/2002 Representa: dia  sete de setembro de 2002 ou dia  nove de julho de 2002  ? ....
Recuperação de Informações Exemplos de problemas: Contexto dos termos .... <tr><td>... o  banco  era feito de madeira e estava pintado de cor verde claro, contrastando com a cor do gramado ....</td></tr> .... .... <tr><td>... ele foi ao  banco  para realizar um depósito em sua conta corrente....</td></tr> ....
Recuperação de Informações Exemplos de problemas: Termos compostos .... <tr><td>... O sr. Carlos Silva tinha ... mas o gerente afirmou que o sr. Antônio Moreira...</td></tr> .... Busca pelos termos:  Carlos Moreira .... <tr><td>... O sr.  Carlos  Silva tinha ... mas o gerente afirmou que o sr. Antônio  Moreira ...</td></tr> ....
Recuperação de Informações Localização de informações Em bases de dados legadas Em formatos digitais diversos Bibliotecas digitais e outros repositórios
Limitações da HTML A linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação. HTML é uma aplicação essencialmente voltada para estrutura do documento, sem se preocupar com a semântica dos conteúdos; Pouca semântica pode ser extraída de um documento, levando à dificuldade de manutenção e compreensão.
Limitações da HTML Quase metade das tags (marcadores) caíram em desuso; Os programas de edição eletrônica, tal como muitos designers, ignoram as tags semânticas(classificam os elementos do texto de acordo com o seu significado). Toda informação da Internet encontra-se difusa e desorganizada, pois trata-se de um repositório mundial descentralizado de documentos eletrônicos.
As ferramentas tradicionais de busca atualmente são baseadas na indexação de documentos a partir do texto puro, privilegiando documentos através de marcações HTML (tags) associadas, quantidade de páginas referenciadas e quantidade de repetições da palavra sendo procurada. Os agentes (softwares) de busca não conseguem entender o conteúdo das páginas, realizando consulta apenas por combinação de palavras-chave, pois os documentos Web foram criados de forma que fossem entendidos apenas por humanos. Limitações da HTML
HTML e WebSemântica Com o crescimento exponencial da Web tornou-se difícil indexar as informações. Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso.
HTML e WebSemântica Surge, então, a necessidade de se criar uma nova estrutura para a Web na qual seja possível escrever programas ( softwares ) capazes de entender o significado de documentos.  Esta nova proposta de estrutura da Web é chamada de Web Semântica ou Web 3.0.
HTML e WebSemântica O projeto da Web Semântica tem o princípio de incluir &quot;informação sobre a informação&quot; na Web. A Web Semântica foi um projeto criado por Tim Berners-Lee, nada mais nada menos que o criador do HTML e da World Wide Web, onde o objetivo desse projeto é melhorar a Web através de padrões e ferramentas que tornem seu conteúdo claro e de fácil manutenção. Mas para que isso ocorra  a linguagem HTML é ineficiente, uma vez que não permite criar categorias semânticas.
HTML e WebSemântica A solução passa pela definição de uma meta-linguagem que permita adaptar uma família de linguagens aos diversos tipos de informação.  Para se trabalhar a Web 3.0 optou-se utilizar a linguagem XML (eXtended Markup Language), que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir. O XML é uma evolução do HTML - não apenas convive, como se integra facilmente a ele.

Html E Websemantica Trabalho

  • 1.
    WEBSEMÂNTICA HTML EQUIPE:ANA CARLA CERBINO ANA CAROLINA ARAUJO DANIELLE PALHANO DOUGLAS PINHEIRO UNIVERSIDADE FEDERAL DO PARÁ Instituto de Ciências Exatas e Naturais Faculdade de Computação Curso de Bacharelado em Ciência da Computação Disciplina: ELEMENTOS DA WEB SEMÂNTICA Professor: ADAGENOR LOBATO RIBEIRO
  • 2.
    HTML O QUEÉ HTML?
  • 3.
    HTML HTML (HyperText Markup Language - Linguagem de marcação de Hipertexto) LINGUAGEM DE MARCAÇÃO :São linguagens que combinam texto com informações extras sobre o texto. Essa informação extra pode ser representada por diversos símbolos ou palavras-chave diferentes, dependendo da linguagem de marcação com que estivermos trabalhando. HIPERTEXTO :Texto suporte que acopla outros textos cujo acesso se dá através dos links que têm a função de conectar a construção de sentido, estendendo ou complementando o texto principal.
  • 4.
    HTML SGML EHY TIME – PADRÕES HY TIME:PADRÃO PARA REPRESENTAÇÃO ESTRUTURADA DE HIPERMIDIA E INFORMAÇÃO BASEADA EM TEMPO. UM DOCUMENTO É VISTO COMO UM CONJUNTO DE EVENTOS CONCORRENTES DEPENDENTES DE TEMPO ( AUDIO, VIDEO ETC...), CONECTADOS POR WEBS OU HIPERLINKS. SGML: STANDARD GENERALIZED MARKUP LANGUAGE PADRÃO ISO 8879 DE FORMATAÇÃO DE TEXTOS. DTD - DOCUMENT TYPE DEFINITION - DEFINE AS REGRAS DE FORMATAÇÃO PARA UMA DADA CLASSE DE DOCUMENTOS. HTML É DEFINIDO SEGUNDO UM DTD DE SGML. HTML É UMA APLICAÇÃO SGML;
  • 5.
    HISTÓRICO 1992 :Definição da linguagem especificações formais, inspiradas nas propostas originais de Tim Berners-Lee em criar uma linguagem baseada em SGML para a WEB. 1994 : É publicado o HTML 2.0 por um grupo de trabalho da IETF (comunidade internacional ampla e aberta (técnicos, agências, fabricantes, fornecedores, pesquisadores) preocupada com a evolução da arquitetura da Internet e seu perfeito funcionamento ).
  • 6.
    HISTÓRICO 1995 e1996 : Netscape e Internet Explorer definem seus próprios padrões e surge o HTML 3.2 baseado nas implementações correntes. OBS: Desde 1996, as especificações HTML vêm sendo mantidas, com o auxílio de fabricantes de software, pela World Wide Web Consortium (W3C) 1997: O HTML 4.0 é desenvolvido separando a apresentação da estrutura com style sheets (folhas de estilo).
  • 7.
    HISTÓRICO 1999 : Definição do HTML 4.01 (suaves modificações da versão anterior). 2000: linguagem tornou-se também uma norma internacional ( ISO / IEC 15445:2000) A partir de 2002:Foco no desenvolvimento do XHTML,especificação HTML baseada em XML.
  • 8.
    PRINCIPAIS CARACTERÍSTICAS PORTABILIDADE: Os documentos escritos em HTML devem ter aparência semelhante nas diversas plataformas de trabalho. FLEXIBILIDADE : O usuário deve ter a liberdade de &quot;costumizar&quot; diversos elementos do documento, como o tamanho padrão da letra, as cores, etc. TAMANHO REDUZIDO : Os documentos devem ter um tamanho reduzido, a fim de economizar tempo na transmissão através da Internet, evitando longos períodos de espera e congestionamento na rede.
  • 9.
    ESTRUTURA BÁSICA TagsAprender HTML, é aprender a usar diversas tags; Rótulos; <tag></tag>;
  • 10.
    Exemplos de Tags<b></b>; <br/> ou <br></br>; <h1></h1>; <i></i>;
  • 11.
    Cascading Style Sheets– CSS Proposto pela World Wide Consortium; CSS1 lançada em 12/1996 com 60 propriedades; CSS2 lançada finalizada em 05/1998 = CSS2 + 70 propriedades.
  • 12.
    Cascading Style Sheets– CSS Mecanismo simples para adicionar estilos; É um padrão de formatação (Web Standadrds) para páginas que permite ir além das limitações impostas pelo HTML;
  • 13.
    O uso defolhas de estilo permite: Mais versatilidade; Maior controle sobre os atributos de uma página; A utilização de layers; Modificar com rapidez o layout de um site;
  • 14.
    Recuperação de InformaçõesCaracterísticas das Informações Como são? E de onde vêem? Conjunto de informações extenso Dados semi-estrutrurados Diferentes formatos de descrição digital Informações em bases de dados Informações em tempo real (sensores, ...)
  • 15.
    Recuperação de InformaçõesSistemas de busca das informações por palavras-chave/diretório Largamente utilizados Baixa relevância de resultados Difícil validação dos dados Navegação em domínio Indexação de documentos Procura de termos Organização dos resultados ( ranking )
  • 16.
    Recuperação de InformaçõesExemplos de problemas: Estrutura do documento: .... <tr><td> AUTOR </td><td> Título </td><td> Ano </td></tr> <tr><td>Pedro Araujo</td><td>Java</td><td>2001</td></tr> <tr><td>Arthur Silva</td><td>XML</td><td>2000</td></tr> ....
  • 17.
    Recuperação de InformaçõesExemplos de problemas: Significado do documento: .... <tr><td> </td><td> Titel </td><td> Year /td></tr> <tr><td> Vfgc hg </td><td></td><td> jhfg kh </td></tr> <tr><td>HuoChe no</td><td>QiChe</td><td>v bijbn</td></tr> ....
  • 18.
    Recuperação de InformaçõesExemplos de problemas: Formato dos elementos .... Data: 07/09/2002 Representa: dia sete de setembro de 2002 ou dia nove de julho de 2002 ? ....
  • 19.
    Recuperação de InformaçõesExemplos de problemas: Contexto dos termos .... <tr><td>... o banco era feito de madeira e estava pintado de cor verde claro, contrastando com a cor do gramado ....</td></tr> .... .... <tr><td>... ele foi ao banco para realizar um depósito em sua conta corrente....</td></tr> ....
  • 20.
    Recuperação de InformaçõesExemplos de problemas: Termos compostos .... <tr><td>... O sr. Carlos Silva tinha ... mas o gerente afirmou que o sr. Antônio Moreira...</td></tr> .... Busca pelos termos: Carlos Moreira .... <tr><td>... O sr. Carlos Silva tinha ... mas o gerente afirmou que o sr. Antônio Moreira ...</td></tr> ....
  • 21.
    Recuperação de InformaçõesLocalização de informações Em bases de dados legadas Em formatos digitais diversos Bibliotecas digitais e outros repositórios
  • 22.
    Limitações da HTMLA linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação. HTML é uma aplicação essencialmente voltada para estrutura do documento, sem se preocupar com a semântica dos conteúdos; Pouca semântica pode ser extraída de um documento, levando à dificuldade de manutenção e compreensão.
  • 23.
    Limitações da HTMLQuase metade das tags (marcadores) caíram em desuso; Os programas de edição eletrônica, tal como muitos designers, ignoram as tags semânticas(classificam os elementos do texto de acordo com o seu significado). Toda informação da Internet encontra-se difusa e desorganizada, pois trata-se de um repositório mundial descentralizado de documentos eletrônicos.
  • 24.
    As ferramentas tradicionaisde busca atualmente são baseadas na indexação de documentos a partir do texto puro, privilegiando documentos através de marcações HTML (tags) associadas, quantidade de páginas referenciadas e quantidade de repetições da palavra sendo procurada. Os agentes (softwares) de busca não conseguem entender o conteúdo das páginas, realizando consulta apenas por combinação de palavras-chave, pois os documentos Web foram criados de forma que fossem entendidos apenas por humanos. Limitações da HTML
  • 25.
    HTML e WebSemânticaCom o crescimento exponencial da Web tornou-se difícil indexar as informações. Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso.
  • 26.
    HTML e WebSemânticaSurge, então, a necessidade de se criar uma nova estrutura para a Web na qual seja possível escrever programas ( softwares ) capazes de entender o significado de documentos. Esta nova proposta de estrutura da Web é chamada de Web Semântica ou Web 3.0.
  • 27.
    HTML e WebSemânticaO projeto da Web Semântica tem o princípio de incluir &quot;informação sobre a informação&quot; na Web. A Web Semântica foi um projeto criado por Tim Berners-Lee, nada mais nada menos que o criador do HTML e da World Wide Web, onde o objetivo desse projeto é melhorar a Web através de padrões e ferramentas que tornem seu conteúdo claro e de fácil manutenção. Mas para que isso ocorra a linguagem HTML é ineficiente, uma vez que não permite criar categorias semânticas.
  • 28.
    HTML e WebSemânticaA solução passa pela definição de uma meta-linguagem que permita adaptar uma família de linguagens aos diversos tipos de informação. Para se trabalhar a Web 3.0 optou-se utilizar a linguagem XML (eXtended Markup Language), que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir. O XML é uma evolução do HTML - não apenas convive, como se integra facilmente a ele.