PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br
Contextualização
 Sistemas de Informação de Recuperação atuais
são incapazes de recuperar informações de
uma forma adequada no contexto de
ambientes informacionais digitais tendo a Web
como plataforma (Big Data).
 Os ambientes computacionais de informação
atendem plenamente as necessidades
informacionais dos usuários?
Objetivo
 Criar um agente de busca semântica na WEB
que permita:
 Localização;
 Tratamento e
 Recuperação da Informação.
 Domínio da busca por documentos
bibliográficos de pesquisas, de modo a
proporcionar a intersecção entre os metadados
de publicações científicas e as necessidades
informacionais dos usuários, proposto por
Fusco (2010).
Metodologia
 Levantamento de requisitos informacionais
para acesso às pesquisas científicas;
 Definição da metodologia de construção de
ontologias;
 Modelagem da ontologia de aplicação;
 Implementação do protótipo do agente
semântico de recuperação de informações
baseado em conceitos semânticos;
 Análise dos resultados de recuperação do
protótipo (prova de conceito).
Plataforma
Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração
Modelo de Extração
Figura 2: Modelo de extração do agente semântico
Ontologia
 Segundo Clark (1999), uma ontologia é
organizada em hierarquias de conceitos;
 E utilizando a classificação de Gomes-Perez
(1999), a ontologia do projeto é uma Ontologia
de Aplicação, que busca solucionar um
problema específico de um domínio.
Implementação Ontologia
 Para realizar a implementação da ontologia,
foi seguido o modelo proposto por Noy (2001),
em que são realizados 7 passos na construção
de ontologias;
 Como domínio para a construção desta
ontologia, foi utilizada busca de publicações
científicas na base de dados IEEE;
 Foi utilizado o programa Protégé para realizar
a implementação da ontologia.
Implementação Ontologia
Figura 3: Diagrama da Ontologia
Implementação do Agente
 O robô de busca extrai os metadados de
artigos da página do IEEE Xplore
(http://ieeexplore.ieee.org).
 Após a extração, é realizada a análise dos
metadados baseados nos conceitos descritos
na ontologia.
Lógica de Extração
Figura 4: Lógica de Extração do Robô de Busca
Testes
 Para a realização dos testes, foram realizadas
buscas de publicações na área de banco de
dados. Por exemplo: publicações sobre
datawarehouse;
 Neste exemplo, o SRI do IEEE recupera 25
artigos, porém apenas 7 são retornados pela
busca semântica, pois são os de fato
aderentes à necessidade informacional do
usuário.
Figura 5: Relações da classe do termo pesquisado
Testes
Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”
Resultados
 O uso de ontologias permite estender o
processo de Recuperação da Informação com a
utilização de conceitos semânticos;
 Os resultados obtidos por este agente
proporcionam uma maior intersecção entre os
documentos e as necessidades informacionais
dos usuários;
 Demonstrou-se uma alternativa prática de
implementação da Web Semântica no processo
de Recuperação da Informação.
Referências Bibliográficas
 Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent
Systems. 1999.
 Fusco, E. Modelos conceituais de dados como parte do processo da
catalogação: perspectiva de uso dos FRBR no desenvolvimento de
catálogos bibliográficos digitais. 2012.
 Gómez-Pérez, A. Ontological engineering A state of the art. Expert
Update: Knowledge Based Systems and Applied Artificial
Intelligence 2.3. 33-43. 1999.
 Noy, N. F. et al. Creating Semantic Web Contents with Protégé-
2000. IEEE. 2001.
PLATAFORMA SEMÂNTICA DE
RECUPERAÇÃO DA INFORMAÇÃO
APLICADA A EXTRAÇÃO DE
ARTIGOS CIENTÍFICOS
Caio Saraiva Coneglian
caio.coneglian@gmail.com
Prof. Dr. Elvis Fusco
fusco@univem.edu.br

Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

  • 1.
    PLATAFORMA SEMÂNTICA DE RECUPERAÇÃODA INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS CIENTÍFICOS Caio Saraiva Coneglian caio.coneglian@gmail.com Prof. Dr. Elvis Fusco fusco@univem.edu.br
  • 2.
    Contextualização  Sistemas deInformação de Recuperação atuais são incapazes de recuperar informações de uma forma adequada no contexto de ambientes informacionais digitais tendo a Web como plataforma (Big Data).  Os ambientes computacionais de informação atendem plenamente as necessidades informacionais dos usuários?
  • 3.
    Objetivo  Criar umagente de busca semântica na WEB que permita:  Localização;  Tratamento e  Recuperação da Informação.  Domínio da busca por documentos bibliográficos de pesquisas, de modo a proporcionar a intersecção entre os metadados de publicações científicas e as necessidades informacionais dos usuários, proposto por Fusco (2010).
  • 4.
    Metodologia  Levantamento derequisitos informacionais para acesso às pesquisas científicas;  Definição da metodologia de construção de ontologias;  Modelagem da ontologia de aplicação;  Implementação do protótipo do agente semântico de recuperação de informações baseado em conceitos semânticos;  Análise dos resultados de recuperação do protótipo (prova de conceito).
  • 5.
    Plataforma Figura 1: Arquiteturade Contextualização do Agente Semântico de Extração
  • 6.
    Modelo de Extração Figura2: Modelo de extração do agente semântico
  • 7.
    Ontologia  Segundo Clark(1999), uma ontologia é organizada em hierarquias de conceitos;  E utilizando a classificação de Gomes-Perez (1999), a ontologia do projeto é uma Ontologia de Aplicação, que busca solucionar um problema específico de um domínio.
  • 8.
    Implementação Ontologia  Pararealizar a implementação da ontologia, foi seguido o modelo proposto por Noy (2001), em que são realizados 7 passos na construção de ontologias;  Como domínio para a construção desta ontologia, foi utilizada busca de publicações científicas na base de dados IEEE;  Foi utilizado o programa Protégé para realizar a implementação da ontologia.
  • 9.
  • 10.
    Implementação do Agente O robô de busca extrai os metadados de artigos da página do IEEE Xplore (http://ieeexplore.ieee.org).  Após a extração, é realizada a análise dos metadados baseados nos conceitos descritos na ontologia.
  • 11.
    Lógica de Extração Figura4: Lógica de Extração do Robô de Busca
  • 12.
    Testes  Para arealização dos testes, foram realizadas buscas de publicações na área de banco de dados. Por exemplo: publicações sobre datawarehouse;  Neste exemplo, o SRI do IEEE recupera 25 artigos, porém apenas 7 são retornados pela busca semântica, pois são os de fato aderentes à necessidade informacional do usuário. Figura 5: Relações da classe do termo pesquisado
  • 13.
    Testes Figura 6: Resultadode uma busca, pesquisando o termo “Datawarehouse”
  • 14.
    Resultados  O usode ontologias permite estender o processo de Recuperação da Informação com a utilização de conceitos semânticos;  Os resultados obtidos por este agente proporcionam uma maior intersecção entre os documentos e as necessidades informacionais dos usuários;  Demonstrou-se uma alternativa prática de implementação da Web Semântica no processo de Recuperação da Informação.
  • 15.
    Referências Bibliográficas  Clark,D. Mad cows, metathesaurim and meaning, IEEE Intelligent Systems. 1999.  Fusco, E. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2012.  Gómez-Pérez, A. Ontological engineering A state of the art. Expert Update: Knowledge Based Systems and Applied Artificial Intelligence 2.3. 33-43. 1999.  Noy, N. F. et al. Creating Semantic Web Contents with Protégé- 2000. IEEE. 2001.
  • 16.
    PLATAFORMA SEMÂNTICA DE RECUPERAÇÃODA INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS CIENTÍFICOS Caio Saraiva Coneglian caio.coneglian@gmail.com Prof. Dr. Elvis Fusco fusco@univem.edu.br