Recuperação da Informação


      Renato Fernandes Corrêa
          Recuperação da Informação -
                  Introdução
                       2010.2


                DCI-UFPE                1
2


              Roteiro
Motivação/Introdução
Definição
Sistema de Recuperação de Informação
Exemplos de SRI
3



       Motivação/Introdução
O problema: "a tarefa massiva de tornar mais
acessível, um acervo crescente de conhecimento“.
VANNEVAR BUSH (1945)
   Explosão informacional
   Importância estratégica da informação
4



         Motivação/Introdução
A solução: Calvin MOOERS (1951) cunhou o termo
recuperação de informação, destacando que ele "engloba os
aspectos intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer sistemas,
técnicas ou máquinas empregados para o desempenho da
operação.“
“Certamente, a recuperação da informação não foi a única
responsável pelo desenvolvimento da CI [Ciência da
Informação], mas pode ser considerada como principal; ao
longo do tempo, a CI ultrapassou a recuperação da informação,
mas os problemas principais tiveram sua origem aí e ainda
constituem seu núcleo.” SARACEVIC (1991)
5
    Recuperação de Informação
            Definição
Área de pesquisa e desenvolvimento que
  investiga métodos e técnicas
  para a representação, a organização, o
  armazenamento, a busca e a recuperação de itens
  de informação

Objetivo principal
  facilitar o acesso a documentos (itens de informação)
  relevantes à necessidade de informação do usuário
     Geralmente representada através de consultas
     baseadas em palavras-chaves
6
Tarefa típica de Recuperação de
        Informação (RI)
Dados
  Um corpus de documentos e
  Uma consulta do usuário
Encontrar
  Um conjunto (ordenados) de documentos que
  são relevantes para a consulta
7


   Elementos de um Sistemas de RI

                Corpus de
                documentos



 Consulta       Sistema de RI


                                1. Doc1
                                2. Doc2
Usuário         Documentos      3. Doc3
                 ordenados         .
                                   .
8
             Recuperação de Informação

         Como funciona?




                                                                      Necessidade de
                                                                       Informação
                           Armazenamento

               Indexação                      Indexação    Consulta
Documentos   Representação                   Representação


        Sistema de                                        Resultado   Usuário
 Recuperação da Informação
                                  Recuperação
                                  Casamento, Ordenação
Modelos de Recuperação de Informação

 Existe uma distinção entre:
   A tarefa do usuário
      Recuperação ou Navegação
   A visão lógica dos documentos
      sua representação no sistema
   O modelo de recuperação de informação
      Clássico ou estruturado ou navegação
Navegação



Embrapa - Infoteca
Recuperação
12


             Sistemas de RI
Um sistema automático para RI pode ser visto como
  a parte do sistema de informação responsável pelo
  armazenamento ordenado dos documentos em um
  banco de dados,
  e sua posterior recuperação
  para responder a consulta do usuário.
Etapas principais na construção:
  Aquisição (seleção) dos documentos
  Preparação dos documentos
  Indexação dos documentos
  Armazenamento
  Recuperação
     Busca (casamento com a consulta do usuário)
     Ordenação dos documentos recuperados
Exemplos de sistemas de                13


  recuperação de informação
Sistemas de RI em DVD e Cederrom
Catálogo em linha de acesso público
Engenhos de busca
Serviços de busca em linha
Sistemas de gerenciamento de documentos
Sistemas de Filtragem de Informação
Sistemas de Extração de Informação
Catálogo em linha de acesso público
              (OPAC)
 Sistemas que recuperam informação em
 bases de dados catalográficos de bibliotecas.
 Exemplo:
15

               Engenhos de Busca

                                                        Engenho de Busca

 Usuário               Servidor de Consultas

                                                                2
            Consulta        1       Recuperador


 Browser    Resposta    4                          3
                                Ordenador
                                                          Base de
                                                          Índices
                       Motor de
                       Indexação       Indexador

                                               Representação dos Docs
            Spider
                        Docs          Pré-Processador
           Aquisição
Web
Serviços de busca em linha
Sistemas que recuperam informação em
bases de dados bibliográficos.
Exemplos:
Sistemas de gerenciamento de
          documentos
Sistemas que gerenciam versões e recuperam
informação em um corpus de documentos digitais.
Exemplos:
  Softwares Proprietários da IBM, Xerox, Oracle e
  Microsoft
  Softwares Livres
     Alfresco
     KnowledgeTree
     Main//Pyrus DMS
     Nuxeo
     OpenKM
     Archivista
Sistemas de Filtragem de Informação
  Sistemas que filtram a informação recuperada
  de acordo com o interesse do usuário

 Usuário       Servidor News



             Artigos       Perfil do
             Indexados     usuário

              Engenho de
                Busca                  Internet
19


Sistemas de Extração de Informação

  Sistemas capazes de extrair de documentos
  relevantes apenas a informação requerida
  A informação extraída pode ser apresentada
  ao usuário e/ou armazenada em BDs.
Página de Hotel
                                  Template
                                   Nome:
                  Sistema de EI    End.:
                                   Fone:
                                   Fax:
                                   Preços:
                                             BD
20


             Referências
BAYEZA-YATES, RIBEIRO-NETO. Modern
Information Retrieval. Addison Wesley:
1999.
ROWLEY, J. A Biblioteca Eletrônica. 2 ed.
Brasília: Brinquet Lemos Livros, 2002.
SARACEVIC, T. Ciência da informação:
origem, evolução e relações. Perspec. Ci.
Inf., Belo Horizonte, v. 1, n. 1, p. 41-62,
jan./jun. 1996

Aula 01 - Recuperação da Informação

  • 1.
    Recuperação da Informação Renato Fernandes Corrêa Recuperação da Informação - Introdução 2010.2 DCI-UFPE 1
  • 2.
    2 Roteiro Motivação/Introdução Definição Sistema de Recuperação de Informação Exemplos de SRI
  • 3.
    3 Motivação/Introdução O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945) Explosão informacional Importância estratégica da informação
  • 4.
    4 Motivação/Introdução A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“ “Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência da Informação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)
  • 5.
    5 Recuperação de Informação Definição Área de pesquisa e desenvolvimento que investiga métodos e técnicas para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação Objetivo principal facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário Geralmente representada através de consultas baseadas em palavras-chaves
  • 6.
    6 Tarefa típica deRecuperação de Informação (RI) Dados Um corpus de documentos e Uma consulta do usuário Encontrar Um conjunto (ordenados) de documentos que são relevantes para a consulta
  • 7.
    7 Elementos de um Sistemas de RI Corpus de documentos Consulta Sistema de RI 1. Doc1 2. Doc2 Usuário Documentos 3. Doc3 ordenados . .
  • 8.
    8 Recuperação de Informação Como funciona? Necessidade de Informação Armazenamento Indexação Indexação Consulta Documentos Representação Representação Sistema de Resultado Usuário Recuperação da Informação Recuperação Casamento, Ordenação
  • 9.
    Modelos de Recuperaçãode Informação Existe uma distinção entre: A tarefa do usuário Recuperação ou Navegação A visão lógica dos documentos sua representação no sistema O modelo de recuperação de informação Clássico ou estruturado ou navegação
  • 10.
  • 11.
  • 12.
    12 Sistemas de RI Um sistema automático para RI pode ser visto como a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados, e sua posterior recuperação para responder a consulta do usuário. Etapas principais na construção: Aquisição (seleção) dos documentos Preparação dos documentos Indexação dos documentos Armazenamento Recuperação Busca (casamento com a consulta do usuário) Ordenação dos documentos recuperados
  • 13.
    Exemplos de sistemasde 13 recuperação de informação Sistemas de RI em DVD e Cederrom Catálogo em linha de acesso público Engenhos de busca Serviços de busca em linha Sistemas de gerenciamento de documentos Sistemas de Filtragem de Informação Sistemas de Extração de Informação
  • 14.
    Catálogo em linhade acesso público (OPAC) Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas. Exemplo:
  • 15.
    15 Engenhos de Busca Engenho de Busca Usuário Servidor de Consultas 2 Consulta 1 Recuperador Browser Resposta 4 3 Ordenador Base de Índices Motor de Indexação Indexador Representação dos Docs Spider Docs Pré-Processador Aquisição Web
  • 16.
    Serviços de buscaem linha Sistemas que recuperam informação em bases de dados bibliográficos. Exemplos:
  • 17.
    Sistemas de gerenciamentode documentos Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais. Exemplos: Softwares Proprietários da IBM, Xerox, Oracle e Microsoft Softwares Livres Alfresco KnowledgeTree Main//Pyrus DMS Nuxeo OpenKM Archivista
  • 18.
    Sistemas de Filtragemde Informação Sistemas que filtram a informação recuperada de acordo com o interesse do usuário Usuário Servidor News Artigos Perfil do Indexados usuário Engenho de Busca Internet
  • 19.
    19 Sistemas de Extraçãode Informação Sistemas capazes de extrair de documentos relevantes apenas a informação requerida A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs. Página de Hotel Template Nome: Sistema de EI End.: Fone: Fax: Preços: BD
  • 20.
    20 Referências BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999. ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002. SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996