SlideShare uma empresa Scribd logo
1 de 38
SISTEMAS DE RECUPERAÇÃO DE
INFORMAÇÃO - SRI
Motivação para Recuperação da Informação
• Problema:
• “A tarefa massiva de tornar mais acessível, um acervo crescente de
conhecimento“. Vannevar Bush (1945)
• Motivação para resolver o problema:
• Importância estratégica da informação;
• Problemas relacionados:
• Explosão informacional;
• Sobrecarga de informação;
Origem
• Desde seu início, eles têm estado fortemente relacionados ao
desenvolvimento tecnológico, tanto no que concerne as
telecomunicações, quanto com a aparição dos primeiros
computadores.
• Utilizados para gerenciar a explosão da informação na literatura
científica e para facilitar a vida do usuário para que o mesmo
pudesse encontrar no emaranhado de informações aquelas que
atendessem as suas necessidades informacionais.
Definições
As definições de SRI buscam abranger as necessidades de
informação e as várias metodologias e tecnologias que, através
dos tempos, foram geradas para atender a essas necessidades,
desde as atividades de organização de coleções de documentos em
acervos bibliográficos, até os modernos sistemas informatizados que
lidam com documentos em formato digital
(SOUZA, 2006).
MOOERS (1951):
 “engloba os aspectos intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer sistemas, técnicas ou
máquinas empregadas para o desempenho da operação”.
Desde Mooers, a Recuperação de Informação (RI) tem sido desenvolvida e
aperfeiçoada, transformando-se em uma atividade multi e interdisciplinar,
podendo ser considerada como vertente tecnológica da CI (SARACEVIC,
1999).
Histórico da área de RI
6
• Os primeiros sistemas computacionais de RI surgiram para automatizar
acesso a informação em bibliotecas na década de 1960;
• Até o início dos anos 1990, as aplicações principais da área ainda eram
catálogos de bibliotecas, jornais, revistas e enci- clopédias eletrônicas e
bases de dados de empresa;
• Até então, RI era uma área periférica dentro da computação, contando
com a atuação de poucos pesquisadores e técni- cos.
No final dos anos 90, uma mudança brusca trouxe RI para o primeiro
plano: a popularização da WEB.
•
A Recuperação da Informação (RI)
• Área de pesquisa e desenvolvimento que
o investiga métodos e técnicas
o para a representação, a organização, o armazenamento, a busca e a
recuperação de itens de informação
• Objetivo principal
o facilitar o acesso a documentos (itens de informação) relevantes à
necessidade de informação do usuário
• geralmente representada através de consultas baseadas em palavras-
chaves
Embora a proposta de Mooers pareça inovadora, na realidade, o sentido de seu
conceito já vinha sendo utilizado na prática dos antigos bibliotecários. Afinal,
na preocupação do campo da Biblioteconomia os aspectos de tratamento e
recuperação de informação sempre estiveram presentes. Apesar das importantes
mudanças produzidas, nestes pouco mais de 50 anos, nos suportes e métodos
empregados bem como no tipo e formatos de informação, a essência do
significado do termo ‘Recuperação de Informação’ permanece invariável.
Missão fundamental
Permitir que um usuário recupere documentos através de certas
características específicas (por autor, título conhecido, assunto ou
qualquer combinação desses elementos).
Processo de RI
Tarefa Típica
Dados:
•Uma coleção ou conjunto de documentos (corpus);
•Uma consulta do usuário;
Encontrar:
•Um conjunto (ordenados) de documentos que são relevantes para a consulta;
Elementos Básicos
Consulta através de uma
expressão de busca
Sistema de Recuperação
de Informação
Corpus de
Documentos
Usuário
Documento1
Documento2
Documento3
SRI
• Um sistema automático para RI pode ser visto como
o a parte do sistema de informação responsável pelo armazenamento ordenado dos
documentos em um banco de dados, e sua posterior recuperação para responder a
consulta do usuário.
• Etapas principais na construção:
o Aquisição (seleção) dos documentos
o Preparação dos documentos
o Indexação dos documentos
o Armazenamento
o Recuperação
• Busca (casamento com a consulta do usuário)
• Ordenação dos documentos recuperados
SRI´s podem ser estudados como “um conjunto de operações
consecutivas, executadas para localizar uma informação
necessária ou documentos que a contenham, com a
recuperação subsequente desses documentos”.
(CESARINO, 1985, p. 158)
Base de documentos
• Sobre a qual um SRI atua depende do contexto e pode ser composta de:
– Livros;
– Documentos;
– Imagens;
– Áudios;
– Vídeos;
– Catálogos;
– Prontuários de pacientes;
– Páginas da internet;
– Normas
– Notícias
– Registros em geral:
• Estruturados;
• Semiestruturados;
• Não estruturados
– ...
Exemplo de SRI
• Buscador de internet.
Base de documentos:
conteúdo da WEB
• Uma busca por “poesia de
amor” no Google retornou
dezenas de milhões de
resultados (já ranqueados)
em menos de meio
segundo!
Exemplo de SRI
Exemplos de SRI
• Sistemas de RI em DVD e CDROM
• Catálogo em linha de acesso público
• Serviços de busca em linha Engenhos de busca
• Sistemas de gerenciamento de documentos Sistemas de filtragem de
informação Sistemas de extração de informação
Catálogo em Linha de Acesso Público (OPAC):
• Sistemas que recuperam informação em bases de dados
catalográficos de bibliotecas;
• Exemplo:
Exemplos de SRI
Serviços de Busca em Linha:
• Sistemas que recuperam informação em bases de dados de
referência e de fonte;
• Exemplos:
Exemplos de SRI
Sistemas de Gerenciamento de Documentos:
•Sistemas que gerenciam versões e recuperam informação em
um corpus de documentos digitais;
•Exemplos:
• Softwares Proprietários: IBM, Xerox, Oracle e Microsoft;
• Softwares Livres: Alfresco, KnowledgeTree, Main/Pyrus DMS, Nuxeo, OpenKM, Archivista;
Exemplos de SRI
Sistemas de Filtragem de Informação:
• Sistemas que filtram a informação recuperada de acordo com o
interesse do usuário;
• Exemplo:
Exemplos de SRI
Sistemas de Extração de Informação:
•Sistemas capazes de extrair de documentos relevantes apenas a
informação requerida;
•A informação extraída pode ser apresentada ao usuário e/ou
armazenada em banco de dados;
•Exemplo: Buscapé extrai informações sobre os produtos, como preços, nas
lojas virtuais;
Exemplos de SRI
Web
Consulta
Resposta
Base de
Índices
Usuário
Spider
Indexador
Representação dos Documentos
Servidor de Consultas
Aquisição
Pré-processador
Docs
Ordenador
2
1
4
Motor de
Indexação
Browser
Exemplos de SRI – Engenho de Busca
Recuperador
3
Recuperação de Informação na Web
• Recuperação por endereço, metadados, conteúdo, ontologia;
• Realizada através de SRIs especializados;
• Utilizam variações do modelo espaço vetorial para recuperação de informação;
• Mecanismos de busca (Search Engines):
• www.google.com.br
• Larry Page e Sergey Brin, 1998;
• www.yahoo.com.br
• David Filo e Jerry Yang, 1994. Atualmente utiliza o índice do Bing;
• www.bing.com.br
• Microsoft Corporation, 2009;
Estratégia de Busca
Definições
ROWLEY (1994):
 “Conjunto de decisões tomadas e procedimentos adotados durante
uma busca”
LOPES (2002):
 “Técnica ou conjunto de regras para tornar possível o encontro entre
uma pergunta formulada e a informação armazenada em uma base
de dados”.
CENDÓN (2005):
 “Um plano que serve para encontrar a informação desejada em que
várias expressões de busca podem ser utilizadas”.
Modelo Booleano
• Modelo baseado na teoria de conjuntos e na álgebra de George Boole
(séc. XIX).
• Desenvolveu um sistema de álgebra e foi um dos percursores da
lógica moderna;
• Criou um modo de conduzir o raciocínio utilizando algumas
expressões simples e monossilábicas:
• Principais problemas
• Ausência de ordem na resposta;
• Respostas podem ser nulas ou muito grandes.
O que são?
• É um tipo de dado primitivo que possui dois valores, que podem ser
considerados como 0 ou 1, verdadeiro ou falso;
• É usado em operações lógicas como conjunção, disjunção, disjunção
exclusiva, equivalência lógica e negação, que correspondem a algumas
das operações da álgebra booleana;
• A implementação do booleano varia de acordo com a linguagem do
computador.
Operadores booleanos mais usados
Português Inglês
Sinais
gráficos
Características
E AND + &
Para se conseguir restringir o âmbito de uma
pesquisa, podem combinar-se termos de pesquisa
através deste operador
NÃO NOT -
Para excluir informações irrelevantes de uma
pesquisa, pode usar-se o operador NOT como
parte da expressão a pesquisar.
OU OR | !
Para maximizar as possibilidades de encontrar
informações que satisfaçam uma dada pesquisa.
Para que serve?
• Possibilitam o acesso aos grandes sistemas de recuperação de
informação e às bases de dados;
• Vieram ampliar significativamente a qualidade das buscas, visto que
essas bases proporcionam diversificados pontos de acesso à
informação;
• Possibilitam o planeamento de estratégias de busca com maior nível
de complexidade ao envolver vários conceitos;
• Ajuda a percorrer documentos, recuperar informações sobre
determinados assuntos e localizar recursos informacionais de
interesse.
Exemplo
• “biblioteconomia AND bibliotecário AND OR profissional da informação” poderia ser
representada pela seguinte operação entre conjuntos:
Coleção completa
Conj. de docs. que contêm
“bibliotecário”
Conj. de docs. que contêm
“profissional da informação”
Conj. de docs. que contêm
“biblioteconomia”
Conjunto resposta
Operadores de Proximidade
• Surgimento dos sistemas de texto completo.
• ADJ – Permite pesquisar duas palavras adjacente no texto de um documento,
na ordem especificada na expressão de busca. – Pronto ADJ Socorro/
“Pronto Socorro”
• NEAR (nº de proximidade) – Permite pesquisar uma palavra próxima da
outra, definindo o número de palavras de distância. – Recuperação NEAR/10
Informação
• WITH – Permite recuperar documentos cujos termos apareçam no mesmo
parágrafo. – Recuperação WITH Informação
• SAME – Permite recuperar documentos cujos termos apareçam na mesma
sentença – Recuperação SAME Informação
Outros Operadores Booleanos
• Asterisco (*) = truncagem
o Colocado no fim de uma palavra como substituição de uma letra que possa alterar
o significado da mesma, providencia todas as variantes que a palavra possa ter.
• COMPUT*
o Resultado dapesquisa: computação, computacional,computador, computadores, computer,
computers.
Outros Operadores Booleanos
• Aspas (“”)
o Serve para especificar uma informação exata. Por exemplo:
• “Hotel Beira Mar”
o A pesquisa vai incidir sobre esse hotel (Hotel Beira Mar), e não sobre qualquer
hotel que se situe à beira-mar.
• Parêntese ( )
o Serve para clarificar relações entre termos.
Referências
CARDOSO, Olinda Nogueira Paes. Recuperação de Informação. Lavras: UFLA, 2003.
CESARINO, Maria Augusta da Nóbrega. Sistemas de Recuperação da Informação. Revista da
Escola de Biblioteconomia da UFMG, Belo Horizonte, v.14, n.2, set., 1985.
FERNEDA, Edberto. Recuperação de Informação: análise sobre a contribuição da Ciência da
Computação para a Ciência da Informação. 2003. 147 f. Tese (Doutorado em Ciência da
Comunicação) - Escola de Comunicação e Artes, Universidade de São Paulo, São Paulo, 2003.
LOPES, Ilza Leite. Estratégica de busca na recuperação da informação: revisão de literatura.
Revista Ciência da Informação, Brasília, v.31, n.2, p.60-71, maio/ago, 2002. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-19652002000200007>. Acesso em:
03 out. 2006.

Mais conteúdo relacionado

Semelhante a 7 AULA_SRI.ppt

Ofinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasOfinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasPedro Príncipe
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoNilton Heck
 
Competência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesCompetência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesRodrigo Moreira Garcia
 
Gestão de dados para periódicos científicos
Gestão de dados para periódicos científicosGestão de dados para periódicos científicos
Gestão de dados para periódicos científicosPortal de Periódicos UFSC
 
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarRecursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarBianca Santana
 
Representação da Informação
Representação da InformaçãoRepresentação da Informação
Representação da InformaçãoHercules Santos
 
Fontes De Informação Científica
Fontes De Informação CientíficaFontes De Informação Científica
Fontes De Informação Científicabsararangua
 
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol..."Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...Suelybcs .
 
Pesquisa bibliografica: Engenharia
Pesquisa bibliografica: EngenhariaPesquisa bibliografica: Engenharia
Pesquisa bibliografica: EngenhariaLeticia Strehl
 
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFAL
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFALArquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFAL
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFALRonaldo Araújo
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014WANDERSON JONER
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoadscsmp
 

Semelhante a 7 AULA_SRI.ppt (20)

Ofinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasOfinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecas
 
Curadoria digital fcrb 2017_dia 1
Curadoria digital fcrb 2017_dia 1Curadoria digital fcrb 2017_dia 1
Curadoria digital fcrb 2017_dia 1
 
Base de Dados
Base de Dados Base de Dados
Base de Dados
 
Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da Informação
 
Oficina 4 - Gestao de dados cientificos: o papel das bibliotecas
Oficina 4 - Gestao de dados cientificos: o papel das bibliotecasOficina 4 - Gestao de dados cientificos: o papel das bibliotecas
Oficina 4 - Gestao de dados cientificos: o papel das bibliotecas
 
Competência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesCompetência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archives
 
Dados de pesquisa: compartilhamento e publicação
Dados de pesquisa: compartilhamento e publicaçãoDados de pesquisa: compartilhamento e publicação
Dados de pesquisa: compartilhamento e publicação
 
Gestão de dados para periódicos científicos
Gestão de dados para periódicos científicosGestão de dados para periódicos científicos
Gestão de dados para periódicos científicos
 
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarRecursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
 
Representação da Informação
Representação da InformaçãoRepresentação da Informação
Representação da Informação
 
Pesquisa Inf.
Pesquisa Inf.Pesquisa Inf.
Pesquisa Inf.
 
Fontes De Informação Científica
Fontes De Informação CientíficaFontes De Informação Científica
Fontes De Informação Científica
 
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol..."Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...
"Fontes de indexação para periódicos científicos", Palestra de Gildenir Carol...
 
Pesquisa bibliografica: Engenharia
Pesquisa bibliografica: EngenhariaPesquisa bibliografica: Engenharia
Pesquisa bibliografica: Engenharia
 
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFAL
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFALArquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFAL
Arquitetura da Informação de websites: o caso do Sistema de Bibliotecas da UFAL
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
 

Mais de OdeteMyraMesquita

DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptx
DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptxDESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptx
DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptxOdeteMyraMesquita
 
1. INTRODUÇÃO A INFORMATICA.pptx
1. INTRODUÇÃO A INFORMATICA.pptx1. INTRODUÇÃO A INFORMATICA.pptx
1. INTRODUÇÃO A INFORMATICA.pptxOdeteMyraMesquita
 
aula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxaula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxOdeteMyraMesquita
 
aula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxaula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxOdeteMyraMesquita
 

Mais de OdeteMyraMesquita (6)

DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptx
DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptxDESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptx
DESCRIÇÃO ARQUIVÍSTICA e ARQUIVAMENTO.pptx
 
1. INTRODUÇÃO A INFORMATICA.pptx
1. INTRODUÇÃO A INFORMATICA.pptx1. INTRODUÇÃO A INFORMATICA.pptx
1. INTRODUÇÃO A INFORMATICA.pptx
 
aula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxaula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptx
 
FONTES DE INFORMAÇAO.pptx
FONTES DE INFORMAÇAO.pptxFONTES DE INFORMAÇAO.pptx
FONTES DE INFORMAÇAO.pptx
 
aula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptxaula_REVISÃO DE LITERATURA.pptx
aula_REVISÃO DE LITERATURA.pptx
 
AULA_SOBRE SEMINARIO.ppt
AULA_SOBRE SEMINARIO.pptAULA_SOBRE SEMINARIO.ppt
AULA_SOBRE SEMINARIO.ppt
 

Último

As teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.pptAs teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.pptorlando dias da silva
 
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptxEB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptxIlda Bicacro
 
Nós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º anoNós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º anoIlda Bicacro
 
Projeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.docProjeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.docCarolineWaitman
 
O que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdfO que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdfGisellySobral
 
Currículo Professor Pablo Ortellado - Universidade de São Paulo
Currículo Professor Pablo Ortellado - Universidade de São PauloCurrículo Professor Pablo Ortellado - Universidade de São Paulo
Currículo Professor Pablo Ortellado - Universidade de São Pauloririg29454
 
Modelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresModelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresAna Isabel Correia
 
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptxSlides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptxLuizHenriquedeAlmeid6
 
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxSlides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxLuizHenriquedeAlmeid6
 
Religiosidade de Assaré - Prof. Francisco Leite
Religiosidade de Assaré - Prof. Francisco LeiteReligiosidade de Assaré - Prof. Francisco Leite
Religiosidade de Assaré - Prof. Francisco Leiteprofesfrancleite
 
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASAPRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASricardo644666
 
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024azulassessoria9
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...azulassessoria9
 
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na ÁfricaPeriodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na Áfricajuekfuek
 
O que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaO que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaHenrique Santos
 
História concisa da literatura brasileira- Alfredo Bosi..pdf
História concisa da literatura brasileira- Alfredo Bosi..pdfHistória concisa da literatura brasileira- Alfredo Bosi..pdf
História concisa da literatura brasileira- Alfredo Bosi..pdfGisellySobral
 
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxEBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxIlda Bicacro
 
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdfCarinaSofiaDiasBoteq
 
transcrição fonética para aulas de língua
transcrição fonética para aulas de línguatranscrição fonética para aulas de língua
transcrição fonética para aulas de línguaKelly Mendes
 

Último (20)

As teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.pptAs teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.ppt
 
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptxEB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
EB1 Cumeada Co(n)Vida à Leitura - Livros à Solta_Serta.pptx
 
Nós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º anoNós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º ano
 
Projeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.docProjeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.doc
 
O que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdfO que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdf
 
Currículo Professor Pablo Ortellado - Universidade de São Paulo
Currículo Professor Pablo Ortellado - Universidade de São PauloCurrículo Professor Pablo Ortellado - Universidade de São Paulo
Currículo Professor Pablo Ortellado - Universidade de São Paulo
 
Modelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresModelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autores
 
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptxSlides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
Slides Lição 07, Central Gospel, As Duas Testemunhas Do Final Dos Tempos.pptx
 
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxSlides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
 
Religiosidade de Assaré - Prof. Francisco Leite
Religiosidade de Assaré - Prof. Francisco LeiteReligiosidade de Assaré - Prof. Francisco Leite
Religiosidade de Assaré - Prof. Francisco Leite
 
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASAPRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
 
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
 
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na ÁfricaPeriodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
 
Poema - Maio Laranja
Poema - Maio Laranja Poema - Maio Laranja
Poema - Maio Laranja
 
O que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaO que é, de facto, a Educação de Infância
O que é, de facto, a Educação de Infância
 
História concisa da literatura brasileira- Alfredo Bosi..pdf
História concisa da literatura brasileira- Alfredo Bosi..pdfHistória concisa da literatura brasileira- Alfredo Bosi..pdf
História concisa da literatura brasileira- Alfredo Bosi..pdf
 
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxEBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
 
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
 
transcrição fonética para aulas de língua
transcrição fonética para aulas de línguatranscrição fonética para aulas de língua
transcrição fonética para aulas de língua
 

7 AULA_SRI.ppt

  • 1. SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO - SRI
  • 2. Motivação para Recuperação da Informação • Problema: • “A tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. Vannevar Bush (1945) • Motivação para resolver o problema: • Importância estratégica da informação; • Problemas relacionados: • Explosão informacional; • Sobrecarga de informação;
  • 3. Origem • Desde seu início, eles têm estado fortemente relacionados ao desenvolvimento tecnológico, tanto no que concerne as telecomunicações, quanto com a aparição dos primeiros computadores. • Utilizados para gerenciar a explosão da informação na literatura científica e para facilitar a vida do usuário para que o mesmo pudesse encontrar no emaranhado de informações aquelas que atendessem as suas necessidades informacionais.
  • 4. Definições As definições de SRI buscam abranger as necessidades de informação e as várias metodologias e tecnologias que, através dos tempos, foram geradas para atender a essas necessidades, desde as atividades de organização de coleções de documentos em acervos bibliográficos, até os modernos sistemas informatizados que lidam com documentos em formato digital (SOUZA, 2006).
  • 5. MOOERS (1951):  “engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregadas para o desempenho da operação”. Desde Mooers, a Recuperação de Informação (RI) tem sido desenvolvida e aperfeiçoada, transformando-se em uma atividade multi e interdisciplinar, podendo ser considerada como vertente tecnológica da CI (SARACEVIC, 1999).
  • 6. Histórico da área de RI 6 • Os primeiros sistemas computacionais de RI surgiram para automatizar acesso a informação em bibliotecas na década de 1960; • Até o início dos anos 1990, as aplicações principais da área ainda eram catálogos de bibliotecas, jornais, revistas e enci- clopédias eletrônicas e bases de dados de empresa; • Até então, RI era uma área periférica dentro da computação, contando com a atuação de poucos pesquisadores e técni- cos. No final dos anos 90, uma mudança brusca trouxe RI para o primeiro plano: a popularização da WEB. •
  • 7. A Recuperação da Informação (RI) • Área de pesquisa e desenvolvimento que o investiga métodos e técnicas o para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação • Objetivo principal o facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário • geralmente representada através de consultas baseadas em palavras- chaves
  • 8. Embora a proposta de Mooers pareça inovadora, na realidade, o sentido de seu conceito já vinha sendo utilizado na prática dos antigos bibliotecários. Afinal, na preocupação do campo da Biblioteconomia os aspectos de tratamento e recuperação de informação sempre estiveram presentes. Apesar das importantes mudanças produzidas, nestes pouco mais de 50 anos, nos suportes e métodos empregados bem como no tipo e formatos de informação, a essência do significado do termo ‘Recuperação de Informação’ permanece invariável.
  • 9. Missão fundamental Permitir que um usuário recupere documentos através de certas características específicas (por autor, título conhecido, assunto ou qualquer combinação desses elementos).
  • 11. Tarefa Típica Dados: •Uma coleção ou conjunto de documentos (corpus); •Uma consulta do usuário; Encontrar: •Um conjunto (ordenados) de documentos que são relevantes para a consulta;
  • 12. Elementos Básicos Consulta através de uma expressão de busca Sistema de Recuperação de Informação Corpus de Documentos Usuário Documento1 Documento2 Documento3
  • 13.
  • 14.
  • 15. SRI • Um sistema automático para RI pode ser visto como o a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados, e sua posterior recuperação para responder a consulta do usuário. • Etapas principais na construção: o Aquisição (seleção) dos documentos o Preparação dos documentos o Indexação dos documentos o Armazenamento o Recuperação • Busca (casamento com a consulta do usuário) • Ordenação dos documentos recuperados
  • 16. SRI´s podem ser estudados como “um conjunto de operações consecutivas, executadas para localizar uma informação necessária ou documentos que a contenham, com a recuperação subsequente desses documentos”. (CESARINO, 1985, p. 158)
  • 17. Base de documentos • Sobre a qual um SRI atua depende do contexto e pode ser composta de: – Livros; – Documentos; – Imagens; – Áudios; – Vídeos; – Catálogos; – Prontuários de pacientes; – Páginas da internet; – Normas – Notícias – Registros em geral: • Estruturados; • Semiestruturados; • Não estruturados – ...
  • 18. Exemplo de SRI • Buscador de internet. Base de documentos: conteúdo da WEB • Uma busca por “poesia de amor” no Google retornou dezenas de milhões de resultados (já ranqueados) em menos de meio segundo!
  • 20. Exemplos de SRI • Sistemas de RI em DVD e CDROM • Catálogo em linha de acesso público • Serviços de busca em linha Engenhos de busca • Sistemas de gerenciamento de documentos Sistemas de filtragem de informação Sistemas de extração de informação
  • 21. Catálogo em Linha de Acesso Público (OPAC): • Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas; • Exemplo: Exemplos de SRI
  • 22. Serviços de Busca em Linha: • Sistemas que recuperam informação em bases de dados de referência e de fonte; • Exemplos: Exemplos de SRI
  • 23. Sistemas de Gerenciamento de Documentos: •Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais; •Exemplos: • Softwares Proprietários: IBM, Xerox, Oracle e Microsoft; • Softwares Livres: Alfresco, KnowledgeTree, Main/Pyrus DMS, Nuxeo, OpenKM, Archivista; Exemplos de SRI
  • 24. Sistemas de Filtragem de Informação: • Sistemas que filtram a informação recuperada de acordo com o interesse do usuário; • Exemplo: Exemplos de SRI
  • 25. Sistemas de Extração de Informação: •Sistemas capazes de extrair de documentos relevantes apenas a informação requerida; •A informação extraída pode ser apresentada ao usuário e/ou armazenada em banco de dados; •Exemplo: Buscapé extrai informações sobre os produtos, como preços, nas lojas virtuais; Exemplos de SRI
  • 26. Web Consulta Resposta Base de Índices Usuário Spider Indexador Representação dos Documentos Servidor de Consultas Aquisição Pré-processador Docs Ordenador 2 1 4 Motor de Indexação Browser Exemplos de SRI – Engenho de Busca Recuperador 3
  • 27. Recuperação de Informação na Web • Recuperação por endereço, metadados, conteúdo, ontologia; • Realizada através de SRIs especializados; • Utilizam variações do modelo espaço vetorial para recuperação de informação; • Mecanismos de busca (Search Engines): • www.google.com.br • Larry Page e Sergey Brin, 1998; • www.yahoo.com.br • David Filo e Jerry Yang, 1994. Atualmente utiliza o índice do Bing; • www.bing.com.br • Microsoft Corporation, 2009;
  • 29. Definições ROWLEY (1994):  “Conjunto de decisões tomadas e procedimentos adotados durante uma busca” LOPES (2002):  “Técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados”. CENDÓN (2005):  “Um plano que serve para encontrar a informação desejada em que várias expressões de busca podem ser utilizadas”.
  • 30. Modelo Booleano • Modelo baseado na teoria de conjuntos e na álgebra de George Boole (séc. XIX). • Desenvolveu um sistema de álgebra e foi um dos percursores da lógica moderna; • Criou um modo de conduzir o raciocínio utilizando algumas expressões simples e monossilábicas: • Principais problemas • Ausência de ordem na resposta; • Respostas podem ser nulas ou muito grandes.
  • 31. O que são? • É um tipo de dado primitivo que possui dois valores, que podem ser considerados como 0 ou 1, verdadeiro ou falso; • É usado em operações lógicas como conjunção, disjunção, disjunção exclusiva, equivalência lógica e negação, que correspondem a algumas das operações da álgebra booleana; • A implementação do booleano varia de acordo com a linguagem do computador.
  • 32. Operadores booleanos mais usados Português Inglês Sinais gráficos Características E AND + & Para se conseguir restringir o âmbito de uma pesquisa, podem combinar-se termos de pesquisa através deste operador NÃO NOT - Para excluir informações irrelevantes de uma pesquisa, pode usar-se o operador NOT como parte da expressão a pesquisar. OU OR | ! Para maximizar as possibilidades de encontrar informações que satisfaçam uma dada pesquisa.
  • 33. Para que serve? • Possibilitam o acesso aos grandes sistemas de recuperação de informação e às bases de dados; • Vieram ampliar significativamente a qualidade das buscas, visto que essas bases proporcionam diversificados pontos de acesso à informação; • Possibilitam o planeamento de estratégias de busca com maior nível de complexidade ao envolver vários conceitos; • Ajuda a percorrer documentos, recuperar informações sobre determinados assuntos e localizar recursos informacionais de interesse.
  • 34. Exemplo • “biblioteconomia AND bibliotecário AND OR profissional da informação” poderia ser representada pela seguinte operação entre conjuntos: Coleção completa Conj. de docs. que contêm “bibliotecário” Conj. de docs. que contêm “profissional da informação” Conj. de docs. que contêm “biblioteconomia” Conjunto resposta
  • 35. Operadores de Proximidade • Surgimento dos sistemas de texto completo. • ADJ – Permite pesquisar duas palavras adjacente no texto de um documento, na ordem especificada na expressão de busca. – Pronto ADJ Socorro/ “Pronto Socorro” • NEAR (nº de proximidade) – Permite pesquisar uma palavra próxima da outra, definindo o número de palavras de distância. – Recuperação NEAR/10 Informação • WITH – Permite recuperar documentos cujos termos apareçam no mesmo parágrafo. – Recuperação WITH Informação • SAME – Permite recuperar documentos cujos termos apareçam na mesma sentença – Recuperação SAME Informação
  • 36. Outros Operadores Booleanos • Asterisco (*) = truncagem o Colocado no fim de uma palavra como substituição de uma letra que possa alterar o significado da mesma, providencia todas as variantes que a palavra possa ter. • COMPUT* o Resultado dapesquisa: computação, computacional,computador, computadores, computer, computers.
  • 37. Outros Operadores Booleanos • Aspas (“”) o Serve para especificar uma informação exata. Por exemplo: • “Hotel Beira Mar” o A pesquisa vai incidir sobre esse hotel (Hotel Beira Mar), e não sobre qualquer hotel que se situe à beira-mar. • Parêntese ( ) o Serve para clarificar relações entre termos.
  • 38. Referências CARDOSO, Olinda Nogueira Paes. Recuperação de Informação. Lavras: UFLA, 2003. CESARINO, Maria Augusta da Nóbrega. Sistemas de Recuperação da Informação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v.14, n.2, set., 1985. FERNEDA, Edberto. Recuperação de Informação: análise sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003. 147 f. Tese (Doutorado em Ciência da Comunicação) - Escola de Comunicação e Artes, Universidade de São Paulo, São Paulo, 2003. LOPES, Ilza Leite. Estratégica de busca na recuperação da informação: revisão de literatura. Revista Ciência da Informação, Brasília, v.31, n.2, p.60-71, maio/ago, 2002. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-19652002000200007>. Acesso em: 03 out. 2006.