SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
1
Recuperação de Informação
	
  
	
  
	
  
	
  Modelos de Recuperação de Documentos:
	
  
	
   	
   	
  Modelo Booleano
	
  
	
  
	
  
	
  
	
  
	
  
	
   	
  Antonio Soares Lobato
2
	
  Sistemas de RI
	
  
	
  
	
  
Um sistema automático para RI pode ser visto como
n
	
  
	
  
	
  
n
	
  
n
a parte do sistema de informação responsável pelo
armazenamento ordenado dos documentos,
e sua posterior recuperação
para responder a consulta do usuário.
Todo SRI adota um modelo computacional de
recuperação de informação que determina o
modo de operação do mesmo.
 Modelos Estruturados
	
  
Listas não-sobrepostas
Nós proximais
Recuperação:
	
  Adhoc
Filtragem
Browsing
A
R
E
F
A
D
O
	
  
	
  
	
  u
S
U
Á
R
I
O
	
   	
  Tarefas e Modelos de
Recuperação de Informação
	
  
	
  
	
  
	
  
	
  
	
   	
   	
  Modelos Clássicos
	
  T
	
  Booleano
Espaço vetorial
Probabilista
Teoria dos conjuntos
	
  
Fuzzy
Booleano estendido
Probabilista
	
  
Redes de inferência
Redes de crença
	
  Algebrico
	
  
	
  	
  E. V. generalizado
	
  	
  Semântica Latente
Redes Neurais
	
  Browsing
	
  
Plano
Estruturado
Hipertextual
4
Modelos Clássicos de Recuperação
	
   	
  de Documentos
	
  
	
  
	
  Veremos o seguinte modelo:
n
	
  
	
  
n
	
  
	
  
n
Modelo Booleano
Para cada modelo, veremos:
n
	
  
	
  
n
	
  
	
  
n
A representação do documento
A representação da consulta
A função de busca
5
	
   	
  Modelo Booleano
	
  Representação do documento
	
  
	
  
Dado o conjunto de n termos representativos para o
corpus em questão (Vocabulário do Sistema)
n V = {k1, k2,...,kn}
Os documentos são representados como conjunto de
termos de indexação, sendo tais conjuntos
representados como vetores de pesos binários de
tamanho n
n
	
  
	
  
	
  
n
Cada posição no vetor corresponde a um termo usado
na indexação dos documentos
Cada valor indica apenas se determinado termo está
ou não presente no documento
k1 k2 k3
d1 1 0 1
d2 1 0 0
d3 0 1 1
d4 1 0 0
d5 1 1 1
d6 1 1 0
d7 0 1 0
Exemplo 1
d1
d2
d3
d4 d5
d6
d7
k1
k2
k3
Por exemplo:
	
  w documento d1 contém os termos k1 e k3, e não contém o
	
   	
  termo k2
	
  w Analogamente, o documento d1 está na interseção entre os
	
   	
  conjuntos k1 e k3
k1 k3
d1
7
	
   	
  Modelo Booleano
	
  Representação da consulta
Consulta:
n
	
  
	
  
n
	
  
	
  
n
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
n
Expressão booleana
Termos conectados por: AND, OR, NOT
O resultado da consulta é o conjunto de
documentos cuja representação satisfazem às
restrições lógicas da expressão de busca, que
fazem a expressão booleana assumir o valor
lógico VERDADEIRO.
Exemplos:
	
  w k1 AND k2
	
  w k1 OR k2
	
  w k1 AND NOT k2
8
Operadores booleanos
9
	
  Exercício
1) Para o exemplo 1, utilizando o modelo booleano,
qual o resultado das buscas:
n
	
  
n
	
  
n
a) K2 AND K3
b) K2 OR K3
C) K2 AND NOT K3
2) Escreva em português o tipo de documentos
retornados pelas expressões de busca abaixo:
n
	
  
n
	
  
n
a) web OR informação
b) recuperação AND (web OR informação)
c) recuperação AND informação AND web
10
	
  Função de busca
	
  
	
  
Relevância “binária”:
n
	
  
	
  
	
  
	
  
	
  
	
  
	
  
n
O documento é considerado relevante se e somente se seu
“casamento” com a consulta é verdadeiro, isto é se o valor
verdade da consulta se torna verdadeiro para aquele
documento.
Não é possível ordenar os documentos recuperados, pois todos
igualmente tornam verdadeiro a expressão de busca
Exemplo de consulta
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  	
  Consulta
	
  k1 AND k2 AND k3
k1 k2
k3
Espaço de termos
de indexação
	
  
	
  Documentos
	
  apresentados ao
	
  usuário
11
Modelo Booleano
Vantagens
n
	
  
n
	
  
n
Modelo simples baseado em teoria bem fundamentada
Fácil de entender e implementar em computador
Permite uma maior precisão na recuperação
Desvantagens
n
	
  
	
  
	
  
n
	
  
	
  
	
  
n
	
  
n
Assume independência entre os termos usados na
indexação
Não permite casamento parcial entre consulta e
documento
Não permite ordenação dos documentos recuperados
A necessidade de informação do usuário deve ser
expressa em termos de uma expressão booleana
	
  w Nem todo usuário é capaz disso

Mais conteúdo relacionado

Último

Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Eró Cunha
 

Último (20)

Poema - Maio Laranja
Poema - Maio Laranja Poema - Maio Laranja
Poema - Maio Laranja
 
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...Regulamento do Festival de Teatro Negro -  FESTIAFRO 2024 - 10ª edição -  CEI...
Regulamento do Festival de Teatro Negro - FESTIAFRO 2024 - 10ª edição - CEI...
 
As teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.pptAs teorias de Lamarck e Darwin para alunos de 8ano.ppt
As teorias de Lamarck e Darwin para alunos de 8ano.ppt
 
O que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdfO que é literatura - Marisa Lajolo com.pdf
O que é literatura - Marisa Lajolo com.pdf
 
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptxEBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
EBPAL_Serta_Caminhos do Lixo final 9ºD (1).pptx
 
Nós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º anoNós Propomos! Sertã 2024 - Geografia C - 12º ano
Nós Propomos! Sertã 2024 - Geografia C - 12º ano
 
Alemanha vs União Soviética - Livro de Adolf Hitler
Alemanha vs União Soviética - Livro de Adolf HitlerAlemanha vs União Soviética - Livro de Adolf Hitler
Alemanha vs União Soviética - Livro de Adolf Hitler
 
Peça de teatro infantil: A cigarra e as formigas
Peça de teatro infantil: A cigarra e as formigasPeça de teatro infantil: A cigarra e as formigas
Peça de teatro infantil: A cigarra e as formigas
 
Formação T.2 do Modulo I da Formação HTML & CSS
Formação T.2 do Modulo I da Formação HTML & CSSFormação T.2 do Modulo I da Formação HTML & CSS
Formação T.2 do Modulo I da Formação HTML & CSS
 
Acróstico - Maio Laranja
Acróstico  - Maio Laranja Acróstico  - Maio Laranja
Acróstico - Maio Laranja
 
Projeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.docProjeto envolvendo as borboletas - poema.doc
Projeto envolvendo as borboletas - poema.doc
 
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdfUFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
 
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
 
transcrição fonética para aulas de língua
transcrição fonética para aulas de línguatranscrição fonética para aulas de língua
transcrição fonética para aulas de língua
 
Tema de redação - A prática do catfish e seus perigos.pdf
Tema de redação - A prática do catfish e seus perigos.pdfTema de redação - A prática do catfish e seus perigos.pdf
Tema de redação - A prática do catfish e seus perigos.pdf
 
Atividades adaptada de matemática (Adição pop )
Atividades adaptada de matemática (Adição pop )Atividades adaptada de matemática (Adição pop )
Atividades adaptada de matemática (Adição pop )
 
Poema - Aedes Aegypt.
Poema - Aedes Aegypt.Poema - Aedes Aegypt.
Poema - Aedes Aegypt.
 
O que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaO que é, de facto, a Educação de Infância
O que é, de facto, a Educação de Infância
 
[2.3.3] 100%_CN7_CAP_[FichaAvaliacao3].docx
[2.3.3] 100%_CN7_CAP_[FichaAvaliacao3].docx[2.3.3] 100%_CN7_CAP_[FichaAvaliacao3].docx
[2.3.3] 100%_CN7_CAP_[FichaAvaliacao3].docx
 
Modelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresModelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autores
 

Destaque

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Destaque (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Aula02-RI-Modelo-Booleano.pdf

  • 1. 1 Recuperação de Informação        Modelos de Recuperação de Documentos:        Modelo Booleano                Antonio Soares Lobato
  • 2. 2  Sistemas de RI       Um sistema automático para RI pode ser visto como n       n   n a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos, e sua posterior recuperação para responder a consulta do usuário. Todo SRI adota um modelo computacional de recuperação de informação que determina o modo de operação do mesmo.
  • 3.  Modelos Estruturados   Listas não-sobrepostas Nós proximais Recuperação:  Adhoc Filtragem Browsing A R E F A D O      u S U Á R I O    Tarefas e Modelos de Recuperação de Informação                Modelos Clássicos  T  Booleano Espaço vetorial Probabilista Teoria dos conjuntos   Fuzzy Booleano estendido Probabilista   Redes de inferência Redes de crença  Algebrico      E. V. generalizado    Semântica Latente Redes Neurais  Browsing   Plano Estruturado Hipertextual
  • 4. 4 Modelos Clássicos de Recuperação    de Documentos      Veremos o seguinte modelo: n     n     n Modelo Booleano Para cada modelo, veremos: n     n     n A representação do documento A representação da consulta A função de busca
  • 5. 5    Modelo Booleano  Representação do documento     Dado o conjunto de n termos representativos para o corpus em questão (Vocabulário do Sistema) n V = {k1, k2,...,kn} Os documentos são representados como conjunto de termos de indexação, sendo tais conjuntos representados como vetores de pesos binários de tamanho n n       n Cada posição no vetor corresponde a um termo usado na indexação dos documentos Cada valor indica apenas se determinado termo está ou não presente no documento
  • 6. k1 k2 k3 d1 1 0 1 d2 1 0 0 d3 0 1 1 d4 1 0 0 d5 1 1 1 d6 1 1 0 d7 0 1 0 Exemplo 1 d1 d2 d3 d4 d5 d6 d7 k1 k2 k3 Por exemplo:  w documento d1 contém os termos k1 e k3, e não contém o    termo k2  w Analogamente, o documento d1 está na interseção entre os    conjuntos k1 e k3 k1 k3 d1
  • 7. 7    Modelo Booleano  Representação da consulta Consulta: n     n     n                             n Expressão booleana Termos conectados por: AND, OR, NOT O resultado da consulta é o conjunto de documentos cuja representação satisfazem às restrições lógicas da expressão de busca, que fazem a expressão booleana assumir o valor lógico VERDADEIRO. Exemplos:  w k1 AND k2  w k1 OR k2  w k1 AND NOT k2
  • 9. 9  Exercício 1) Para o exemplo 1, utilizando o modelo booleano, qual o resultado das buscas: n   n   n a) K2 AND K3 b) K2 OR K3 C) K2 AND NOT K3 2) Escreva em português o tipo de documentos retornados pelas expressões de busca abaixo: n   n   n a) web OR informação b) recuperação AND (web OR informação) c) recuperação AND informação AND web
  • 10. 10  Função de busca     Relevância “binária”: n               n O documento é considerado relevante se e somente se seu “casamento” com a consulta é verdadeiro, isto é se o valor verdade da consulta se torna verdadeiro para aquele documento. Não é possível ordenar os documentos recuperados, pois todos igualmente tornam verdadeiro a expressão de busca Exemplo de consulta                  Consulta  k1 AND k2 AND k3 k1 k2 k3 Espaço de termos de indexação    Documentos  apresentados ao  usuário
  • 11. 11 Modelo Booleano Vantagens n   n   n Modelo simples baseado em teoria bem fundamentada Fácil de entender e implementar em computador Permite uma maior precisão na recuperação Desvantagens n       n       n   n Assume independência entre os termos usados na indexação Não permite casamento parcial entre consulta e documento Não permite ordenação dos documentos recuperados A necessidade de informação do usuário deve ser expressa em termos de uma expressão booleana  w Nem todo usuário é capaz disso