SlideShare uma empresa Scribd logo
1 de 38
Baixar para ler offline
Filtragemerecuperaçãoda
informaçãonaweb
Vanessa Levati Biff
Maio, 2016
UNIVERSIDADE FEDERAL DE SANTA CATARINA
Departamento de Ciência da Informação
Programa de Pós-Graduação em Ciência da Informação
Disciplina: Recuperação Inteligente da Informação
Profº: Dr. Angel Godoy Vieira
Motivações....
a explosão bibliográfica;
Motivações...
a sobrecarga da informação;
Motivações...
a falta de um método para comparar e processar
diferentes tipos de informações disponíveis na web!
Objetivo
Avaliar técnicas de filtragem e recuperação de informação e
suas aplicações na otimização da busca de informação na web.
Recuperaçãodainformaçãonaweb
Recuperaçãodainformaçãonaweb
A recuperação da informação (RI) abrange estudos voltados
aos processos relativos ao acesso à informação, propondo
modelos que solucionem a necessidade da informação de um
usuário em determinado conjunto de dados.
ProblemasdeRInaweb
- Quantidade de documentos não relevantes retornados;
- Tempo dispendido pelo usuário para verificação das
buscas.
Os problemas estão relacionados ao modelo de recuperação
adotado, que muitas vezes desconsideram o contexto da
consulta.
(BAEZA-YATES; RIBEIRO-NETO; 2013)
sISTEMASDERECUPERAÇÃOdainformação
SRI são compostos por três processos básicos: a consulta de
informação, a indexação e o cálculo de similaridade que
basicamente verifica a ocorrência ou não dos termos da
consulta na base de dados.
Atualmente são utilizadas técnicas de mineração de dados
como indexação de termos, classificação de documentos mas a
maioria dos modelos adotados não levam em consideração
aspectos semânticos da consulta ou do perfil do usuário
problemasdesri
- Coincidir a representação com as necessidades dos
usuários;
- Os usuários não conseguirem expressar suas necessidades;
- Necessidade de interagir com o sistema.
(XIE; 2008)
técnicasderecuperaçãodainformação
Em recuperação da informação, há várias abordagens que
tentam melhorar a formulação da consulta inicial afim de
melhorar a recuperação de informações úteis. Dentre elas há
processo de feedback de relevância e a expansão da consulta.
O primeiro ocorre quando o usuário fornece explicitamente
informações sobre os documentos relevantes para uma
consulta, e o segundo quando as informações relacionadas à
consulta são utilizadas para expandi-la.
(BAEZA-YATES; RIBEIRO-NETO, 2013)
recuperaçãodainformaçãointerativa
Belkin et al. (2004) conclui que embora haja uma boa
quantidade de pesquisas sobre algorítimos de recuperação da
informação que atendam essas características, pouco se tem
focado em questões de recuperação interativa. Isso porque
seres humanos são mais complexos do que algoritmos
correspondentes, suas motivações e comportamentos são mais
variados e difíceis de se medir.
Entretanto, sistemas de Informação que filtram informações
relevantes para um determinado usuário baseado em seu perfil
são conhecidos como Sistemas de Recomendação.
Sistemasderecomendação
Sistemas de recomendação tem o efeito de orientar os
usuários de forma personalizada para objetos interessantes
em um grande espaço de opções possíveis.
(LOPS, GEMMIS; SEMERARO, 2004)
Os usuários precisam de um apoio personalizado em peneirar
grande quantidades de informação disponíveis, de acordo com
os seus interesses e gostos
Filtragemdeinformação
Compreende em um método para gerir grandes fluxos de
informações, cujo objetivo é expor aos usuários apenas a
informação relevante que atenda suas necessidades.
(HANANI; SHAPIRA; SHOVAL, 2001)
Filtragemdeinformação
Compreende em um método para gerir grandes fluxos de
informações, cujo objetivo é expor aos usuários apenas a
informação relevante que atenda suas necessidades.
(HANANI; SHAPIRA; SHOVAL, 2001)
exemplodeaplicações
- Filtros para resultados de pesquisa na internet;
- Filtros de e-mails personalizados com base em perfis
pessoais;
- Filtros para aplicações de e-commerce que tratam de
produtos e promoções para apenas clientes potenciais.
(HANANI; SHAPIRA; SHOVAL, 2001)
técnicasdeFiltragemdeinformação
Com o objetivo de gerir a sobrecarga de informação, a
Filtragem de Informação faz uso dos vários métodos,
conceitos e técnicas de diversas áreas de pesquisa, como:
Recuperação de Informação, Inteligência Artificial e Ciência
Comportamental.
- Filtragem baseada em conteúdo;
- Filtragem colaborativa;
- Filtragem Híbrida.
(HANANI; SHAPIRA; SHOVAL, 2001)
Filtragembaseadaemconteúdo
Baseia-se na análise do conteúdo do item e no perfil do
usuário.
Técnicas para:
- Representar os itens;
- Produzir o perfil de usuário;
- Comparar o perfil do usuário com a representação do item.
Utiliza técnica de RI:
- Modelo vetorial
- Indexação semântica
(métodos de aprendizagem)
Utiliza técnica de RI:
- Aprendizado de máquina;
- Algoritmos e redes neurais;
- Feedback de relevância;
(explicito e implicito)
Histórico de
feedback do
usuário
Itens do sistema
Perfil do usuário
Cálculo de similaridade entre
perfil do usuário e itens do
sistema
Lista de recomendações
Usuário interage com o sistema
DesvantagensDAFILTRAGEMBASEADAEMCONTEÚDO
Limite na análise de conteúdo Só é eficaz se os itens tiveram a quantidade considerável de
informação armazenada de forma textual.
Superespecialização O usuário fica limitado a um grau especifico de novidade,
afetando a diversidade.
Novos usuários Pois a avaliação do usuário é necessária para que o sistema
possa compreender e atender suas preferências.
(LOPS; GEMMIS; SEMERARO, 2004)
Filtragemcolaborativa
Tenta prever a utilidade dos itens para um determinado
usuário com base nos itens que foram previamente avaliados
por outros usuários.
Filtragemcolaborativa
Filtragemcolaborativa
julgamento explicito
Filtragemcolaborativa
julgamento implicito
desvantagensdafiltragemcolaborativa
Novos itens Novo item não será indicado até que tenha sido avaliado por
um número considerável de usuários
Novos usuários O insuficiente conhecimento do novo usuário afeta o
estabelecimento de vizinhança.
Dispersão Se um item for avaliado por poucas pessoas, este item
raramente será recomendado.
Escalabilidade Muitas avaliações pode ocasionar lentidão no calculo de
similaridade..
(ADOMAVICIUS; TUZHILIN, 2005)
Filtragemhíbrida
Combina os pontos fortes da filtragem baseada em conteúdo e
da filtragem colaborativa.
Filtragem baseada em conteúdo
- Independência do usuário
- Indicação de itens ainda não avaliados por
qualquer usuário
- Histórico de consumo
Filtragem colaborativa
- Recomendação de itens diversos e
inesperados
- Descoberta de novos relacionamentos entre
usuários
- Histórico de avaliações em comum
Filtragemhíbrida
Método de hibridização Descrição
Ponderada (Weighted) As pontuações das técnicas de filtragem são combinadas para
produzir uma única recomendação.
Comutação (Switching) O sistema alterna entre as técnicas dependendo da situação atual.
Misturada (Mixed) Recomendações de vários técnicas diferentes são apresentado ao
mesmo tempo.
Combinação de recurso
(Feature combination)
Características de diferentes técnicas são jogadas juntas em um único
algoritmo de recomendação.
Cascata (Cascade) Uma técnica refina as recomendações dadas por outra.
Aumento do recurso
(Feature augmentation)
A saída de uma técnica é utilizada como uma característica de entrada
para outra.
Fonte: (BURKE, 2002, p.7, tradução nossa)
Consideraçõesfinais
1. 2. [...]
Recuperação
Filtragem
Consideraçõesfinais
Recuperação Filtragem
Frequência de uso Usuário singular, curto prazo Uso repetitivo, longo prazo
Representação da necessidade
de informação
Palavras de consulta Perfil de usuário
Preocupações Coleta e organização dos
itens
Distribuição dos itens
Escopo do sistema Relevância dos itens para a
necessidade de informação
pontual
Processamento de um fluxo
de informações para
corresponder a gostos e
preferências
Exemplos Science Direct, Google
Acadêmico, Yahoo!
Amazon, Google News,
Youtube, Netflix
Consideraçõesfinais
“A recuperação da informação e filtragem de informação são
realmente dois lados da mesma moeda. Eles trabalham em
conjunto para ajudar as pessoas a obter as informações
necessárias para suas tarefas.” (BELKIN; CROFT, 1995, p.9,
tradução nossa)
A maior parte dos problemas que parecem ser exclusivos para
filtragem de informação são especializações de problemas que
aparecem na recuperação da informação, na medida em que,
grande parte da experiência e pesquisa em RI é diretamente
relevante para FI.
Consideraçõesfinais
Por outro lado, pesquisadores como Pariser (2011) argumentam
que o uso de técnicas de filtragem de informação aplicados a
recuperação da informação tem contribuído para o crescimento
do que ele denomina de “Filtro Bolha”, uma consequência
perigosa da personalização da web.
O emprego de tais tecnologias pode dificultar o acesso a
novas informações que poderiam ampliar a visão de mundo, uma
vez que tais técnicas adaptam a informação retornada a
partir dos gostos pessoais e, desta forma, acabam tornando o
ambiente da web um espelho unidirecional, tendo em vista que
só refletirá seus próprios interesses.
referênciasbibliográficas
ADOMAVICIUS, G.; TUZHILIN, A. Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art
and Possible Extensions. IEEE Transactions on Knowledge and Data Engineering, New York, v. 17, n. 6, p. 734-749,
June. 2005.
BAEZA-YATES, R.; RIBEIRO-NETO, B.. Recuperação de Informação: Conceitos e Tecnologia das Máquinas de Busca.
2ª ed. Porto Alegre: Bookman, 2013.
BELKIN, N.J.; CROFT, W.B. Information filtering and information retrieval: Two sides of the same coin?. Communications
of the ACM, v.35, n.12, p.29-38, dez., 1992.
BELKIN, N.J. et al. Evaluating interactive information retrieval systems: Opportunities and challenges. In: Proceedings of
CHI'2004, 1594-1595, 2004.
HANANI, U.; SHAPIRA, B.; SHOVAL, P. Information filtering: Overview of issues, research and systems. User Modeling
and User-Adapted Interaction, v. 11, n.3, p. 203-259, 2001.
referênciasbibliográficas
INTERNET LIVE STATS. 2016 Disponível em: <http://www.internetlivestats.com/> Acesso em 30 abr. 2016.
LOPS, P.; GEMMIS, M.; SEMERARO, G.. Content-based Recommender Systems: State of the Art and Trends. In: RICCI,
F. et al. Recommender Systems Handbook. New York: Springer, 2011. p. 73-105.
http://facweb.cs.depaul.edu/mobasher/classes/ect584/Papers/ContentBasedRS.pdf
MANNING, C. D.; RAGHAVAN, P.; SCHUTZE, H. I. Web search basics. In:An introduction to information retrieval.
Cambridge: Cambridge University Press, 2007, p. 385--408.
SARWAR, B. et al. Item-based Collaborative Filtering Recommendation Algorithms. In: Proceedings of the 10th
international conference on World Wide Web, ACM, New York, 2001. p. 285-295. Disponível em: http://www10.
org/cdrom/papers/519/ . Acesso em 30 abr. 2016.
XIE, I. Interactive Information Retrieval in Digital Environments. New York: IGI Publishing, 2008.
Filtragemerecuperaçãoda
informaçãonaweb
Vanessa Levati Biff
Maio, 2016
UNIVERSIDADE FEDERAL DE SANTA CATARINA
Departamento de Ciência da Informação
Programa de Pós-Graduação em Ciência da Informação
Disciplina: Recuperação Inteligente da Informação
Profº: Dr. Angel Godoy Vieira

Mais conteúdo relacionado

Mais procurados

Aula II - Fato histórico, sujeito histórico, a história.pptx
Aula II - Fato histórico, sujeito histórico, a história.pptxAula II - Fato histórico, sujeito histórico, a história.pptx
Aula II - Fato histórico, sujeito histórico, a história.pptxIrisneideMaximo1
 
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...Dalton Martins
 
Pesquisa Bibliografica
Pesquisa BibliograficaPesquisa Bibliografica
Pesquisa BibliograficaLeticia Strehl
 
Plano de aula 02 sistema circulatório
Plano de aula 02 sistema circulatórioPlano de aula 02 sistema circulatório
Plano de aula 02 sistema circulatóriofamiliaestagio
 
Proposta de serviço de disseminação da Informação
Proposta de serviço de disseminação da InformaçãoProposta de serviço de disseminação da Informação
Proposta de serviço de disseminação da InformaçãoAna Carolina Simionato
 
Aula 3 revisão de literatura e metodologia
Aula 3 revisão de literatura e metodologiaAula 3 revisão de literatura e metodologia
Aula 3 revisão de literatura e metodologiabioalvarenga
 
Exaustividade, precisão e consistência em indexação: sistematização conceitual
Exaustividade, precisão e consistência em indexação: sistematização conceitualExaustividade, precisão e consistência em indexação: sistematização conceitual
Exaustividade, precisão e consistência em indexação: sistematização conceitualLuciana Piovezan
 
Como Fazer Trabalho Cientifico
Como Fazer Trabalho CientificoComo Fazer Trabalho Cientifico
Como Fazer Trabalho CientificoLucila Pesce
 
A questão de Referência - Denis Grogan
A questão de Referência - Denis GroganA questão de Referência - Denis Grogan
A questão de Referência - Denis GroganPatricia Neubert
 

Mais procurados (20)

Pesquisa de informação científica: estratégias e fontes
Pesquisa de informação científica: estratégias e fontesPesquisa de informação científica: estratégias e fontes
Pesquisa de informação científica: estratégias e fontes
 
Pesquisa de campo
Pesquisa de campoPesquisa de campo
Pesquisa de campo
 
Defesa Mestrado
Defesa MestradoDefesa Mestrado
Defesa Mestrado
 
Aula II - Fato histórico, sujeito histórico, a história.pptx
Aula II - Fato histórico, sujeito histórico, a história.pptxAula II - Fato histórico, sujeito histórico, a história.pptx
Aula II - Fato histórico, sujeito histórico, a história.pptx
 
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...
Apresentação da Defesa do Doutorado - Análise de redes sociais de colaboração...
 
Projeto pibid
Projeto pibid Projeto pibid
Projeto pibid
 
Saber avaliar a informação
Saber avaliar a informaçãoSaber avaliar a informação
Saber avaliar a informação
 
Monografia Ana Maria Pedagogia 2012
Monografia Ana Maria Pedagogia 2012Monografia Ana Maria Pedagogia 2012
Monografia Ana Maria Pedagogia 2012
 
Repositórios Digitais Confiáveis
Repositórios Digitais ConfiáveisRepositórios Digitais Confiáveis
Repositórios Digitais Confiáveis
 
Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]
 
Slides para a qualificação
Slides para a qualificaçãoSlides para a qualificação
Slides para a qualificação
 
Relato de experiência pdf
Relato de experiência pdfRelato de experiência pdf
Relato de experiência pdf
 
Pesquisa Bibliografica
Pesquisa BibliograficaPesquisa Bibliografica
Pesquisa Bibliografica
 
Plano de aula 02 sistema circulatório
Plano de aula 02 sistema circulatórioPlano de aula 02 sistema circulatório
Plano de aula 02 sistema circulatório
 
Proposta de serviço de disseminação da Informação
Proposta de serviço de disseminação da InformaçãoProposta de serviço de disseminação da Informação
Proposta de serviço de disseminação da Informação
 
Aula 3 revisão de literatura e metodologia
Aula 3 revisão de literatura e metodologiaAula 3 revisão de literatura e metodologia
Aula 3 revisão de literatura e metodologia
 
Exaustividade, precisão e consistência em indexação: sistematização conceitual
Exaustividade, precisão e consistência em indexação: sistematização conceitualExaustividade, precisão e consistência em indexação: sistematização conceitual
Exaustividade, precisão e consistência em indexação: sistematização conceitual
 
Qualificacao tcc (1)
Qualificacao tcc (1)Qualificacao tcc (1)
Qualificacao tcc (1)
 
Como Fazer Trabalho Cientifico
Como Fazer Trabalho CientificoComo Fazer Trabalho Cientifico
Como Fazer Trabalho Cientifico
 
A questão de Referência - Denis Grogan
A questão de Referência - Denis GroganA questão de Referência - Denis Grogan
A questão de Referência - Denis Grogan
 

Destaque

Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoNilton Heck
 
Aula 02 - Recuperação da Informação / Modelos de Sistemas de Recuperação
Aula 02 - Recuperação da Informação / Modelos de Sistemas de RecuperaçãoAula 02 - Recuperação da Informação / Modelos de Sistemas de Recuperação
Aula 02 - Recuperação da Informação / Modelos de Sistemas de RecuperaçãoNilton Heck
 
Desenvolvimento de coleções em centro de documentação: um relato de experiên...
Desenvolvimento de coleções em centro de documentação: um relato de experiên...Desenvolvimento de coleções em centro de documentação: um relato de experiên...
Desenvolvimento de coleções em centro de documentação: um relato de experiên...Vanessa Biff
 
Recuperação colaborativa da informação
Recuperação colaborativa da informaçãoRecuperação colaborativa da informação
Recuperação colaborativa da informaçãoVanessa Biff
 
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto Campos
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto CamposOrganização do acervo fotográfico da biblioteca escolar Sebastião Neto Campos
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto CamposVanessa Biff
 
Gestao Do Conhecimento_parte 2
Gestao Do Conhecimento_parte 2Gestao Do Conhecimento_parte 2
Gestao Do Conhecimento_parte 2Leonardo Moraes
 
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticos
Aula 2   Recuperação de Informação: operadores booleanos e aspectos linguísticosAula 2   Recuperação de Informação: operadores booleanos e aspectos linguísticos
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticosFilipe Reis
 
A coordenação de eventos como aspecto complementar à formação do profissional...
A coordenação de eventos como aspecto complementar à formação do profissional...A coordenação de eventos como aspecto complementar à formação do profissional...
A coordenação de eventos como aspecto complementar à formação do profissional...Semana Biblioteconomia
 
Soft information retrieval / Modelos de recuperação alternativos
Soft information retrieval / Modelos de recuperação alternativosSoft information retrieval / Modelos de recuperação alternativos
Soft information retrieval / Modelos de recuperação alternativosVanessa Biff
 
O processo de análise de assunto
O processo de análise de assuntoO processo de análise de assunto
O processo de análise de assuntojani_jpa2012
 
Métodos usados na recuperação de dados
Métodos usados na recuperação de dadosMétodos usados na recuperação de dados
Métodos usados na recuperação de dadosjulio-wong
 
A documentação Jurídica no contexto do Centro de Documentação - Roseli Miranda
A documentação Jurídica no contexto do Centro de Documentação - Roseli MirandaA documentação Jurídica no contexto do Centro de Documentação - Roseli Miranda
A documentação Jurídica no contexto do Centro de Documentação - Roseli MirandaSemana Biblioteconomia
 
Ciência da Informação: histórico e delimitação do campo
Ciência da Informação: histórico e delimitação do campoCiência da Informação: histórico e delimitação do campo
Ciência da Informação: histórico e delimitação do campoGiseli Adornato de Aguiar
 
Análise dos Modelos de Recuperação de Informação
Análise dos Modelos de Recuperação de InformaçãoAnálise dos Modelos de Recuperação de Informação
Análise dos Modelos de Recuperação de InformaçãoDiogo Benicá
 
Divulgação Científica - Fábio F. de Albuquerque
Divulgação Científica - Fábio F. de AlbuquerqueDivulgação Científica - Fábio F. de Albuquerque
Divulgação Científica - Fábio F. de AlbuquerqueSemana Biblioteconomia
 

Destaque (20)

Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da Informação
 
Aula 02 - Recuperação da Informação / Modelos de Sistemas de Recuperação
Aula 02 - Recuperação da Informação / Modelos de Sistemas de RecuperaçãoAula 02 - Recuperação da Informação / Modelos de Sistemas de Recuperação
Aula 02 - Recuperação da Informação / Modelos de Sistemas de Recuperação
 
Desenvolvimento de coleções em centro de documentação: um relato de experiên...
Desenvolvimento de coleções em centro de documentação: um relato de experiên...Desenvolvimento de coleções em centro de documentação: um relato de experiên...
Desenvolvimento de coleções em centro de documentação: um relato de experiên...
 
Recuperação colaborativa da informação
Recuperação colaborativa da informaçãoRecuperação colaborativa da informação
Recuperação colaborativa da informação
 
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto Campos
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto CamposOrganização do acervo fotográfico da biblioteca escolar Sebastião Neto Campos
Organização do acervo fotográfico da biblioteca escolar Sebastião Neto Campos
 
Gestao Do Conhecimento_parte 2
Gestao Do Conhecimento_parte 2Gestao Do Conhecimento_parte 2
Gestao Do Conhecimento_parte 2
 
Comunidade de Prática
Comunidade de PráticaComunidade de Prática
Comunidade de Prática
 
Arquivo invertido
Arquivo invertidoArquivo invertido
Arquivo invertido
 
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticos
Aula 2   Recuperação de Informação: operadores booleanos e aspectos linguísticosAula 2   Recuperação de Informação: operadores booleanos e aspectos linguísticos
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticos
 
A coordenação de eventos como aspecto complementar à formação do profissional...
A coordenação de eventos como aspecto complementar à formação do profissional...A coordenação de eventos como aspecto complementar à formação do profissional...
A coordenação de eventos como aspecto complementar à formação do profissional...
 
Soft information retrieval / Modelos de recuperação alternativos
Soft information retrieval / Modelos de recuperação alternativosSoft information retrieval / Modelos de recuperação alternativos
Soft information retrieval / Modelos de recuperação alternativos
 
O processo de análise de assunto
O processo de análise de assuntoO processo de análise de assunto
O processo de análise de assunto
 
Métodos usados na recuperação de dados
Métodos usados na recuperação de dadosMétodos usados na recuperação de dados
Métodos usados na recuperação de dados
 
A documentação Jurídica no contexto do Centro de Documentação - Roseli Miranda
A documentação Jurídica no contexto do Centro de Documentação - Roseli MirandaA documentação Jurídica no contexto do Centro de Documentação - Roseli Miranda
A documentação Jurídica no contexto do Centro de Documentação - Roseli Miranda
 
Analise de Assunto
Analise de AssuntoAnalise de Assunto
Analise de Assunto
 
Ciência da Informação: histórico e delimitação do campo
Ciência da Informação: histórico e delimitação do campoCiência da Informação: histórico e delimitação do campo
Ciência da Informação: histórico e delimitação do campo
 
Análise dos Modelos de Recuperação de Informação
Análise dos Modelos de Recuperação de InformaçãoAnálise dos Modelos de Recuperação de Informação
Análise dos Modelos de Recuperação de Informação
 
Divulgação Científica - Fábio F. de Albuquerque
Divulgação Científica - Fábio F. de AlbuquerqueDivulgação Científica - Fábio F. de Albuquerque
Divulgação Científica - Fábio F. de Albuquerque
 
Origens e evolução da Ciência da Informação
Origens e evolução da Ciência da InformaçãoOrigens e evolução da Ciência da Informação
Origens e evolução da Ciência da Informação
 
Apresentação da tese defesa oral
Apresentação da tese defesa oralApresentação da tese defesa oral
Apresentação da tese defesa oral
 

Semelhante a Filtragem e recuperação da informação

Artigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informaçãoArtigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informaçãoCristina Ferreira
 
Necessidades de otimização dos processos de planejamento e operacionalização ...
Necessidades de otimização dos processos de planejamento e operacionalização ...Necessidades de otimização dos processos de planejamento e operacionalização ...
Necessidades de otimização dos processos de planejamento e operacionalização ...Rodrigo Moreira Garcia
 
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3Thalita Gama
 
Arquitetura da informação para blogs
Arquitetura da informação para blogsArquitetura da informação para blogs
Arquitetura da informação para blogsLaura Inafuko
 
O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...Rodrigo Moreira Garcia
 
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...Fabiana Andrade Pereira
 
Palestra 05_Metricas alternativas
Palestra 05_Metricas alternativasPalestra 05_Metricas alternativas
Palestra 05_Metricas alternativasUNICAMP - PPEC
 
Métricas alternativas e marketing científico digital
Métricas alternativas e marketing científico digitalMétricas alternativas e marketing científico digital
Métricas alternativas e marketing científico digitalPortal de Periódicos UFSC
 
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontes
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontesCURADORIA DE CONTEÚDOS: elaboração de um guia de fontes
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontesRita Almeida
 
Desenvolvimento de competência informacional em busca bibliográfica em bases ...
Desenvolvimento de competência informacional em busca bibliográfica em bases ...Desenvolvimento de competência informacional em busca bibliográfica em bases ...
Desenvolvimento de competência informacional em busca bibliográfica em bases ...http://bvsalud.org/
 
Bisset e. 2017 tese doutorado
Bisset e. 2017 tese doutoradoBisset e. 2017 tese doutorado
Bisset e. 2017 tese doutoradoebicet
 

Semelhante a Filtragem e recuperação da informação (20)

Resenha Crítica
Resenha CríticaResenha Crítica
Resenha Crítica
 
Artigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informaçãoArtigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informação
 
MARKETING2
MARKETING2MARKETING2
MARKETING2
 
Necessidades de otimização dos processos de planejamento e operacionalização ...
Necessidades de otimização dos processos de planejamento e operacionalização ...Necessidades de otimização dos processos de planejamento e operacionalização ...
Necessidades de otimização dos processos de planejamento e operacionalização ...
 
Sistemas de recomendação
Sistemas de recomendaçãoSistemas de recomendação
Sistemas de recomendação
 
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3
Preparatório Santa Biblioteconomia - Foco UFF e Aeronáutica - Aula 3
 
Arquitetura da informação para blogs
Arquitetura da informação para blogsArquitetura da informação para blogs
Arquitetura da informação para blogs
 
Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...
 
O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...O comportamento do usuário final na recuperação temática da informação: um es...
O comportamento do usuário final na recuperação temática da informação: um es...
 
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
SEARCH ENGINE OPTIMIZATION (SEO) PARA BIBLIOTECAS VIRTUAIS: ESTUDO DE CASO DA...
 
Gestão de dados de pesquisa
Gestão de dados de pesquisaGestão de dados de pesquisa
Gestão de dados de pesquisa
 
Palestra 05_Metricas alternativas
Palestra 05_Metricas alternativasPalestra 05_Metricas alternativas
Palestra 05_Metricas alternativas
 
Aula 4
Aula 4Aula 4
Aula 4
 
Atlas analise de dados
Atlas analise de dadosAtlas analise de dados
Atlas analise de dados
 
Métricas alternativas e marketing científico digital
Métricas alternativas e marketing científico digitalMétricas alternativas e marketing científico digital
Métricas alternativas e marketing científico digital
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontes
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontesCURADORIA DE CONTEÚDOS: elaboração de um guia de fontes
CURADORIA DE CONTEÚDOS: elaboração de um guia de fontes
 
Curadoria de dados de pesquisa
Curadoria de dados de pesquisaCuradoria de dados de pesquisa
Curadoria de dados de pesquisa
 
Desenvolvimento de competência informacional em busca bibliográfica em bases ...
Desenvolvimento de competência informacional em busca bibliográfica em bases ...Desenvolvimento de competência informacional em busca bibliográfica em bases ...
Desenvolvimento de competência informacional em busca bibliográfica em bases ...
 
Bisset e. 2017 tese doutorado
Bisset e. 2017 tese doutoradoBisset e. 2017 tese doutorado
Bisset e. 2017 tese doutorado
 

Mais de Vanessa Biff

O Pensamento pedagógico Renascentista ao Positivista
O Pensamento pedagógico Renascentista ao PositivistaO Pensamento pedagógico Renascentista ao Positivista
O Pensamento pedagógico Renascentista ao PositivistaVanessa Biff
 
O papel da biblioteca escolar na formação de leitores
O papel da biblioteca escolar na formação de leitoresO papel da biblioteca escolar na formação de leitores
O papel da biblioteca escolar na formação de leitoresVanessa Biff
 
Relações entre leitura, letramento, identidade e o papel da biblioteca escolar
Relações entre leitura, letramento, identidade  e o papel da biblioteca escolarRelações entre leitura, letramento, identidade  e o papel da biblioteca escolar
Relações entre leitura, letramento, identidade e o papel da biblioteca escolarVanessa Biff
 
Letramento informacional em bibliotecas públicas
Letramento informacional em bibliotecas públicasLetramento informacional em bibliotecas públicas
Letramento informacional em bibliotecas públicasVanessa Biff
 
Marxismo e filosofia da linguagem
Marxismo e filosofia da linguagemMarxismo e filosofia da linguagem
Marxismo e filosofia da linguagemVanessa Biff
 
Apresentação defesa de mestrado
Apresentação defesa de mestradoApresentação defesa de mestrado
Apresentação defesa de mestradoVanessa Biff
 
Agentes inteligentes
Agentes inteligentesAgentes inteligentes
Agentes inteligentesVanessa Biff
 
A Experiência do CEDRIC na gestão documental do CTCL
A Experiência do CEDRIC na gestão documental do CTCLA Experiência do CEDRIC na gestão documental do CTCL
A Experiência do CEDRIC na gestão documental do CTCLVanessa Biff
 

Mais de Vanessa Biff (8)

O Pensamento pedagógico Renascentista ao Positivista
O Pensamento pedagógico Renascentista ao PositivistaO Pensamento pedagógico Renascentista ao Positivista
O Pensamento pedagógico Renascentista ao Positivista
 
O papel da biblioteca escolar na formação de leitores
O papel da biblioteca escolar na formação de leitoresO papel da biblioteca escolar na formação de leitores
O papel da biblioteca escolar na formação de leitores
 
Relações entre leitura, letramento, identidade e o papel da biblioteca escolar
Relações entre leitura, letramento, identidade  e o papel da biblioteca escolarRelações entre leitura, letramento, identidade  e o papel da biblioteca escolar
Relações entre leitura, letramento, identidade e o papel da biblioteca escolar
 
Letramento informacional em bibliotecas públicas
Letramento informacional em bibliotecas públicasLetramento informacional em bibliotecas públicas
Letramento informacional em bibliotecas públicas
 
Marxismo e filosofia da linguagem
Marxismo e filosofia da linguagemMarxismo e filosofia da linguagem
Marxismo e filosofia da linguagem
 
Apresentação defesa de mestrado
Apresentação defesa de mestradoApresentação defesa de mestrado
Apresentação defesa de mestrado
 
Agentes inteligentes
Agentes inteligentesAgentes inteligentes
Agentes inteligentes
 
A Experiência do CEDRIC na gestão documental do CTCL
A Experiência do CEDRIC na gestão documental do CTCLA Experiência do CEDRIC na gestão documental do CTCL
A Experiência do CEDRIC na gestão documental do CTCL
 

Filtragem e recuperação da informação

  • 1. Filtragemerecuperaçãoda informaçãonaweb Vanessa Levati Biff Maio, 2016 UNIVERSIDADE FEDERAL DE SANTA CATARINA Departamento de Ciência da Informação Programa de Pós-Graduação em Ciência da Informação Disciplina: Recuperação Inteligente da Informação Profº: Dr. Angel Godoy Vieira
  • 4. Motivações... a falta de um método para comparar e processar diferentes tipos de informações disponíveis na web!
  • 5. Objetivo Avaliar técnicas de filtragem e recuperação de informação e suas aplicações na otimização da busca de informação na web.
  • 7. Recuperaçãodainformaçãonaweb A recuperação da informação (RI) abrange estudos voltados aos processos relativos ao acesso à informação, propondo modelos que solucionem a necessidade da informação de um usuário em determinado conjunto de dados.
  • 8. ProblemasdeRInaweb - Quantidade de documentos não relevantes retornados; - Tempo dispendido pelo usuário para verificação das buscas. Os problemas estão relacionados ao modelo de recuperação adotado, que muitas vezes desconsideram o contexto da consulta. (BAEZA-YATES; RIBEIRO-NETO; 2013)
  • 9. sISTEMASDERECUPERAÇÃOdainformação SRI são compostos por três processos básicos: a consulta de informação, a indexação e o cálculo de similaridade que basicamente verifica a ocorrência ou não dos termos da consulta na base de dados. Atualmente são utilizadas técnicas de mineração de dados como indexação de termos, classificação de documentos mas a maioria dos modelos adotados não levam em consideração aspectos semânticos da consulta ou do perfil do usuário
  • 10. problemasdesri - Coincidir a representação com as necessidades dos usuários; - Os usuários não conseguirem expressar suas necessidades; - Necessidade de interagir com o sistema. (XIE; 2008)
  • 11. técnicasderecuperaçãodainformação Em recuperação da informação, há várias abordagens que tentam melhorar a formulação da consulta inicial afim de melhorar a recuperação de informações úteis. Dentre elas há processo de feedback de relevância e a expansão da consulta. O primeiro ocorre quando o usuário fornece explicitamente informações sobre os documentos relevantes para uma consulta, e o segundo quando as informações relacionadas à consulta são utilizadas para expandi-la. (BAEZA-YATES; RIBEIRO-NETO, 2013)
  • 12. recuperaçãodainformaçãointerativa Belkin et al. (2004) conclui que embora haja uma boa quantidade de pesquisas sobre algorítimos de recuperação da informação que atendam essas características, pouco se tem focado em questões de recuperação interativa. Isso porque seres humanos são mais complexos do que algoritmos correspondentes, suas motivações e comportamentos são mais variados e difíceis de se medir. Entretanto, sistemas de Informação que filtram informações relevantes para um determinado usuário baseado em seu perfil são conhecidos como Sistemas de Recomendação.
  • 13. Sistemasderecomendação Sistemas de recomendação tem o efeito de orientar os usuários de forma personalizada para objetos interessantes em um grande espaço de opções possíveis. (LOPS, GEMMIS; SEMERARO, 2004) Os usuários precisam de um apoio personalizado em peneirar grande quantidades de informação disponíveis, de acordo com os seus interesses e gostos
  • 14. Filtragemdeinformação Compreende em um método para gerir grandes fluxos de informações, cujo objetivo é expor aos usuários apenas a informação relevante que atenda suas necessidades. (HANANI; SHAPIRA; SHOVAL, 2001)
  • 15. Filtragemdeinformação Compreende em um método para gerir grandes fluxos de informações, cujo objetivo é expor aos usuários apenas a informação relevante que atenda suas necessidades. (HANANI; SHAPIRA; SHOVAL, 2001)
  • 16. exemplodeaplicações - Filtros para resultados de pesquisa na internet; - Filtros de e-mails personalizados com base em perfis pessoais; - Filtros para aplicações de e-commerce que tratam de produtos e promoções para apenas clientes potenciais. (HANANI; SHAPIRA; SHOVAL, 2001)
  • 17. técnicasdeFiltragemdeinformação Com o objetivo de gerir a sobrecarga de informação, a Filtragem de Informação faz uso dos vários métodos, conceitos e técnicas de diversas áreas de pesquisa, como: Recuperação de Informação, Inteligência Artificial e Ciência Comportamental. - Filtragem baseada em conteúdo; - Filtragem colaborativa; - Filtragem Híbrida. (HANANI; SHAPIRA; SHOVAL, 2001)
  • 18. Filtragembaseadaemconteúdo Baseia-se na análise do conteúdo do item e no perfil do usuário. Técnicas para: - Representar os itens; - Produzir o perfil de usuário; - Comparar o perfil do usuário com a representação do item.
  • 19.
  • 20. Utiliza técnica de RI: - Modelo vetorial - Indexação semântica (métodos de aprendizagem)
  • 21. Utiliza técnica de RI: - Aprendizado de máquina; - Algoritmos e redes neurais; - Feedback de relevância; (explicito e implicito)
  • 22.
  • 23. Histórico de feedback do usuário Itens do sistema Perfil do usuário Cálculo de similaridade entre perfil do usuário e itens do sistema Lista de recomendações Usuário interage com o sistema
  • 24. DesvantagensDAFILTRAGEMBASEADAEMCONTEÚDO Limite na análise de conteúdo Só é eficaz se os itens tiveram a quantidade considerável de informação armazenada de forma textual. Superespecialização O usuário fica limitado a um grau especifico de novidade, afetando a diversidade. Novos usuários Pois a avaliação do usuário é necessária para que o sistema possa compreender e atender suas preferências. (LOPS; GEMMIS; SEMERARO, 2004)
  • 25. Filtragemcolaborativa Tenta prever a utilidade dos itens para um determinado usuário com base nos itens que foram previamente avaliados por outros usuários.
  • 29. desvantagensdafiltragemcolaborativa Novos itens Novo item não será indicado até que tenha sido avaliado por um número considerável de usuários Novos usuários O insuficiente conhecimento do novo usuário afeta o estabelecimento de vizinhança. Dispersão Se um item for avaliado por poucas pessoas, este item raramente será recomendado. Escalabilidade Muitas avaliações pode ocasionar lentidão no calculo de similaridade.. (ADOMAVICIUS; TUZHILIN, 2005)
  • 30. Filtragemhíbrida Combina os pontos fortes da filtragem baseada em conteúdo e da filtragem colaborativa. Filtragem baseada em conteúdo - Independência do usuário - Indicação de itens ainda não avaliados por qualquer usuário - Histórico de consumo Filtragem colaborativa - Recomendação de itens diversos e inesperados - Descoberta de novos relacionamentos entre usuários - Histórico de avaliações em comum
  • 31. Filtragemhíbrida Método de hibridização Descrição Ponderada (Weighted) As pontuações das técnicas de filtragem são combinadas para produzir uma única recomendação. Comutação (Switching) O sistema alterna entre as técnicas dependendo da situação atual. Misturada (Mixed) Recomendações de vários técnicas diferentes são apresentado ao mesmo tempo. Combinação de recurso (Feature combination) Características de diferentes técnicas são jogadas juntas em um único algoritmo de recomendação. Cascata (Cascade) Uma técnica refina as recomendações dadas por outra. Aumento do recurso (Feature augmentation) A saída de uma técnica é utilizada como uma característica de entrada para outra. Fonte: (BURKE, 2002, p.7, tradução nossa)
  • 33. Consideraçõesfinais Recuperação Filtragem Frequência de uso Usuário singular, curto prazo Uso repetitivo, longo prazo Representação da necessidade de informação Palavras de consulta Perfil de usuário Preocupações Coleta e organização dos itens Distribuição dos itens Escopo do sistema Relevância dos itens para a necessidade de informação pontual Processamento de um fluxo de informações para corresponder a gostos e preferências Exemplos Science Direct, Google Acadêmico, Yahoo! Amazon, Google News, Youtube, Netflix
  • 34. Consideraçõesfinais “A recuperação da informação e filtragem de informação são realmente dois lados da mesma moeda. Eles trabalham em conjunto para ajudar as pessoas a obter as informações necessárias para suas tarefas.” (BELKIN; CROFT, 1995, p.9, tradução nossa) A maior parte dos problemas que parecem ser exclusivos para filtragem de informação são especializações de problemas que aparecem na recuperação da informação, na medida em que, grande parte da experiência e pesquisa em RI é diretamente relevante para FI.
  • 35. Consideraçõesfinais Por outro lado, pesquisadores como Pariser (2011) argumentam que o uso de técnicas de filtragem de informação aplicados a recuperação da informação tem contribuído para o crescimento do que ele denomina de “Filtro Bolha”, uma consequência perigosa da personalização da web. O emprego de tais tecnologias pode dificultar o acesso a novas informações que poderiam ampliar a visão de mundo, uma vez que tais técnicas adaptam a informação retornada a partir dos gostos pessoais e, desta forma, acabam tornando o ambiente da web um espelho unidirecional, tendo em vista que só refletirá seus próprios interesses.
  • 36. referênciasbibliográficas ADOMAVICIUS, G.; TUZHILIN, A. Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions. IEEE Transactions on Knowledge and Data Engineering, New York, v. 17, n. 6, p. 734-749, June. 2005. BAEZA-YATES, R.; RIBEIRO-NETO, B.. Recuperação de Informação: Conceitos e Tecnologia das Máquinas de Busca. 2ª ed. Porto Alegre: Bookman, 2013. BELKIN, N.J.; CROFT, W.B. Information filtering and information retrieval: Two sides of the same coin?. Communications of the ACM, v.35, n.12, p.29-38, dez., 1992. BELKIN, N.J. et al. Evaluating interactive information retrieval systems: Opportunities and challenges. In: Proceedings of CHI'2004, 1594-1595, 2004. HANANI, U.; SHAPIRA, B.; SHOVAL, P. Information filtering: Overview of issues, research and systems. User Modeling and User-Adapted Interaction, v. 11, n.3, p. 203-259, 2001.
  • 37. referênciasbibliográficas INTERNET LIVE STATS. 2016 Disponível em: <http://www.internetlivestats.com/> Acesso em 30 abr. 2016. LOPS, P.; GEMMIS, M.; SEMERARO, G.. Content-based Recommender Systems: State of the Art and Trends. In: RICCI, F. et al. Recommender Systems Handbook. New York: Springer, 2011. p. 73-105. http://facweb.cs.depaul.edu/mobasher/classes/ect584/Papers/ContentBasedRS.pdf MANNING, C. D.; RAGHAVAN, P.; SCHUTZE, H. I. Web search basics. In:An introduction to information retrieval. Cambridge: Cambridge University Press, 2007, p. 385--408. SARWAR, B. et al. Item-based Collaborative Filtering Recommendation Algorithms. In: Proceedings of the 10th international conference on World Wide Web, ACM, New York, 2001. p. 285-295. Disponível em: http://www10. org/cdrom/papers/519/ . Acesso em 30 abr. 2016. XIE, I. Interactive Information Retrieval in Digital Environments. New York: IGI Publishing, 2008.
  • 38. Filtragemerecuperaçãoda informaçãonaweb Vanessa Levati Biff Maio, 2016 UNIVERSIDADE FEDERAL DE SANTA CATARINA Departamento de Ciência da Informação Programa de Pós-Graduação em Ciência da Informação Disciplina: Recuperação Inteligente da Informação Profº: Dr. Angel Godoy Vieira