Indexação e busca baseada em metadados em um sistema P2P Híbrido

394 visualizações

Publicada em

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
394
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4
Ações
Compartilhamentos
0
Downloads
2
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Indexação e busca baseada em metadados em um sistema P2P Híbrido

  1. 1. Indexação e buscabaseada em metadadosem um sistema P2PHíbridoCentro de InformáticaUniversidade Federal dePernambucoMarco André Santos Machadomasm@cin.ufpe.br
  2. 2. Agenda● Indexação e Buscas● Metadados● Trabalhos Relacionados● Proposta● Análise Comparativa 2
  3. 3. Indexação e Buscas 3
  4. 4. Metadados● ID● Nome● Tamanho (Kb)● Path● Datas de criação, indexação, modificação● Interesses do usuário● Categoria● Conteúdo 4
  5. 5. Trabalhos Relacionados 5
  6. 6. Trabalhos Relacionados● Sixearch – Composto por muito componentes: – Crawler – Sistema para Indexação – Mecanismo de Recuperação – Sistema de aprendizado baseado em contexto● Index local, aggregated, em clustering) 6
  7. 7. Trabalhos Relacionados● Minerva – Cada peer descobre e indexa seus arquivos – Envia um conjunto de metadados baseado em termos para um index global – Possui um index local e global (2-steps) 7
  8. 8. Trabalhos Relacionados● eSearch – Indexação baseado em palavras-chave – Possui peer divididos por palavras-chave para armazenar o index – Index local e global – Local: documento X contêm os termos a, b – Global: termos a está nos documentos X, Z 8
  9. 9. Proposta● Indexação – Extrair o conteúdo (Apache Tika) – Extrair metadados – Indexar (Lucene) – Local – SearchServer● Busca – Local – Global – Distribuída 9
  10. 10. Análise ComparativaCenário 1●● Index local, global, distribuído 10
  11. 11. Análise ComparativaCenário 1●● Index local, global, distribuído 11
  12. 12. Análise Comparativa● Cenário 1 – Index local, global, distribuído – Vantagens ● A busca sempre retornará resultados ● SearhServer ON => index completo – Desvantagens ● Dupla indexação ● Maior quantidade de mensagens ● Sobrecarga do SearchServer ● Busca distribuída => Flood 12
  13. 13. Análise ComparativaCenário 2●● Index global 13
  14. 14. Análise Comparativa● Cenário 2 – Index global – Vantagens ● Única indexação ● Menor qnt. de mensagens ● SearhServer ON => index completo – Desvantagens ● Sobrecarga do SearchServer ● A busca pode NÃO retorna resultados (SearchServer => OFF) 14
  15. 15. Análise ComparativaCenário 3●● Index local / distribuído 15
  16. 16. Análise Comparativa● Cenário 3 – Index local / distribuído – Vantagens ● Única indexação ● Menor qnt. de mensagens para indexar – Desvantagens ● A busca só retorna resultados do peers online ● Não possui um index completo 16
  17. 17. Obrigado! 17

×