Um Algoritmo De Busca Utilizando Tesauros

1.255 visualizações

Publicada em

Minhas apresentação do TCC

1 comentário
0 gostaram
Estatísticas
Notas
  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
1.255
No SlideShare
0
A partir de incorporações
0
Número de incorporações
16
Ações
Compartilhamentos
0
Downloads
16
Comentários
1
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Um Algoritmo De Busca Utilizando Tesauros

  1. 1. Um algoritmo de busca utilizando recuperação da informação e tesauros Trabalho de Conclusão de Curso Aluno: Daniel Ferreira de Lima Orientação: Edgar Noda
  2. 2. <ul><li>Introdução
  3. 3. Panorama
  4. 4. Conceitos Básicos
  5. 5. Algoritmo de busca
  6. 6. Obtenção de conteúdo
  7. 7. Testes
  8. 8. Projetos futuros </li></ul>Roteiro
  9. 9. Roteiro <ul><li>Introdução
  10. 10. Panorama
  11. 11. Conceitos Básicos
  12. 12. Algoritmo de busca
  13. 13. Obtenção de conteúdo
  14. 14. Testes
  15. 15. Projetos futuros </li></ul>
  16. 16. Introdução <ul><li>Internet </li><ul><li>Repositórios de dado </li></ul><li>Buscas
  17. 17. Recuperar informação </li></ul>
  18. 18. Roteiro <ul><li>Introdução
  19. 19. Panorama
  20. 20. Conceitos Básicos
  21. 21. Algoritmo de busca
  22. 22. Obtenção de conteúdo
  23. 23. Testes
  24. 24. Projetos futuros </li></ul>
  25. 25. BING Panorama
  26. 26. <ul><li>Google </li></ul>Panorama
  27. 27. <ul><li>Muita informação? </li></ul>Panorama
  28. 28. Roteiro <ul><li>Introdução
  29. 29. Panorama
  30. 30. Conceitos Básicos
  31. 31. Algoritmo de busca
  32. 32. Obtenção de conteúdo
  33. 33. Testes
  34. 34. Projetos futuros </li></ul>
  35. 35. Recuperação da informação <ul><li>Forma de obter conteúdo </li><ul><li>Internet
  36. 36. Textos
  37. 37. Bancos de dados </li></ul></ul>
  38. 38. <ul><li>Procurar por um livro
  39. 39. Achar conteúdo em um
  40. 40. livro
  41. 41. Uma procura no Google </li></ul>Recuperação da informação
  42. 42. <ul><li>Sinônimos </li><ul><li>Palavra (sinonimo1, sinonimo2, ..) </li></ul><li>Organização </li><ul><li>Termo inicial mais relevante
  43. 43. Termo final menos relevante. </li></ul><li>Primeiro termo recebe maior pontuação (100). </li></ul>s 1 =100 s n =100- n *10 ; Condição: s n >=10 Tesauros
  44. 44. Tesauros <ul>dog: <ul>dog, domestic dog, Canis familiaris </ul></ul>=> canine, canid => domestic animal, domesticated animal dog (100), domestic dog(90), canis familiares(80), canine(70)
  45. 45. <ul><li>Algoritmo de buscas e recuperação da informação </li><ul><li>Utiliza tesauros </li><ul><li>rede de computadores </li></ul><li>Pontuação de relevância </li></ul><li>Obtenção de conteúdo </li><ul><li>Várias fontes de dados </li></ul></ul>Objetivo
  46. 46. Roteiro <ul><li>Introdução
  47. 47. Panorama
  48. 48. Conceitos Básicos
  49. 49. Algoritmo de busca
  50. 50. Obtenção de conteúdo
  51. 51. Testes
  52. 52. Projetos futuros </li></ul>
  53. 53. Algoritmo de busca <ul><li>Dicionário
  54. 54. Tesauros
  55. 55. Algoritmo de pontuação e seleção
  56. 56. Recuperação de conteúdo </li></ul>
  57. 57. Dicionário <ul><li>Dicionário </li><ul><li>Recebe massa de dados
  58. 58. Trata
  59. 59. Gera base de informações </li></ul></ul>Dicionário dinâmico <ul><ul><li>Se adequa a novos termos </li></ul></ul>
  60. 60. Dicionário <ul><li>Dicionário a ser criado: redes </li></ul>Massa de dados ← Livro de redes Extrai termos frequentes Calcula peso dos termos Calcula peso por palavra encontrada Gera XML com estas informações
  61. 61. Dicionário <dicionarios> <categoria nome='network' pontos='20901005' palavras='344749' percentual='0.10739407511'> <palavra indice='1' valor='network' pontos='27' /> <palavra indice='2' valor='packet' pontos='22' /> <palavra indice='3' valor='layer' pontos='21' /> <palavra indice='4' valor='frame' pontos='21' /> <palavra indice='5' valor='protocol' pontos='20' /> ...
  62. 62. Cálculo de pontos <ul>Ativação de categoria </ul>t1 tn sn sn ∑ tn+sn . . . <ul>tn*sn=total de pontos para o termo </ul>s1 sn tn = termos sn = sinônimos
  63. 63. Qualificação da resposta <ul>Nível de relevância </ul>
  64. 64. Realimentação de dicionário <ul><li>Dicionário </li><ul><li>Massa de dados = nova massa de dados
  65. 65. Recria dicionário
  66. 66. Novos termos e pesos </li></ul></ul>
  67. 67. Roteiro <ul><li>Introdução
  68. 68. Panorama
  69. 69. Conceitos Básicos
  70. 70. Algoritmo de busca
  71. 71. Obtenção de conteúdo
  72. 72. Testes
  73. 73. Projetos futuros </li></ul>
  74. 74. Obtenção de conteúdo Local Rede/ Web Remoto Algoritmo de busca
  75. 75. Obtenção de conteúdo <ul><li>Busca Internet </li></ul><ul><li>Busca Local </li></ul><ul><li>Busca Remota </li></ul><ul><li>Busca de Máquinas </li></ul>
  76. 76. Busca Internet <ul><li>Spider </li><ul><li>Site
  77. 77. Recupera informação </li></ul><li>Navega link a link </li><ul><li>Gera cache </li></ul></ul>
  78. 78. Busca Local <ul><li>Varre diretórios
  79. 79. Retorna conteúdo </li></ul>Buscador Sistema de Arquivos
  80. 80. Busca Remota <ul><li>Envia objeto 'Busca Local' </li><ul><li>Aguarda o retorno </li></ul><li>Máquina remota </li><ul><li>Executa objeto
  81. 81. Envia resposta </li></ul></ul>Cliente Cliente Servidor Servidor rede
  82. 82. Busca Máquinas <ul><li>Rede </li><ul><li>Busca máquinas
  83. 83. Permite buscas massivas </li></ul></ul><ul>Exemplo: <li>No diretório /media/músicas/ procure *.mp3 no endereço 10.9.8.[1-255] </li></ul>
  84. 84. Roteiro <ul><li>Introdução
  85. 85. Panorama
  86. 86. Conceitos Básicos
  87. 87. Algoritmo de busca
  88. 88. Obtenção de conteúdo
  89. 89. Testes
  90. 90. Projetos futuros </li></ul>
  91. 91. Testes <ul><li>Texto de redes passado para o buscador
  92. 92. Resultado:
  93. 93. Categoria: NETWORK
  94. 94. Pontos: [ 10350 ]
  95. 95. Relevância: [ ALTA ]
  96. 96. Pontos por palavra: [ 62 ] </li></ul>
  97. 97. Testes <ul><li>Texto sobre um assunto qualquer passado para o buscador
  98. 98. Resultado:
  99. 99. Categoria: NETWORK
  100. 100. Pontos: [ 0 ]
  101. 101. Relevância: [ BAIXA ]
  102. 102. Pontos por palavra: [ 0 ] </li></ul>
  103. 103. Roteiro <ul><li>Introdução
  104. 104. Panorama
  105. 105. Conceitos Básicos
  106. 106. Algoritmo de busca
  107. 107. Obtenção de conteúdo
  108. 108. Testes
  109. 109. Projetos futuros </li></ul>
  110. 110. Projetos futuros <ul><li>Aplicação de redes neurais com propagação
  111. 111. Suporte a outras categorias e idiomas (detecção)
  112. 112. Utilização da Wordnet </li><ul><li>Outros relacionamentos além de sinônimos </li></ul><li>Usar semântica das tags HTML para influenciar pontuação (hn, p, b)
  113. 113. Utilização de agentes
  114. 114. Múltipla ativação
  115. 115. Busca em outros tipos de conteúdo </li><ul><li>Imagens, vídeo, áudio </li></ul></ul>
  116. 116. Conclusão <ul><li>Resultado do algoritmo
  117. 117. Necessidade dos algoritmos de busca
  118. 118. Quantidade de informação </li><ul><li>Aumento exponencial
  119. 119. Novas formas de gerar conteúdo </li><ul><li>Twitter, blogs, waves </li></ul></ul></ul>
  120. 120. FIM Aluno: Daniel Ferreira de Lima
  121. 121. Complementos <ul><li>Demonstrações práticas
  122. 122. Linguagem de programação: Python
  123. 123. 33 módulos, 15 classes
  124. 124. Demo: </li><ul><li>slide31.py
  125. 125. slide37.py </li></ul></ul>
  126. 126. Bibliografia   <ul><ul><li>http://tinyurl.com/lkzlx4
  127. 127. http://tinyurl.com/m2x2xq
  128. 128. http://tinyurl.com/5psocx </li></ul></ul>FAM - Faculdade de Americana  Novembro de 2009  

×