Tag Suggestion using Multiple Sources of Knowledge

807 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
807
No SlideShare
0
A partir de incorporações
0
Número de incorporações
127
Ações
Compartilhamentos
0
Downloads
10
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • - CONTEXTO DAS SOLUÇÕES DE SUGESTÃO DE TAGS- ORGANIZAÇÃO DE PÁGINAS
  • TAGS NUM DOS SITES MAIS POPULARES DA WEB DESCRIÇÃO E ORGANIZAÇÃO SERIA MAIS DIFÍCIL SEM TAGS
  • - N HÁ CLASSIFICAÇÃO HIERÁRQUICA, DITA MTO RÍGIDA P CLASSIFICAR DADOS NA WEB- AGREGADORES -> SISTEMAS DE COMPARTILHAMENTO DE RECURSOS (URLS NO DELICIOUS, VIDEOS NO YOUTUBE)
  • POPULAR TAGSRAILS ( SEE MORE ) RUBY, PROGRAMAÇÃO
  • FOLK + TAXONOMY
  • PALAVRAS LIGADAS = BINDED WORDS
  • // Coffee não é uma boa tag pra descrever essa página
  • [FIM] PROCESSO “GENÉRICO”... EXEMPLO – SUGESTÃO NO DELICIOUS. . .
  • PARA UM RECURSO – JÁ Q VÁRIOS USUÁRIOS PODEM ENVIAR A MESMA URL
  • DESAMBIGUAÇÃO – JAVA (ÚNICA TAG EM PÁGS SOBRE LING E CAFÉ)- ATÉ AQUI == O QUE E PORQUÊ DE SUGESTÃO. MAS COMO?
  • TREINAMENTO = DATASET DELICIOUS (PÁGS,TAGS)
  • AM – MAIS USADA E COM BONS RESULTADOS EM SUGESTÃOMÁQUINA VETOR SUPORTE – USADA COM SUCESSO EM DIVERSAS APLICAÇÕES, ESPECIALMENTE EM TAREFAS ENVOLVENDO TEXTO
  • NÃO É SISTEMA, É SOLUÇÃO!!!!
  • // total number of 15 features
  • // Delicious is not a goodexample of inboundanchor
  • -- VERMELHO – TERMOS RELEVANTES NA PÁGINA ALVO-- EX: QTAS VEZES UM TERMO APARECEU COMO RELACIONADO NAS VÁRIAS CONSULTAS
  • CLASSIFICADOR SVM (MAS A SOLUÇÃO É INDEPENDENTE DE MÉTODO)
  • PRECISÃO: DOS TERMOS CLASSIFICADOS COMO TAGS, QTAS DECISÕES FORAM CORRETASCOBERTURA: DE TODAS AS TAGS, QTAS FORAM CORRETAMENTE CLASSIFICADAS?
  • N DÁ PRA DESCREVER TODAS AS FEATURES, ALGUMAS SÃO ÓBVIAS PELO NOMEPRECISÃO TITLE - RECALL IDF
  • !!!!!!EXPERIMENTO INBOUND N CONVERGIU!!!!!INBOUND INBOUNDINBOUND
  • RESULTADOS QUE MAIS “GANHAM” COM A REMOÇÃO DE UM ATRIBUTO, A DIFERENÇA É MÍNIMAHÁ REDUDÂNCIA NA INFORMAÇÃO QUE OS ATRIBUTOS CARREGAM
  • TODAS AS FEATURES SÃO IMPORTANTES, INFLUI DIRETAMENTE NA PERDA DE F-1
  • VOLTAR AO SLIDE 30!!! FREQUENCY OF OCCURRENCE DOMINA AS OUTRAS FEATURES
  • NÃO FOI FEITO EXPERIMENTO PARA WORDNET E INBOUND (REDUDANTE COM O ANTERIOR)
  • RECALL CONDIZENTE COM A ANÁLISE FONTES X TAGS
  • ==CLASSIFICADOR INBOUND “ATRAPALHA” A DECISÃO DOS OUTROS
  • DATASET USADO EM 2008B
  • COVERAGE – Similar A COBERTURANOVELTY - tags marked as goodbutnotassigned
  • Precision1 – QUASE TODAS AS TAGS FORAM CONSIDERADAS BOAS POR PELO MENOS 1 USUARIOPrecision3 - User-agreement is difficultCoverage - Usersand ANTaReS use differentvocabularies. Lots of synonyms (pageand site) andbindedwords (user: “webpage”, antares: “web”, “page”)Novelty:2/10 tags werenotthought of byuser, notobvious
  • ×