O documento apresenta uma abordagem para classificação multirrótulo que explora correlações entre rótulos usando métodos de detecção de comunidade. A abordagem propõe gerar partições híbridas globais e locais dos rótulos usando esses métodos e avalia seu desempenho em comparação com partições convencionais. Os resultados indicam que as partições híbridas obtiveram desempenho melhor ou competitivo em diversos conjuntos de dados.
9. a = (Label1 == 1) E (Label2 == 1) b = (Label1 == 0) E (Label2 == 1)
c = (Label1 == 1) E (Label2 == 0) d = (Label1 == 0) E (Label2 == 0)
10. k-NN sparsification: k varia de 1 até L - 1;
Threshold: remove uma porcentagem das arestas;
Como consequência muitos grafos são gerados.
11. Métodos de Detecção de Comunidade
- Podem modelar as correlações entre rótulos pois encontram relações entre os
dados;
- São algoritmos de particionamento de grafos:
- Dividem os vértices em grupo de forma que as arestas entre eles são
minimizadas;
- Uma comunidade é um grupo de vértices com muitas arestas dentro da
comunidade e poucas arestas fora da comunidade;
12. Métodos de Detecção de Comunidade
- Walktrap: baseado em caminhadas aleatórias;
- Fast Greedy: baseado no ganho de modularidade;
- Edge Betweenness: baseado no número de caminhos mais curtos através da
aresta;
- Louvain: método multinível baseado em FastGreedy;
- Infomap: método multinível baseado na equação do mapa;
- SpinGlass: baseado em Potts Spin Glass;
- Label Propagation: cada vértice é atribuído ao rótulo mais frequente entre seus
vizinhos.
13. Modularidade: mede a separação entre vértices, quantificando a
densidade de links dentro de comunidades em comparação com
links entre comunidades;
14. Coeficiente da Silhueta: mede a qualidade das partições com base
na proximidade entre os rótulos de um determinado cluster e a
distância entre esses rótulos e o cluster mais próximo.
25. Em geral:
- Melhor Desempenho: Partições Locais;
- Pior Desempenho: Partições Globais;
- Partições Híbridas e Aleatórias:
- Melhores que as Partições Globais;
- Melhores que as Partições Locais em
alguns datasets;
- Competitivas entre si;
RESULTADOS
26. - Sparsification methods: k-NN obteve
desempenhos ligeiramente melhores quando
comparados ao threshold;
- Hierarchical methods: Jaccard index foi
melhor que Rogers-Tanimoto;
- Non-Hierarchical methods:
Rogers-Tanimoto em geral foi melhor que
Jaccard index.
RESULTADOS
27. - Friedman Test: indicou que há diferença
estatística entre os métodos comparados;
- Nemenyi Post Hoc Test: Não há diferenças
estatísticas entre
- partições aleatórias e locais;
- partições aleatórias e globais;
- partições híbridas e locais;
RESULTADOS
29. - As partições híbridas foram capazes de obter
resultados melhores, ou competitivos, em
vários conjuntos de dados em comparação
com as outras partições;
- As abordagens locais e globais convencionais
e amplamente utilizadas podem não estar
usando corretamente as correlações de
rótulos;
CONCLUSÕES
30. - Trabalhos Futuros:
- Testar a abordagem com outro
classificador;
- Verificar as outras medidas de avaliação
multirrótulo;
CONCLUSÕES
32. CREDITS: This presentation template was created by
Slidesgo, including icons by Flaticon, and
infographics & images by Freepik
OBRIGADA!
Perguntas?
elainececiliagatto@gmail.com
@cissagatto
Please keep this slide for attribution.