Proposta de um modelo de aprendizado competitivo para classificacao hierarqui...
Além do Aprendizado Local e Global: Particionando o espaço de classes em problemas de classificação multirrótulo
1. Além do Aprendizado Local e Global:
Particionando o Espaço de Classes em
Problemas de Classificação Multirrótulo
Universidade Federal de São Carlos - UFSCar
Centro de Ciências Exatas e de Tecnologia - CCET
Departamento de Computação - DC
Programa de Pós-Graduação em Ciência da Computação - PPGCC
Grupo de Pesquisa: Bioinformatics and Machine Learning - BIOMAL
Defesa de Doutorado
ELAINE CECÍLIA GATTO
14/11/2023
5. CORRELAÇÕES ENTRE RÓTULOS
Figura 1: Exemplo ilustrativo de uma imagem com rótulos correlacionados
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 5
Aprendizado de
correlações:
- Ajudam a predizer rótulos
que provavelmente não
seriam preditos utilizando
métodos que não as
consideram
- Ajudam a aumentar o poder
preditivo do classificador.
6. ABORDAGENS MULTIRRÓTULO
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 6
Abordagem Global
◎ Novos algoritmos ;
◎ Adapta algoritmos existentes ;
◎ Lida diretamente com o
problema;
◎ Apenas um modelo é induzido;
◎ Informações e correlações
locais podem ser ignoradas.
Abordagem Local
◎ Divide o problema multirrótulo
em vários problemas binários;
◎ Induz um classificador binário
para cada um dos rótulos
individualmente;
◎ Uso de informações muito
específicas;
◎ Perda de informações;
◎ Impraticável explorar as
correlações entre rótulos;
7. TIPOS DE PARTIÇÕES
Figura 2: Partições Global, Local e Híbrida
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 7
8. GRUPOS INSTÂNCIAS X GRUPOS RÓTULOS
◎ Como particionamentos de dados
considerando diretamente os
rótulos correlacionados podem
impactar no resultado preditivo de
um classificador?
◎ Agrupamento de instâncias
similares é diferente de
agrupamento de rótulos similares;
◎ Contradição nos classificadores;
◎ Tarefa não trivial de combinação
de predições;
◎ Correlações diretas entre rótulos.
◎ Rótulos exclusivos;
Figura 3: Ilustração de um particionamento de
instâncias e seus respectivos rótulos
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 8
9. CLASSIFICADOR
Figura 6: Ilustração de uma partição híbrida como um conjunto de dados estruturado.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 9
● Verificar a melhoria no desempenho do
classificador a partir das partições híbridas;
● Comparar partições com o mesmo viés, usando o
mesmo classificador;
● Comparar com partições local, global e aleatórias
10. PARTIÇÃO ADEQUADA
◎ Problemas multirrótulo:
○ Grande número de
possíveis partições;
○ Encontrar a partição
híbrida mais adequada é
um desafio.
◎ Número de Bell: definido como
o número de partições possíveis
de um conjunto com n
elementos consistindo de k
conjuntos separados e não
vazios
Tabela 1: Exemplos de Número de Bell
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 10
11. “
É possível encontrar uma partição composta
por grupos disjuntos de rótulos
correlacionados que melhore o desempenho
preditivo do classificador em relação às
tradicionais abordagens global e local.
HIPÓTESE
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 11
13. PARTIÇÕES HÍBRIDAS PARA CLASSIFICAÇÃO
MULTIRRÓTULO -HPML
Figura 26: Visão Geral do método HPML
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 13
14. PARTIÇÕES HÍBRIDAS PARA CLASSIFICAÇÃO
MULTIRRÓTULO -HPML
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 14
HPML.A HPML.B HPML.C HPML.D
Passo-
2
Medidas de Similaridade
Redes Neurais: Mapas Auto
Organizáveis de Kohonen
Medidas de Similaridade +
Grafos de Co-Ocorrência de
Rótulos
Medidas de Similaridade
Passo-
3
Algoritmo de Agrupamento
Hierárquico Aglomerativo
Redes Neurais: Mapas Auto
Organizáveis de Kohonen
Métodos de Detecção de
Comunidades
Algoritmo de Agrupamento
Hierárquico Aglomerativo
Passo-
5 e 6
Classificador ou Coeficiente
da Silhueta
Classificador ou Coeficiente
da Silhueta
Classificador ou Coeficiente
da Silhueta
Classificador ou Coeficiente
da Silhueta
Passo-
7
Classificador com versão
local e global
Classificador com versão
local e global
Classificador com versão
local e global
- Sem Encadeamento
- Encadeamento dos rótulos
- Encadeamento dos Grupos
- Encadeamento de rótulos e
grupos
- Classificador com versão
local e global
15. HPML.A
1
Tabela 17: Matriz de Similaridade
Tabela 16: Espaço de Rótulos Ilustrativo
2
Figiura 27: Tabela de
Contingência
Tabela 18: Matriz de Dissimilaridade
3
Similaridades
Dissimilaridades
MODELAGEM DAS CORRELAÇÕES
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 15
16. HPML.A
Tabela 18: Matriz de Dissimilaridade
3
PARTICIONAMENTO
Figura 31: Passo 3 ilustrado
Figura 29: Dendrograma para a Tabela 18
com Complete LInkage
4
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 16
17. HPML.A
5
Figura 31: Passo 3 ilustrado
6
Tabela 19: Partições Geradas
Figura 30: Representação das
Partições da Tabela 19
PARTIÇÕES GERADAS
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 17
18. HPML.B
Figura 38: HPML.B: Passos 1 e 2 ilustrados. Triângulos representam as
instâncias e os círculos neurônios compostos por instâncias similares.
MODELAGEM DAS CORRELAÇÕES
Figura 39: Gráfico de Contagem
1
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 18
19. HPML.B
1
2
3
Figura 39: Gráfico de
Mapeamento com Cortes
Mapa de Kohonen:
agrupamento de instâncias
PARTICIONAMENTO
Figura 40: Estratégia de transformação.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 19
20. HPML.C
Tabela 17: Matriz de Similaridade
1 2
Tabela 20: Matriz de
Similaridade Convertida
MODELAGEM DAS CORELAÇÕES
Figura 42: Grafo com self-loop (esquerda)
e grafo sem self-loop (direita)
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 20
3
22. PASSO 4: Montagem dos Datasets
Figura 32: Datasets
para cada grupo
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 22
23. PASSO 5: Validação com Classificador
PASSO 6: Escolha da Melhor Partição Híbrida
Figura 33: Validação com Classificador
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 23
24. PASSO 5: Validação com Silhueta
PASSO 6: Escolha da Melhor Partição Híbrida
Figura 34: Validação com Silhueta
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 24
25. PASSO 7: Teste da Partição Escolhida
Figura 36: Teste da partição híbrida selecionada
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 25
26. HPML.D.padrão
Figura 46 – Abstração da metodologia do HPML.D.Padrão.
Igual ao HPML.A: não possui encadeamento em nenhum nível. Florestas Aleatórias para problemas Multilabel
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 26
27. HPML.D.CI
Figura 47 – Abstração da metodologia do HPML.D.CI
Internal chains – encadeamento interno.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 27
28. HPML.D.CE - treino CE = External Chains, ou encadeamento externo
Figura 48 – Fase de Treinamento do HPML.D.CE
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 28
29. HPML.D.CE - teste
Figura 49 – Fase de Teste do HPML.D.CE
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 29
30. HPML.D.CEI - treino CEI = External and Internal Chains, ou
encadeamento externo e interno
Figura 50 – Fase de Treino do HPML.D.CEI
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 30
33. Configurações
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 33
HPML.A.c - IJCNN 2021 Exaustivo/Oráculo - KAIS Comunidades - BRACIS 2023 Encadeamento - Bélgica
HPML. A A e B C D
Passo-2 Índice Jaccard Kohonen
Índice Jaccard
Índice Jaccard
Rogers Tanimoto
Grafos de Co-Ocorrência
Índice Jaccard
Rogers Tanimoto
Passo-3 Algoritmo de Agrupamento
Hierárquico Aglomerativo:
- Métricas de Ligação: Single,
Average, Complete;
- Cortes no dendrograma
Kohonen:
- Cortes no mapa
- Transformação de partições
Algoritmo de Agrupamento
Hierárquico Aglomerativo:
- Métricas de Ligação: Single,
Average, Complete;
- Cortes no dendrograma
Métodos de Detecção de
Comunidades
- Hierárquicos
- Não Hierárquicos: cortes no
dendrograma
- Modularidade
Algoritmo de Agrupamento
Hierárquico Aglomerativo:
- Métricas de Ligação: Ward.D2;
- Cortes no dendrograma
Passo-5
e 6
Maior Macro-F1 Maior Macro-F1, Micro-F1 e
Coeficiente da Silhueta.
Maior Coeficiente da Silhueta Maior Coeficiente da Silhueta
Passo 7 Clus Clus Clus ECC + Random Forests
Datasets Entre 4 e 22 rótulos Entre 4 e 7 rótulos Entre 5 e 178 rótulos Entre 101 e 174 rótulos
34. Motivações
- Experimento Inicial
- Investiga a hipótese
elaborada
- Investiga o quanto
uma partição híbrida
é próxima da melhor
partição possível para
um dataset;
- Exaustivo: valida
todas as partições
possíveis e testa a
melhor;
- Oráculo: testa todas
as partições possíveis
- Não há consenso na
literatura sobre qual
abordagem
multirrótulo é melhor
- Investiga a aplicação
de métodos de
detecção de
comunidade na
classificação
multirrótulo;
- Investiga
dificuldades no
aprendizado de
rótulos e das
correlações entre
rótulos
- ECC: estado da arte,
considera correlações;
- Desafio: alta
dimensionalidade do
espaço de rótulos =
longa cadeia de
rótulos;
- Solução: Usar
cadeias de tamanho
limitado;
- Investiga se é
possível melhorar as
cadeias de
classificadores ao
encadear grupos
disjuntos de rótulos
correlacionados.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 34
1) HPML.A.c 2) Exaustivo e Oráculo 3) Comunidades 4) Encadeamento
Em revisão - KAIS
Best Paper
Runner-Up
BRACIS 2023
IJCNN 2021 Em andamento
35. Medidas de Avaliação de Desempenho
HPML.D
ROC-AUC
ROC-AUC-Macro
ROC-AUC-Micro
AUPRC-Micro
AUPRC-Macro
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 35
Wrong Label Problem: mede quando o rótulo pode ser predito para
algumas instâncias, mas essas predições estão sempre erradas
Constant Label Problem: mede quando o mesmo
rótulo é predito para todas as instâncias.
Missing Label Problem: mede a proporção
de rótulos que nunca são preditos.
38. Métodos Comparados
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 38
Estas foram as partições comparadas: global, local, HPML.A.C onde
C indica CLUS, e dois tipos de partições aleatórias baseadas no
padrão do algoritmo de agrupamento hierárquico aglomerativo.
Tabela - Métodos Comparados
39. 14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 39
Resultados
Vitórias, Derrotas e Empates. (1 X todos)
41. Resultados
◎ Métrica de ligação mais escolhida:
◎ Single
◎ Partições híbridas mais escolhidas:
◎ Próximas de uma partição local;
◎ Resultados competitivos;
◎ Média do nível do desbalanceamento
○ baixo desempenho;
◎ Nível de dependência incondicional (ULD):
○ pouco impacto no processo;
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 41
42. Resultados
◎ Conjuntos de dados com poucos
rótulos têm mais possibilidade
de agrupar rótulos
correlacionados;
◎ Aleatoriedade:
○ Não ajudou o suficiente a
melhorar as predições;
○ Não alterou muito a
distribuição dos rótulos;
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 42
◎ Partições locais:
○ melhores resultados;
◎ Partições globais:
○ piores resultados;
◎ Partições aleatórias e híbridas:
○ Superam as globais;
○ São competitivas entre si e
com as locais.
49. ◎ Melhor partição de acordo com a partição oráculo:
○ HPML.A, HPML.B, e alguns aleatórios na maior parte dos folds;
◎ Partições mais escolhidas:
○ 40% de todas elas são compostas por 2 grupos de rótulos;
◎ Os métodos híbridos aqui propostos são capazes de escolher uma
partição híbrida com uma configuração igual ou próxima da melhor
partição de um dataset, conforme oráculo;
Resultados
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 49
50. ◎ Partições híbridas:
○ Altamente competitivas com as partições aleatórias;
○ Melhores ou superiores em vários casos;
○ Grupos disjuntos de rótulos correlacionados podem levar a melhores
resultados;
○ Importante para conjuntos de dados com um número muito grande de
rótulos.
◎ Partições aleatórias:
○ Resultados competitivos e superiores em vários casos com relação às
partições locais e globais;
○ Métodos tradicionais ainda falham em lidar corretamente com as
correlações entre rótulos.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 50
Resultados
57. • Métodos de detecção de comunidade mais escolhidos:
○ Walktrap, InfoMap e Edge Betweenness;
• Partições híbridas mais escolhidas:
○ Composta por 2 grupos;
• Resultados de desempenho das partições híbridas;
○ Competitivos em comparação com outras partições;
○ Superam as globais;
○ Não são superiores às locais para alguns conjuntos de dados.;
• HPML.C não é significativamente afetado pela esparsificação com o 𝑘-NN;
• Esparsificação com 𝑘-NN obteve desempenho ligeiramente melhor quando
comparado com a esparsificação feita com threshold;
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 57
Resultados
58. ◎ No geral de todos os métodos e datasets:
○ Índice Jaccard + Métodos Hierárquicos: melhores em mais datasets do que
aqueles com Rogers-Tanimoto;
○ Rogers-Tanimoto + Métodos Não Hierárquicos: melhores em mais datasets
que o Índice Jaccard;
○ Não há grande melhoria na performance independente do particionamento
utilizado.
◎ Considerar ou não quando dois rótulos nunca ocorrem juntos:
○ Não afeta demasiadamente o resultado final;
○ Tanto as partições híbridas geradas com Jaccard, quanto com Rogers foram
capazes de melhorar o desempenho preditivo para alguns datasets;
◎ O classificador induzido não conseguiu usufruir do aprendizado das correlações;
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 58
Resultados
60. Métodos Comparados
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 60
Foram comparados os métodos global, local, o ECC, e as quatro versões do HPML.D.
Na tabela RF significa Random Forests.
61. 14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 61
Resultados
Vitórias, Derrotas e Empates. (1 X todos)
66. ◎ Partições híbridas mais escolhidas:
○ próximas de uma partição local;
○ vários grupos com um único rótulo e apenas 1 grupo com 2 rótulos.
◎ Partições globais obtiveram os melhores resultados:
○ Nas Florestas Aleatórias um conjunto maior de árvores de decisão
multirrótulo é utilizada para decidir os rótulos preditos;
○ Características dos próprios datasets;
○ Um número maior de correlações pode existir nos datasets com mais de
100 rótulos.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 66
Resultados
67. ◎ HPML.D: para alguns casos é pode-se afirmar que aprender as partições híbridas
sem nenhum encadeamento é melhor que aprender todos os rótulos juntos em um
conjunto de classificadores em cadeia.
◎ HPML.D.CI: encadear os rótulos dentro dos grupos disjuntos de rótulos
correlacionados leva a resultados melhores que induzir o ECC de forma tradicional
em alguns casos;
◎ HPML.D.CE: há casos em que quebrar a longa cadeia de classificadores, por meio
das partições híbridas, em uma ordem de encadeamento baseada correlações, é
melhor que o tradicional ECC.
◎ HPML.D.CEI: aprender vários níveis de correlação leva o classificador a obter
melhores resultados em pouquíssimos casos.
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 67
Resultados
69. ◎ Foi possível testar a hipótese, verificar que ela é positiva e que há
necessidade de mais investigação;
◎ Partições híbridas obtiveram resultados competitivos, ou melhores,
em diversos datasets e métodos, com relação às outras partições;
◎ As abordagens global e local não se mostraram melhores do que as
aleatórias ou híbridas
◎ O experimento exaustivo e oráculo mostrou que é possível
encontrar uma ou mais partições entre a global e local que
melhoram o desempenho preditivo.
Conclusão
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 69
70. ◎ Métodos encadeados:
○ Competitivos;
○ Desempenho melhor que o ECC, Global e Local em alguns casos.
◎ CLP, MLP e WLP:
○ Muitos rótulos não foram aprendidos, nem preditos corretamente
pelos classificadores;
○ Indica a necessidade de melhorias no classificador.
Conclusão
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 70
71. ◎ Poucos rótulos:
○ Partições locais tendem a obter os melhores resultados;
○ Partições globais o pior quando.
◎ Muitos rótulos:
○ Partições locais tendem a obter os piores resultados;
○ Partições globais tendem a ter os melhores resultados.
◎ Possibilidade:
○ Poucos rótulos = poucas correlações;
○ Muitos rótulos = muitas correlações.
Conclusão
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 71
72. ◎ Como trabalhos futuros pode-se:
◎ Elaborar uma medida de correlação específica;
◎ Elaborar uma medida para quantificar o aprendizado baseado em
correlações;
◎ Utilizar ainda mais datasets com mais de 100 rótulos;
◎ Estudar e aplicar novos métodos de particionamento;
◎ Estudar e aplicar outros critério de seleção de melhor partição híbrida;
◎ Induzir outros classificadores que consigam lidar com diferentes
configurações de partições;
◎ Estudar e testar formas para validar e testar todas as partições possíveis
para datasets com mais de 7 rótulos.
TRABALHOS FUTUROS
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 72
75. PUBLICAÇÕES
◎ Gatto, E.C., Valejo, A.D.B., Ferrandin, M., Cerri, R. (2023).
Community Detection for Multi-label Classification. In: Naldi,
M.C., Bianchi, R.A.C. (eds) Intelligent Systems. BRACIS 2023.
Lecture Notes in Computer Science(), vol 14195. Springer,
Cham. https://doi.org/10.1007/978-3-031-45368-7_6
◎ E. C. Gatto, M. Ferrandin and R. Cerri, "Exploring Label
Correlations for Partitioning the Label Space in Multi-label
Classification," 2021 International Joint Conference on Neural
Networks (IJCNN), Shenzhen, China, 2021, pp. 1-8, doi:
10.1109/IJCNN52387.2021.9533331
◎
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 75
76. PRÉ-PRINTS
◎ Recusado: Gatto, Elaine Cecilia and Ferrandin, Mauri and
Cerri, Ricardo, Clustering Labels in Multi-Label Learning: A
Study Using Randomness and Label Correlations. Available
at SSRN: https://ssrn.com/abstract=4163294 or
http://dx.doi.org/10.2139/ssrn.4163294
◎ Em Revisão: Elaine Cecília Gatto, Mauri Ferrandin, Ricardo
Cerri et al. Multi-Label Classification with Label Clusters, 07
July 2023, PREPRINT (Version 1) available at Research Square
[https://doi.org/10.21203/rs.3.rs-3133411/v1]
14/11/2023 ELAINE CECÍLIA GATTO - DEFESA DE DOUTORADO 76