Este documento propõe um modelo de aprendizado competitivo para classificação hierárquica multirrótulo. A classificação hierárquica multirrótulo é um problema desafiador que envolve rotular objetos com múltiplas classes organizadas em uma hierarquia. Abordagens competitivas aplicando aprendizado não supervisionado têm sido usadas, mas há poucos trabalhos combinando aprendizado supervisionado e não-supervisionado. Este projeto investiga como redes neurais artificiais competitivas podem ajudar nessa tarefa, dado que quanto mais profunda a
ATIVIDADE 1 - SISTEMAS DISTRIBUÍDOS E REDES - 52_2024.docx
Proposta de um modelo de aprendizado competitivo para classificacao hierarquica multirrotulo
1. Proposta de um Modelo de Aprendizado Competitivo para Classificação Hierárquica
Multirrótulo
Elaine Cecília Gatto1, Ricardo Cerri2
1 Faculdade Anhanguera de Bauru, elainececiliagatto@gmail.com
2 Universidade Federal de São Carlos, cerri@dc.ufscar.br
A Classificação Hierárquica Multirrótulo (CHM) é um problema desafiador da área de
Aprendizado de Máquina (AM), sendo considerada uma tarefa complexa dentro da
Classificação de Dados[1], possuindo aplicações em áreas como Bioinformática,
classificação de textos e imagens. Um problema de CHM pode ser formalizado como
possuindo um espaço de exemplos X; um conjunto de classes C; uma ordem parcial que
representa o relacionamento superclasse ≤h; sendo que ∀ c1, c2 ∈ C : c1 ≤h c2 ⇔c1
uma superclasse de c2; uma hierarquia de Classes (C,≤h), um conjunto de tuplas (xi, Ci)
sendo xi ∈ X, Ci ⊆ C | c ∈ Ci ⇒∀c’ ≤h c : c’ ∈ Ci; um critério de qualidade q que
recompensa modelos com alto desempenho preditivo e baixa complexidade, e por fim,
uma função f:X → 2C; sendo 2C o conjunto de potência de C, | c ∈ f(x) ⇒ ∀c’ ≤h c : c’ ∈
f(x) e f otimiza q[2]. As classes em um problema de CHM podem ser organizadas como
uma Árvore ou como um Grafo Acíclico Direcionado. Dada essa taxonomia, os algoritmos
de AM devem rotular objetos como pertencentes a múltiplos caminhos
simultaneamente[3]. Abordagens Competitivas, que aplicam aprendizado não
supervisionado, têm sido recentemente aplicadas para resolução de problemas
envolvendo CHM, porém, ainda há poucos trabalhos que relatam soluções aplicando
Abordagens Competitivas Híbridas, mesclando aprendizado supervisionado e não-
supervisionado. Portanto, este projeto de pesquisa tem como objetivo investigar como o
aprendizado competitivo, usando redes neurais artificiais, pode colaborar para tarefas de
CHM. Abordagens não supervisionadas podem ser interessantes dado que, quanto mais
profunda uma classe na hierarquia, menos exemplos positivos ela possui, dificultando o
aprendizado supervisionado.
Palavras-Chave: Aprendizado de Máquina, Aprendizado Competitivo, Aprendizado Semi-
Supervisionado, Aprendizado Supervisionado, Tarefas de Classificação, Classificação
2. Hierárquica, Classificação Hierárquica Multirrótulo, Classificação Global, Classificação
Local, Redes Neurais Artificiais.
Referências
[1] WEHRMANN, J.; CERRI, R.; BARROS, R.C.Hierarchical Multi-Label Classification
Networks. In Proceedings of the 35th International Conference on Machine Learning,
PMLR 80:5075-5084, 2018.
[2] VENS, C., STRUYF, J. SCHIETGAT, L.; DZEROSKI, S.;BLOCKEEL, H. Decision
Trees for Hierarchical Multi-Label Classification. Machine Learning, 73(2);185-24.
[3] BORGER, H. B. Classificador Hierárquico Multirrótulo usando uma rede neural
competitiva. Tese (Doutorado em Informática) – Programa de Pós-Graduação em
Informática, Pontificia Universidade Católica do Paraná. Curitiba, p.4, 2012.