Proposta de um Modelo de Aprendizado Competitivo para Classificação Hierárquica
Multirrótulo
Elaine Cecília Gatto1, Ricardo Cerri2
1 Faculdade Anhanguera de Bauru, elainececiliagatto@gmail.com
2 Universidade Federal de São Carlos, cerri@dc.ufscar.br
A Classificação Hierárquica Multirrótulo (CHM) é um problema desafiador da área de
Aprendizado de Máquina (AM), sendo considerada uma tarefa complexa dentro da
Classificação de Dados[1], possuindo aplicações em áreas como Bioinformática,
classificação de textos e imagens. Um problema de CHM pode ser formalizado como
possuindo um espaço de exemplos X; um conjunto de classes C; uma ordem parcial que
representa o relacionamento superclasse ≤h; sendo que ∀ c1, c2 ∈ C : c1 ≤h c2 ⇔c1
uma superclasse de c2; uma hierarquia de Classes (C,≤h), um conjunto de tuplas (xi, Ci)
sendo xi ∈ X, Ci ⊆ C | c ∈ Ci ⇒∀c’ ≤h c : c’ ∈ Ci; um critério de qualidade q que
recompensa modelos com alto desempenho preditivo e baixa complexidade, e por fim,
uma função f:X → 2C; sendo 2C o conjunto de potência de C, | c ∈ f(x) ⇒ ∀c’ ≤h c : c’ ∈
f(x) e f otimiza q[2]. As classes em um problema de CHM podem ser organizadas como
uma Árvore ou como um Grafo Acíclico Direcionado. Dada essa taxonomia, os algoritmos
de AM devem rotular objetos como pertencentes a múltiplos caminhos
simultaneamente[3]. Abordagens Competitivas, que aplicam aprendizado não
supervisionado, têm sido recentemente aplicadas para resolução de problemas
envolvendo CHM, porém, ainda há poucos trabalhos que relatam soluções aplicando
Abordagens Competitivas Híbridas, mesclando aprendizado supervisionado e não-
supervisionado. Portanto, este projeto de pesquisa tem como objetivo investigar como o
aprendizado competitivo, usando redes neurais artificiais, pode colaborar para tarefas de
CHM. Abordagens não supervisionadas podem ser interessantes dado que, quanto mais
profunda uma classe na hierarquia, menos exemplos positivos ela possui, dificultando o
aprendizado supervisionado.
Palavras-Chave: Aprendizado de Máquina, Aprendizado Competitivo, Aprendizado Semi-
Supervisionado, Aprendizado Supervisionado, Tarefas de Classificação, Classificação
Hierárquica, Classificação Hierárquica Multirrótulo, Classificação Global, Classificação
Local, Redes Neurais Artificiais.
Referências
[1] WEHRMANN, J.; CERRI, R.; BARROS, R.C.Hierarchical Multi-Label Classification
Networks. In Proceedings of the 35th International Conference on Machine Learning,
PMLR 80:5075-5084, 2018.
[2] VENS, C., STRUYF, J. SCHIETGAT, L.; DZEROSKI, S.;BLOCKEEL, H. Decision
Trees for Hierarchical Multi-Label Classification. Machine Learning, 73(2);185-24.
[3] BORGER, H. B. Classificador Hierárquico Multirrótulo usando uma rede neural
competitiva. Tese (Doutorado em Informática) – Programa de Pós-Graduação em
Informática, Pontificia Universidade Católica do Paraná. Curitiba, p.4, 2012.

Proposta de um modelo de aprendizado competitivo para classificacao hierarquica multirrotulo

  • 1.
    Proposta de umModelo de Aprendizado Competitivo para Classificação Hierárquica Multirrótulo Elaine Cecília Gatto1, Ricardo Cerri2 1 Faculdade Anhanguera de Bauru, elainececiliagatto@gmail.com 2 Universidade Federal de São Carlos, cerri@dc.ufscar.br A Classificação Hierárquica Multirrótulo (CHM) é um problema desafiador da área de Aprendizado de Máquina (AM), sendo considerada uma tarefa complexa dentro da Classificação de Dados[1], possuindo aplicações em áreas como Bioinformática, classificação de textos e imagens. Um problema de CHM pode ser formalizado como possuindo um espaço de exemplos X; um conjunto de classes C; uma ordem parcial que representa o relacionamento superclasse ≤h; sendo que ∀ c1, c2 ∈ C : c1 ≤h c2 ⇔c1 uma superclasse de c2; uma hierarquia de Classes (C,≤h), um conjunto de tuplas (xi, Ci) sendo xi ∈ X, Ci ⊆ C | c ∈ Ci ⇒∀c’ ≤h c : c’ ∈ Ci; um critério de qualidade q que recompensa modelos com alto desempenho preditivo e baixa complexidade, e por fim, uma função f:X → 2C; sendo 2C o conjunto de potência de C, | c ∈ f(x) ⇒ ∀c’ ≤h c : c’ ∈ f(x) e f otimiza q[2]. As classes em um problema de CHM podem ser organizadas como uma Árvore ou como um Grafo Acíclico Direcionado. Dada essa taxonomia, os algoritmos de AM devem rotular objetos como pertencentes a múltiplos caminhos simultaneamente[3]. Abordagens Competitivas, que aplicam aprendizado não supervisionado, têm sido recentemente aplicadas para resolução de problemas envolvendo CHM, porém, ainda há poucos trabalhos que relatam soluções aplicando Abordagens Competitivas Híbridas, mesclando aprendizado supervisionado e não- supervisionado. Portanto, este projeto de pesquisa tem como objetivo investigar como o aprendizado competitivo, usando redes neurais artificiais, pode colaborar para tarefas de CHM. Abordagens não supervisionadas podem ser interessantes dado que, quanto mais profunda uma classe na hierarquia, menos exemplos positivos ela possui, dificultando o aprendizado supervisionado. Palavras-Chave: Aprendizado de Máquina, Aprendizado Competitivo, Aprendizado Semi- Supervisionado, Aprendizado Supervisionado, Tarefas de Classificação, Classificação
  • 2.
    Hierárquica, Classificação HierárquicaMultirrótulo, Classificação Global, Classificação Local, Redes Neurais Artificiais. Referências [1] WEHRMANN, J.; CERRI, R.; BARROS, R.C.Hierarchical Multi-Label Classification Networks. In Proceedings of the 35th International Conference on Machine Learning, PMLR 80:5075-5084, 2018. [2] VENS, C., STRUYF, J. SCHIETGAT, L.; DZEROSKI, S.;BLOCKEEL, H. Decision Trees for Hierarchical Multi-Label Classification. Machine Learning, 73(2);185-24. [3] BORGER, H. B. Classificador Hierárquico Multirrótulo usando uma rede neural competitiva. Tese (Doutorado em Informática) – Programa de Pós-Graduação em Informática, Pontificia Universidade Católica do Paraná. Curitiba, p.4, 2012.