4. Método em 4 Passos
1 2 3 4
Modelar
Correlações
entre os
Rótulos
5. Método em 4 Passos
1 2 3 4
agrupar as
correlações
e gerar
partições
híbridas
Modelar
Correlações
entre os
Rótulos
6. Método em 4 Passos
1 2 3 4
agrupar as
correlações
e gerar
partições
híbridas
Modelar
Correlações
entre os
Rótulos
Validar as
partições
híbridas e
escolher a
melhor
7. Método em 4 Passos
1 2 3 4
agrupar as
correlações
e gerar
partições
híbridas
Modelar
Correlações
entre os
Rótulos
Validar as
partições
híbridas e
escolher a
melhor
Teste
8. Método em 4 Passos
1 2 3 4
agrupar as
correlações
e gerar
partições
híbridas
Modelar
Correlações
entre os
Rótulos
Validar as
partições
híbridas e
escolher a
melhor
Teste
Oi pessoal. Meu nome é Elaine, sou estudante de Doutorado no Programa de Pós Graduação em Ciência da Computação da UFSCar campus São Carlos, meu orientador é o Prof. Dr. Ricardo Cerri e o Prof. Dr. Mauri Ferrandin, da UFSC é meu co-orientador. Neste vídeo falar um pouquinho pra vocês sobre o nosso projeto de pesquisa intitulado Explorando correlações entre rótulos para particionar o espaço de rótulos na classificação multirrótulo. Portanto, minha pesquisa é na área de aprendizado de máquina e classificação multirrótulo é uma tarefa do aprendizado de máquina capaz de associar instâncias a um ou mais rótulos simultaneamente.
Trabalhos recentes na área de Classificação mulitrrótulo apresentam diferentes estratégias para explorar correlações entre rótulos, de forma a melhorar o desempenho dos classificadores.
No entanto, poucos trabalhos investigaram estratégias para usar as correlações entre os rótulos para particionar o espaço de rótulos.
A maior parte dos trabalhos em classificação multirrótulo aplica uma abordagem de particionamento dos rótulos global ou local.
A Figura 1 ilustra os tipos de partições que estamos falando aqui onde os quadrados representams as partições propiamente ditas, os circulos representam os grupos de rótulos e os losangos representam os rótulos propriamente ditos.
Uma partição global é composta por um único grupo que contem todos os rótulos, portanto, nesta abordagem de particionamento todos os rótulos do problema são tratados ao mesmo tempo.
A Figura 1b ilustra uma partição local, onde cada rótulo está em um grupo diferente, portanto, cada rótulo é tratado indivualmente.
A Figura 1c ilustra as partições híbridas, que são o tipo de partição que estamos buscando neste projeto de pesquisa.
Essas partições híbridas são compostas por grupos de rótulos correlacionados e, como podem notar, os rótulos não se repetem nos grupos da partição.
Enquanto as partições globais requerem apenas um classificador, as partições locais requerem um classificador binário para cada rótulo.
No caso das partições híbridas uma combinação de classificadores é necessária
Portanto, o nosso projeto de pesquisa tem como principal objetivo desenvolver uma estratégia capaz de particionar o espaço do rótulo, explorando as correlações entre rótulos, para encontrar partições híbridas, ou seja, partições entre locais e globais.
Para atingir este objetivo, estruturamos um método em quatro passos.
Primeiro passo: rótulos usando o espaço de rótulos do conjunto de treinamento, modelamos as correlações entre os rótulos de forma que uma matriz de correlações seja gerada.
Segundo passo: com a matriz de correlações pronta, aplicamos um algoritmo de agrupamento hierárquico aglomerativo nessa matriz que resulta em um dendrograma.
Quando cortamos este dendrograma em vários níveis, ele gera diferentes partições que constituem as características que desejamos para partições híbridas.
Terceiro Passo: com as partições híbridas geradas, a próxima etapa é validá-las e escolher a melhor para ser testada. Podemos escolher a melhor partição usando medidas de avaliação, portanto, usando classificadores para modelar e avaliar cada uma das partições híbridas, ou então podemos usar um coeficiente de validação de agrupamento, como o silhouete, por exemplo.
Quarto passo: testar a partição híbrida escolhida no conjunto de teste e, por fim, comparar os resultados obtidos das partições híbridas com as partições locais e globais.
Acreditamos que com as partições híbridas conseguiremos melhorar o desempenho preditivo dos classificadores multirrótulo.
É isso pessoal. Espero que tenham gostado e se interessado pelo nosso projeto. Caso queiram saber mais, basta entrar em contato comigo em uma das redes sociais listadas aqui. Muito obrigada.