III Workshop on Computational Intelligence      Avaliação de Partições vs        Avaliação de Clusters     Gustavo Henriqu...
Motivação• Definição de cluster;• Abordagens tradicionais: cada algoritmo  segue um critério diferente;• Abordagens multi-...
MotivaçãoPreparação dos                                      Agrupamento                                  Validação    Dad...
Critérios de Agrupamento• Compactação:   – Pequena variação intra-cluster;   – Clusters esféricos e/ou bem separados;• Enc...
Abordagens  Estrutura Real                                                 K-Means    Single Link                         ...
Índices Relativos     Índice                          Critério                              Característica  Desvio Total  ...
Experimento Realizado1. Preparação dos dados artificiais FCPS;2. Execução para vários conjuntos de dados, utilizando   a d...
Experimento Realizado                                              -Normalizar: Silhueta, Desvio Total1. Preparação dos da...
Conjunto de Dados       Fundamental Clustering Problems Suite (FCPS)Wing Nut                                              ...
Resultados: Wing Nut1,00,90,80,70,6                                                                                       ...
Resultados: Atom                                            1,001,00,90,80,7                                  0,620,6     ...
Resultados: LSun1,00,90,80,70,6                                                                                           ...
Resultados: Target                                                         1,00          1,00          1,00          1,001...
Considerações Finais• Análise de clusters individualmente é uma abordagem  promissora;• Conjunto de índices complementares...
Considerações Finais• As estruturas destes conjuntos de dados  favorecem os critérios baseados em  encadeamento;• O índice...
Dúvidas?Gustavo Henrique Rodrigues Pinto Tomas Email: gustavoh_rodrigues@hotmail.com                       Katti Faceli   ...
Próximos SlideShares
Carregando em…5
×

Avaliacao de particao vs avaliacao de clusters wci 2010

591 visualizações

Publicada em

Slides utilizados durante a apresentação do artigo intitulado "Avaliação de Partições Vs Avaliação de Clusters" no III Workshop on Computational Intelligence - Joint Conference 2010

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
591
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
4
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Avaliacao de particao vs avaliacao de clusters wci 2010

  1. 1. III Workshop on Computational Intelligence Avaliação de Partições vs Avaliação de Clusters Gustavo Henrique Rodrigues Pinto Tomas Dra. Katti Faceli Projeto financiado por: Programa Institucional de Bolsas de Iniciação Cientifica – PIBICConselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq Universidade Federal de São Carlos – Campus Sorocaba
  2. 2. Motivação• Definição de cluster;• Abordagens tradicionais: cada algoritmo segue um critério diferente;• Abordagens multi-objetivos: Ex.: MOCLE.• Nova Abordagem: Análise de Clusters Individualmente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  3. 3. MotivaçãoPreparação dos Agrupamento Validação Dados Critérios de Agrupamento Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  4. 4. Critérios de Agrupamento• Compactação: – Pequena variação intra-cluster; – Clusters esféricos e/ou bem separados;• Encadeamento: – Objetos vizinhos tem que compartilhar o mesmo cluster; – Adequado para clusters com forma arbitrária; – Ruim quando há pouca separação entre os clusters;• Separação: – Somente a separação espacial fornece pouca informação; – Aplicada em associação com outros critérios. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  5. 5. Abordagens Estrutura Real K-Means Single Link AverageAnálise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  6. 6. Índices Relativos Índice Critério Característica Desvio Total Compactação Avalia a qualidade de um (Adaptado) agrupamento em termos da compactação dos clusters Conectividade Encadeamento Reflete o grau com que os objetos (Adaptado) vizinhos são colocados no mesmo cluster Silhueta Compactação e Baseia-se na proximidade entre os Separação objetos de um cluster e na distância dos objetos de um cluster ao cluster mais próximoConsistência-KNN Encadeamento Os objetos de cada classe são (Adaptado) distribuídos de forma consistente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  7. 7. Experimento Realizado1. Preparação dos dados artificiais FCPS;2. Execução para vários conjuntos de dados, utilizando a distância Euclideana como função de proximidade;3. Tratamento dos resultados;4. Plotagem de gráficos;5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  8. 8. Experimento Realizado -Normalizar: Silhueta, Desvio Total1. Preparação dos dados artificiais Conectividade e FCPS; - Alterar melhor valor: Silhueta e2. Execução para vários conjuntos de dados, utilizando Consistência-KNN a distância Euclideana como função de proximidade;3. Tratamento dos resultados;4. Plotagem de gráficos;5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  9. 9. Conjunto de Dados Fundamental Clustering Problems Suite (FCPS)Wing Nut Atom LSun TargetAnálise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  10. 10. Resultados: Wing Nut1,00,90,80,70,6 sil0,5 dev 0,39 0,39 0,390,4 con 0,28 0,28 0,280,3 cknn0,2 0,12 0,13 0,11 0,13 0,140,1 0,010,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  11. 11. Resultados: Atom 1,001,00,90,80,7 0,620,6 0,55 sil0,5 dev0,4 0,34 con0,3 cknn0,2 0,10 0,080,1 0,04 0,01 0,07 0,00 0,00 0,000,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  12. 12. Resultados: LSun1,00,90,80,70,6 sil0,5 dev0,4 con 0,29 0,29 0,32 0,290,3 0,26 0,24 0,26 cknn 0,160,2 0,13 0,13 0,130,1 0,01 0,00 0,00 0,00 0,010,0 Real C1 C2 C3 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  13. 13. Resultados: Target 1,00 1,00 1,00 1,001,00,90,8 0,67 0,700,7 0,65 0,65 0,650,6 0,61 sil0,5 0,44 dev 0,410,4 0,35 con0,3 cknn0,2 0,13 0,090,1 0,08 0,02 0,02 0,02 0,02 0,00 0,00 0,00 0,00 0,01 0,01 0,01 0,010,0 Real C1 C2 C3 C4 C5 C6 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  14. 14. Considerações Finais• Análise de clusters individualmente é uma abordagem promissora;• Conjunto de índices complementares para avaliar estruturas heterogêneas;• Qualidade baixa de um cluster influência negativamente o resultado da partição. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  15. 15. Considerações Finais• As estruturas destes conjuntos de dados favorecem os critérios baseados em encadeamento;• O índice consistência-KNN obteve em média bom desempenho;• Índices com mesmo critério podem se comportar de maneira diferente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  16. 16. Dúvidas?Gustavo Henrique Rodrigues Pinto Tomas Email: gustavoh_rodrigues@hotmail.com Katti Faceli Email: katti@ufscar.br Obrigado!Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba

×