CLUSTERIZAÇÃO DE DADOS  USANDO ALGORÍTIMOS   IMUNOINSPIRADOS  Antonio Augusto Conti F. Leão           DCC/UFLA
IntroduçãoO sistema imunológico humano é altamentedistribuído, altamente adaptativo, naturalmenteauto-organizado, mantendo...
IntroduçãoCom isso, esse trabalho apresentará umalgoritmo (CAIS – Clustering with ArtificialImmune System) e tem a seguint...
Introdução● Metodologia da implementação do algoritmo,contendo um passo-a-passo de seufuncionamento.● Resultados e análise...
Clusterização de Dados           Referencial TeóricoO termo “clusterização” vem do inglês tocluster, que significa “agrupar...
Sistema Imunológico Natural          Referencial TeóricoI. Sistema Imunológico Inato: é capaz deresponder imediatamente a ...
Sistema Imunológico Natural  Referencial Teórico
Sistema Imune Natural            Referencial Teórico   Células apresentadoras de antígeno (APCs)especializadas, como macró...
Sistema Imune Natural            Referencial Teórico   Partes destes peptídeos se ligam a moléculas docomplexo de histocom...
Sistema Imune Natural            Referencial Teórico   As células T possuem receptores de superfície quetêm a função de re...
Sistema Imune Natural            Referencial Teórico    Uma vez ativados pelo reconhecimentoMHC/peptídeo, as células T se ...
Sistema Imune Natural             Referencial Teórico  Diferente dos receptores das células T, entretanto, osreceptores da...
Sistema Imune Natural            Referencial Teórico    Quando ativadas, as células B se dividem e sediferenciam em plasmó...
Sistema Imune Natural     Esquema Simplificado - (VII)   A ligação dos anticorpos aos antígenos encontradosfaz com que o p...
Sistemas Imunológicos Artificiais            Referencial Teórico●   Os sistemas imunológicos artificiais são    metodologi...
Sistemas Imunológicos Artificiais           Referencial Teórico    Algumas Aplicações●   Reconhecimento de Padrões●   Segu...
Sistemas Imunológicos Artificiais            Referencial Teórico    Algoritmos Fundamentais ao trabalho:●   CLONALG (CLONa...
Sistemas Imunológicos Artificiais (CLONALG)           Referencial Teórico   Algoritmo de Seleção Clonal (CLONALG) O algori...
Sistemas Imunológicos Artificiais (CLONALG)             Referencial Teórico  ●   Gere um conjunto (P) de candidatos a solu...
Sistemas Imunológicos Artificiais (CLONALG)             Referencial Teórico ●   Submeta a população de clones a um esquema...
Sistemas Imunológicos Artificiais (aiNet)          Referencial Teórico       Artificial Immune Network (aiNet)A rede imuno...
Sistemas Imunológicos Artificiais (aiNet)           Referencial TeóricoIlustração da aiNet: (a) Conjunto de antígenos aser...
Sistemas Imunológicos Artificiais (aiNet)            Referencial Teórico● Após execução do CLONALG, compare ascélulas de m...
Metodologia  AISF - Artificial Immune System FrameworkPara a implementação do algoritmo declusterização, foi utilizado o AI...
Metodologia
MetodologiaCAIS – Clustering with Artificial Immune System● Cria-se uma população inicial de células B● Enquanto a quantid...
Metodologia ●  Ative a célula;  ● Gere clones;  ● Faça mutação nos clones;● Verifique os clones, apresentando-os para os  a...
Metodologia ●  Atualize o tempo de vida de todas as células;  ● Adicione novas células à população;● Selecione todos os re...
Metodologia ●  Salve a célula B em uma estrutura de    dados;  ● Salve a taxa de afinidade em uma estrutura    de dado;● Ju...
Metodologia
Resultados e Análises       KDD99
Resultados e Análises   Packet DatasetsA melhor média de acertos obtida peloautor desse banco de dados testes foi de96.06%
Resultados e AnálisesO algoritmo CAIS não está totalmentefinalizado. A versão atual é funcional e jámostra-se promissora, p...
ConclusãoA maior contribuição desse trabalho foi de deapresentar um novo algoritmo com uma visãodiferente da existente na ...
Próximos SlideShares
Carregando em…5
×

Clusterizacao de Dados Usando Algoritmos Imunoinspirados

967 visualizações

Publicada em

Publicada em: Turismo, Tecnologia
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
967
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4
Ações
Compartilhamentos
0
Downloads
16
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Clusterizacao de Dados Usando Algoritmos Imunoinspirados

  1. 1. CLUSTERIZAÇÃO DE DADOS USANDO ALGORÍTIMOS IMUNOINSPIRADOS Antonio Augusto Conti F. Leão DCC/UFLA
  2. 2. IntroduçãoO sistema imunológico humano é altamentedistribuído, altamente adaptativo, naturalmenteauto-organizado, mantendo a memória deencontros passados e tem a habilidade decontinuamente aprender sobre novos encontros.Sob esse ponto de vista, há muito o que oferecercomo meio de inspiração para resolução demodelos e problemas computacionais.
  3. 3. IntroduçãoCom isso, esse trabalho apresentará umalgoritmo (CAIS – Clustering with ArtificialImmune System) e tem a seguinte estrutura:●Referencial Teórico, apresentando conceitosbásicos sobre sistemas imológicos naturais eartificiais, com alguns algoritmos fundamentais,como também conceitos de mineração dedados.
  4. 4. Introdução● Metodologia da implementação do algoritmo,contendo um passo-a-passo de seufuncionamento.● Resultados e análise dos testes feitos com oalgoritmo criado.● Conclusão e sugestão de melhorias.
  5. 5. Clusterização de Dados Referencial TeóricoO termo “clusterização” vem do inglês tocluster, que significa “agrupar”, “aglomerar”.Assim, no presente contexto, se faz o ato deagrupar dados.
  6. 6. Sistema Imunológico Natural Referencial TeóricoI. Sistema Imunológico Inato: é capaz deresponder imediatamente a uma grandequantidade de patógenos sem a necessidade deuma prévia exposição dos mesmos.II. Sistema Imunológico Adaptativo: o sistemaimune adaptativo cria e produz anticorposespecíficos contra cada patógeno, e por issogasta-se um tempo maior para a sua produção.
  7. 7. Sistema Imunológico Natural Referencial Teórico
  8. 8. Sistema Imune Natural Referencial Teórico Células apresentadoras de antígeno (APCs)especializadas, como macrófagos, circulam pelo corpoingerindo e digerindo os patógenos encontrados,fragmentando-os em peptídeosantigênicos
  9. 9. Sistema Imune Natural Referencial Teórico Partes destes peptídeos se ligam a moléculas docomplexo de histocompatibilidade principal (MHC) esão apresentados na superfície celular.
  10. 10. Sistema Imune Natural Referencial Teórico As células T possuem receptores de superfície quetêm a função de reconhecer diferentes complexosMHC/peptídeo.
  11. 11. Sistema Imune Natural Referencial Teórico Uma vez ativados pelo reconhecimentoMHC/peptídeo, as células T se dividem e secretamlinfocinas (sinais químicos) que mobilizam outroscomponentes do sistemaimunológico.
  12. 12. Sistema Imune Natural Referencial Teórico Diferente dos receptores das células T, entretanto, osreceptores das células B são capazes de reconhecerpartes livres solúveis dos antígenos, semas moléculas do MHC
  13. 13. Sistema Imune Natural Referencial Teórico Quando ativadas, as células B se dividem e sediferenciam em plasmócitos, secretando anticorposem altas taxas
  14. 14. Sistema Imune Natural Esquema Simplificado - (VII) A ligação dos anticorpos aos antígenos encontradosfaz com que o patógeno seja neutralizado.
  15. 15. Sistemas Imunológicos Artificiais Referencial Teórico● Os sistemas imunológicos artificiais são metodologias de manipulação de dados, classificação, representação e raciocínio que seguem um paradigma biológico plausível: o sistema imunológico humano (WWW Starlab).● Um sistema imunológico artificial é um sistema computacional baseado em metáforas do sistema imunológico natural (Timmis, 2000a).● Os sistemas imunológicos artificiais são compostos por metodologias inteligentes, inspiradas no sistema imunológico biológico, para a solução de problemas de mundo real (Dasgupta, 1998).
  16. 16. Sistemas Imunológicos Artificiais Referencial Teórico Algumas Aplicações● Reconhecimento de Padrões● Segurança Computacional● Robótica● Otimização● Detecção de Falhas e Anomalias● Aprendizagem de Máquinas
  17. 17. Sistemas Imunológicos Artificiais Referencial Teórico Algoritmos Fundamentais ao trabalho:● CLONALG (CLONal selection ALGorithm)● AiNet (Artificial Immune NETwork)
  18. 18. Sistemas Imunológicos Artificiais (CLONALG) Referencial Teórico Algoritmo de Seleção Clonal (CLONALG) O algoritmo parte do princípio de que quando um linfócito reconhece um antígeno com um algum grau de afinidade (dada por uma medida de distância, como Euclidiana, por exemplo), ele tende a proliferar e gerar clones.
  19. 19. Sistemas Imunológicos Artificiais (CLONALG) Referencial Teórico ● Gere um conjunto (P) de candidatos a solução, composto pelo subconjunto de células de memória (M) mais o restante (P{r}) da população (P = P{r} ∪ M); ● Determine (processo de seleção) os n melhores indivíduos (P{n}) da população (P), baseado em uma medida de afinidade; ● Reproduza (processo de clonagem) estes n melhores indivíduos, gerando uma população temporária de clones (C). A quantidade de filhos de cada indivíduo é diretamente proporcional à sua afinidade;
  20. 20. Sistemas Imunológicos Artificiais (CLONALG) Referencial Teórico ● Submeta a população de clones a um esquema de hipermutação, em que a taxa de mutação é proporcional à afinidade do anticorpo. Uma população de anticorpos maduros é gerada (C*); ● Re-selecione os melhores indivíduos de C* para compor o conjunto de memória M; ● Substitua d anticorpos por novos indivíduos (diversidade). Os anticorpos com menores afinidades possuem maiores probabilidades de serem substituídos.
  21. 21. Sistemas Imunológicos Artificiais (aiNet) Referencial Teórico Artificial Immune Network (aiNet)A rede imunológica artificial, chamada aiNet, éum grafo com conexões ponderadas, nãonecessariamente totalmente interconectado,composto por um conjunto de nós,denominados anticorpos, e conjuntos de paresde nós chamados conexões, com um valorcaracterístico associado, chamado de peso daconexão ou simplesmente peso.
  22. 22. Sistemas Imunológicos Artificiais (aiNet) Referencial TeóricoIlustração da aiNet: (a) Conjunto de antígenos aserem reconhecidos e clusterizados, contendo trêsregiões de alta concentração antigênica. (b) aiNetcom os anticorpos rotulados e os respectivos pesosdas conexões. As linhas tracejadas indicam conexõesque deverão ser detectadas e removidas com oobjetivo de gerar subgrafos desconexos, cada umcaracterizando um cluster diferente da rede.
  23. 23. Sistemas Imunológicos Artificiais (aiNet) Referencial Teórico● Após execução do CLONALG, compare ascélulas de memória entre si.● As que alcançarem uma afinidade mínima nacomparação, são colocadas em um únicoconjunto.● Após os conjuntos formados, compare osantígenos para determinar em qual dos gruposeles pertencem.
  24. 24. Metodologia AISF - Artificial Immune System FrameworkPara a implementação do algoritmo declusterização, foi utilizado o AISF, uma bibliotecade classes e funções criadas na linguagem deprogramação Python, com suporte a um grandenúmero de processos e elementos do sistemaimune, que foi apresentado em Uchôa (2009).
  25. 25. Metodologia
  26. 26. MetodologiaCAIS – Clustering with Artificial Immune System● Cria-se uma população inicial de células B● Enquanto a quantidade das células B quereconhecem os antígenos não atinjam umaporcentagem determinada, os próximos passosserão executados: ● Apresente os antígenos às células B ● Para cada célula B que atinge uma taxa mínima de ativação:
  27. 27. Metodologia ● Ative a célula; ● Gere clones; ● Faça mutação nos clones;● Verifique os clones, apresentando-os para os antígenos;● Se há clone que reconheça algum antígeno antígenos: ● Selecione os melhores clones; ● Adicione esses melhores clones na população de células;
  28. 28. Metodologia ● Atualize o tempo de vida de todas as células; ● Adicione novas células à população;● Selecione todos os receptores da populaçãosobrevivente. Para cada receptor, os próximospassos serão executados: ● Apresente um receptor à população; ● Para cada célula B da população e a taxa de afinidade com o receptor: ● Se o receptor atual tiver uma taxa de afinidade com a célula B maior que um valor determinado:
  29. 29. Metodologia ● Salve a célula B em uma estrutura de dados; ● Salve a taxa de afinidade em uma estrutura de dado;● Junte as duas estruturas criadas anteriormente em uma só;● Ordene, por afinidade, essa estrutura;● Para todas as células salvas nessa estrutura de dados, excluindo a com maior afinidade, elimine todas as outras;
  30. 30. Metodologia
  31. 31. Resultados e Análises KDD99
  32. 32. Resultados e Análises Packet DatasetsA melhor média de acertos obtida peloautor desse banco de dados testes foi de96.06%
  33. 33. Resultados e AnálisesO algoritmo CAIS não está totalmentefinalizado. A versão atual é funcional e jámostra-se promissora, porém, possibilidade demelhoria está clara e será feita em trabalhosfuturos.Uma funcionalidade importante ainda em fasede implementação e testes é de poderdeterminar uma quantidade específica declusters.
  34. 34. ConclusãoA maior contribuição desse trabalho foi de deapresentar um novo algoritmo com uma visãodiferente da existente na maior parte dostrabalhos na área.Essa nova visão amplia o leque de trabalhos naárea, servindo de inspiração para trabalhosfuturos.

×