Sistema Imunológico Artificial para
Predição de Fraudes e Furtos de
Energia Elétrica
Dissertação de Mestrado
Mauricio Volk...
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Sistema Imunológico Artificial
Sistema Imunológico Natural
Possíveis Aplicações
RECONHECIMENTO DE PADRÕES
VIDA ARTIFICIAL
MÉTODOS DE BUSCA E OTIMIZAÇÃO
CONTROLE E NAVEGAÇÃO AUTÔNOMA...
Motivação
● SIA ainda não está tão difundido quanto
outras áreas;
● Muitos trabalhos utilizando toy problems;
● Qual a efi...
Motivação
● Como seria a sua modelagem e
adaptação ao problema de um domínio
específico?
● E como ficaria seu desempenho
c...
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Fraudes e Furtos de Energia
Elétrica
Fraudes e Furtos de Energia
Elétrica
● Exemplos de perdas não técnicas:
● furtos de energia,
● erros de medição,
● erros n...
Como funciona o Faturamento de
Energia Elétrica?
Como funciona o Faturamento de
Energia Elétrica?
Unidade
Consumidora
Rede Elétrica
Medidor
Fraude
Unidade
Consumidora
Rede Elétrica
Medidor
Fraude
Furto 1
Consumidor
Não Cadastrado
Rede Elétrica
Furto 2
Unidade
Consumidora
Rede Elétrica
Medidor
Como combater Fraudes e Furtos?
Como combater Fraudes e Furtos?
A Ideia
Utilizar um algoritmo de
Sistema Imunológico Artificial
para predizer consumidores
fraudadores baseados nos
seus d...
A CEEE-D
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Conjunto de Dados
● Dados de consumidores reais de uma
cidade específica;
● Inicialmente a proporção era irreal e
alguns a...
Conjunto de Dados
854
54
Conjunto de Dados
● tipo_cliente;
● classe;
● fases
● pessoa_fisica_juridica
● rotatividade_titularidade
● carga_declarada...
Projeto
Domínio do Problema
Sistema
Imunológico
Artificial
Representação
Métricas de Afinidade
Algoritmos Imunológicos
Sol...
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Modelos
Modelos
Consumidor:
array de
atributos
Modelos
Detector:
array de
atributos
Consumidor:
array de
atributos
Modelos
Detector:
array de
atributos
Afinidade:
similaridade
(distância)
Consumidor:
array de
atributos
Algoritmo
Algoritmo
Gerar uma
população
randômica
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clon...
Utilização do Classificador
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Metodologia de Validação
● Objetivos:
● Avaliar se o SIA consegue predizer os
consumidores desonestos: Ganho em
Precisão;
...
Medida-F
0 20 40 60 80 100
0
20
40
60
80
100
Recall
Precisão
Metodologia de Validação
● Foram realizadas 10 Validações Cruzadas
Deixando Um de Fora;
● Foram calculados a Média, Desvio...
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Resultados Experimentais
Métrica Média Desvio
Padrão
Intervalo de
Confiança
(nível 95%)
Precisão 14,00% 0,86 [13,47%,
14,4...
Resultados Experimentais
● A precisão randômica da amostra é
5,95%;
● O ganho em precisão do classificador
ficou em 2,35.
Comparação com Outros Algoritmos
# Algoritmo Precisão Recall Medida-F
1 Clonalg (SIA) 13,07% 71,93% 23,39%
2 Naive Bayes 1...
Comparação com Outros Algoritmos
0 10 20 30 40 50 60 70 80 90 100
0
10
20
30
40
50
60
Recall
Precisão
SIASIA
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resu...
Conclusões (1 de 2)
● Diferente de outros trabalhos, este utilizou
métrica que faz sentido no contexto do
negócio em vez d...
Conclusões (2 de 2)
● SIA deve ser considerado um candidato
em potencial para resolver problemas de
classificação;
● Os al...
Sugestões de Trabalhos Futuros
● Algoritmos de seleção de atributos;
● Explorar outras medidas de distância para
dados cat...
Continuidade do Trabalho na CEEE
● Primeiros resultados com dados reais
foram considerados pela CEEE muito
positivos;
● CE...
Submissão de Artigo
International Conference on Enterprise
Information Systems (ICEIS) 2012:
Aceito.
FIM
Muito obrigado pela atenção.
Próximos SlideShares
Carregando em…5
×

Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia Elétrica

611 visualizações

Publicada em

Publicada em: Ciências
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
611
No SlideShare
0
A partir de incorporações
0
Número de incorporações
8
Ações
Compartilhamentos
0
Downloads
11
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia Elétrica

  1. 1. Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia Elétrica Dissertação de Mestrado Mauricio Volkweis Astiazara Prof. Dr. Dante Augusto Couto Barone Orientador Porto Alegre, junho de 2012
  2. 2. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  3. 3. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  4. 4. Sistema Imunológico Artificial Sistema Imunológico Natural
  5. 5. Possíveis Aplicações RECONHECIMENTO DE PADRÕES VIDA ARTIFICIAL MÉTODOS DE BUSCA E OTIMIZAÇÃO CONTROLE E NAVEGAÇÃO AUTÔNOMA APRENDIZAGEM DE MÁQUINA ALOCAÇÃO DE TAREFAS SISTEMAS BASEADOS EM AGENTES CLASSIFICAÇÃO MINERAÇÃO DE DADOS DETECÇÃO DE ANOMALIAS E FALHAS
  6. 6. Motivação ● SIA ainda não está tão difundido quanto outras áreas; ● Muitos trabalhos utilizando toy problems; ● Qual a eficácia de um Sistema Imunológico Artificial aplicado a um problema real?
  7. 7. Motivação ● Como seria a sua modelagem e adaptação ao problema de um domínio específico? ● E como ficaria seu desempenho comparado aos algoritmos mais tradicionais?
  8. 8. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  9. 9. Fraudes e Furtos de Energia Elétrica
  10. 10. Fraudes e Furtos de Energia Elétrica ● Exemplos de perdas não técnicas: ● furtos de energia, ● erros de medição, ● erros no processo de faturamento, ● consumidores sem equipamento de medição ● etc. ● ANEEL apontou em 2007 que as perdas não técnicas correspondem a 5 bilhões de reais anuais no país.
  11. 11. Como funciona o Faturamento de Energia Elétrica?
  12. 12. Como funciona o Faturamento de Energia Elétrica? Unidade Consumidora Rede Elétrica Medidor
  13. 13. Fraude Unidade Consumidora Rede Elétrica Medidor
  14. 14. Fraude
  15. 15. Furto 1 Consumidor Não Cadastrado Rede Elétrica
  16. 16. Furto 2 Unidade Consumidora Rede Elétrica Medidor
  17. 17. Como combater Fraudes e Furtos?
  18. 18. Como combater Fraudes e Furtos?
  19. 19. A Ideia Utilizar um algoritmo de Sistema Imunológico Artificial para predizer consumidores fraudadores baseados nos seus dados.
  20. 20. A CEEE-D
  21. 21. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  22. 22. Conjunto de Dados ● Dados de consumidores reais de uma cidade específica; ● Inicialmente a proporção era irreal e alguns atributos não podiam ser usados; ● O conjunto final ficou com 19 atributos incluindo o rótulo.
  23. 23. Conjunto de Dados 854 54
  24. 24. Conjunto de Dados ● tipo_cliente; ● classe; ● fases ● pessoa_fisica_juridica ● rotatividade_titularidade ● carga_declarada ● teve_corte ● possui_debito_automatico ● osc_consumo ● irregularidade_leitura01 ● irregularidade_leitura03 ● irregularidade_leitura04 ● irregularidade_leitura09 ● irregularidade_leitura25 ● irregularidade_leitura26 ● irregularidade_leitura43 ● irregularidade_leitura44 ● irregularidade_leitura50 ● resultado
  25. 25. Projeto Domínio do Problema Sistema Imunológico Artificial Representação Métricas de Afinidade Algoritmos Imunológicos Solução
  26. 26. Expansão Clonal
  27. 27. Expansão Clonal
  28. 28. Expansão Clonal
  29. 29. Expansão Clonal
  30. 30. Expansão Clonal
  31. 31. Expansão Clonal
  32. 32. Modelos
  33. 33. Modelos Consumidor: array de atributos
  34. 34. Modelos Detector: array de atributos Consumidor: array de atributos
  35. 35. Modelos Detector: array de atributos Afinidade: similaridade (distância) Consumidor: array de atributos
  36. 36. Algoritmo
  37. 37. Algoritmo Gerar uma população randômica
  38. 38. Algoritmo Gerar uma população randômica Apresentar antígeno à população
  39. 39. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones
  40. 40. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones Melhor indivíduo tem afinidade > limiar?
  41. 41. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones Melhor indivíduo tem afinidade > limiar? NãoNão
  42. 42. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones Melhor indivíduo tem afinidade > limiar? Adicioná-lo à lista de células de memória SimSim NãoNão
  43. 43. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones Melhor indivíduo tem afinidade > limiar? Adicioná-lo à lista de células de memória Substituir piores indivíduos por novos randômicos NãoNão SimSim
  44. 44. Algoritmo Gerar uma população randômica Apresentar antígeno à população Reproduzir os melhores e realizar mutação nos clones Melhor indivíduo tem afinidade > limiar? Adicioná-lo à lista de células de memória Substituir piores indivíduos por novos randômicos NãoNão Próximo antígeno SimSim
  45. 45. Utilização do Classificador
  46. 46. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  47. 47. Metodologia de Validação ● Objetivos: ● Avaliar se o SIA consegue predizer os consumidores desonestos: Ganho em Precisão; ● Avaliar a eficácia: Medida-F; ● Avaliar a eficácia em relação a outros métodos: Comparação com outros algoritmos.
  48. 48. Medida-F 0 20 40 60 80 100 0 20 40 60 80 100 Recall Precisão
  49. 49. Metodologia de Validação ● Foram realizadas 10 Validações Cruzadas Deixando Um de Fora; ● Foram calculados a Média, Desvio Padrão e Intervalo de Confiança.
  50. 50. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  51. 51. Resultados Experimentais Métrica Média Desvio Padrão Intervalo de Confiança (nível 95%) Precisão 14,00% 0,86 [13,47%, 14,43%] Recall 72,04% 4,32 [69,36%, 74,71%] Medida-F 23,44% 1,41 [22,56%, 24,31%]
  52. 52. Resultados Experimentais ● A precisão randômica da amostra é 5,95%; ● O ganho em precisão do classificador ficou em 2,35.
  53. 53. Comparação com Outros Algoritmos # Algoritmo Precisão Recall Medida-F 1 Clonalg (SIA) 13,07% 71,93% 23,39% 2 Naive Bayes 10,6% 94,44% 19,07% 3 Voting feature intervals 10,25% 90,74% 18,42% 4 KNN (K=1) 14,55% 14,81% 14,68% 5 RandomTree 10,64% 9,26% 9,9% 6 RandomForest 12,5% 3,7% 5,71%
  54. 54. Comparação com Outros Algoritmos 0 10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 Recall Precisão SIASIA
  55. 55. Sumário ● Introdução ● Fraudes e Furtos de Energia Elétrica ● Modelo Proposto ● Metodologia de Validação ● Análise de Resultados ● Conclusões e Sugestões de Trabalhos Futuros
  56. 56. Conclusões (1 de 2) ● Diferente de outros trabalhos, este utilizou métrica que faz sentido no contexto do negócio em vez da acurácia de maneira simplista; ● O SIA conseguiu aprender o conceito de consumidor desonesto; ● Em termos de medida-F, o SIA ficou em primeiro lugar.
  57. 57. Conclusões (2 de 2) ● SIA deve ser considerado um candidato em potencial para resolver problemas de classificação; ● Os algoritmos de classificação utilizados poderão produzir resultados melhores com uma parametrização adequada.
  58. 58. Sugestões de Trabalhos Futuros ● Algoritmos de seleção de atributos; ● Explorar outras medidas de distância para dados categóricos; ● Uso do histórico de consumo poderia ser melhorado (série temporal); ● Simplificação da parametrização.
  59. 59. Continuidade do Trabalho na CEEE ● Primeiros resultados com dados reais foram considerados pela CEEE muito positivos; ● CEEE solicitou continuidade com mais dados reais; ● Sugerimos palestra sobre a tarefa de classificação, suas etapas e ferramentas (ensinar a pescar).
  60. 60. Submissão de Artigo International Conference on Enterprise Information Systems (ICEIS) 2012: Aceito.
  61. 61. FIM Muito obrigado pela atenção.

×