Detecção Preventiva de Fracionamento de Compras
Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração ...
2
USING BAYESIAN NETWORKS TO IDENTIFY
AND PREVENT SPLIT PURCHASES IN BRAZIL
Rommel N. Carvalho, Leonardo J. Sales, Henriqu...
Introdução
Metodologia
Entendimento e Preparação dos Dados
Modelagem e Avaliação
Implantação
Conclusão
Agenda
3
Introdução
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusã...
Trilha de Fracionamento
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantaç...
Será que vai fracionar?
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantaç...
Metodologia
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclus...
CRISP-DM
CRoss Industry Standard Process for Data Mining
Introdução – Metodologia – Entendimento e Preparação dos Dados –
...
Entendimento e Preparação
dos Dados
Entendimento para levantar hipóteses sobre
o melhor uso dos dados e preparação para
tr...
Dados Utilizados
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Co...
Modelagem e Avaliação
Aprendizagem de modelos a partir dos conjunto
de dados finais, ajuste de parâmetros para
melhorar pe...
Será que vai fracionar?
?
12Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Impla...
De Volta à Preparaçao
13Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantaç...
Naïve Bayes vs Bayes Net (K2) –
com e sem Resampling
14Introdução – Metodologia – Entendimento e Preparação dos Dados –
Mo...
Mudando algoritmos e
número de pais
15Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliaç...
Tem como melhorar?
16Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação ...
Implantação
Descoberta de novas regras, validação das regras
existentes, documentação e elaboração de
relatório com result...
Possível Fracionamento
O sistema identificou que há outras
compras semelhantes a essa, que
podem caracterizar um fracionam...
Conclusão
19Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclus...
Conclusões
É possível usar Mineração de Dados para prevenção
Resultados satisfatórios
Todos fracionamentos foram classific...
Detecção preventiva de fracionamento de compras
Próximos SlideShares
Carregando em…5
×

Detecção preventiva de fracionamento de compras

340 visualizações

Publicada em

Essa palestra apresenta o uso de Mineração de Dados para identificar fracionamentos de forma proativa, ou seja, antes mesmo do fracionamento se concretizar. Dessa forma, é possível alertar o usuário e evitar que a irregularidade aconteça. Nesse trabalho, foram utilizados diversos algoritmos diferentes de classificação, todos baseados em redes bayesianas. Foram analisadas mais de 50 mil compras na área de TI e o modelo final foi capaz de classificar corretamente todos os casos de fracionamento de forma proativa e obteve uma acurácia geral de 99,197%

Rommel Novaes Carvalho - Controladoria-Geral da União

Coordenador-Geral do Observatório da Despesa Pública da CGU (http://www.cgu.gov.br/assuntos/informacoes-estrategicas/observatorio-da-despesa-publica), realizou seu PhD e Pós-Doc na George Mason University, EUA, na área de Inteligência Artificial, Web Semântica e Mineração de Dados e também é professor do Mestrado Profissional em Computação Aplicada da UnB

Publicada em: Governo e ONGs
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
340
No SlideShare
0
A partir de incorporações
0
Número de incorporações
9
Ações
Compartilhamentos
0
Downloads
13
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Detecção preventiva de fracionamento de compras

  1. 1. Detecção Preventiva de Fracionamento de Compras Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração Pública | 11/09/2015 @ TCU Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
  2. 2. 2 USING BAYESIAN NETWORKS TO IDENTIFY AND PREVENT SPLIT PURCHASES IN BRAZIL Rommel N. Carvalho, Leonardo J. Sales, Henrique A. da Rocha, and Gilson L. Mendes Coordenador-Geral do ODP / Cientista de Dados / Professor https://about.me/rommelnc Departamento de Pesquisas e Informações Estratégicas (DIE) / Departamento de Ciência da Computação (CIC) Controladoria-Geral da União (CGU) / Universidade de Brasília (UnB) BMAW workshop @ UAI 2014 Quebec City, Quebec, Canada - 07/27/2014 Artigo: http://ceur-ws.org/Vol-1218/bmaw2014_paper_7.pdf Slides: http://pt.slideshare.net/rommelnc/bmaw-2014-using-bayesian-networks-to-identify-and-prevent-split-purchases-in-brazil Apresentação: https://www.youtube.com/watch?v=UVOsztdSQ3A Baseado no Artigo
  3. 3. Introdução Metodologia Entendimento e Preparação dos Dados Modelagem e Avaliação Implantação Conclusão Agenda 3
  4. 4. Introdução Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 4
  5. 5. Trilha de Fracionamento Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão R$ 9.890,00 5
  6. 6. Será que vai fracionar? Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão ? 6
  7. 7. Metodologia Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 7
  8. 8. CRISP-DM CRoss Industry Standard Process for Data Mining Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 8
  9. 9. Entendimento e Preparação dos Dados Entendimento para levantar hipóteses sobre o melhor uso dos dados e preparação para transformar os dados brutos em um conjunto de dados utilizados para criação do modelo Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 9
  10. 10. Dados Utilizados Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão SIASG CPF CNPJ CNAE 2005 a 2010 Compras de materiais e serviços de TI 42 atributos ~ 70 mil registros ‘ ? IDs ? 26 atributos ~ 50 mil registros centavos e bilhões análise do especialista 10
  11. 11. Modelagem e Avaliação Aprendizagem de modelos a partir dos conjunto de dados finais, ajuste de parâmetros para melhorar performance, escolha do melhor modelo baseado na validação e teste com conjunto desconhecido de dados Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 11
  12. 12. Será que vai fracionar? ? 12Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  13. 13. De Volta à Preparaçao 13Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  14. 14. Naïve Bayes vs Bayes Net (K2) – com e sem Resampling 14Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  15. 15. Mudando algoritmos e número de pais 15Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  16. 16. Tem como melhorar? 16Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  17. 17. Implantação Descoberta de novas regras, validação das regras existentes, documentação e elaboração de relatório com resultados finais, e implantação do modelo final em produção 17Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  18. 18. Possível Fracionamento O sistema identificou que há outras compras semelhantes a essa, que podem caracterizar um fracionamento. Usuário XXXX, matrícula YYYY, tem certeza que deseja continuar? Confirmar operação? 18Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão ?
  19. 19. Conclusão 19Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  20. 20. Conclusões É possível usar Mineração de Dados para prevenção Resultados satisfatórios Todos fracionamentos foram classificados corretamente AUROC bastante alta (.999) Acurácia bastante alta (99.197%) É preciso fortalecer integração entre diferentes Órgãos Entender e avaliar resultados com dados mais atuais Avaliar tabelas de probabilidades da rede Cuidado com overfitting Aplicar técnicas em novos problemas governamentais 20Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão

×