 Crises financeiras e restrições orçamentárias
 Redução de Auditores-Fiscais nas
administrações tributárias e aduaneiras...
3
 Saída: pedir mais gente ou trabalhar melhor?
4
 Trabalhar melhor = selecionar melhor o que
deve ser trabalhado
 Volume de dados não permite mais análises de
especialis...
6
 Compensação de crédito: utilizar um crédito
para quitar um débito (diferentes tributos ou
não)
 Ex: pagamento a maior (...
 O Sistema de Controle de Crédito (SCC) analisa a
soliticação e, com base em alguns parâmetros de
risco, defere, indefere...
Fonte: https://www.serpro.gov.br/tema/noticias-tema/de-volta-para-o-contribuinte
9
 Problema: seleção de solicitações para análise manual
pode gerar compensações indevidas, afetando o saldo
líquido de arr...
 Mestrado em Computação Aplicada - UnB
 Orientador: Prof. Dr. João Carlos Felix
 Coorientador: Prof. Dr. Rommel Novaes ...
12
 Quais características do contribuinte são mais
importantes estatisticamente para definir se
haverá deferimento ou não da...
 Ensaio inicial: 1a
Região Fiscal da RFB, que
abrange as unidades federativas do DF, GO,
MT, MS e TO
 +- 8000 famílias t...
 Tratamentos básicos:
 Retirada de acentos
 Exclusão de linhas com poucas informações ou
nulas
 Transformação de tipos...
 Uma família pode ter solicitações deferidas e
indeferidas
 Limite arbritrário: acima de 70% do valor do
crédito indefer...
 Do total de variáveis dependentes, foram
escolhidas 8 (oito) para iniciar as análise de
importância e significância esta...
 Responder aos questionamentos realizados no
entendimento do negócio.
 Regressão logística para entender quais
caracterí...
 Regressão logística: somente 4 das 8 delas se
mostraram estatisticamente significativas para
explicar o modelo
 Modelos...
 Para todos os modelos a base foi separada em
duas, uma de treinamento e outra para testes
na proporção 80 para 20%.
 Ba...
21
22
 Boa técnica: usar regressão para escolher as
variáveis antes da confecção dos modelos
preditivos (modelos com todas as v...
 Nem sempre acertar mais significa melhora no
processo de seleção de trabalhos
 Indicador de performance de processo é
n...
 Retornar ao entendimento do negócio para
avaliar por tipo de crédito (Saldo negativo de
IRPJ, PIS/Cofins não cumulativo,...
26
 Análise por tipo de crédito com retirada de
outliers (instituições financeiras, grandes
empreiteiras)
 Amostras maiores...
Obrigado!
Auditor-Fiscal Leon Sólon da Silva – leon.silva@rfb.gov.br
Auditor-Fiscal Márcio Vital Santos de Araujo – marcio...
Painel 04   03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito t...
Próximos SlideShares
Carregando em…5
×

Painel 04 03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário

181 visualizações

Publicada em

Brasil 100% Digital - O evento teve como principal objetivo a troca de experiências relacionadas ao uso de técnicas avançadas de análise de dados como instrumento para melhoria da gestão e do controle de entidades e políticas públicas. Espera-se que os debates contribuam para que as instituições participantes possam iniciar ou intensificar a adoção de tais técnicas, de modo a obter maior eficiência e efetividade em suas atividades.

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
181
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
2
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Painel 04 03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário

  1. 1.  Crises financeiras e restrições orçamentárias  Redução de Auditores-Fiscais nas administrações tributárias e aduaneiras de todo o mundo  Aumento na carga de trabalho (contribuintes, solicitações de compensação, importação e exportação) 2
  2. 2. 3
  3. 3.  Saída: pedir mais gente ou trabalhar melhor? 4
  4. 4.  Trabalhar melhor = selecionar melhor o que deve ser trabalhado  Volume de dados não permite mais análises de especialistas sem auxílio de ferramentas  Análise de dados: encontrar padrões, correlações e realizar predições a partir de massas de dados* e conhecimento de especialistas nos processos de trabalho 5
  5. 5. 6
  6. 6.  Compensação de crédito: utilizar um crédito para quitar um débito (diferentes tributos ou não)  Ex: pagamento a maior (erro na hora de pagar um “carnê leão”) pode ser restituído (receber o valor de volta) ou compensado  Vantagem da compensação: processo mais célere em comparação com a restituição 7
  7. 7.  O Sistema de Controle de Crédito (SCC) analisa a soliticação e, com base em alguns parâmetros de risco, defere, indefere ou separa a compensaçao para análise manual do Auditor-Fiscal.  Estoque de processos de análise manual se elevou sobremaneira. Classificar melhor as solicitações para escolher aqueles com maior risco de indeferimento 8
  8. 8. Fonte: https://www.serpro.gov.br/tema/noticias-tema/de-volta-para-o-contribuinte 9
  9. 9.  Problema: seleção de solicitações para análise manual pode gerar compensações indevidas, afetando o saldo líquido de arrecadação  Proposta: melhorar a seleção de processos de compensação tributária utilizando modelos preditivos  Reduzir os riscos para aumentar a análise de processos que tenham mais riscos de indeferimento (equívoco do contribuinte ou fraude) 10
  10. 10.  Mestrado em Computação Aplicada - UnB  Orientador: Prof. Dr. João Carlos Felix  Coorientador: Prof. Dr. Rommel Novaes Carvalho (de novo esse cara?)  Predizer se uma solicitação de compensação será indeferida 11
  11. 11. 12
  12. 12.  Quais características do contribuinte são mais importantes estatisticamente para definir se haverá deferimento ou não da solicitação de compensação?  Para novas solicitações de crédito, quais as chances de serem ou não deferidas? 13
  13. 13.  Ensaio inicial: 1a Região Fiscal da RFB, que abrange as unidades federativas do DF, GO, MT, MS e TO  +- 8000 famílias trabalhadas manualmente (classificadas) por Auditores-Fiscais  1 família são todas as solicitações de compensação relativas a um mesmo crédito 14
  14. 14.  Tratamentos básicos:  Retirada de acentos  Exclusão de linhas com poucas informações ou nulas  Transformação de tipos de dados  Os dados foram todos trabalhos utilizando o software R (R Studio). 15
  15. 15.  Uma família pode ter solicitações deferidas e indeferidas  Limite arbritrário: acima de 70% do valor do crédito indeferido é uma família indeferida, abaixo de 70% é considerada deferida 16
  16. 16.  Do total de variáveis dependentes, foram escolhidas 8 (oito) para iniciar as análise de importância e significância estatística e para construção dos modelos  Variáveis escolhidas por especialistas em compensação de crédito 17
  17. 17.  Responder aos questionamentos realizados no entendimento do negócio.  Regressão logística para entender quais características da compensação/contribuinte mais influenciam na decisão de deferimento/indeferimento 18
  18. 18.  Regressão logística: somente 4 das 8 delas se mostraram estatisticamente significativas para explicar o modelo  Modelos preditivos: regressão logística, o algoritmo Naive Bayes e Random Forests. 19
  19. 19.  Para todos os modelos a base foi separada em duas, uma de treinamento e outra para testes na proporção 80 para 20%.  Base de treinamento foi utilizada para realizar a chamada validação cruzada (cross-validation), que permite que uma mesma base seja usada tanto para treinamento quanto para validação para achar um modelo menos sobreajustado 20
  20. 20. 21
  21. 21. 22
  22. 22.  Boa técnica: usar regressão para escolher as variáveis antes da confecção dos modelos preditivos (modelos com todas as variáveis não passou de 0.53 de acurácia).  Resultados interessantes, cerca de 70% de acerto nas predições 23
  23. 23.  Nem sempre acertar mais significa melhora no processo de seleção de trabalhos  Indicador de performance de processo é necessário: valor indeferido/família analisada  Resultado: fracasso completo 24
  24. 24.  Retornar ao entendimento do negócio para avaliar por tipo de crédito (Saldo negativo de IRPJ, PIS/Cofins não cumulativo, etc)  Resultado: um pouco melhor 25
  25. 25. 26
  26. 26.  Análise por tipo de crédito com retirada de outliers (instituições financeiras, grandes empreiteiras)  Amostras maiores (8a RF)  A partir de um modelo com boa predição, aplicar em algumas unidades 27
  27. 27. Obrigado! Auditor-Fiscal Leon Sólon da Silva – leon.silva@rfb.gov.br Auditor-Fiscal Márcio Vital Santos de Araujo – marcio.vital@rfb.gov.br

×