
Classificação de clientes
bancários com baixa renda
Felipe Alves Fonseca
Brasil 100% Digital
Seminário sobre Análise de ...
1
2
3
4
Contexto
Problema
Metodologia
Resultados
 5
6
Considerações finais
Bibliografia

Instituições financeiras
-> Concessão de crédito
Gestão do Risco de crédito
Modelo único x Segmentação
Contexto
Classes C, D e E com
mais acesso aos bancos
Necessidade de modelo
específico para esse público
Existência de grupo com
ina...
Identificação feita através do
canal de abertura da c/c
Não é desejável
segmentação por canal
Necessário criar segmentação...
1
Clientes com renda
inferior à R$ 2500 e
c/c em out/14
2 Amostra pareada de
40.000 clientes
3 13 variáveis
cadastrais
Met...
1
Clientes com renda
inferior à R$ 2500 e
c/c em out/14
2 Amostra pareada de
40.000 clientes
3 13 variáveis
cadastrais
4
A...
AUROC
Teste estatístico
de comparação
das médias da
área sob a curva
ROC das três
técnicas testadas
Resultados
Resultados ...
Variáveis
Cinco variáveis
mais importantes
nas várias
árvores de
decisão criadas
no Random
Forest
Resultados
Resultados ob...
AURO
C
VS
Resultados
Resultados obtidos na amostra de
teste
Sensibilidad
e
Acuráci
a
Especificidade
Com apenas 14 variáveis, todas cadastrais, foram obtidos
bons resultados
Independente do canal de atendimento, é possível ...
• ANDERSON, R. The credit scoring toolkit. Oxford University Press,
2007.
• BREINAN, L. Random forests. Machine Learning, ...
Contatos
Felipe Alves Fonseca
felipe.fonseca@bb.com.br
+55 61 3493-2117
Obrigado!
Próximos SlideShares
Carregando em…5
×

Painel 01 02 - felipe fonseca - Classificação de clientes bancários com baixa renda

233 visualizações

Publicada em

Brasil 100% Digital - O evento teve como principal objetivo a troca de experiências relacionadas ao uso de técnicas avançadas de análise de dados como instrumento para melhoria da gestão e do controle de entidades e políticas públicas. Espera-se que os debates contribuam para que as instituições participantes possam iniciar ou intensificar a adoção de tais técnicas, de modo a obter maior eficiência e efetividade em suas atividades.

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
233
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
6
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Painel 01 02 - felipe fonseca - Classificação de clientes bancários com baixa renda

  1. 1.  Classificação de clientes bancários com baixa renda Felipe Alves Fonseca Brasil 100% Digital Seminário sobre Análise de Dados na Administração Pública Set/2015
  2. 2. 1 2 3 4 Contexto Problema Metodologia Resultados  5 6 Considerações finais Bibliografia 
  3. 3. Instituições financeiras -> Concessão de crédito Gestão do Risco de crédito Modelo único x Segmentação Contexto
  4. 4. Classes C, D e E com mais acesso aos bancos Necessidade de modelo específico para esse público Existência de grupo com inadimplência elevada Problema Inadimplência 300% maior!
  5. 5. Identificação feita através do canal de abertura da c/c Não é desejável segmentação por canal Necessário criar segmentação que não dependa do canal Problema Inadimplência 300% maior!
  6. 6. 1 Clientes com renda inferior à R$ 2500 e c/c em out/14 2 Amostra pareada de 40.000 clientes 3 13 variáveis cadastrais Metodologia Estado civil Nível de instrução Sexo Indicador União estável Tipo de residência Indicador de telefone fixoIndicador de celular Região geográfica Ocupação principal Natureza da ocupação Salário líquido Tempo no emprego Idade
  7. 7. 1 Clientes com renda inferior à R$ 2500 e c/c em out/14 2 Amostra pareada de 40.000 clientes 3 13 variáveis cadastrais 4 Amostra para treino de 60% e teste 40% 5 Validação feita através do 10-fold Cross Validation 6 Técnicas de classificação: •Random Forest •Support Vector Machine •Regressão Logística Metodologia
  8. 8. AUROC Teste estatístico de comparação das médias da área sob a curva ROC das três técnicas testadas Resultados Resultados obtidos nas 10 amostras de validação
  9. 9. Variáveis Cinco variáveis mais importantes nas várias árvores de decisão criadas no Random Forest Resultados Resultados obtidos nas 10 amostras de validação Salário líquido Tempo de ocupação Idade Ocupação principal Tel. Res. cadastrad o Importância
  10. 10. AURO C VS Resultados Resultados obtidos na amostra de teste Sensibilidad e Acuráci a Especificidade
  11. 11. Com apenas 14 variáveis, todas cadastrais, foram obtidos bons resultados Independente do canal de atendimento, é possível classificar um cliente como pertencente ao grupo de maior risco assim que ele abre sua conta, possibilitando uma melhor gestão do risco e o desenvolvimento de modelos mais especializados. Random Forest se mostrou a melhor escolha, acertando bem os clientes com baixa e com alta inadimplência. Considerações finais
  12. 12. • ANDERSON, R. The credit scoring toolkit. Oxford University Press, 2007. • BREINAN, L. Random forests. Machine Learning, v. 45, p. 5–32, 2011. • MAKUCH, W. M. The basics of a better application score. GlenlakePublishing Company, 2001. • SIDDIQI, M. Credit risk scorecards: Developing and implementing intelligent credit scoring. Wiley, 2005. • THOMAS, L. C. Consumer credit models: Pricing, profit, and portfolios.Oxford University Press, 2009. • VAPNIK, V. N. The nature of statistical learning theory. Springer, 1995. • Imagens: • “poor” by Nicolas Vicent from the Noun Project • “Bank” by Mark Caron from the Noun Project • “earn money” by TukTuk Design from the Noun Project • “Man by Jennifer” Morrow from the Noun Project Bibliografia
  13. 13. Contatos Felipe Alves Fonseca felipe.fonseca@bb.com.br +55 61 3493-2117 Obrigado!

×