2. Análise de Riscos no Agronegócio
Edileusa Estefani Prado
Cientista de Dados, Professora, mestranda em Métodos Quantitativos na FEA-USP;
MBA em Analytics e Big Data (FIA); Pós-Graduação em Consultoria em Internet (FASP);
Bacharel em Ciências da Computação (UNESP)
3. Análise de Riscos no Agronegócio - Objetivo
Através de um Caso de
Risco de Crédito Agrícola,
demonstrar os passos
efetuados em Ciências de
Dados, para se obter um
modelo de crédito score
usando machine learning.
4. Caso: Risco de Crédito Agrícola - Problema
Grande
Cooperativa
Agrícola
Problema
de
Negócio
➢Pico de Requisições (90 Dias)
➢Tempo de Avaliação (5h/Análise)
➢Volume de Concedido (R$ 1,13Bi)
➢Nível de Inadimplência (> 2%)
11. Caso: Risco de Crédito Agrícola – Qualidade dos Dados
Fermento
vencido
no bolo?
Bolo
não
cresce
12. Caso: Risco de Crédito Agrícola – Qualidade dos Dados
BAD DATA
Descritiva
O que
aconteceu?
Preditiva
O que
acontecerá
Prescritiva
O que
deveria
acontecer
Analytics
13. Caso: Risco de Crédito Agrícola – Seleção de Variáveis
Utilizadas 42 variáveis da base de dados da Cooperativa, destacando àquelas com
maior peso na classificação de risco:
Variáveis Financeiras
▪ Código do Cooperado
▪ Limite do empréstimo (Histórico por Safra / Mediana)
▪ Uso do empréstimo (%)
▪ Área de Produção (propriedade + arrendamento)
▪ Capacidade Produtiva (Histórico Safra / entrega)
▪ Débitos da Terceira Parte (Classificação por Safra /
proporcional)
▪ Renegociação(Classificação por Safra)
▪ Histórico Inadimplência (Classificação conforme
Safra)
▪ Garantias (S / N => 1 / 2)
Variáveis Cadastrais
▪ Código do Cooperado
▪ Idade (em anos)
▪ Sexo
▪ Estado Civil
▪ Dependentes (quantidade)
▪ Tempo como cooperado(total anos)
▪ Tipo de Atividade(class. Cooperativa)
14. Caso: Risco de Crédito Agrícola - Metodologia
Metodologia de Análise para definição da Classificação de Risco
❑Ponto de observação: Período de tempo usado para definir a população / amostra de
modelagem.
▪ O período deve ser representativo do ambiente de pontuação atual / futuro.
▪ Somente variáveis que mostram comportamento ou características do cooperado/conta no
momento da observação ou antes disso, podem ser usadas no desenvolvimento do
modelo.
Ponto de Observação
Histórico Período de Observação
Safra < 2016 Safra > = 2016
70 % dos dados para Treinamento 30% dos dados para Validação
15. Caso: Risco de Crédito Agrícola - Metodologia
Definição de BOM ou MAU pagador derivou-se da análise de avaliação de
risco definido pelo próprio cliente, onde:
• Para valores 5, 4 e 3 da avaliação de risco, definiu-se que seria
considerado BOM pagador ➔ 0 como valor
• Para valores < 3 da avaliação de risco, definiu-se que seria considerado
MAU pagador → 1 como valor.
16. Caso: Risco de Crédito Agrícola – Modelo de Dados
Flow - H2O
17. Caso: Risco de Crédito Agrícola – Modelo de Dados
O que é
H2O?
18. Caso: Risco de Crédito
Agrícola – H2O: O que é?
H2O é uma
ferramenta Open
Source usada para
construir modelos de
dados para Machine e
Deep Learning.
19. Caso: Risco de Crédito Agrícola – H2O: Arquitetura de alto nível