SlideShare uma empresa Scribd logo
1 de 35
Baixar para ler offline
Workshops
Ciência de Dados na PráticaPatrocínio:
Apoio: Organização:
Análise de Riscos no Agronegócio
Edileusa Estefani Prado
Cientista de Dados, Professora, mestranda em Métodos Quantitativos na FEA-USP;
MBA em Analytics e Big Data (FIA); Pós-Graduação em Consultoria em Internet (FASP);
Bacharel em Ciências da Computação (UNESP)
Análise de Riscos no Agronegócio - Objetivo
Através de um Caso de
Risco de Crédito Agrícola,
demonstrar os passos
efetuados em Ciências de
Dados, para se obter um
modelo de crédito score
usando machine learning.
Caso: Risco de Crédito Agrícola - Problema
Grande
Cooperativa
Agrícola
Problema
de
Negócio
➢Pico de Requisições (90 Dias)
➢Tempo de Avaliação (5h/Análise)
➢Volume de Concedido (R$ 1,13Bi)
➢Nível de Inadimplência (> 2%)
Caso: Risco de Crédito Agrícola - Roadmap
Caso: Risco de Crédito Agrícola - Arquitetura
Caso: Risco de Crédito Agrícola - Exploração
Caso: Risco de Crédito Agrícola – Junção e Agregação
Processo de integração das tabelas para exploração
dos dados
Caso: Risco de Crédito Agrícola - Tratamento
Caso: Risco de Crédito Agrícola - Tratamento
Caso: Risco de Crédito Agrícola – Qualidade dos Dados
Fermento
vencido
no bolo?
Bolo
não
cresce
Caso: Risco de Crédito Agrícola – Qualidade dos Dados
BAD DATA
Descritiva
O que
aconteceu?
Preditiva
O que
acontecerá
Prescritiva
O que
deveria
acontecer
Analytics
Caso: Risco de Crédito Agrícola – Seleção de Variáveis
Utilizadas 42 variáveis da base de dados da Cooperativa, destacando àquelas com
maior peso na classificação de risco:
Variáveis Financeiras
▪ Código do Cooperado
▪ Limite do empréstimo (Histórico por Safra / Mediana)
▪ Uso do empréstimo (%)
▪ Área de Produção (propriedade + arrendamento)
▪ Capacidade Produtiva (Histórico Safra / entrega)
▪ Débitos da Terceira Parte (Classificação por Safra /
proporcional)
▪ Renegociação(Classificação por Safra)
▪ Histórico Inadimplência (Classificação conforme
Safra)
▪ Garantias (S / N => 1 / 2)
Variáveis Cadastrais
▪ Código do Cooperado
▪ Idade (em anos)
▪ Sexo
▪ Estado Civil
▪ Dependentes (quantidade)
▪ Tempo como cooperado(total anos)
▪ Tipo de Atividade(class. Cooperativa)
Caso: Risco de Crédito Agrícola - Metodologia
Metodologia de Análise para definição da Classificação de Risco
❑Ponto de observação: Período de tempo usado para definir a população / amostra de
modelagem.
▪ O período deve ser representativo do ambiente de pontuação atual / futuro.
▪ Somente variáveis que mostram comportamento ou características do cooperado/conta no
momento da observação ou antes disso, podem ser usadas no desenvolvimento do
modelo.
Ponto de Observação
Histórico Período de Observação
Safra < 2016 Safra > = 2016
70 % dos dados para Treinamento 30% dos dados para Validação
Caso: Risco de Crédito Agrícola - Metodologia
Definição de BOM ou MAU pagador derivou-se da análise de avaliação de
risco definido pelo próprio cliente, onde:
• Para valores 5, 4 e 3 da avaliação de risco, definiu-se que seria
considerado BOM pagador ➔ 0 como valor
• Para valores < 3 da avaliação de risco, definiu-se que seria considerado
MAU pagador → 1 como valor.
Caso: Risco de Crédito Agrícola – Modelo de Dados
Flow - H2O
Caso: Risco de Crédito Agrícola – Modelo de Dados
O que é
H2O?
Caso: Risco de Crédito
Agrícola – H2O: O que é?
H2O é uma
ferramenta Open
Source usada para
construir modelos de
dados para Machine e
Deep Learning.
Caso: Risco de Crédito Agrícola – H2O: Arquitetura de alto nível
Caso: Risco de Crédito Agrícola – H2O: Clientes
Caso: Risco de Crédito Agrícola – H2O: Parse - Train
Caso: Risco de Crédito Agrícola – H2O: Parse - Train
Caso: Risco de Crédito Agrícola – H2O: Parse - Validation
Caso: Risco de Crédito Agrícola – H2O: Parse - Validation
Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação
Modelo Random Forest
Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação
Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação
Caso: Risco de Crédito Agrícola – H2O: Previsão
Caso: Risco de Crédito Agrícola – H2O: Previsão
Caso: Risco de Crédito Agrícola – H2O: Previsão - Probabilidades
Caso: Risco de Crédito Agrícola – Comparativo
Caso: Risco de Crédito Agrícola – Resultado (Estimativa)
Caso: Risco de Crédito Agrícola – Consequência
MAU BOM
Cooperativa e
Cooperados
felizes
Q & A
FIM

Mais conteúdo relacionado

Semelhante a Análise de Risco no Agronegócio com Machine Learning

Aula 02 giovanni --dcbd
Aula 02   giovanni --dcbdAula 02   giovanni --dcbd
Aula 02 giovanni --dcbdgtiprotec
 
Sistema de Gestão de Risco - Implantação
Sistema de Gestão de Risco - ImplantaçãoSistema de Gestão de Risco - Implantação
Sistema de Gestão de Risco - ImplantaçãoAndré Santos
 
Insurance Service Meeting 2016 – Ricardo Lachac
Insurance Service Meeting 2016 – Ricardo LachacInsurance Service Meeting 2016 – Ricardo Lachac
Insurance Service Meeting 2016 – Ricardo LachacCNseg
 
Tecnologia analítica para a indústria de crédito e cobrança
Tecnologia analítica para a indústria de crédito e cobrançaTecnologia analítica para a indústria de crédito e cobrança
Tecnologia analítica para a indústria de crédito e cobrançaLeonardo Couto
 
Proposta de Modelo de Classificação de Riscos de Contratos Públicos
Proposta de Modelo de Classificação de Riscos de Contratos PúblicosProposta de Modelo de Classificação de Riscos de Contratos Públicos
Proposta de Modelo de Classificação de Riscos de Contratos PúblicosRommel Carvalho
 
Análise e gestão do risco
Análise e gestão do riscoAnálise e gestão do risco
Análise e gestão do riscoXikkoRibeiro
 
Uma experiência em gestão de risco sócio-ambiental
Uma experiência em gestão de risco sócio-ambientalUma experiência em gestão de risco sócio-ambiental
Uma experiência em gestão de risco sócio-ambientalBeefPoint
 
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da Aplicação
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da AplicaçãoGerenciamento de Riscos e Projetos - Boas Práticas e Desafios da Aplicação
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da AplicaçãoGUGP SUCESU-RS
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
Poder do Estatístico na Era da Ciência de Dados
Poder do Estatístico na Era da Ciência de DadosPoder do Estatístico na Era da Ciência de Dados
Poder do Estatístico na Era da Ciência de DadosMarcelo Fernandes
 
Continuidade de Negócios Aplicada a Cadeia de Suprimentos
Continuidade de Negócios Aplicada a Cadeia de SuprimentosContinuidade de Negócios Aplicada a Cadeia de Suprimentos
Continuidade de Negócios Aplicada a Cadeia de SuprimentosTiago Kiill
 
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...Anderson Pinho
 
Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Daniela Brauner
 

Semelhante a Análise de Risco no Agronegócio com Machine Learning (20)

jjjjjjjjjjjjjjj
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
jjjjjjjjjjjjjjj
 
Aula 02 giovanni --dcbd
Aula 02   giovanni --dcbdAula 02   giovanni --dcbd
Aula 02 giovanni --dcbd
 
Sistema de Gestão de Risco - Implantação
Sistema de Gestão de Risco - ImplantaçãoSistema de Gestão de Risco - Implantação
Sistema de Gestão de Risco - Implantação
 
Insurance Service Meeting 2016 – Ricardo Lachac
Insurance Service Meeting 2016 – Ricardo LachacInsurance Service Meeting 2016 – Ricardo Lachac
Insurance Service Meeting 2016 – Ricardo Lachac
 
Tecnologia analítica para a indústria de crédito e cobrança
Tecnologia analítica para a indústria de crédito e cobrançaTecnologia analítica para a indústria de crédito e cobrança
Tecnologia analítica para a indústria de crédito e cobrança
 
Gestão de riscos
Gestão de riscosGestão de riscos
Gestão de riscos
 
Lecture 3 :: Análise e Gestão de Risco
Lecture 3 :: Análise e Gestão de RiscoLecture 3 :: Análise e Gestão de Risco
Lecture 3 :: Análise e Gestão de Risco
 
Six Sigma
Six SigmaSix Sigma
Six Sigma
 
Proposta de Modelo de Classificação de Riscos de Contratos Públicos
Proposta de Modelo de Classificação de Riscos de Contratos PúblicosProposta de Modelo de Classificação de Riscos de Contratos Públicos
Proposta de Modelo de Classificação de Riscos de Contratos Públicos
 
Análise e gestão do risco
Análise e gestão do riscoAnálise e gestão do risco
Análise e gestão do risco
 
Uma experiência em gestão de risco sócio-ambiental
Uma experiência em gestão de risco sócio-ambientalUma experiência em gestão de risco sócio-ambiental
Uma experiência em gestão de risco sócio-ambiental
 
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da Aplicação
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da AplicaçãoGerenciamento de Riscos e Projetos - Boas Práticas e Desafios da Aplicação
Gerenciamento de Riscos e Projetos - Boas Práticas e Desafios da Aplicação
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
Linear - Softwares Matemáticos
Linear - Softwares Matemáticos Linear - Softwares Matemáticos
Linear - Softwares Matemáticos
 
Poder do Estatístico na Era da Ciência de Dados
Poder do Estatístico na Era da Ciência de DadosPoder do Estatístico na Era da Ciência de Dados
Poder do Estatístico na Era da Ciência de Dados
 
Transformando Riscos em Oportunidades de Negócio
Transformando Riscos em Oportunidades de NegócioTransformando Riscos em Oportunidades de Negócio
Transformando Riscos em Oportunidades de Negócio
 
Continuidade de Negócios Aplicada a Cadeia de Suprimentos
Continuidade de Negócios Aplicada a Cadeia de SuprimentosContinuidade de Negócios Aplicada a Cadeia de Suprimentos
Continuidade de Negócios Aplicada a Cadeia de Suprimentos
 
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...
Previsão de Inadimplência por Redes Neurais Artificiais na Presença de Baixo ...
 
Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Business Analytics - Data Science Processes
Business Analytics - Data Science Processes
 
Palestra do Meio-Dia “O mercado segurador brasileiro em 2013 e perspectivas p...
Palestra do Meio-Dia “O mercado segurador brasileiro em 2013 e perspectivas p...Palestra do Meio-Dia “O mercado segurador brasileiro em 2013 e perspectivas p...
Palestra do Meio-Dia “O mercado segurador brasileiro em 2013 e perspectivas p...
 

Análise de Risco no Agronegócio com Machine Learning

  • 1. Workshops Ciência de Dados na PráticaPatrocínio: Apoio: Organização:
  • 2. Análise de Riscos no Agronegócio Edileusa Estefani Prado Cientista de Dados, Professora, mestranda em Métodos Quantitativos na FEA-USP; MBA em Analytics e Big Data (FIA); Pós-Graduação em Consultoria em Internet (FASP); Bacharel em Ciências da Computação (UNESP)
  • 3. Análise de Riscos no Agronegócio - Objetivo Através de um Caso de Risco de Crédito Agrícola, demonstrar os passos efetuados em Ciências de Dados, para se obter um modelo de crédito score usando machine learning.
  • 4. Caso: Risco de Crédito Agrícola - Problema Grande Cooperativa Agrícola Problema de Negócio ➢Pico de Requisições (90 Dias) ➢Tempo de Avaliação (5h/Análise) ➢Volume de Concedido (R$ 1,13Bi) ➢Nível de Inadimplência (> 2%)
  • 5. Caso: Risco de Crédito Agrícola - Roadmap
  • 6. Caso: Risco de Crédito Agrícola - Arquitetura
  • 7. Caso: Risco de Crédito Agrícola - Exploração
  • 8. Caso: Risco de Crédito Agrícola – Junção e Agregação Processo de integração das tabelas para exploração dos dados
  • 9. Caso: Risco de Crédito Agrícola - Tratamento
  • 10. Caso: Risco de Crédito Agrícola - Tratamento
  • 11. Caso: Risco de Crédito Agrícola – Qualidade dos Dados Fermento vencido no bolo? Bolo não cresce
  • 12. Caso: Risco de Crédito Agrícola – Qualidade dos Dados BAD DATA Descritiva O que aconteceu? Preditiva O que acontecerá Prescritiva O que deveria acontecer Analytics
  • 13. Caso: Risco de Crédito Agrícola – Seleção de Variáveis Utilizadas 42 variáveis da base de dados da Cooperativa, destacando àquelas com maior peso na classificação de risco: Variáveis Financeiras ▪ Código do Cooperado ▪ Limite do empréstimo (Histórico por Safra / Mediana) ▪ Uso do empréstimo (%) ▪ Área de Produção (propriedade + arrendamento) ▪ Capacidade Produtiva (Histórico Safra / entrega) ▪ Débitos da Terceira Parte (Classificação por Safra / proporcional) ▪ Renegociação(Classificação por Safra) ▪ Histórico Inadimplência (Classificação conforme Safra) ▪ Garantias (S / N => 1 / 2) Variáveis Cadastrais ▪ Código do Cooperado ▪ Idade (em anos) ▪ Sexo ▪ Estado Civil ▪ Dependentes (quantidade) ▪ Tempo como cooperado(total anos) ▪ Tipo de Atividade(class. Cooperativa)
  • 14. Caso: Risco de Crédito Agrícola - Metodologia Metodologia de Análise para definição da Classificação de Risco ❑Ponto de observação: Período de tempo usado para definir a população / amostra de modelagem. ▪ O período deve ser representativo do ambiente de pontuação atual / futuro. ▪ Somente variáveis que mostram comportamento ou características do cooperado/conta no momento da observação ou antes disso, podem ser usadas no desenvolvimento do modelo. Ponto de Observação Histórico Período de Observação Safra < 2016 Safra > = 2016 70 % dos dados para Treinamento 30% dos dados para Validação
  • 15. Caso: Risco de Crédito Agrícola - Metodologia Definição de BOM ou MAU pagador derivou-se da análise de avaliação de risco definido pelo próprio cliente, onde: • Para valores 5, 4 e 3 da avaliação de risco, definiu-se que seria considerado BOM pagador ➔ 0 como valor • Para valores < 3 da avaliação de risco, definiu-se que seria considerado MAU pagador → 1 como valor.
  • 16. Caso: Risco de Crédito Agrícola – Modelo de Dados Flow - H2O
  • 17. Caso: Risco de Crédito Agrícola – Modelo de Dados O que é H2O?
  • 18. Caso: Risco de Crédito Agrícola – H2O: O que é? H2O é uma ferramenta Open Source usada para construir modelos de dados para Machine e Deep Learning.
  • 19. Caso: Risco de Crédito Agrícola – H2O: Arquitetura de alto nível
  • 20. Caso: Risco de Crédito Agrícola – H2O: Clientes
  • 21. Caso: Risco de Crédito Agrícola – H2O: Parse - Train
  • 22. Caso: Risco de Crédito Agrícola – H2O: Parse - Train
  • 23. Caso: Risco de Crédito Agrícola – H2O: Parse - Validation
  • 24. Caso: Risco de Crédito Agrícola – H2O: Parse - Validation
  • 25. Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação Modelo Random Forest
  • 26. Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação
  • 27. Caso: Risco de Crédito Agrícola – H2O: Métricas de Validação
  • 28. Caso: Risco de Crédito Agrícola – H2O: Previsão
  • 29. Caso: Risco de Crédito Agrícola – H2O: Previsão
  • 30. Caso: Risco de Crédito Agrícola – H2O: Previsão - Probabilidades
  • 31. Caso: Risco de Crédito Agrícola – Comparativo
  • 32. Caso: Risco de Crédito Agrícola – Resultado (Estimativa)
  • 33. Caso: Risco de Crédito Agrícola – Consequência MAU BOM Cooperativa e Cooperados felizes
  • 34. Q & A
  • 35. FIM