TDC 2015 Big Data - Modelos Preditivos

393 visualizações

Publicada em

Apresentação realizada no TDC 2015 em Porto Alegre em 25/09/2015. Apresentação do case GVwise para a gestão da evasão e permanência.

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
393
No SlideShare
0
A partir de incorporações
0
Número de incorporações
19
Ações
Compartilhamentos
0
Downloads
4
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

TDC 2015 Big Data - Modelos Preditivos

  1. 1. Globalcode – Open4education Trilha BigData Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos Rodrigo de Moraes e Wagner Luiz Cambruzzi Mestres em Computação Aplicada
  2. 2. Globalcode – Open4education Conceitos Sistemas Preditivos
  3. 3. Globalcode – Open4education Sistemas Preditivos O que é: Um sistema preditivo é um sistema capaz de analisar dados e definir um modelo matemático da relação existente entre os dados de fatos prévios a determinados acontecimentos. Como: Através da aplicação de técnicas de Mineração de Dados e de Aprendizado de Máquina.
  4. 4. Globalcode – Open4education Mineração de Dados Processo de Descoberta do Conhecimento Processo VS. Etapa Objetivo: Extração de conhecimento não trivial através da análise e processamento de dados referentes a fatos ocorridos no passado
  5. 5. Globalcode – Open4education Mineração de Dados Tipos de aprendizado de máquina Supervisionado Não supervisionado
  6. 6. Globalcode – Open4education Mineração de Dados Tipos de aprendizado de máquina Supervisionado Aprendizado sobre dados históricos cujo o resultado de interesse é conhecido Não supervisionado Identificação de padrões semelhantes existentes nos dados, sem informação prévia de qualquer relação entre eles
  7. 7. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação
  8. 8. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Objetivo: Estimar o valor de alguma variável baseado na observação de outras variáveis Exemplo: Estimar o valor de mercado de uma casa baseado em sua metragem, número de quartos, número de banheiros e etc...
  9. 9. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering
  10. 10. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Objetivo: Encontrar agrupamentos de amostras de dados com base na semelhança dos valores de variáveis Exemplo: Identificação de diferentes perfis de consumidores, Categorias de documentos textuais...
  11. 11. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação
  12. 12. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Objetivo: Identificação de concorrência de valores de variáveis Exemplo: Correlação entre itens em compras, identificação de padrões de escrita...
  13. 13. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias
  14. 14. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Objetivo: Identificação de situações/comportamentos fora do padrão Exemplo: Fraudes em movimentações bancárias / utilização de cartões de créditos
  15. 15. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Classificação / Predição
  16. 16. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Classificação/Predição Objetivo: Identificação de padrões nos dados capazes de distinguir diferentes grupos de amostras Exemplo: Classificação de documentos, Classificação de polaridade de sentimentos, sucesso ou insucesso acadêmico
  17. 17. Globalcode – Open4education Classificadores Naïve Bayes Fonte: https://computersciencesource.wordpress.com/2010/01/28/year-2-machine-learning-naive-bayes-classifier/
  18. 18. Globalcode – Open4education Classificadores Decision Trees (Árvores de Decisão)
  19. 19. Globalcode – Open4education Classificadores Decision Trees Fonte: http://web.tecnico.ulisboa.pt/ana.freitas/bioinformatics.ath.cx/bioinformatics.ath.cx/indexf23d.html?id=199
  20. 20. Globalcode – Open4education Support Vector Machines (SVM) Classificadores
  21. 21. Globalcode – Open4education Support Vector Machines (SVM) Classificadores Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
  22. 22. Globalcode – Open4education Support Vector Machines (SVM) Fonte: https://www.youtube.com/watch?v=3liCbRZPrZA Classificadores
  23. 23. Globalcode – Open4education Support Vector Machines (SVM) Classificadores Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
  24. 24. Globalcode – Open4education Classificadores Artificial Neural Networks (ANNs)
  25. 25. Globalcode – Open4education Classificadores Artificial Neural Networks (ANNs)
  26. 26. Globalcode – Open4education Séries temporais Dados que variam “continuamente” no tempo e que cada um dos valores apresenta certa dependência em relação aos valores do passado Exemplos: Mercado Financeiro Consumo de energia elétrica Temperatura Umidade
  27. 27. Globalcode – Open4education Séries temporais
  28. 28. Globalcode – Open4education Os problemas dos dados Formato do dado / Armazenamento / Integridade Compatibilidade de histórico Alterações e migrações de sistemas Metodologia de definição de variáveis Existências de poucos dados (amostras) sobre o problema Existência de dados supervisionados Critérios de definição de classes Desbalanceamento entre classes
  29. 29. Globalcode – Open4education Estudo de caso de um sistema preditivo
  30. 30. Globalcode – Open4education Contexto
  31. 31. Globalcode – Open4education Perfil da Empresa • 28 anos de atuação; • Especialista em Sistema de Gestão Educacional; • Atuação exclusiva no segmento educacional; • 700+ clientes no Brasil; • 130+ colaboradores.
  32. 32. Globalcode – Open4education Como nasceu o projeto? • Unidade de Novos Negócios; • Problema da evasão em IES; • Projeto RHAE do CNPQ; • Grupo de Pesquisa e Mestrados; • Validação da Ideia; • Produto.
  33. 33. Globalcode – Open4education O que é o GVwise? Uma solução que atua na gestão da retenção de alunos.
  34. 34. Globalcode – Open4education Dados? Eventos Professores e Tutores AdministrativoCoordenações 2. Instituição de Ensino Ambiente Virtual de Aprendizagem 3. Dados Atendimento 1. Estudantes
  35. 35. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  36. 36. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 1 – Mapeamento de indicadores AVEA, ERP, CRM, ... Indicadores Exploração dos dados Como funciona?
  37. 37. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  38. 38. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  39. 39. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 2 - Geração e validação de padrões Definição de perfis Indicadores de estudantes (histórico) Aprovados Reprovados Evadidos Identificação dos grupos deinteresse Mineração dedados e identificação depadrões Como funciona?
  40. 40. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  41. 41. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  42. 42. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 3 - Predição e emissão de alertas Módulo de encaminhamentos Estudantes classificados conforme o risco Classificação ou prediçãoIndicadores de estudantes (atuais) Central de Atendimento Ações automáticas Equipe de Retenção Como funciona?
  43. 43. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  44. 44. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  45. 45. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 4 - Avaliação e realização de ações Analise dos estudantes em risco Realização deações Aumento da Permanência Gerência do Processo Como funciona?
  46. 46. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  47. 47. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  48. 48. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  49. 49. Globalcode – Open4education Como entregamos?  Interface de acompanhamento de uma turma
  50. 50. Globalcode – Open4education Como entregamos?  Interface de acompanhamento de uma turma
  51. 51. Globalcode – Open4education  Interface de indicadores de um estudante Como entregamos?
  52. 52. Globalcode – Open4education  Interface de acompanhamento gráfico de indicadores do estudante Como entregamos?
  53. 53. Globalcode – Open4education  Cadastro de ações Como entregamos?
  54. 54. Globalcode – Open4education  Histórico de ações Como entregamos?
  55. 55. Globalcode – Open4education Resultados de Predição 0.00% 20.00% 40.00% 60.00% 80.00% 100.00% Módulo 2 Módulo 3 Módulo 4 Módulo 5 Módulo 6 Módulo 7 Geral Evadidos Não Evadidos
  56. 56. Globalcode – Open4education  Aprovados: melhoria de 18%  Evadidos: melhoria de 25% Resultados de Retenção
  57. 57. Globalcode – Open4education Obrigado! Rodrigo de Moraes – rmoraes@gvwise.com.br Wagner Cambruzzi – wcambruzzi@gvwise.com.br

×