O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

Inteligência analítica aplicada a negócios

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Próximos SlideShares
Inteligência Analítica
Inteligência Analítica
Carregando em…3
×

Confira estes a seguir

1 de 65 Anúncio

Mais Conteúdo rRelacionado

Diapositivos para si (20)

Semelhante a Inteligência analítica aplicada a negócios (20)

Anúncio

Inteligência analítica aplicada a negócios

  1. 1. Uma Visão Atual sobre Business Intelligence Conceitos Essenciais sobre CRM Data Warehouse: A Memória da Empresa Data Mining: A Inteligência da Empresa Soluções Analíticas On-line Análises Supervisionadas e Não-Supervisionadas Análise Exploratória de Dados Análises com Machine Learning e Neural Networks Técnicas de Estimação, Segmentação e Predição Aplicações e Cases de Sucesso Bibliografia Conteúdo
  2. 2. Entrevista de Peter Drucker – o mais respeitado pensador dos negócios – concedida à Rádio Pública Nacional e publicada pela Revista Exame em 15 de Fevereiro de 2006.
  3. 3. Crescimento e Longevidade da Empresa Familiar Objetivo • Analisar o preparo das empresas familiares brasileiras para se obter ou manter o sucesso. • Avaliar como a família controladora preocupa-se com a realização de objetivos financeiros – como, por exemplo, a valorização do negócio – e com a de objetivos não financeiros – como a manutenção de um relacionamento saudável entre os vários membros da família. • Descrever e avaliar a adoção de diversas práticas associadas ao sucesso da empresa familiar. Novellino (2007, p. 13-17)
  4. 4. Uma Visão Atual sobre Business Inteligence Clientes Patrimônio Produção Crédito Vendas Business Inteligence Data Mining DataWarewouse Marketing Data Mart Finanças Data Mart Logística Data Mart Nível Operacional • OLTP • ERP • Sistemas Legados • Dados Externos Nível Warehouse • Coleta • Limpeza • Organização • Distribuição Nível Analítico • Análise • Consulta • Relatório Nível Usuário Diagnóstico Idéias Lucratividade
  5. 5. Ferramentas de Business Inteligence são ferramentas: Uma Visão Atual sobre Business Inteligence De Análise, Acessibilidade Interativa e Manipulação de informações críticas gerando conhecimento para o negócio Que propiciam insights confiáveis a partir das informações-chave da empresa, visando identificar problemas e oportunidades De apoio à decisão que é o uso explícito do conhecimento.
  6. 6. CRM é uma abordagem empresarial destinada a entender e influenciar o comportamento dos clientes, por meio de comunicações significativas para melhorar as compras, a retenção, a lealdade e a lucratividade deles. Metas estratégicas: Ampliar mercados e identificar prospects Gerar conhecimento sobre a carteira de clientes Aumentar a lucratividade de uma cadeia de valor Cliente Certo Oferta Certa Canais Certos Hora Certa O relacionamento 1:1 A premissa atual é que custa menos manter os clientes atuais do que obter novos – na realidade, cinco vezes menos. Isso requer conhecer e estabelecer um relacionamento direto, cliente a cliente. Business Inteligence Conceitos Essenciais sobre CRM
  7. 7. Estamos afogados em informação, mas morrendo de fome por conhecimento . John Naisbett “Em razão da globalização da economia, o mercado começa a exigir que alguns valores sejam resgatados. Para se tornarem mais competitivas, algumas empresas começam a diminuir a produtividade dos recursos e a valorizar o serviço ao cliente” Resende (2005, p. 3) “O relacionamento de empresas com seus clientes sofreu mudanças drásticas nos últimos anos. Não há mais como garantir um negócio com o cliente por longo tempo. Como resultado disso, muitas companhias descobriram a necessidade de entender melhor seus clientes e, rapidamente, responder aos seus desejos e necessidades” Benson, Smith & Thearling (1999, p. 4) Conceitos Essenciais sobre CRM
  8. 8. Baixo Alto Alto Definição dos objetivos de atendimento aos Clientes Campanhas de segmentação e gerenciamento de Clientes Ative e desenvolva os Clientes lucrativos Retenhas os Clientes valiosos Desenvolva e transfira os Clientes lucrativos Lealdade dos Clientes Referências de Clientes Consultor de Clientes Níveis de Foco no Cliente RetornosobreoInvestimento-ROI Swift (2000, p. 18) Conceitos Essenciais sobre CRM
  9. 9. DW Data Mining Database MarketingAplicações Analíticas Avaliando a eficiência da ação Conhecendo o perfil dos clientes e identificando públicos para as ações Refinando os critérios FontesdeDados(SistemasTransacionais) Gerenciamento de Campanhas Definindo a melhor oferta para um determinado público Detalhando a comunicação da oferta Gerando a lista-alvo Gerenciamento de Contatos Contatando o público-alvo Capturando as respostas Cliente Conceitos Essenciais sobre CRM Teixeira (2004)– Telemar
  10. 10. Base de Dados Multidimensional Base de Dados Multirelacional Data Marts Data Warehouse Sistema de Gerenciamento de Banco de Dados Meta Dados Dados Data Warehouse: A Memória da Empresa Dados Externos e Operacionais Extração Limpeza Carregando Plataforma de Gerenciamento Plataforma de Administração Repositório 1 2 3 4 5 6 Relatório, Consulta, EIS. OLAP Data Mining Aplicações & Ferramentas Sistema de Transferência de Informação Benson, Smith e Thearling ( 1999, p. 30)
  11. 11. Aplicação Prática Entender o que já conhecemos Solucionar o problema Caracterizar a situação Data Mining Data Mining: A Inteligência da Empresa O que já conhecemos determina o que podemos conhecer O termo problema está associado à dificuldade em encontrar um caminho apropriado, ou caminhos, de uma ação potencial; nunca existe uma só maneira. Uma descrição para isto é modelagem qualitativa; modelos são uma parte que acompanha a vida humana em diversas circunstâncias. Data mining é uma extensão recente de ferramentas de modelagem quantitativa, matemática e estatística; Os modelos usados em Data Mining são a estrutura do conhecimento humano. Agora falamos sobre construção de modelos apropriados. Uma vez posto o fundamento, a trama nos lança uma visão, na qual podemos determinar quais questões são significantes; isto gera um mapa que apresenta e interpreta toda a situação.
  12. 12. Uma loja de chocolates deseja conhecer melhor seus consumidores, pois seria interessante avaliar a existência de um núcleo de clientes que justificaria o investimento em chocolates finos, importados e mais caros, além dos nacionais. Podemos, a partir de dados de sistemas internos e de pesquisa de mercado, estabelecer relações matemáticas entre informações, permitindo verificar margens de lucros e previsões de vendas para esses consumidores. As pesquisas podem diminuir as incertezas em torno da estratégia empreendida, dos resultados e da situação mundial. Data Mining: A Inteligência da Empresa Público Alvo Analistas de Mercado
  13. 13. Estratégia e Tática Data Mining: A Inteligência da Empresa Data Mining é freqüentemente, usado em negócios como uma ferramenta tática. Claro que há muito valor no uso de Data Mining como ferramenta de tática. No entanto, o núcleo de processos de negócios toma lugar em nível estratégico e é o uso estratégico de Data Mining que garante o maior retorno para uma companhia. Conjunto de atividades possíveis e disponíveis em uma circunstância particular; cada atividade conduz a um resultado potencial diferente. Estratégia Indica a ação concreta que empreende alguma estratégia, tentando influenciar algum evento de ordem macro. Tática
  14. 14. Soluções Analíticas On-Line Muito do esforço humano no curso da história tem sido destinado a descobrir padrões úteis para, então, construir modelos aplicáveis em diversos problemas. Data mining é simplesmente a última linha de ferramentas para detectar padrões significativos e, conseqüentemente, melhorar o controle do mundo. Em um nível fundamental, isto é nada mais e nada menos que a busca automática de padrões em banco de dados. Pyle (2003, p. 4) Pré-processamento Extração de Padrões Pós- processamento Identificação do Problema Utilização do Conhecimento
  15. 15. Soluções Analíticas On-Line
  16. 16. Benefícios das Soluções Analíticas Avançadas Estratégicos Tático Melhoria contínua na capacidade de tomada de decisão Otimizações em Relacionamentos e Operações empresariais Ferramentas mais poderosas para o staff do conhecimento Análise Multidimensional, Otimização de performance em processos, Análise em cenários What-if , Interfaces intuitivas para usuário Funcional Vendas Marketing Finanças RH Operação TI Comportamento do cliente, Análise da equipe comercial, Análise de vendas cruzadas Participação de mercado, Efetividade de Campanhas, Ciclo de Produtos e Serviços Performance negocial, Relatórios consolidados, Planejamento e Orçamento Avaliação de Performance, Análise de compensações, Planejamento e Otimização Planejamento de Produção, Processo, Controle de Qualidade, Eficiência operacional Integração Business & E-Business, ...
  17. 17. Análises Supervisionada e Não-Supervisionada SupervisionadasNão-Supervisionadas Algumas Técnicas de Mining Mercado Telecom Financeiro Varejo Seguros Entender e reconhecer o próximo passo do clientes. Classificar diferentes grupos de clientes, produtos ou serviços por regras definidas pela ordem de importância das características estudadas. Propensão a aquisição / churn de produtos, serviços, clientes. Predizer a quantidade de vendas por produtos, clientes novos, cancelamentos, etc. Inferir sobre o tempo de vida útil do cliente e do valor do cliente (Life Time Value) Entender o perfil de cada cliente (Segmentação Mercadológica e Comportamental) Entender dos principais fatores discriminantes entre grupos de clientes. Regressão Logística Redes Neurais (RBF) Árvore de Decisão Análise Discriminante Análise de Sobrevivência Análise de Cluster (K-Means, SOM) Árvore de Classificação Análise de Associação Análise de Séries Temporais CPqD – Centro de Pesquisas e Desenvolvimentos em Telecomunicações ( 2003)
  18. 18. Astarefas:oquefazer? Tarefas e Técnicas As técnicas: como fazer?
  19. 19. Análises com Machine Learning e Neural Network Especificação do Problema nnmnnn m yxxxT yxxxT yxxxT YXXX      21 22322212 11312111 21 Aprendizado de Máquina Classificador Dados Brutos Avaliação Especialista Variável Dependente (Classe) Variável Independente (Atributos) Conhecimento do domínio Conhecimento do domínio Monard e Baranauskas (2005, p. 92) Máquina de Aprendizagem é uma área de Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre o aprendizado bem como a construção de sistemas capazes de adquirir conhecimento de forma automática. A decisão é tomada baseada em experiências acumuladas por meio da solução bem-sucedida de problemas anteriores. Monard e Baranauskas (2005, p. 89)
  20. 20. Análises com Machine Learning e Neural Network Árvore de Classificação para Concessão de Crédito 1 2 3 4 5 6 7 Credito<=593,89 Fundos<=11694, Credito<=546,84 385 115 369 16 9 7 Aprovado Aprovado Reprovado Aprovado Aprovado Aprovado Reprovado Reprovado Aprovado Imagine a situação em que desejamos entender como uma decisão de concessão de crédito é tomada sobre a observação de concessões feitas no passado. O gráfico acima foi gerado a partir de 500 registros de concessões de uma empresa. Concessão de Crédito
  21. 21. Análises com Machine Learning e Neural Network Web graph Node size: Relative support of each item Line thickness: Relative joint support of two items Color darkness of line: Relative lift of two items 0,000 1,163 Pizza Seafood DOM_SEDN DOM_SPRTGender==Male Hamburger EXT_SPRT Other Mexican EXT_SEDN Sandw iches Chinese Chicken
  22. 22. Redes Neurais Artificiais são capazes de resolver, basicamente, problemas de aproximação, predição, classificação, categorização e otimização. Aplicações conhecidas de Redes Neurais como reconhecimento de caracteres, reconhecimento de voz, predição de séries temporais, modelagem de processos, controle, entre outras, são na verdade novas formas de apresentação destas classes de problemas. Análises com Machine Learning e Neural Network
  23. 23. JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN195 MAY19 SEP195 JAN196 MAY19 SEP196 0 100 200 300 400 500 600 700 Variável Original Rede Neural Análises com Machine Learning e Neural Network Análise de Previsão de Reservas de Passagens Aéreas
  24. 24. Aplicações e Cases de Sucesso Transações Bancárias Registros de Compras Perfil de Uso da Internet Informações de Satélite Rotas de Transporte Medidas de Produção Informações Integradas Códigos de Barra A coleta de dados tem atingido grandes proporções: a cada 20 meses a quantidade de informações no mundo dobra. E a questão agora é: Quanto de conhecimento novo temos obtido? O novo conhecimento ou KDD – Knowledge Discovery in Databases – visa otimizar e automatizar o processo de descrição das tendências e dos padrões contidos neste processo, potencialmente úteis e interpretáveis.
  25. 25. Análise de Churn Telefonia Celular Aplicações e Cases de Sucesso
  26. 26. Aplicações e Cases de Sucesso Enquanto empresas como as de Cartão de Crédito, esforçam-se para manter taxas de Churn de clientes em 0,4% ao mês, as companhias de telefonia celular chegam a pouco mais que 2,2% ao mês, em média, no mundo. Isso significa que 27% da carteira de clientes é perdida anualmente na renovação de contratos. Uma companhia de pesquisa em Análise de Churn/Attrition, a J. D. Power and Associates, estima que 90% de usuários de celulares mudaram de operadora nos últimos 5 anos. Perder um cliente gera grande despesa, visto que o custo para adquirir novos clientes envolve trabalho de vendas, marketing, publicidade e comissões. E muitos desses novos clientes são menos lucrativos que os que foram perdidos.
  27. 27. Razão de CHURN por novos clientes 0% 10% 20% 30% 40% 50% 60% 70% 80% 1 2 3 4 5 6 7 8 9 10 Período de tempo Clientesperdidospornovosclientes Amadurecimento do mercado de TELCO Dados reais de uma empresa de telecomunicações Norte Americana. Aplicações e Cases de Sucesso
  28. 28. Curto prazo: Identificar os prováveis “churners ” dos próximos dias e abordá-los via Telemarketing Médio prazo: Capacitar usuários para utilização e interpretação dos modelos de Data Mining para análise de CHURN. Longo prazo: Incorporar os modelos de Data Mining à solução integrada de CRM. Aplicações e Cases de Sucesso
  29. 29. Retorno do Investimento Instante t: número de clientes: nt receita média por cliente: r receita total: Rt = nt * r Instante t + 1: número de novos clientes: nn número de “churners”: nc receita total: Rt +1 = (nt + nn – nc) * r Aplicações e Cases de Sucesso
  30. 30. Suponha que o número de novos clientes seja duas vezes maior do que o número de “churners”, ou seja: nn = 2 * nc Então, a receita total no instante t + 1 será Rt + 1 = (nt + nn – nc) * r = (nt + 0,5 * nn) * r (1) Suponha que, com a implementação de Data Mining, consigamos reduzir em 30% o número de “churners”. Então, Rt + 1 = (nt + 0,65 * nn) * r (2) Aplicações e Cases de Sucesso
  31. 31. Suponha uma empresa de telecomunicações com as seguintes características com respeito à telefonia móvel, sistema pós-pago: nt = 500.000 r = R$ 50,00 nn = 5.000 t = 1 mês Então, Rt = nt * r = R$ 25.000.000,00. volta Ganho de receita em 1 mês: R$ 37.500,00 Ganho de receita em 12 meses: R$ 450.000,00 Aplicando (1): Rt +1 = R$ 25.125.000,00 Aplicando (2): Rt +1 = R$ 25.162.500,00 Aplicações e Cases de Sucesso
  32. 32. Aplicações e Cases de Sucesso Vejamos um estudo de caso sobre este tema. Coletamos dados de 260 mil usuários da Companhia TelCom S.A. O objetivo é encontrar um modelo que prediga os possíveis Churners com os dados fornecidos do mês de Agosto/2005 e aplicar o modelo encontrado no mês de Setembro/2005. O modelo utilizado é um algoritmo de Data Mining, CART – Classification and Regression Trees –, a técnica executa uma mineração diretamente dentro da base de dados relacional Informação Demográfica Dados do Cliente Call Center Serviço de Atendimento ao Cliente Base de Dados para Análise
  33. 33. Aplicações e Cases de Sucesso Tree 1 graph for TMM5 Num. of non-terminal nodes: 10, Num. of terminal nodes: 11 ID=1 N=36 Mu=67,027778 Var=4368,527006 ID=2 N=24 Mu=24,416667 Var=456,576389 ID=4 N=21 Mu=17,142857 Var=91,265306 ID=6 N=15 Mu=11,866667 Var=13,182222 ID=8 N=11 Mu=10,000000 Var=3,636364 ID=11 N=7 Mu=11,285714 Var=1,061224 ID=7 N=6 Mu=30,333333 Var=42,888889 ID=3 N=12 Mu=152,250000 Var=1298,187500 ID=17 N=8 Mu=173,625000 Var=510,234375 ID=18 N=7 Mu=166,571429 Var=185,102041 ID=10 N=4 Mu=7,750000 Var=0,187500 ID=12 N=3 Mu=12,333333 Var=0,222222 ID=13 N=4 Mu=10,500000 Var=0,250000 ID=9 N=4 Mu=17,000000 Var=3,500000 ID=14 N=5 Mu=27,800000 Var=12,960000 ID=15 N=1 Mu=43,000000 Var=0,000000 ID=5 N=3 Mu=75,333333 Var=50,888889 ID=16 N=4 Mu=109,500000 Var=132,750000 ID=20 N=2 Mu=147,500000 Var=2,250000 ID=21 N=5 Mu=174,200000 Var=54,560000 ID=19 N=1 Mu=223,000000 Var=0,000000 TMI <= 66,500000 > 66,500000 MAT <= 65,000000 > 65,000000 TMI <= 17,500000 > 17,500000 TMI <= 10,500000 > 10,500000 TMI <= 7,500000 > 7,500000 N_M <= 86,850000 > 86,850000 TMI <= 29,000000 > 29,000000 TMI <= 86,000000 > 86,000000 TMI <= 124,500000 > 124,500000 TMI <= 101,000000 > 101,000000
  34. 34. Aplicações e Cases de Sucesso Resultados: O modelo de Árvore de Decisão identificou 21 segmentos dentro dos 260 mil clientes. No segmento 10, por exemplo, foi identificado para o mês de Agosto 1161 clientes pertinentes a esse segmento, destes houve uma taxa de Churn de cerca de 84%, as características dos clientes que pertenciam ao segmento 10 eram: Contrato tipo Meus Minutos; Duração do serviço é menor que 23 meses; Duração do serviço de Roaming é por tempo maior que 9 meses; O assinante contratou uma das 13 tarifas; Ao aplicar o modelo encontrado para o mês de Setembro (com cerca de 280 mil clientes), o segmento 10 alcançou o número de 403 clientes.
  35. 35. Aplicações e Cases de Sucesso Segmento Propensão de Churn Base do Segmento Volume de Churn Base Acumulada Churn Acumulado Percentual Acumulado de Churn Percentual Acumulado de Base 10 83,72 403 337 403 337 1,2 0,1 1 64,78 360 233 763 571 2,0 0,3 13 60,66 4249 2.577 5.012 3.148 11,1 1,8 4 53,61 227 122 5.239 3.270 11,6 1,9 18 50,22 7502 3.768 12.741 7.037 24,9 4,5 21 44,08 1840 811 14.581 7.848 27,7 5,2 16 32,15 649 209 15.230 8.057 28,5 5,4 13 28,54 1705 487 16.935 8.544 30,2 6,0 17 27,08 572 155 17.507 8.698 30,8 6,2 20 26,60 1696 451 19.203 9.150 32,3 6,8 19 26,04 5369 1.398 24.572 10.548 37,3 8,7 9 25,56 2955 755 27.527 11.303 40,0 9,8 8 21,11 2125 449 29.652 11.752 41,5 10,5 2 20,36 964 196 30.616 11.948 42,2 10,9
  36. 36. Aplicações e Cases de Sucesso Um esforço foi desempenhado sobre um grupo que representa os 5,2% acumulado dos dados originais que, equivalentemente, correspondia a 27,7% de possíveis Churners. Uma campanha em dois canais de comunicação foi direcionada para estes clientes que atenderam com um retorno de 21% de renovação de contratos. Esse resultado perdurou por 2 meses e, no seguinte, o número de respondentes das campanhas empregadas decresceu e um novo modelo foi adaptado. Note que para o segmento 10, no mês de Agosto, tinha um total de 1161 clientes, mas no mês de Setembro, eram apenas 403. Isso mostra que a indicação de um cliente em um determinado grupo muda rapidamente, logo o modelo tem uma vida curta.
  37. 37. Pesquisa de Mercado Segmentação Aplicações e Cases de Sucesso
  38. 38. Aplicações e Cases de Sucesso “A Hallmark tem um cartão para todo tipo de pessoa e toda ocasião. A líder no mercado de cartões divide rigorosamente o mercado consumidor a fim de identificar segmentos e nichos para novos produtos e linhas de produtos. Seus profissionais de marketing segmentam por raça, religião, ocasião, idade, nacionalidade, sensibilidade ao preço e outras variáveis.” “Por exemplo, a marca Hallmark Em Español dispõe de mais de mil cartões elaborados para hispno-americanos; a marca Tree of Live é voltada para norte-americanos de origem judaica; a marca Fresh Ink é direcionada para mulheres entre 18 e 39 anos, e a marca Warn Wishes – cujos cartões custam 99 centavos de dólar – concentra-se nos compradores sensíveis ao preço.” Kotler (2005, p. 182)
  39. 39. Aplicações e Cases de Sucesso O marketing direcionado envolve três atividades: Segmentação de Mercado Identificação de Mercado Posicionamento de Mercado
  40. 40. Aplicações e Cases de Sucesso PrincipaisVariáveisdeSegmentação GeográficaDemográficaPsicográficaComportamental Região Porte de cidade ou região metropolitana Densidade Área Idade, Tamanho e Ciclo de vida da família Sexo e Renda Ocupação e Grau de Instrução Religião, Nacionalidade, Classe Social Estilo de Vida Personalidade Valores Cultura O objetivo básico da segmentação é concentrar esforços de marketing em determinados alvos, que a empresa entende como favoráveis para serem explorados comercialmente, em decorrência de sua capacidade de satisfazer a demanda dos focos, de maneira mais adequada. Ocasiões, Benefícios e Status de usuário Índice de utilização e Status de fidelidade Estágio de prontidão Atitude em relação ao produto
  41. 41. Aplicações e Cases de Sucesso Executamos uma pesquisa para avaliar como o cliente, sob certas condições, escolhe um tipo de carro entre aqueles de origem: Americana Européia Japonesa Com tamanhos: Pequeno, Média e Grande; e tipo: Familiar, Esporte e de Trabalho. Avaliamos questões simples em relação aos clientes, tais como: Casa: Própria ou Alugada; Sexo: Masculino e Feminino; Renda: 1 Renda ou 2 Rendas por família; Estado Civil: Solteiro com filhos, Casado com filhos, Solteiro e Casado
  42. 42. Aplicações e Cases de Sucesso
  43. 43. Aplicações e Cases de Sucesso 2D Plot of Row and Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 9 x 4 Standardization: Row and column profiles Americano:Pequeno Americano:Médio Americano:GrandeJaponês:Pequeno Japonês:Médio Japonês:Grande Europeu:Pequeno Europeu:Médio Europeu:Grande Solteiro com Filhos Casado com Filhos Solteiro Casado -0,4 -0,3 -0,2 -0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 Dimension 1; Eigenvalue: ,04844 (67,74% of Inertia) -0,3 -0,2 -0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 Dimension2;Eige Row.Coords Col.Coords
  44. 44. Aplicações e Cases de Sucesso
  45. 45. Text Mining Busca de Padrão de Comportamento de Usuários na Internet Aplicações e Cases de Sucesso
  46. 46. Aplicações e Cases de Sucesso Gramática Radical Origem Extração de Conhecimento Sumarização Categorização Clustering Tarefas de mineração de textos Extração Recuperação da Informação Preparação dos Dados Ebecken, Lopes e Costa (2005, p. 339) Mineração de Textos é um conjunto de técnicas e processos que descobrem conhecimento inovador nos textos. Ela está sendo empregada atualmente em projetos de diversas áreas, incluindo a operações internas do mundo dos negócios.
  47. 47. Extraindo “reviews” do website www.carreview.com Não Estruturados Estruturados Aplicações e Cases de Sucesso
  48. 48. Passo 1 – Extração de Palavras Extração de palavras dos textos Refinar o processo de “filtragem” do texto • Parsing, Stubbing, Stemming, etc. (Algorítimos) Aplicações e Cases de Sucesso
  49. 49. Passo 2 – Transformação de Palavras Transformamos contagens de palavras em índices que reflitam a importância relativa das palavras. Várias aplicações disponíveis no STATISTICA Text Miner: Inversão de freqüência de documentos, freqüência Log , freqüência Binária, etc. Aplicações e Cases de Sucesso
  50. 50. Passo 3 – Indexar Semântica Latente Número Total de palavras extraídas foram em torno de 300. Redução da dimensionalidade global da matriz de entrada (número de entradas de documentos X número de palavras extraídas). Identificar dimensões “ocultas” ou “subjacentes” (ou significâncias) descritas ou discutidas pelos documentos de entrada. Singular Value Decomposition Aplicações e Cases de Sucesso
  51. 51. Mapa Perceptual – Espaço Semântico Aplicações e Cases de Sucesso
  52. 52. Esta ferramenta identifica automaticamente as melhores preditoras para a palavra “Transmission”. Pode-se notar que carzz é uma das palavras mais proximamente “Transmission” nestes documentos. Feature Selection Do Text Mining para o Data Mining Aplicações e Cases de Sucesso
  53. 53. Interactive Trees Aplicações e Cases de Sucesso Siga a “trilha” desta Árvore de Decisão para identificar as palavras que discriminam entre diferentes tipos de carros.
  54. 54. Gráfico de Interação: Car Type × Negative connotation words Aplicações e Cases de Sucesso
  55. 55. Data Mining Credit Scoring Aplicações e Cases de Sucesso
  56. 56. Objetivo: Fornecer subsídios para melhoria no controle de concessão de crédito por meio de modelos matemáticos de previsão de risco de inadimplência e credit score. Aplicações e Cases de Sucesso
  57. 57. Potencialidades: • Avaliação do risco de concessão de crédito. • Identificação de nichos de mercado preferenciais para concessão de crédito. • Informações para campanhas direcionadas de recuperação de crédito. • Informações para campanhas de prevenção à inadimplência. Aplicações e Cases de Sucesso
  58. 58. Desempenho do modelo matemático Calcula a probabilidade de uma operação de crédito entrar em inadimplência através de tratamento estatístico das informações contidas no histórico da base de dados. Probabilidade de inadimplência0 100% A probabilidade é obtida por meio de uma equação com coeficientes aplicados às variáveis que explicam a inadimplência. Os coeficientes são calculados através de procedimentos de inferência estatística. Aplicações e Cases de Sucesso
  59. 59. 0 100% alto riscobaixo risco ponto de cortenichos preferenciais Escala de risco de inadimplência (Probabilidade) fácil recuperação difícil recuperação Aplicações e Cases de Sucesso
  60. 60. Aplicações e Cases de Sucesso
  61. 61. Mas o ponto crítico é quando o banco empresta para alguém que tem grande chance de não pagar. O banco tem uma lista de 252 inadimplentes, dos quais 196 (78%) foram identificadas pelo modelo. Dentre as 1000 operações envolvendo valores no total de R$ 10.827.831,00, 260 contrastes foram identificados pelo modelo, cuja soma em moeda é de R$ 3.113.403,00 Aplicações e Cases de Sucesso
  62. 62. Resultado R$ 704.801,30 Valor total da inadimplência identificado pelo modelo Valor total da InadimplênciaR$ 3.171.605,25 R$ 2.466.804,98 Aplicações e Cases de Sucesso
  63. 63. Bibliografia Swift, R. CRM, customer relationship management: o revolucionário marketing de relacionamentos com o cliente. Rio de Janeiro: Campus, 2001. Rezende, S. O. (Coord.). Sistemas Inteligentes: Fundamentos e Aplicações. Barueri-SP: Manole, 2005. Monard, M.C. & Baranauskas, J. A. Conceitos sobre Aprendizado de Máquina. In: Rezende, S. O. (Coord.). Sistemas Inteligentes: Fundamentos e Aplicações, Barueri: Manole, 2005. p. 81-104. Novellino, A..Crescimento e Longevidade da Empresa Familiar, São Paulo, 2007. Trabalho disponível no site: www.prosperarebrasil.com.br . Ebecken, N. F. F., Lopes, M. C. S. & Costa, M. C. Mineração de Textos. In: Rezende, S. O. (Coord.). Sistemas Inteligentes: Fundamentos e Aplicações, Barueri: Manole, 2005. p. 337- 372. Pyle, D. Business Modeling and Data Mining. San Francisco: Morgan Kaufmann Publishers, 2003. Berry, M. J. A. & Linoff, G. S. Data Mining Techniques. Indianapolis, Indiana: Wiley Publishing, 2004. Kotler, P. Marketing essencial: conceitos, estratégias e casos. São Paulo: Prentice Hall, 2005. Berson, A., Smith, S. & Thearling, K. Building Data Mining Applications for CRM.
  64. 64. Facebook.com/iminersolutions twitter.com/iminersolutions iminer@iminer.com.br +55 11 3996 4226

×