SlideShare uma empresa Scribd logo
1 de 73
Baixar para ler offline
Data Warehouse
              &
    Data Mining
    Bruno Machado
 Jerônimo Madruga
Sumário

 Sistemas de apoio à decisão
 Data Warehouse
 Data Mining
Sistemas de apoio à decisão
Sistemas de apoio à decisão

 Informação
   Recurso mais importante para uma empresa tomar
   decisões estratégicas
   Obtida pela análise de dados históricos de venda,
   produção, clientes, etc...
 Análise de dados
   Responsável por fornecer as informações vitais para a
   empresa
   Pode aumentar a competitividade de uma empresa
   Era realizada de forma intuitiva pelos gerentes
Sistemas de apoio à decisão

 Dificuldades para obter informação
   Quantidade de dados a serem analisados cresce
   com a expansão do negócio e com o passar dos
   anos
   Dados conflitantes vindos de fontes diferentes
   podem gerar informações desencontradas
   Impossível para um ser humano manter e analisar
   todos os dados
   Informação não é mais mantida por gerentes devido
   à mobilidade no mercado de trabalho
Sistemas de apoio à decisão

 Sistemas de Apoio à Decisão (SAD)
   Usam dados históricos mantidos em um banco de
   dados convencional
   Dados históricos são analisados usando técnicas de
   mineração de dados para obter informações usadas
   na tomada de decisões
   Estatísticas de venda, produção, clientes, etc.
   podem ser levantadas e consideradas para tomar
   decisões estratégicas de negócio
Sistemas de apoio à decisão

 Benefícios dos Sistemas de Apoio à Decisão
   Determinar o mercado-alvo de um produto
   Definir o preço de um produto, criar promoções e
   condições especiais de compra
   Verificar a eficácia de campanhas de marketing
   Otimizar a quantidade de produtos no estoque
   Responder rapidamente a mudanças no mercado e
   determinar novas tendências, ganhando eficiência e
   lucratividade
Sistemas de apoio à decisão

 Problema: dados históricos não são mantidos
 nos BDs da empresa
   Volume de dados seria muito grande
   Desempenho seria insatisfatório
 Solução: criar um BD exclusivamente para
 manter os dados históricos
   Especializado para realizar poucas consultas sobre
   um grande volume de dados
   Surge o Data Warehouse (DW) e posteriormente o
   Data Mining (DM)
Data Warehouse
Data Warehouse

 Histórico
   Criado pela IBM na década de 60 com o nome Information
   Warehouse
   Relançado diversas vezes sem grande sucesso
   O nome Data Warehouse foi dado por William H. Inmon,
   considerado o inventor desta tecnologia
   Tornou-se viável com o surgimento de novas tecnologias
   para armazenar e processar uma grande quantidade de
   dados
Data Warehouse

 Conceito
   Sistema que armazena dados históricos usados no
   processo de tomada de decisão
   Integra os dados corporativos de uma empresa em um
   único repositório
 Funcionalidade
   Criar uma visão única e centralizada dos dados que
   estavam dispersos em diversos BDs
   Permitir que usuários finais executem consultas, gerem
   relatórios e façam análises
Data Warehouse

 BDs usados nas aplicações de negócio são
 chamados BDs operacionais
 DW é um BD informacional alimentado com dados
 dos BDs operacionais da empresa
   Disponibiliza dados atuais e dados históricos
   Dados podem ser sumarizados (condensados) para que sejam
   analisados
   Contém também metadados, que são dados sobre os dados
   armazenados no DW
BD Operacional X Data Warehouse
                  BD Operacional       Data Warehouse
Usuários          Funcionários         Alta administração
Utilização        Tarefas cotidianas   Decisões estratégicas

Padrão de uso     Previsível           Difícil de prever
Princípio de      Com base em          Com base em análise
funcionamento     transações           de dados
Valores           Valores atuais       Valores históricos e
dos dados         e voláteis           imutáveis
Detalhamento      Alto                 Sumarizado
Organização dos   Orientado a          Orientado a assunto
dados             aplicações
Principais Características de um DW
 Para que seja considerado um Data Warehouse, um banco
 de dados deve:
   Coletar dados de várias fontes
   Dados coletados devem ser transformados para que haja uma
   visão única dos dados
   Dados devem ser usados por aplicativos para obter informações
   que dêem apoio à decisão
 Um Data Warehouse também deve ser:
   Orientado a assunto
   Integrado
   Não-volátil
   Variável com o tempo
Principais Características de um DW

 Orientação a assunto
   Os dados em um DW são organizados de modo a
   facilitar a análise dos dados
   Dados são organizados por assunto e não por
   aplicação, como em BDs operacionais

              Produtos

                                        Histórico
              Clientes
                                        de Vendas
  Aplicação                 Análise
  de Venda    Estoque      de Vendas
Principais Características de um DW

  Integração
    Dados de um DW provém de diversas fontes
    Dados podem ser sumarizados ou eliminados
    Formato dos dados deve ser padronizado para
    uniformizar nomes, unidades de medida, etc.
                 UK                                   Data
                                      C
               Produtos Peso (lb)     o             Warehouse
     Brasil                           n
                          Peso (kg)   v Peso (gr)
    Produtos                          e              Produtos
                USA                   r
                          Peso (oz)   s
                                      ã
               Produtos               o
Principais Características de um DW

 Não-Volátil
   Dados não são mais alterados depois de incluídos
   no DW
   Operações no DW
     Em um BD operacional é possível incluir, alterar e eliminar
     dados
     Já no DW é possível apenas incluir dados
   Garante que consultas subseqüentes a um dado
   produzirão o mesmo resultado
Principais Características de um DW

 Variável com o Tempo
   Os dados no DW são relativos
   a um determinado instante de tempo
                     Produto       Preço
       BD            Caneta Azul   0,50
     Preços          Lápis Preto   0,30
                     ...           ...

                     Produto       Jan/03   Fev/03   Mar/03
                     Caneta Azul   0,40     0,45     0,50
      DW
                     Lápis Preto   0,25     0,28     0,30
     Preços
                     ...           ...      ...      ...
Arquitetura de um DW

 Sistemas de Extração Tradicionais

                                       Dados
                                     Operacionais

                                      Sistemas de
                                       Extração


                                         Dados
                                     Informacionais
Arquitetura de um DW

 Sistemas baseados em Data Warehouse

                                 Dados
                               Operacionais


                                  Data
                                Warehouse


                                   Dados
                               Informacionais
Arquitetura de um DW

 Principais tarefas efetuadas pelo DW
   Obter dados dos BDs operacionais e externos
   Armazenar os dados
   Fornecer informações para tomada de decisão
   Administrar o sistema e os dados
 Principais componentes do DW
   Mecanismos para acessar e transformar dados
   Mecanismo para armazenamento de dados
   Ferramentas para análise de dados
   Ferramentas de gerência
Estrutura Interna de um DW

 Requisitos do DW
   Eficiente
     Grande volume de dados imutáveis
     Processamento paralelo e/ou distribuído
   Confiável
     Funcionamento do sistema
     Resultado das análises
   Expansível
     Crescente volume de dados
     Maior número de fontes de dados
Estrutura Interna de um DW

 Em geral são usados BDs relacionais para
 armazenar os dados do DW
   Capazes de manter e processar grandes volumes
   de dados
   Otimizados para lidar com dados imutáveis
 As ferramentas de análise empregam:
   Técnicas de mineração de dados
   Inteligência artificial: redes neurais, fuzzy, etc.
   A Internet: Web mining, agentes móveis, etc.
Estrutura Interna de um DW
Clientes Operacionais     BDs Operacionais    BDs Externos




                                Obtenção
                                de Dados




                                              Gerenciamento
                             Data Warehouse
Clientes Informacionais

                                 Busca de
                               Informações
Estrutura Interna de um DW

 Obtenção de Dados
  Oracle


SQL Server        Extrair           Transformar      Carregar
             • Dados            •   Limpar        • Organizar
               operacionais     •   Reconciliar   • Combinar várias
             • Dados externos   •   Aprimorar       fontes              Data
   DB2                          •   Sumarizar     • Popular sob
                                •   Agregar         demanda           Warehouse

 InterBase


 Arquivos
Estrutura Interna de um DW

 Busca de Informações
                 Localizar       Analisar
   Data         Catálogo de    Análise multi-
                informações    dimensional
 Warehouse
                Visualização   Data mining
                de negócios    Consultas
                Modelos        e relatórios
 Armazenar
• Dados
  relacionais
• Cache
• Várias
  plataformas
Estrutura Interna de um DW

 Modelo de Camadas
                          Dados Operacionais   Dados Externos

                                   Acesso aos Dados




                                                                Gerenc. de Processos
                                                                Gerenc. de Processos
     Troca de Mensagens




                                     Data Staging

                                 Data Warehouse Físico

                                   Acesso aos Dados

                                  Acesso à Informação
Estrutura Interna de um DW

 Funções das Camadas do DW
   Dados Operacionais/Externos: fontes de dados
   Acesso aos Dados: extrair dados dos BDs
   Data Staging: transformar e carregar dados
   Data Warehouse Físico: armazenar dados
   Acesso aos Dados: localizar dados para análise
   Acesso à Informação: analisar dados
   Troca de Mensagens: transportar dados
   Gerenc. de Processos: controlar atividades
Granularidade

 Granularidade
   Nível de detalhe dos dados
   De extrema importância no projeto do DW
       Dados        Nível médio      Dados pouco
     detalhados     de detalhe        detalhados




                                  Granularidade
Granularidade

 Definir a granularidade adequada é vital para
 que o DW atenda seus objetivos
   Mais detalhes    Mais dados    Análise mais longa
      Informação mais detalhada
   Menos detalhes     Menos dados    Análise mais
   curta    Informação menos detalhada
 Para evitar que se perca informação são
 criados vários níveis de granularidade
Granularidade

 Dados x Granularidade
   Dados Atuais
     Refletem acontecimentos recentes
     Alto nível de detalhe (baixa granularidade)
   Dados Sumarizados
     Dados históricos condensados
     Menor nível de detalhe (maior granularidade)
   Dados Antigos
     Dados históricos mantidos em fita, CD, etc
     Alto nível de detalhe (baixa granularidade)
Granularidade

 Processo de sumarização
   Aplica um novo esquema de modo a condensar os
   dados
   Ex.: armazenar totais, médias, etc.
 Processo de envelhecimento
   Transfere os dados antigos do HD para fita, CD,
   etc.
   Mantém o nível de detalhe para que nenhuma
   informação seja perdida
Granularidade
                     Dados
                   Altamente
                  Sumarizados

                     Dados
                  Ligeiramente
                  Sumarizados
   Sumarização

                 Dados Atuais

Envelhecimento
                    Dados
                    Antigos
Data Marts

 Dados mantidos no DW são separados por
 assunto em subconjuntos de acordo com:
    A estrutura interna da empresa
    O processo de tomada de decisão
 Estes subconjuntos dos dados são chamados
 de Data Marts

 Data Mart     Data Mart    Data Mart   Data Mart
 Financeiro     Vendas      Marketing   Produção
Data Marts

 Um Data Mart desempenha o papel de um
 DW departamental, regional ou funcional
 Uma empresa pode construir seus Data Marts
 gradativamente a partir do DW
                        Data
                      Warehouse



 Data Mart    Data Mart      Data Mart   Data Mart
 Am. Latina     EUA           Europa       Ásia
Data Marts

 Dados podem ser repetidos em dois ou mais
 Data Marts
 Os mesmos dados podem estar
 representados com granularidade diferente
 Ex:
      Data Mart    Vendas detalhadas
       Vendas

                   Vendas totais mensais
      Data Mart
      Financeiro
Metadados

 Os Metadados são dados sobre os dados
  Para cada atributo mantido no DW há uma entrada
  no dicionário de dados
  Os dados são processados, atualizados e
  consultados partindo dos metadados
  Usuários ficam conhecendo a estrutura e o
  significado dos dados
  No BD operacional, a estrutura e o significado dos
  dados estão embutidos nas aplicações
Metadados

 Camadas de Metadados
  Metadados Operacionais
    Definem a estrutura dos dados operacionais
  Metadados do DW
    Orientados por assunto
    Informam como os dados do DW foram calculados e como
    devem ser interpretados
  Metadados do Usuário
    Organizam os metadados do DW com base em conceitos
    familiares ao usuário final
Metadados

 Classificação em função dos dados descritos
   Metadados de Mapeamento
     Como BDs operacionais são mapeados no DW
   Metadados de Sumarização
     Como os dados foram sumarizados no DW
   Metadados Históricos
     Como a estrutura dos dados vem mudando
   Metadados de Padrões de Acesso
     Como os dados do DW vem sendo acessados
   Metadados de Miscelânea
Metadados

 Fontes de Metadados
  Código fonte dos SBDs operacionais
  Diagramas CASE de BDs operacionais e do DW
  Documentação dos BDs operacionais e do DW
  Entrevistas com usuários, administradores e
  programadores dos BDs e do DW
  O ambiente de DW
    Freqüência de acesso aos dados, tempo de resposta,
    controle de usuários, etc.
Acesso aos Dados

 Acesso em Duas Camadas
  Fontes de     Servidor
   Dados         de DW      Data Warehouse


 Acesso em Três Camadas
  Fontes de     Servidor
   Dados         de DW      Data Warehouse

                Servidor    Aplicação do Usuário
                de Aplic.   Aplicação do Usuário
Tipos de Data Warehouse

 DW baseado em Servidor
   Mainframe ou servidor de rede local (LAN)
 DW Virtual
   Reúne dados operacionais e dados históricos
   mantidos em BDs – não há um DW central
 DW Distribuído
   DW global reúne dados de vários DWs locais
 DW baseado na Web
   Dados provenientes da World Wide Web
Data Mining
Data Mining

 Motivações
    Grande disponibilidade de dados
   armazenados eletronicamente
    Existem informações úteis, invisíveis,
   nesses grandes volumes de dados
    Aproveitar para prever um conhecimento
   futuro (ir além do armazenamento explícito
   de dados).
Data Mining
 Definição
   Data mining (mineração de dados), é o processo de
   extração de conhecimento de grandes bases de dados,
   convencionais ou não
   Utiliza técnicas de inteligência artificial que procuram
   relações de similaridade ou discordância entre dados
   Seu objetivo é encontrar, automaticamente, padrões,
   anomalias e regras com o propósito de transformar
   dados, aparentemente ocultos, em informações úteis
   para a tomada de decisão e/ou avaliação de resultados
Data Mining

 Uma empresa utilizando data mining é capaz
 de:
   Criar parâmetros para entender o comportamento
   do consumidor
   Identificar afinidades entre as escolhas de produtos
   e serviços
   Prever hábitos de compras
   Analisar comportamentos habituais para detectar
   fraudes
Data Mining
 Data mining X Data warehouse:
   Data mining ⇒ extração inteligente de dados;
   Data warehouse ⇒ repositório centralizado de dados;
   Data mining não é uma evolução do Data warehouse;
   Data mining não depende do Data warehouse, mas obtém-se
   melhores resultados quando aplicados em conjunto;
   Cada empresa deve saber escolher qual das técnicas é importante
   para o seu negócio;
   Data Warehouse aliado a ferramentas estatísticas desempenham
   papel semelhante ao data mining, mas não descobrem novos
   padrões de comportamento.
Evolução
      Evolução           Perguntas           Tecnologia disponível      Características

     Coleção de         “Qual foi meu         Computadores, Fitas,      Retrospectiva,
       dados        rendimento total nos           discos               Dados estáticos
       1960         últimos cinco anos ?”                               como resposta

     Acessos aos        “Qual foi meu               RDBMS,               Retrospectiva,
       dados       rendimento no Brasil no           SQL,              dados dinâmicos a
        1980          último janeiro ?”              ODBC               nível de registros
                                                                         como resposta

       Data              “Qual foi meu       Processamento analítico     Retrospectiva,
    warehousing    rendimento no Brasil no   on-line, banco de dados    dados dinâmicos
    & suporte a     último janeiro? Do sul   multidimencionais, data   em múltiplos níveis
      decisão           até o nordeste”            warehousing           como resposta
       1990

    Data Mining    “Porque alguns produtos   Algoritmos avançados,        Prospectivo,
    Atualmente      são mais vendidos na         computadores             Informações
                        região sul ?”        multiprocessados, B.D.      (perspectivas)
                                              grandes e poderosos        como resposta.
O Processo Data Mining

 Fases / Etapas.
   Seleção.
   Pré-processamento.
   Transformação.
   Data mining.
   Interpretação e Avaliação.
O Processo Data Mining

 Seleção
   Selecionar ou segmentar dados de acordo com
   critérios definidos
 Pré-processamento
    Estágio de limpeza dos dados, onde
   informações julgadas desnecessárias são
   removidas
    Reconfiguração dos dados para assegurar
   formatos consistentes (identificação)
O Processo Data Mining

 Transformação
    Transforma-se os dados em formatos utilizáveis. Esta
   depende da técnica data mining usada
      Disponibilizar os dados de maneira usável e navegável
 Data mining
    É a verdadeira extração dos padrões de comportamento dos
   dados
    Utilizando a definição de fatos, medidas de padrões, estados
   e o relacionamento entre eles
O Processo Data Mining

 Interpretação e Avaliação
    Identificado os padrões pelo sistema, estes são
   interpretados em conhecimentos, os quais darão
   suporte a tomada de decisões humanas
Uma arquitetura data mining
Aprendizagem para data mining

 Aprendizagem computacional
    Automação do processo de aprendizagem, através da
    construção de regras baseadas em observações dos
    estados e transações do ambiente.
    Examina os exemplos e seus resultados e aprende como
    reproduzi-los e como fazer generalizações sobre novos
    casos
Aprendizagem para data mining
 Aprendizagem indutiva:
   Faz análise nos dados para encontrar padrões
   Agrupa objetos similares em classes
   Formula regras

   Aprendizagem supervisionada
      Aprende baseando-se em exemplos (“professor” ajuda a construir um
      modelo definido de classes e fornecendo exemplos de cada classe ⇒
      formular a descrição e a forma da classe)
   Aprendizagem não supervisionada
      Aprende baseando-se em observações e descobertas (não se define
      classes, deve-se observar os exemplos e reconhecer os padrões por
      si só ⇒ uma descrição de classes para cada ambiente).
Funções do data mining

 Modelo de verificação
   Aprende baseando-se em exemplos pré-classificados
   (+/-)
   Objetivo: formular descrições consistentes e gerais de
   classes em função de seus atributos.
 Modelo de descoberta
   Aprende baseando-se em observações e descobertas
   Descoberta automática de informações ocultas
   Procura ocorrências de padrões, tendências e generalizações
   sobre os dados sem a intervenção do usuário
   Agrupar elementos similares
Funções do data mining

 Modelo de classificação :
   Atributos mais significativos definidos um classe
   O usuário define as atributos para cada classe
   Aplica regras para criar modelos de ações futuras
 Associação:
   Procura registos que tenham similaridades associativas
   Podem ser expressados por regras
Funções do data mining
 Padrões temporais/seqüenciais :
   Analisa registros num período de tempo, procurando
   encontrar padrões (eventos/compras) de
   comportamento.
   Identificar o perfil do cliente
   Identificar padrões que precedem outros padrões
 Segmentação/agrupamento:
   Segmenta a base de dados em grupos por suas
   similaridade e diferenças
   O sistema tem que descobrir por si próprio as
   similaridade e diferenças
Técnicas

 Indução
   Regras indutivas (rule induction)
     Regra indutiva é o processo de olhar uma série de dados
     e, a partir dela, gerar padrões.
     Pode-se trabalhar com dados numéricos ou não
     Pelo fato de explorar uma série de dados, o sistema
     indutivo cria hipóteses que conduzem a padrões
     Regras cobertas ⇒ comportamentos estáveis
     Regras inexatas ⇒ margem de precisão “fixada” (%)
Técnicas

 Indução:
Técnicas

 Árvores de decisão:
   Representações simples do conhecimento
   Utilização de regras condicionais
   A partir de um conjunto de valores decide SIM ou
   NÃO
   Mais rápida e mais compreensível que redes
   neurais
Técnicas

 Árvores de decisão:
Técnicas

 Redes Neurais:
   É uma abordagem computacional que envolve
   desenvolvimento de estruturas matemáticas com a
   habilidade de aprender
   Estruturalmente, uma rede neural consiste em um
   número de elementos interconectados (chamados
   neurônios/nós), que possuem entrada, saída e
   processamento
   São organizados em camadas que aprendem pela
   modificação da conexão
Técnicas

 Redes Neurais:
   Para construir um modelo neural, nós primeiramente
   "adestramos" a rede em um dataset de treinamento e então
   usamos a rede já treinada para fazer predições
   Problemas:
     Não retorna informação a priori
     Não pode ser treinada em uma grande base de dados
     Entrada não pode ser dados alfa-numéricos
     Nenhuma explanação dos dados é fornecida
Técnicas

 Redes Neurais:
Área de atuação

 Áreas de aplicações potenciais:
   Vendas e Marketing
     Identificar padrões de comportamento de consumidores
     Associar comportamentos à características demográficas
     de consumidores
     Campanhas de marketing direto
      Identificar consumidores “leais”
Área de atuação

 Áreas de aplicações potenciais:
   Bancos
     Identificar padrões de fraudes (cartões de crédito)
     Identificar características de correntistas
     Mercado Financeiro
   Médica
     Comportamento de pacientes
     Identificar terapias de sucessos para diferentes
     tratamentos
     Fraudes em planos de saúdes
     Comportamento de usuários de planos de saúde
Exemplos

 Fraldas e cervejas
   O que as cervejas tem a ver com as fraldas ?
   Homens casados, entre 25 e 30 anos, compravam
   fraldas e/ou cervejas às sextas-feiras à tarde no
   caminho do trabalho para casa;
   Wal-Mart otimizou às gôndolas nos pontos de
   vendas, colocando as fraldas ao lado das cervejas
   Resultado: o consumo cresceu 30%
Exemplos

 Lojas Brasileiras
   Aplicou 1 milhão de dólares em técnicas de data
   mining
   Reduziu de 51000 produtos para 14000 produtos
   oferecidos em suas lojas
   Exemplo de anomalias detectadas:
    – Roupas de inverno e guarda chuvas encalhadas no
      nordeste
    – Batedeiras 110v a venda em SC onde a corrente é
      220v
Conclusões
 Data Warehouse é um sistema de aquisição de
 informação que mantém um histórico para avaliação
 posterior, além de manter de forma unificada e
 padronizada os dados que são adquiridos
 Data Mining é um processo que permite
 compreender o comportamento dos dados
 Tem um suporte muito forte em I. A.
 Pode ser bem aplicado em diversas áreas de
 negócios
 Só será eficiente se o valor das informações
 extraídas exceder o custo do processamento dos
 dados brutos
Bibliografia

 www.db-book.com
 www.the-data-mine.com
 http://www.intelliwise.com/reports/i2002.htm
 www.anderson.ucla.edu/faculty/jason.frand/te
 acher/technologies/palace/datamining.htm
 http://www.thearling.com/text/dmwhite/dmwhit
 e.htm
Bibliografia

 http://www.cs.bham.ac.uk/~anp/TheDataMine.
 html
 http://www.satafe.edu/~kurt/index.shtml
 http://pt.wikipedia.org/wiki/Data_Warehouse
 www.baguete.com.br/artigosDetalhes.php?id=
 154
 www.ica.ele.puc-rio.br/cursos/download/DM-
 apostila1.pdf
Data Warehouse
              &
    Data Mining
    Bruno Machado
 Jerônimo Madruga

Mais conteúdo relacionado

Mais procurados

Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big DataCarlos Barbieri
 
Escritório de Governança de Dados - Conceitos e dicas para implantação
Escritório de Governança de Dados - Conceitos e dicas para implantaçãoEscritório de Governança de Dados - Conceitos e dicas para implantação
Escritório de Governança de Dados - Conceitos e dicas para implantaçãoBergson Lopes Rêgo, PMP
 
Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Helder da Rocha
 
Aula 3 Sistemas de Informação - Tipos de SI
Aula 3 Sistemas de Informação - Tipos de SIAula 3 Sistemas de Informação - Tipos de SI
Aula 3 Sistemas de Informação - Tipos de SIDaniel Brandão
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Informática Básica - Planilha Eletronica - Microsoft Excel 2010
Informática Básica - Planilha Eletronica - Microsoft Excel 2010Informática Básica - Planilha Eletronica - Microsoft Excel 2010
Informática Básica - Planilha Eletronica - Microsoft Excel 2010Joeldson Costa Damasceno
 
Escritório de governança de dados
Escritório de governança de dadosEscritório de governança de dados
Escritório de governança de dadosBLRDATA
 
Aula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação GerencialAula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação GerencialAnderson Simão
 
Aula05 padrões sem fio
Aula05   padrões sem fioAula05   padrões sem fio
Aula05 padrões sem fioCarlos Veiga
 
Sistemas de Informações Gerenciais - SIG
Sistemas de Informações Gerenciais - SIGSistemas de Informações Gerenciais - SIG
Sistemas de Informações Gerenciais - SIGMúsicaParaense.Org
 
Modelagem De Banco De Dados
Modelagem De Banco De DadosModelagem De Banco De Dados
Modelagem De Banco De Dadosmgoberto
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBItiaquarius
 

Mais procurados (20)

Governança de Dados e Big Data
Governança de Dados e Big DataGovernança de Dados e Big Data
Governança de Dados e Big Data
 
Dados x informação
Dados x informaçãoDados x informação
Dados x informação
 
Aula Data Mining
Aula Data MiningAula Data Mining
Aula Data Mining
 
Escritório de Governança de Dados - Conceitos e dicas para implantação
Escritório de Governança de Dados - Conceitos e dicas para implantaçãoEscritório de Governança de Dados - Conceitos e dicas para implantação
Escritório de Governança de Dados - Conceitos e dicas para implantação
 
Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)Introdução à Visualização de Dados (2015)
Introdução à Visualização de Dados (2015)
 
Aula 3 Sistemas de Informação - Tipos de SI
Aula 3 Sistemas de Informação - Tipos de SIAula 3 Sistemas de Informação - Tipos de SI
Aula 3 Sistemas de Informação - Tipos de SI
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Informática Básica - Planilha Eletronica - Microsoft Excel 2010
Informática Básica - Planilha Eletronica - Microsoft Excel 2010Informática Básica - Planilha Eletronica - Microsoft Excel 2010
Informática Básica - Planilha Eletronica - Microsoft Excel 2010
 
Aula 2 - Introdução a Banco de Dados
Aula 2 - Introdução a Banco de DadosAula 2 - Introdução a Banco de Dados
Aula 2 - Introdução a Banco de Dados
 
Escritório de governança de dados
Escritório de governança de dadosEscritório de governança de dados
Escritório de governança de dados
 
Manual powerpoint 2007
Manual powerpoint 2007Manual powerpoint 2007
Manual powerpoint 2007
 
Aula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação GerencialAula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação Gerencial
 
Aula05 padrões sem fio
Aula05   padrões sem fioAula05   padrões sem fio
Aula05 padrões sem fio
 
Sistemas de Informações Gerenciais - SIG
Sistemas de Informações Gerenciais - SIGSistemas de Informações Gerenciais - SIG
Sistemas de Informações Gerenciais - SIG
 
Modelagem De Banco De Dados
Modelagem De Banco De DadosModelagem De Banco De Dados
Modelagem De Banco De Dados
 
Gestão de Dados - Novos tempos
Gestão de Dados - Novos temposGestão de Dados - Novos tempos
Gestão de Dados - Novos tempos
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBI
 
Aula4 levantamento requisitos
Aula4 levantamento requisitosAula4 levantamento requisitos
Aula4 levantamento requisitos
 
Microsoft PowerBI
Microsoft PowerBIMicrosoft PowerBI
Microsoft PowerBI
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 

Semelhante a Data Warehouse e Data Mining para Tomada de Decisão

UCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data WarehouseUCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data WarehouseVinícius Amaral
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...fabiolagrijo
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftDennes Torres
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data WarehouseJeorgeCarmona
 
Aula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dadosAula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dadoswapiva
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data WarehouseFernando Peres
 
Tomada decisão
Tomada decisãoTomada decisão
Tomada decisãoEcoplas
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informaçãoFábio Andrade
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesCaio Louro
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionaiselliando dias
 
Pg20235 rf20222vp20208
Pg20235 rf20222vp20208Pg20235 rf20222vp20208
Pg20235 rf20222vp20208rikardojsf
 
Data warehousing
Data warehousingData warehousing
Data warehousingacistec
 

Semelhante a Data Warehouse e Data Mining para Tomada de Decisão (20)

UCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data WarehouseUCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data Warehouse
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoft
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Conceitos DW
Conceitos DWConceitos DW
Conceitos DW
 
Aula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dadosAula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dados
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data Warehouse
 
Tópico 2
Tópico 2Tópico 2
Tópico 2
 
Tomada decisão
Tomada decisãoTomada decisão
Tomada decisão
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informação
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory Databases
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionais
 
Banco aula 01
Banco aula 01Banco aula 01
Banco aula 01
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Pg20235 rf20222vp20208
Pg20235 rf20222vp20208Pg20235 rf20222vp20208
Pg20235 rf20222vp20208
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 
TA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdfTA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdf
 

Mais de Jerônimo Medina Madruga

PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019
PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019
PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019Jerônimo Medina Madruga
 
Rock & Code - Como criar música programando - Tchelinux pelotas 2019
Rock & Code - Como criar música programando - Tchelinux pelotas 2019Rock & Code - Como criar música programando - Tchelinux pelotas 2019
Rock & Code - Como criar música programando - Tchelinux pelotas 2019Jerônimo Medina Madruga
 
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019Jerônimo Medina Madruga
 
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...Jerônimo Medina Madruga
 
Dê a cara a tapa como se destacar no mercado de trabalho - Tchelinux Sant'An...
Dê a cara a tapa  como se destacar no mercado de trabalho - Tchelinux Sant'An...Dê a cara a tapa  como se destacar no mercado de trabalho - Tchelinux Sant'An...
Dê a cara a tapa como se destacar no mercado de trabalho - Tchelinux Sant'An...Jerônimo Medina Madruga
 
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...Jerônimo Medina Madruga
 
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...Jerônimo Medina Madruga
 
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...Jerônimo Medina Madruga
 
Rock And Code: Como criar música programando
Rock And Code: Como criar música programandoRock And Code: Como criar música programando
Rock And Code: Como criar música programandoJerônimo Medina Madruga
 
Remember the name: Como se tornar um rockstar no mercado de trabalho
Remember the name: Como se tornar um rockstar no mercado de trabalhoRemember the name: Como se tornar um rockstar no mercado de trabalho
Remember the name: Como se tornar um rockstar no mercado de trabalhoJerônimo Medina Madruga
 
Como se tornar um programador melhor - Saci 2017 IFSul Bagé
Como se tornar um programador melhor - Saci 2017 IFSul BagéComo se tornar um programador melhor - Saci 2017 IFSul Bagé
Como se tornar um programador melhor - Saci 2017 IFSul BagéJerônimo Medina Madruga
 
Dê a cara a tapa 5 estratégias para se sobressair no mercado e ser um profis...
Dê a cara a tapa  5 estratégias para se sobressair no mercado e ser um profis...Dê a cara a tapa  5 estratégias para se sobressair no mercado e ser um profis...
Dê a cara a tapa 5 estratégias para se sobressair no mercado e ser um profis...Jerônimo Medina Madruga
 
Aprendendo a aprender software livre - Tchelinux Bagé 2017
Aprendendo a aprender software livre - Tchelinux Bagé 2017Aprendendo a aprender software livre - Tchelinux Bagé 2017
Aprendendo a aprender software livre - Tchelinux Bagé 2017Jerônimo Medina Madruga
 
Moodle direto das trincheiras - Tchelinux UCPel 2017
Moodle direto das trincheiras - Tchelinux UCPel 2017Moodle direto das trincheiras - Tchelinux UCPel 2017
Moodle direto das trincheiras - Tchelinux UCPel 2017Jerônimo Medina Madruga
 
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017Jerônimo Medina Madruga
 
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...Tudo que você queria saber sobre software livre mas não tinha coragem de perg...
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...Jerônimo Medina Madruga
 
Aprendendo a aprender software livre - Tchelinux Bagé 2016
Aprendendo a aprender software livre - Tchelinux Bagé 2016Aprendendo a aprender software livre - Tchelinux Bagé 2016
Aprendendo a aprender software livre - Tchelinux Bagé 2016Jerônimo Medina Madruga
 
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...Jerônimo Medina Madruga
 
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...Jerônimo Medina Madruga
 

Mais de Jerônimo Medina Madruga (20)

PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019
PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019
PyGame Over: Insert coins to learn with Python - Tchelinux Porto Alegre 2019
 
Rock & Code - Como criar música programando - Tchelinux pelotas 2019
Rock & Code - Como criar música programando - Tchelinux pelotas 2019Rock & Code - Como criar música programando - Tchelinux pelotas 2019
Rock & Code - Como criar música programando - Tchelinux pelotas 2019
 
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019
Rock 'n' Code - Como criar música programando - Tchelinux Camaquã 2019
 
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...
Desenvolvendo Jogos com PyGame - Jerônimo Medina Madruga - Tchelinux 2019 Rio...
 
Dê a cara a tapa como se destacar no mercado de trabalho - Tchelinux Sant'An...
Dê a cara a tapa  como se destacar no mercado de trabalho - Tchelinux Sant'An...Dê a cara a tapa  como se destacar no mercado de trabalho - Tchelinux Sant'An...
Dê a cara a tapa como se destacar no mercado de trabalho - Tchelinux Sant'An...
 
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...
Rock 'n' Code: Como criar música programando - I Semana Acadêmica da Licencia...
 
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...
Do Zero ao Python - I Semana Acadêmica da Licenciatura em Computação - IFSul ...
 
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...
Desmistificando a gamificação: como "jogos" podem potencializar a educação - ...
 
Rock And Code: Como criar música programando
Rock And Code: Como criar música programandoRock And Code: Como criar música programando
Rock And Code: Como criar música programando
 
Do zero ao python em 40 minutos!
Do zero ao python em 40 minutos!Do zero ao python em 40 minutos!
Do zero ao python em 40 minutos!
 
Remember the name: Como se tornar um rockstar no mercado de trabalho
Remember the name: Como se tornar um rockstar no mercado de trabalhoRemember the name: Como se tornar um rockstar no mercado de trabalho
Remember the name: Como se tornar um rockstar no mercado de trabalho
 
Como se tornar um programador melhor - Saci 2017 IFSul Bagé
Como se tornar um programador melhor - Saci 2017 IFSul BagéComo se tornar um programador melhor - Saci 2017 IFSul Bagé
Como se tornar um programador melhor - Saci 2017 IFSul Bagé
 
Dê a cara a tapa 5 estratégias para se sobressair no mercado e ser um profis...
Dê a cara a tapa  5 estratégias para se sobressair no mercado e ser um profis...Dê a cara a tapa  5 estratégias para se sobressair no mercado e ser um profis...
Dê a cara a tapa 5 estratégias para se sobressair no mercado e ser um profis...
 
Aprendendo a aprender software livre - Tchelinux Bagé 2017
Aprendendo a aprender software livre - Tchelinux Bagé 2017Aprendendo a aprender software livre - Tchelinux Bagé 2017
Aprendendo a aprender software livre - Tchelinux Bagé 2017
 
Moodle direto das trincheiras - Tchelinux UCPel 2017
Moodle direto das trincheiras - Tchelinux UCPel 2017Moodle direto das trincheiras - Tchelinux UCPel 2017
Moodle direto das trincheiras - Tchelinux UCPel 2017
 
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017
Aprendendo Software Livre como Neo Aprendeu Kung Fu - Tchelinux UCPel 2017
 
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...Tudo que você queria saber sobre software livre mas não tinha coragem de perg...
Tudo que você queria saber sobre software livre mas não tinha coragem de perg...
 
Aprendendo a aprender software livre - Tchelinux Bagé 2016
Aprendendo a aprender software livre - Tchelinux Bagé 2016Aprendendo a aprender software livre - Tchelinux Bagé 2016
Aprendendo a aprender software livre - Tchelinux Bagé 2016
 
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...
Need for (web) speed: Uma introdução a otimização de velocidade de sites e We...
 
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...
Dê a Cara a Tapa: Uma Palestra Intrigante sobre Oceano Azul, Cauda Longa, Mer...
 

Data Warehouse e Data Mining para Tomada de Decisão

  • 1. Data Warehouse & Data Mining Bruno Machado Jerônimo Madruga
  • 2. Sumário Sistemas de apoio à decisão Data Warehouse Data Mining
  • 3. Sistemas de apoio à decisão
  • 4. Sistemas de apoio à decisão Informação Recurso mais importante para uma empresa tomar decisões estratégicas Obtida pela análise de dados históricos de venda, produção, clientes, etc... Análise de dados Responsável por fornecer as informações vitais para a empresa Pode aumentar a competitividade de uma empresa Era realizada de forma intuitiva pelos gerentes
  • 5. Sistemas de apoio à decisão Dificuldades para obter informação Quantidade de dados a serem analisados cresce com a expansão do negócio e com o passar dos anos Dados conflitantes vindos de fontes diferentes podem gerar informações desencontradas Impossível para um ser humano manter e analisar todos os dados Informação não é mais mantida por gerentes devido à mobilidade no mercado de trabalho
  • 6. Sistemas de apoio à decisão Sistemas de Apoio à Decisão (SAD) Usam dados históricos mantidos em um banco de dados convencional Dados históricos são analisados usando técnicas de mineração de dados para obter informações usadas na tomada de decisões Estatísticas de venda, produção, clientes, etc. podem ser levantadas e consideradas para tomar decisões estratégicas de negócio
  • 7. Sistemas de apoio à decisão Benefícios dos Sistemas de Apoio à Decisão Determinar o mercado-alvo de um produto Definir o preço de um produto, criar promoções e condições especiais de compra Verificar a eficácia de campanhas de marketing Otimizar a quantidade de produtos no estoque Responder rapidamente a mudanças no mercado e determinar novas tendências, ganhando eficiência e lucratividade
  • 8. Sistemas de apoio à decisão Problema: dados históricos não são mantidos nos BDs da empresa Volume de dados seria muito grande Desempenho seria insatisfatório Solução: criar um BD exclusivamente para manter os dados históricos Especializado para realizar poucas consultas sobre um grande volume de dados Surge o Data Warehouse (DW) e posteriormente o Data Mining (DM)
  • 10. Data Warehouse Histórico Criado pela IBM na década de 60 com o nome Information Warehouse Relançado diversas vezes sem grande sucesso O nome Data Warehouse foi dado por William H. Inmon, considerado o inventor desta tecnologia Tornou-se viável com o surgimento de novas tecnologias para armazenar e processar uma grande quantidade de dados
  • 11. Data Warehouse Conceito Sistema que armazena dados históricos usados no processo de tomada de decisão Integra os dados corporativos de uma empresa em um único repositório Funcionalidade Criar uma visão única e centralizada dos dados que estavam dispersos em diversos BDs Permitir que usuários finais executem consultas, gerem relatórios e façam análises
  • 12. Data Warehouse BDs usados nas aplicações de negócio são chamados BDs operacionais DW é um BD informacional alimentado com dados dos BDs operacionais da empresa Disponibiliza dados atuais e dados históricos Dados podem ser sumarizados (condensados) para que sejam analisados Contém também metadados, que são dados sobre os dados armazenados no DW
  • 13. BD Operacional X Data Warehouse BD Operacional Data Warehouse Usuários Funcionários Alta administração Utilização Tarefas cotidianas Decisões estratégicas Padrão de uso Previsível Difícil de prever Princípio de Com base em Com base em análise funcionamento transações de dados Valores Valores atuais Valores históricos e dos dados e voláteis imutáveis Detalhamento Alto Sumarizado Organização dos Orientado a Orientado a assunto dados aplicações
  • 14. Principais Características de um DW Para que seja considerado um Data Warehouse, um banco de dados deve: Coletar dados de várias fontes Dados coletados devem ser transformados para que haja uma visão única dos dados Dados devem ser usados por aplicativos para obter informações que dêem apoio à decisão Um Data Warehouse também deve ser: Orientado a assunto Integrado Não-volátil Variável com o tempo
  • 15. Principais Características de um DW Orientação a assunto Os dados em um DW são organizados de modo a facilitar a análise dos dados Dados são organizados por assunto e não por aplicação, como em BDs operacionais Produtos Histórico Clientes de Vendas Aplicação Análise de Venda Estoque de Vendas
  • 16. Principais Características de um DW Integração Dados de um DW provém de diversas fontes Dados podem ser sumarizados ou eliminados Formato dos dados deve ser padronizado para uniformizar nomes, unidades de medida, etc. UK Data C Produtos Peso (lb) o Warehouse Brasil n Peso (kg) v Peso (gr) Produtos e Produtos USA r Peso (oz) s ã Produtos o
  • 17. Principais Características de um DW Não-Volátil Dados não são mais alterados depois de incluídos no DW Operações no DW Em um BD operacional é possível incluir, alterar e eliminar dados Já no DW é possível apenas incluir dados Garante que consultas subseqüentes a um dado produzirão o mesmo resultado
  • 18. Principais Características de um DW Variável com o Tempo Os dados no DW são relativos a um determinado instante de tempo Produto Preço BD Caneta Azul 0,50 Preços Lápis Preto 0,30 ... ... Produto Jan/03 Fev/03 Mar/03 Caneta Azul 0,40 0,45 0,50 DW Lápis Preto 0,25 0,28 0,30 Preços ... ... ... ...
  • 19. Arquitetura de um DW Sistemas de Extração Tradicionais Dados Operacionais Sistemas de Extração Dados Informacionais
  • 20. Arquitetura de um DW Sistemas baseados em Data Warehouse Dados Operacionais Data Warehouse Dados Informacionais
  • 21. Arquitetura de um DW Principais tarefas efetuadas pelo DW Obter dados dos BDs operacionais e externos Armazenar os dados Fornecer informações para tomada de decisão Administrar o sistema e os dados Principais componentes do DW Mecanismos para acessar e transformar dados Mecanismo para armazenamento de dados Ferramentas para análise de dados Ferramentas de gerência
  • 22. Estrutura Interna de um DW Requisitos do DW Eficiente Grande volume de dados imutáveis Processamento paralelo e/ou distribuído Confiável Funcionamento do sistema Resultado das análises Expansível Crescente volume de dados Maior número de fontes de dados
  • 23. Estrutura Interna de um DW Em geral são usados BDs relacionais para armazenar os dados do DW Capazes de manter e processar grandes volumes de dados Otimizados para lidar com dados imutáveis As ferramentas de análise empregam: Técnicas de mineração de dados Inteligência artificial: redes neurais, fuzzy, etc. A Internet: Web mining, agentes móveis, etc.
  • 24. Estrutura Interna de um DW Clientes Operacionais BDs Operacionais BDs Externos Obtenção de Dados Gerenciamento Data Warehouse Clientes Informacionais Busca de Informações
  • 25. Estrutura Interna de um DW Obtenção de Dados Oracle SQL Server Extrair Transformar Carregar • Dados • Limpar • Organizar operacionais • Reconciliar • Combinar várias • Dados externos • Aprimorar fontes Data DB2 • Sumarizar • Popular sob • Agregar demanda Warehouse InterBase Arquivos
  • 26. Estrutura Interna de um DW Busca de Informações Localizar Analisar Data Catálogo de Análise multi- informações dimensional Warehouse Visualização Data mining de negócios Consultas Modelos e relatórios Armazenar • Dados relacionais • Cache • Várias plataformas
  • 27. Estrutura Interna de um DW Modelo de Camadas Dados Operacionais Dados Externos Acesso aos Dados Gerenc. de Processos Gerenc. de Processos Troca de Mensagens Data Staging Data Warehouse Físico Acesso aos Dados Acesso à Informação
  • 28. Estrutura Interna de um DW Funções das Camadas do DW Dados Operacionais/Externos: fontes de dados Acesso aos Dados: extrair dados dos BDs Data Staging: transformar e carregar dados Data Warehouse Físico: armazenar dados Acesso aos Dados: localizar dados para análise Acesso à Informação: analisar dados Troca de Mensagens: transportar dados Gerenc. de Processos: controlar atividades
  • 29. Granularidade Granularidade Nível de detalhe dos dados De extrema importância no projeto do DW Dados Nível médio Dados pouco detalhados de detalhe detalhados Granularidade
  • 30. Granularidade Definir a granularidade adequada é vital para que o DW atenda seus objetivos Mais detalhes Mais dados Análise mais longa Informação mais detalhada Menos detalhes Menos dados Análise mais curta Informação menos detalhada Para evitar que se perca informação são criados vários níveis de granularidade
  • 31. Granularidade Dados x Granularidade Dados Atuais Refletem acontecimentos recentes Alto nível de detalhe (baixa granularidade) Dados Sumarizados Dados históricos condensados Menor nível de detalhe (maior granularidade) Dados Antigos Dados históricos mantidos em fita, CD, etc Alto nível de detalhe (baixa granularidade)
  • 32. Granularidade Processo de sumarização Aplica um novo esquema de modo a condensar os dados Ex.: armazenar totais, médias, etc. Processo de envelhecimento Transfere os dados antigos do HD para fita, CD, etc. Mantém o nível de detalhe para que nenhuma informação seja perdida
  • 33. Granularidade Dados Altamente Sumarizados Dados Ligeiramente Sumarizados Sumarização Dados Atuais Envelhecimento Dados Antigos
  • 34. Data Marts Dados mantidos no DW são separados por assunto em subconjuntos de acordo com: A estrutura interna da empresa O processo de tomada de decisão Estes subconjuntos dos dados são chamados de Data Marts Data Mart Data Mart Data Mart Data Mart Financeiro Vendas Marketing Produção
  • 35. Data Marts Um Data Mart desempenha o papel de um DW departamental, regional ou funcional Uma empresa pode construir seus Data Marts gradativamente a partir do DW Data Warehouse Data Mart Data Mart Data Mart Data Mart Am. Latina EUA Europa Ásia
  • 36. Data Marts Dados podem ser repetidos em dois ou mais Data Marts Os mesmos dados podem estar representados com granularidade diferente Ex: Data Mart Vendas detalhadas Vendas Vendas totais mensais Data Mart Financeiro
  • 37. Metadados Os Metadados são dados sobre os dados Para cada atributo mantido no DW há uma entrada no dicionário de dados Os dados são processados, atualizados e consultados partindo dos metadados Usuários ficam conhecendo a estrutura e o significado dos dados No BD operacional, a estrutura e o significado dos dados estão embutidos nas aplicações
  • 38. Metadados Camadas de Metadados Metadados Operacionais Definem a estrutura dos dados operacionais Metadados do DW Orientados por assunto Informam como os dados do DW foram calculados e como devem ser interpretados Metadados do Usuário Organizam os metadados do DW com base em conceitos familiares ao usuário final
  • 39. Metadados Classificação em função dos dados descritos Metadados de Mapeamento Como BDs operacionais são mapeados no DW Metadados de Sumarização Como os dados foram sumarizados no DW Metadados Históricos Como a estrutura dos dados vem mudando Metadados de Padrões de Acesso Como os dados do DW vem sendo acessados Metadados de Miscelânea
  • 40. Metadados Fontes de Metadados Código fonte dos SBDs operacionais Diagramas CASE de BDs operacionais e do DW Documentação dos BDs operacionais e do DW Entrevistas com usuários, administradores e programadores dos BDs e do DW O ambiente de DW Freqüência de acesso aos dados, tempo de resposta, controle de usuários, etc.
  • 41. Acesso aos Dados Acesso em Duas Camadas Fontes de Servidor Dados de DW Data Warehouse Acesso em Três Camadas Fontes de Servidor Dados de DW Data Warehouse Servidor Aplicação do Usuário de Aplic. Aplicação do Usuário
  • 42. Tipos de Data Warehouse DW baseado em Servidor Mainframe ou servidor de rede local (LAN) DW Virtual Reúne dados operacionais e dados históricos mantidos em BDs – não há um DW central DW Distribuído DW global reúne dados de vários DWs locais DW baseado na Web Dados provenientes da World Wide Web
  • 44. Data Mining Motivações Grande disponibilidade de dados armazenados eletronicamente Existem informações úteis, invisíveis, nesses grandes volumes de dados Aproveitar para prever um conhecimento futuro (ir além do armazenamento explícito de dados).
  • 45. Data Mining Definição Data mining (mineração de dados), é o processo de extração de conhecimento de grandes bases de dados, convencionais ou não Utiliza técnicas de inteligência artificial que procuram relações de similaridade ou discordância entre dados Seu objetivo é encontrar, automaticamente, padrões, anomalias e regras com o propósito de transformar dados, aparentemente ocultos, em informações úteis para a tomada de decisão e/ou avaliação de resultados
  • 46. Data Mining Uma empresa utilizando data mining é capaz de: Criar parâmetros para entender o comportamento do consumidor Identificar afinidades entre as escolhas de produtos e serviços Prever hábitos de compras Analisar comportamentos habituais para detectar fraudes
  • 47. Data Mining Data mining X Data warehouse: Data mining ⇒ extração inteligente de dados; Data warehouse ⇒ repositório centralizado de dados; Data mining não é uma evolução do Data warehouse; Data mining não depende do Data warehouse, mas obtém-se melhores resultados quando aplicados em conjunto; Cada empresa deve saber escolher qual das técnicas é importante para o seu negócio; Data Warehouse aliado a ferramentas estatísticas desempenham papel semelhante ao data mining, mas não descobrem novos padrões de comportamento.
  • 48. Evolução Evolução Perguntas Tecnologia disponível Características Coleção de “Qual foi meu Computadores, Fitas, Retrospectiva, dados rendimento total nos discos Dados estáticos 1960 últimos cinco anos ?” como resposta Acessos aos “Qual foi meu RDBMS, Retrospectiva, dados rendimento no Brasil no SQL, dados dinâmicos a 1980 último janeiro ?” ODBC nível de registros como resposta Data “Qual foi meu Processamento analítico Retrospectiva, warehousing rendimento no Brasil no on-line, banco de dados dados dinâmicos & suporte a último janeiro? Do sul multidimencionais, data em múltiplos níveis decisão até o nordeste” warehousing como resposta 1990 Data Mining “Porque alguns produtos Algoritmos avançados, Prospectivo, Atualmente são mais vendidos na computadores Informações região sul ?” multiprocessados, B.D. (perspectivas) grandes e poderosos como resposta.
  • 49. O Processo Data Mining Fases / Etapas. Seleção. Pré-processamento. Transformação. Data mining. Interpretação e Avaliação.
  • 50. O Processo Data Mining Seleção Selecionar ou segmentar dados de acordo com critérios definidos Pré-processamento Estágio de limpeza dos dados, onde informações julgadas desnecessárias são removidas Reconfiguração dos dados para assegurar formatos consistentes (identificação)
  • 51. O Processo Data Mining Transformação Transforma-se os dados em formatos utilizáveis. Esta depende da técnica data mining usada Disponibilizar os dados de maneira usável e navegável Data mining É a verdadeira extração dos padrões de comportamento dos dados Utilizando a definição de fatos, medidas de padrões, estados e o relacionamento entre eles
  • 52. O Processo Data Mining Interpretação e Avaliação Identificado os padrões pelo sistema, estes são interpretados em conhecimentos, os quais darão suporte a tomada de decisões humanas
  • 54. Aprendizagem para data mining Aprendizagem computacional Automação do processo de aprendizagem, através da construção de regras baseadas em observações dos estados e transações do ambiente. Examina os exemplos e seus resultados e aprende como reproduzi-los e como fazer generalizações sobre novos casos
  • 55. Aprendizagem para data mining Aprendizagem indutiva: Faz análise nos dados para encontrar padrões Agrupa objetos similares em classes Formula regras Aprendizagem supervisionada Aprende baseando-se em exemplos (“professor” ajuda a construir um modelo definido de classes e fornecendo exemplos de cada classe ⇒ formular a descrição e a forma da classe) Aprendizagem não supervisionada Aprende baseando-se em observações e descobertas (não se define classes, deve-se observar os exemplos e reconhecer os padrões por si só ⇒ uma descrição de classes para cada ambiente).
  • 56. Funções do data mining Modelo de verificação Aprende baseando-se em exemplos pré-classificados (+/-) Objetivo: formular descrições consistentes e gerais de classes em função de seus atributos. Modelo de descoberta Aprende baseando-se em observações e descobertas Descoberta automática de informações ocultas Procura ocorrências de padrões, tendências e generalizações sobre os dados sem a intervenção do usuário Agrupar elementos similares
  • 57. Funções do data mining Modelo de classificação : Atributos mais significativos definidos um classe O usuário define as atributos para cada classe Aplica regras para criar modelos de ações futuras Associação: Procura registos que tenham similaridades associativas Podem ser expressados por regras
  • 58. Funções do data mining Padrões temporais/seqüenciais : Analisa registros num período de tempo, procurando encontrar padrões (eventos/compras) de comportamento. Identificar o perfil do cliente Identificar padrões que precedem outros padrões Segmentação/agrupamento: Segmenta a base de dados em grupos por suas similaridade e diferenças O sistema tem que descobrir por si próprio as similaridade e diferenças
  • 59. Técnicas Indução Regras indutivas (rule induction) Regra indutiva é o processo de olhar uma série de dados e, a partir dela, gerar padrões. Pode-se trabalhar com dados numéricos ou não Pelo fato de explorar uma série de dados, o sistema indutivo cria hipóteses que conduzem a padrões Regras cobertas ⇒ comportamentos estáveis Regras inexatas ⇒ margem de precisão “fixada” (%)
  • 61. Técnicas Árvores de decisão: Representações simples do conhecimento Utilização de regras condicionais A partir de um conjunto de valores decide SIM ou NÃO Mais rápida e mais compreensível que redes neurais
  • 63. Técnicas Redes Neurais: É uma abordagem computacional que envolve desenvolvimento de estruturas matemáticas com a habilidade de aprender Estruturalmente, uma rede neural consiste em um número de elementos interconectados (chamados neurônios/nós), que possuem entrada, saída e processamento São organizados em camadas que aprendem pela modificação da conexão
  • 64. Técnicas Redes Neurais: Para construir um modelo neural, nós primeiramente "adestramos" a rede em um dataset de treinamento e então usamos a rede já treinada para fazer predições Problemas: Não retorna informação a priori Não pode ser treinada em uma grande base de dados Entrada não pode ser dados alfa-numéricos Nenhuma explanação dos dados é fornecida
  • 66. Área de atuação Áreas de aplicações potenciais: Vendas e Marketing Identificar padrões de comportamento de consumidores Associar comportamentos à características demográficas de consumidores Campanhas de marketing direto Identificar consumidores “leais”
  • 67. Área de atuação Áreas de aplicações potenciais: Bancos Identificar padrões de fraudes (cartões de crédito) Identificar características de correntistas Mercado Financeiro Médica Comportamento de pacientes Identificar terapias de sucessos para diferentes tratamentos Fraudes em planos de saúdes Comportamento de usuários de planos de saúde
  • 68. Exemplos Fraldas e cervejas O que as cervejas tem a ver com as fraldas ? Homens casados, entre 25 e 30 anos, compravam fraldas e/ou cervejas às sextas-feiras à tarde no caminho do trabalho para casa; Wal-Mart otimizou às gôndolas nos pontos de vendas, colocando as fraldas ao lado das cervejas Resultado: o consumo cresceu 30%
  • 69. Exemplos Lojas Brasileiras Aplicou 1 milhão de dólares em técnicas de data mining Reduziu de 51000 produtos para 14000 produtos oferecidos em suas lojas Exemplo de anomalias detectadas: – Roupas de inverno e guarda chuvas encalhadas no nordeste – Batedeiras 110v a venda em SC onde a corrente é 220v
  • 70. Conclusões Data Warehouse é um sistema de aquisição de informação que mantém um histórico para avaliação posterior, além de manter de forma unificada e padronizada os dados que são adquiridos Data Mining é um processo que permite compreender o comportamento dos dados Tem um suporte muito forte em I. A. Pode ser bem aplicado em diversas áreas de negócios Só será eficiente se o valor das informações extraídas exceder o custo do processamento dos dados brutos
  • 71. Bibliografia www.db-book.com www.the-data-mine.com http://www.intelliwise.com/reports/i2002.htm www.anderson.ucla.edu/faculty/jason.frand/te acher/technologies/palace/datamining.htm http://www.thearling.com/text/dmwhite/dmwhit e.htm
  • 72. Bibliografia http://www.cs.bham.ac.uk/~anp/TheDataMine. html http://www.satafe.edu/~kurt/index.shtml http://pt.wikipedia.org/wiki/Data_Warehouse www.baguete.com.br/artigosDetalhes.php?id= 154 www.ica.ele.puc-rio.br/cursos/download/DM- apostila1.pdf
  • 73. Data Warehouse & Data Mining Bruno Machado Jerônimo Madruga