DATA QUALITY
UNIDADE CURRICULAR: GESTÃO DE DADOS
DISCENTE: DINA MARQUES
DOCENTE: CARLOS COSTA
ANO LETIVO: 2017/2018
DATA QUALITY
▪ Hoffer (2007): define dados como sendo objetos
e eventos que estão armazenados de forma a
estarem à disposição dos utilizadores.
▪ Strong & Wang (1996): afirmam que os dados
com qualidade são os que estão aptos a serem
utilizados pelos consumidores.
▪ Redman (2004): define que os dados com
qualidade estão aptos a ser utilizados nas
operações de planeamento e tomada de decisão.
PROBLEMA - DATA QUALITY NAS EMPRESAS
DINA MARQUES - MQDEE
Vayghan et al.
(2007)
Dados Mestre
Criados uma vez mas
usados com muita
frequência
Ex: Característica dos
produtos
Dados
Transacionais
O Caso da faturação
Dados
Históricos
DINA MARQUES - MQDEE
Redman (1998)
Impacto nas
Operações
Insatisfação por parte
dos funcionários e
clientes levando a um
aumento dos custos
Impacto ao
Nível Tático
Tomadas de decisão
menos precisas e
mais demoradas
Impacto
Estratégico
Desvio da atenção
dos Gestores
DINA MARQUES - MQDEE
DATA QUALITY MANAGEMENT - GEIGER (2004)
BOA RELAÇÃO ENTRE AS TI E O NEGÓCIO
• Nenhum departamento se quer responsabilizar
• Requer uma cooperação multifuncional, envolvendo toda a empresa.
• Acarreta custos.
• É um trabalho intensivo dado que é necessário identificar os
principais problemas e requer muita disciplina.
• O retorno de tal investimento é difícil de quantificar.
DINA MARQUES - MQDEE
1. Caraterização dos dados para analisar as
especificidades dos dados
2. Qual a qualidade dos dados para perceber os
problemas dos mesmos
3. Integração dos dados em diferentes bases de
dados
4. Aumento do valor dos dados
1. Excluir dados
2. Aceitar dados
3. Corrigir os dados
4. Usar um valor padrão
DINA MARQUES - MQDEE
Id Título Autor
Ano da
primeira
publicação
1 Ensaio sobre a
Cegueira
Sophia de Mello
Breyner
1995
2 A fada Oriana José Saramago 1964
3 A fórmula de
Deus
João Rodrigues Santos 0
4 O Primo Basílio NULL 1878
1º Erro: Sintática: José em vez de
João
2º Erro: Semântica: Troca de
Autores entre o livro 1 e 2
3ºErro: Informação incompleta:
para o livro 4 não há autor
4ºErro: Consistência : Não pode
haver livros lançados na data 0 dado
que já foram todos publicados
QUALIDADE DOS DADOS PROPRIAMENTE DITOS
DINA MARQUES - MQDEE
QUALIDADE DOS DADOS EM RELAÇÃO AO ESQUEMA
Duas formas de modelar pessoa e morada
Fonte: Data Quality: Concepts, Methodologies and Techniques (Adaptado)
DINA MARQUES - MQDEE
POTTER’S WHEEL
FORMAT: modificação de uma
coluna, alterando o nome da
mesma
SPLIT: dividir uma coluna em
duas
MERGE: agrupar colunas
DINA MARQUES - MQDEE
PROBLEMA DA DUPLICAÇÃO DE DADOS
EXCEL
DINA MARQUES - MQDEE
ACCESS

Data Quality

  • 1.
    DATA QUALITY UNIDADE CURRICULAR:GESTÃO DE DADOS DISCENTE: DINA MARQUES DOCENTE: CARLOS COSTA ANO LETIVO: 2017/2018
  • 2.
    DATA QUALITY ▪ Hoffer(2007): define dados como sendo objetos e eventos que estão armazenados de forma a estarem à disposição dos utilizadores. ▪ Strong & Wang (1996): afirmam que os dados com qualidade são os que estão aptos a serem utilizados pelos consumidores. ▪ Redman (2004): define que os dados com qualidade estão aptos a ser utilizados nas operações de planeamento e tomada de decisão. PROBLEMA - DATA QUALITY NAS EMPRESAS DINA MARQUES - MQDEE
  • 3.
    Vayghan et al. (2007) DadosMestre Criados uma vez mas usados com muita frequência Ex: Característica dos produtos Dados Transacionais O Caso da faturação Dados Históricos DINA MARQUES - MQDEE
  • 4.
    Redman (1998) Impacto nas Operações Insatisfaçãopor parte dos funcionários e clientes levando a um aumento dos custos Impacto ao Nível Tático Tomadas de decisão menos precisas e mais demoradas Impacto Estratégico Desvio da atenção dos Gestores DINA MARQUES - MQDEE
  • 5.
    DATA QUALITY MANAGEMENT- GEIGER (2004) BOA RELAÇÃO ENTRE AS TI E O NEGÓCIO • Nenhum departamento se quer responsabilizar • Requer uma cooperação multifuncional, envolvendo toda a empresa. • Acarreta custos. • É um trabalho intensivo dado que é necessário identificar os principais problemas e requer muita disciplina. • O retorno de tal investimento é difícil de quantificar. DINA MARQUES - MQDEE
  • 6.
    1. Caraterização dosdados para analisar as especificidades dos dados 2. Qual a qualidade dos dados para perceber os problemas dos mesmos 3. Integração dos dados em diferentes bases de dados 4. Aumento do valor dos dados 1. Excluir dados 2. Aceitar dados 3. Corrigir os dados 4. Usar um valor padrão DINA MARQUES - MQDEE
  • 7.
    Id Título Autor Anoda primeira publicação 1 Ensaio sobre a Cegueira Sophia de Mello Breyner 1995 2 A fada Oriana José Saramago 1964 3 A fórmula de Deus João Rodrigues Santos 0 4 O Primo Basílio NULL 1878 1º Erro: Sintática: José em vez de João 2º Erro: Semântica: Troca de Autores entre o livro 1 e 2 3ºErro: Informação incompleta: para o livro 4 não há autor 4ºErro: Consistência : Não pode haver livros lançados na data 0 dado que já foram todos publicados QUALIDADE DOS DADOS PROPRIAMENTE DITOS DINA MARQUES - MQDEE
  • 8.
    QUALIDADE DOS DADOSEM RELAÇÃO AO ESQUEMA Duas formas de modelar pessoa e morada Fonte: Data Quality: Concepts, Methodologies and Techniques (Adaptado) DINA MARQUES - MQDEE
  • 9.
    POTTER’S WHEEL FORMAT: modificaçãode uma coluna, alterando o nome da mesma SPLIT: dividir uma coluna em duas MERGE: agrupar colunas DINA MARQUES - MQDEE
  • 10.
    PROBLEMA DA DUPLICAÇÃODE DADOS EXCEL DINA MARQUES - MQDEE ACCESS