SlideShare uma empresa Scribd logo
1 de 10
DATA QUALITY
UNIDADE CURRICULAR: GESTÃO DE DADOS
DISCENTE: DINA MARQUES
DOCENTE: CARLOS COSTA
ANO LETIVO: 2017/2018
DATA QUALITY
▪ Hoffer (2007): define dados como sendo objetos
e eventos que estão armazenados de forma a
estarem à disposição dos utilizadores.
▪ Strong & Wang (1996): afirmam que os dados
com qualidade são os que estão aptos a serem
utilizados pelos consumidores.
▪ Redman (2004): define que os dados com
qualidade estão aptos a ser utilizados nas
operações de planeamento e tomada de decisão.
PROBLEMA - DATA QUALITY NAS EMPRESAS
DINA MARQUES - MQDEE
Vayghan et al.
(2007)
Dados Mestre
Criados uma vez mas
usados com muita
frequência
Ex: Característica dos
produtos
Dados
Transacionais
O Caso da faturação
Dados
Históricos
DINA MARQUES - MQDEE
Redman (1998)
Impacto nas
Operações
Insatisfação por parte
dos funcionários e
clientes levando a um
aumento dos custos
Impacto ao
Nível Tático
Tomadas de decisão
menos precisas e
mais demoradas
Impacto
Estratégico
Desvio da atenção
dos Gestores
DINA MARQUES - MQDEE
DATA QUALITY MANAGEMENT - GEIGER (2004)
BOA RELAÇÃO ENTRE AS TI E O NEGÓCIO
• Nenhum departamento se quer responsabilizar
• Requer uma cooperação multifuncional, envolvendo toda a empresa.
• Acarreta custos.
• É um trabalho intensivo dado que é necessário identificar os
principais problemas e requer muita disciplina.
• O retorno de tal investimento é difícil de quantificar.
DINA MARQUES - MQDEE
1. Caraterização dos dados para analisar as
especificidades dos dados
2. Qual a qualidade dos dados para perceber os
problemas dos mesmos
3. Integração dos dados em diferentes bases de
dados
4. Aumento do valor dos dados
1. Excluir dados
2. Aceitar dados
3. Corrigir os dados
4. Usar um valor padrão
DINA MARQUES - MQDEE
Id Título Autor
Ano da
primeira
publicação
1 Ensaio sobre a
Cegueira
Sophia de Mello
Breyner
1995
2 A fada Oriana José Saramago 1964
3 A fórmula de
Deus
João Rodrigues Santos 0
4 O Primo Basílio NULL 1878
1º Erro: Sintática: José em vez de
João
2º Erro: Semântica: Troca de
Autores entre o livro 1 e 2
3ºErro: Informação incompleta:
para o livro 4 não há autor
4ºErro: Consistência : Não pode
haver livros lançados na data 0 dado
que já foram todos publicados
QUALIDADE DOS DADOS PROPRIAMENTE DITOS
DINA MARQUES - MQDEE
QUALIDADE DOS DADOS EM RELAÇÃO AO ESQUEMA
Duas formas de modelar pessoa e morada
Fonte: Data Quality: Concepts, Methodologies and Techniques (Adaptado)
DINA MARQUES - MQDEE
POTTER’S WHEEL
FORMAT: modificação de uma
coluna, alterando o nome da
mesma
SPLIT: dividir uma coluna em
duas
MERGE: agrupar colunas
DINA MARQUES - MQDEE
PROBLEMA DA DUPLICAÇÃO DE DADOS
EXCEL
DINA MARQUES - MQDEE
ACCESS

Mais conteúdo relacionado

Mais de eurosigdoc acm

CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALeurosigdoc acm
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGeurosigdoc acm
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõeseurosigdoc acm
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automationeurosigdoc acm
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDEeurosigdoc acm
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desportoeurosigdoc acm
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?eurosigdoc acm
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...eurosigdoc acm
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo eurosigdoc acm
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Codeeurosigdoc acm
 
Aplicação dos Principios de Gamification em Contexto e-learning
Aplicação dos Principios de Gamification em Contexto e-learningAplicação dos Principios de Gamification em Contexto e-learning
Aplicação dos Principios de Gamification em Contexto e-learningeurosigdoc acm
 
Estimação dos parâmetros de uma fila de espera M/M/1 usando Python
Estimação dos parâmetros de uma fila de espera M/M/1 usando PythonEstimação dos parâmetros de uma fila de espera M/M/1 usando Python
Estimação dos parâmetros de uma fila de espera M/M/1 usando Pythoneurosigdoc acm
 
Crowdfunding e crowdsourcing
Crowdfunding e crowdsourcingCrowdfunding e crowdsourcing
Crowdfunding e crowdsourcingeurosigdoc acm
 

Mais de eurosigdoc acm (20)

CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
 
Blockchain
Blockchain Blockchain
Blockchain
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
 
Erp
ErpErp
Erp
 
ERP
ERPERP
ERP
 
Aplicação dos Principios de Gamification em Contexto e-learning
Aplicação dos Principios de Gamification em Contexto e-learningAplicação dos Principios de Gamification em Contexto e-learning
Aplicação dos Principios de Gamification em Contexto e-learning
 
ERP: Caso Hydra IT
ERP: Caso Hydra ITERP: Caso Hydra IT
ERP: Caso Hydra IT
 
Nuvem de Computação
Nuvem de ComputaçãoNuvem de Computação
Nuvem de Computação
 
Estimação dos parâmetros de uma fila de espera M/M/1 usando Python
Estimação dos parâmetros de uma fila de espera M/M/1 usando PythonEstimação dos parâmetros de uma fila de espera M/M/1 usando Python
Estimação dos parâmetros de uma fila de espera M/M/1 usando Python
 
Crowdfunding e crowdsourcing
Crowdfunding e crowdsourcingCrowdfunding e crowdsourcing
Crowdfunding e crowdsourcing
 
Data Mining
Data MiningData Mining
Data Mining
 
Fake News
Fake NewsFake News
Fake News
 

Último

ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx2m Assessoria
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploDanilo Pinotti
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx2m Assessoria
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsDanilo Pinotti
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx2m Assessoria
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx2m Assessoria
 

Último (6)

ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 

Data Quality

  • 1. DATA QUALITY UNIDADE CURRICULAR: GESTÃO DE DADOS DISCENTE: DINA MARQUES DOCENTE: CARLOS COSTA ANO LETIVO: 2017/2018
  • 2. DATA QUALITY ▪ Hoffer (2007): define dados como sendo objetos e eventos que estão armazenados de forma a estarem à disposição dos utilizadores. ▪ Strong & Wang (1996): afirmam que os dados com qualidade são os que estão aptos a serem utilizados pelos consumidores. ▪ Redman (2004): define que os dados com qualidade estão aptos a ser utilizados nas operações de planeamento e tomada de decisão. PROBLEMA - DATA QUALITY NAS EMPRESAS DINA MARQUES - MQDEE
  • 3. Vayghan et al. (2007) Dados Mestre Criados uma vez mas usados com muita frequência Ex: Característica dos produtos Dados Transacionais O Caso da faturação Dados Históricos DINA MARQUES - MQDEE
  • 4. Redman (1998) Impacto nas Operações Insatisfação por parte dos funcionários e clientes levando a um aumento dos custos Impacto ao Nível Tático Tomadas de decisão menos precisas e mais demoradas Impacto Estratégico Desvio da atenção dos Gestores DINA MARQUES - MQDEE
  • 5. DATA QUALITY MANAGEMENT - GEIGER (2004) BOA RELAÇÃO ENTRE AS TI E O NEGÓCIO • Nenhum departamento se quer responsabilizar • Requer uma cooperação multifuncional, envolvendo toda a empresa. • Acarreta custos. • É um trabalho intensivo dado que é necessário identificar os principais problemas e requer muita disciplina. • O retorno de tal investimento é difícil de quantificar. DINA MARQUES - MQDEE
  • 6. 1. Caraterização dos dados para analisar as especificidades dos dados 2. Qual a qualidade dos dados para perceber os problemas dos mesmos 3. Integração dos dados em diferentes bases de dados 4. Aumento do valor dos dados 1. Excluir dados 2. Aceitar dados 3. Corrigir os dados 4. Usar um valor padrão DINA MARQUES - MQDEE
  • 7. Id Título Autor Ano da primeira publicação 1 Ensaio sobre a Cegueira Sophia de Mello Breyner 1995 2 A fada Oriana José Saramago 1964 3 A fórmula de Deus João Rodrigues Santos 0 4 O Primo Basílio NULL 1878 1º Erro: Sintática: José em vez de João 2º Erro: Semântica: Troca de Autores entre o livro 1 e 2 3ºErro: Informação incompleta: para o livro 4 não há autor 4ºErro: Consistência : Não pode haver livros lançados na data 0 dado que já foram todos publicados QUALIDADE DOS DADOS PROPRIAMENTE DITOS DINA MARQUES - MQDEE
  • 8. QUALIDADE DOS DADOS EM RELAÇÃO AO ESQUEMA Duas formas de modelar pessoa e morada Fonte: Data Quality: Concepts, Methodologies and Techniques (Adaptado) DINA MARQUES - MQDEE
  • 9. POTTER’S WHEEL FORMAT: modificação de uma coluna, alterando o nome da mesma SPLIT: dividir uma coluna em duas MERGE: agrupar colunas DINA MARQUES - MQDEE
  • 10. PROBLEMA DA DUPLICAÇÃO DE DADOS EXCEL DINA MARQUES - MQDEE ACCESS