SlideShare uma empresa Scribd logo
1 de 1
Baixar para ler offline
Gilberto Pereira
Project Manager
gilberto.pereira@pessoaseprocessos.com
Garbage in, garbage out. Para quem trabalha
em projectos de BI, ou em qualquer outra
área que contemple alguma componente de
integração de dados, esta é uma verdade de
La Palice. Traduzindo de uma forma muito
simplista, não se pode esperar dados de
qualidade como output de um processo,
quando os dados de entrada do mesmo não
têm a qualidade necessária.
O que é então a qualidade dos dados? É a
percepção de que esses dados servem os
propósitos a que se destinam, tendo em
conta o contexto de utilização. Cobre vários
aspectos sobre os dados, que vão desde a
sua integridade, completude, confiança,
correcção, precisão, relevância, consistência,
condições de acesso, estado de actualização,
e muitos outros.
Uma das tarefas de um consultor num
projecto de BI é precisamente garantir a
qualidade dos dados, por outras palavras, ser
responsável pelo “Data Quality
Management” do projecto. É nossa
responsabilidade explorar a riqueza dos
dados que o cliente dispõe, tentando sempre
obter outputs de qualidade, mesmo quando
os dados disponíveis têm uma qualidade,
digamos, duvidosa. E para isso contamos
com a ajuda do Data Quality Management
Framework, que não é mais do que uma
versão do nosso já bem conhecido ciclo de
vida das aplicações.
A primeira fase é o Data Assessment. É aqui
que, após um processo de descoberta e
validação dos dados, se decide quais os que
não podem ser usados, por não
apresentarem a qualidade mínima necessária.
É aqui também que se seleccionam os dados
que podem ser usados directamente, ou
aqueles para os quais são necessárias
alterações aos processos de geração, para
que possam vir a ser usados.
De seguida vem a fase do Data
Transformation, onde se definem e
implementam os processos de extracção,
transformação e carga (ETL) necessários
para garantir que temos os dados que
necessitamos, onde necessitamos, e no
formato que necessitamos.
A 3ª fase é a fase de Data Monitoring, onde
se certifica que os dados mantêm os critérios
de qualidade necessários para cumprir com
os objectivos do projecto. No decorrer
destes processos de monitorização podem
ocorrer necessidades de correcção ou novas
descobertas, pelo que o ciclo deve ser
reiniciado, transformando assim o Data
Quality Management num processo contínuo
que só termina verdadeiramente quando a
aplicação para a qual foi implementado for
descontinuada.
Nota: Este texto não se encontra escrito ao
abrigo do novo acordo ortográfico.
Qualidade dos
Dados vs Dados de
Qualidade

Mais conteúdo relacionado

Destaque

SICAP - Sistema de Informação para Controlo e Acompanhamento de Projetos
SICAP - Sistema de Informação para Controlo e Acompanhamento de ProjetosSICAP - Sistema de Informação para Controlo e Acompanhamento de Projetos
SICAP - Sistema de Informação para Controlo e Acompanhamento de ProjetosP&P - Pessoas e Processos
 
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...Maria Angelica Castellani
 

Destaque (7)

SICAP - Sistema de Informação para Controlo e Acompanhamento de Projetos
SICAP - Sistema de Informação para Controlo e Acompanhamento de ProjetosSICAP - Sistema de Informação para Controlo e Acompanhamento de Projetos
SICAP - Sistema de Informação para Controlo e Acompanhamento de Projetos
 
Folha Informativa de Consultoria P&P
Folha Informativa de Consultoria P&PFolha Informativa de Consultoria P&P
Folha Informativa de Consultoria P&P
 
P&P - Plataforma de gestão educativa
P&P - Plataforma de gestão educativaP&P - Plataforma de gestão educativa
P&P - Plataforma de gestão educativa
 
CPM - Transformação e Maturidade
CPM - Transformação e MaturidadeCPM - Transformação e Maturidade
CPM - Transformação e Maturidade
 
A evolução do CRM: Social CRM
A evolução do CRM: Social CRMA evolução do CRM: Social CRM
A evolução do CRM: Social CRM
 
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...
Gestão de Portfolio Integrando Projetos e Processos (PMO+BPMO) como Centro de...
 
P&P PMO - Folha Informativa
P&P PMO - Folha Informativa P&P PMO - Folha Informativa
P&P PMO - Folha Informativa
 

Semelhante a Garbage in, garbage out - Qualidade dos Dados vs Dados de Qualidade

20BI-Artigo_TCC_final
20BI-Artigo_TCC_final20BI-Artigo_TCC_final
20BI-Artigo_TCC_finalJohn Stracci
 
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...Universidade de São Paulo (EEL USP)
 
A03 paper - perfil business intelligence - a cadeia de processamento
A03   paper - perfil business intelligence - a cadeia de processamentoA03   paper - perfil business intelligence - a cadeia de processamento
A03 paper - perfil business intelligence - a cadeia de processamentoMarcelo Krug
 
realizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesrealizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesarthurjosemberg
 
Geração Tec - Help Desk - Tenha um Helpdesk de Qualidade
Geração Tec - Help Desk - Tenha um Helpdesk de QualidadeGeração Tec - Help Desk - Tenha um Helpdesk de Qualidade
Geração Tec - Help Desk - Tenha um Helpdesk de QualidadeAlan Carlos
 
Indicadores de políticas públicas e métricas de software: uma visão em paralelo
Indicadores de políticas públicas e métricas de software: uma visão em paraleloIndicadores de políticas públicas e métricas de software: uma visão em paralelo
Indicadores de políticas públicas e métricas de software: uma visão em paraleloRoberto de Pinho
 
Gerencia de Decisões
Gerencia de DecisõesGerencia de Decisões
Gerencia de Decisõesmarviowesley
 
Gestao da tecnologia_da_informacao_unidade_ii
Gestao da tecnologia_da_informacao_unidade_iiGestao da tecnologia_da_informacao_unidade_ii
Gestao da tecnologia_da_informacao_unidade_iimambrosino
 
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...ferbsi
 
O Modelo de Decisão para Profissionais de Administração de Dados
O Modelo de Decisão para Profissionais de Administração de DadosO Modelo de Decisão para Profissionais de Administração de Dados
O Modelo de Decisão para Profissionais de Administração de DadosCentus Consultoria
 
Qualidade de dados Aula Compacta.pdf
Qualidade de dados Aula Compacta.pdfQualidade de dados Aula Compacta.pdf
Qualidade de dados Aula Compacta.pdfCelso Paquete Cellso
 
GOVERNANCA DE DADOS.pdf
GOVERNANCA DE DADOS.pdfGOVERNANCA DE DADOS.pdf
GOVERNANCA DE DADOS.pdfJoseEPininga
 
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...tdc-globalcode
 

Semelhante a Garbage in, garbage out - Qualidade dos Dados vs Dados de Qualidade (20)

20BI-Artigo_TCC_final
20BI-Artigo_TCC_final20BI-Artigo_TCC_final
20BI-Artigo_TCC_final
 
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...
A Importância dos Sistemas de Qualidade para o Desenvolvimento de Software da...
 
A03 paper - perfil business intelligence - a cadeia de processamento
A03   paper - perfil business intelligence - a cadeia de processamentoA03   paper - perfil business intelligence - a cadeia de processamento
A03 paper - perfil business intelligence - a cadeia de processamento
 
realizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesrealizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_services
 
Geração Tec - Help Desk - Tenha um Helpdesk de Qualidade
Geração Tec - Help Desk - Tenha um Helpdesk de QualidadeGeração Tec - Help Desk - Tenha um Helpdesk de Qualidade
Geração Tec - Help Desk - Tenha um Helpdesk de Qualidade
 
Indicadores de políticas públicas e métricas de software: uma visão em paralelo
Indicadores de políticas públicas e métricas de software: uma visão em paraleloIndicadores de políticas públicas e métricas de software: uma visão em paralelo
Indicadores de políticas públicas e métricas de software: uma visão em paralelo
 
Gerencia de Decisões
Gerencia de DecisõesGerencia de Decisões
Gerencia de Decisões
 
Benchmarking e resultados
Benchmarking e resultadosBenchmarking e resultados
Benchmarking e resultados
 
Gestao da tecnologia_da_informacao_unidade_ii
Gestao da tecnologia_da_informacao_unidade_iiGestao da tecnologia_da_informacao_unidade_ii
Gestao da tecnologia_da_informacao_unidade_ii
 
Avaliação da Qualidade da Informação em empresa de TI
Avaliação da Qualidade da Informação em empresa de TIAvaliação da Qualidade da Informação em empresa de TI
Avaliação da Qualidade da Informação em empresa de TI
 
Mpsbr
MpsbrMpsbr
Mpsbr
 
Cobit2
Cobit2Cobit2
Cobit2
 
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...
SISTEMA DE INFORMAÇÃO PARA GERENCIAMENTO DE PRODUTOS E/OU SERVIÇOS EM EMPRESA...
 
Apresentação
ApresentaçãoApresentação
Apresentação
 
O Modelo de Decisão para Profissionais de Administração de Dados
O Modelo de Decisão para Profissionais de Administração de DadosO Modelo de Decisão para Profissionais de Administração de Dados
O Modelo de Decisão para Profissionais de Administração de Dados
 
Qualidade de dados Aula Compacta.pdf
Qualidade de dados Aula Compacta.pdfQualidade de dados Aula Compacta.pdf
Qualidade de dados Aula Compacta.pdf
 
MPS.BR
MPS.BRMPS.BR
MPS.BR
 
Artigo jad utfpr
Artigo jad utfprArtigo jad utfpr
Artigo jad utfpr
 
GOVERNANCA DE DADOS.pdf
GOVERNANCA DE DADOS.pdfGOVERNANCA DE DADOS.pdf
GOVERNANCA DE DADOS.pdf
 
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...
TDC2018SP | Trilha Arq Dados - A importância da Governança de dados, MDM e Qu...
 

Último

Conferência SC 2024 | De vilão a herói: como o frete vai salvar as suas vendas
Conferência SC 2024 |  De vilão a herói: como o frete vai salvar as suas vendasConferência SC 2024 |  De vilão a herói: como o frete vai salvar as suas vendas
Conferência SC 2024 | De vilão a herói: como o frete vai salvar as suas vendasE-Commerce Brasil
 
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?E-Commerce Brasil
 
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...E-Commerce Brasil
 
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)E-Commerce Brasil
 
Conferência SC 24 | O custo real de uma operação
Conferência SC 24 | O custo real de uma operaçãoConferência SC 24 | O custo real de uma operação
Conferência SC 24 | O custo real de uma operaçãoE-Commerce Brasil
 
Conferência SC 24 | Estratégias de precificação: loja própria e marketplace
Conferência SC 24 | Estratégias de precificação: loja própria e marketplaceConferência SC 24 | Estratégias de precificação: loja própria e marketplace
Conferência SC 24 | Estratégias de precificação: loja própria e marketplaceE-Commerce Brasil
 
Conferência SC 24 | Estratégias de precificação para múltiplos canais de venda
Conferência SC 24 | Estratégias de precificação para múltiplos canais de vendaConferência SC 24 | Estratégias de precificação para múltiplos canais de venda
Conferência SC 24 | Estratégias de precificação para múltiplos canais de vendaE-Commerce Brasil
 
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...E-Commerce Brasil
 
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...Welldonelily Skype
 
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...E-Commerce Brasil
 
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024E-Commerce Brasil
 
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...E-Commerce Brasil
 
Conferência SC 24 | Gestão logística para redução de custos e fidelização
Conferência SC 24 | Gestão logística para redução de custos e fidelizaçãoConferência SC 24 | Gestão logística para redução de custos e fidelização
Conferência SC 24 | Gestão logística para redução de custos e fidelizaçãoE-Commerce Brasil
 
66ssssssssssssssssssssssssssssss4434.pptx
66ssssssssssssssssssssssssssssss4434.pptx66ssssssssssssssssssssssssssssss4434.pptx
66ssssssssssssssssssssssssssssss4434.pptxLEANDROSPANHOL1
 
Ética NO AMBIENTE DE TRABALHO, fundamentosdas relações.pdf
Ética NO AMBIENTE DE TRABALHO,  fundamentosdas relações.pdfÉtica NO AMBIENTE DE TRABALHO,  fundamentosdas relações.pdf
Ética NO AMBIENTE DE TRABALHO, fundamentosdas relações.pdfInsttLcioEvangelista
 
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?E-Commerce Brasil
 
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagens
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagensEP GRUPO - Mídia Kit 2024 - conexão de marcas e personagens
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagensLuizPauloFerreira11
 
representações cartograficas - 1 ano.pptx
representações cartograficas - 1 ano.pptxrepresentações cartograficas - 1 ano.pptx
representações cartograficas - 1 ano.pptxCarladeOliveira25
 
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...Conferência SC 24 | Inteligência artificial no checkout: como a automatização...
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...E-Commerce Brasil
 

Último (19)

Conferência SC 2024 | De vilão a herói: como o frete vai salvar as suas vendas
Conferência SC 2024 |  De vilão a herói: como o frete vai salvar as suas vendasConferência SC 2024 |  De vilão a herói: como o frete vai salvar as suas vendas
Conferência SC 2024 | De vilão a herói: como o frete vai salvar as suas vendas
 
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?
Conferência SC 24 | Data Analytics e IA: o futuro do e-commerce?
 
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...
Conferência SC 24 | A força da geolocalização impulsionada em ADS e Fullcomme...
 
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)
Conferência SC 24 | Otimize sua logística reversa com opções OOH (out of home)
 
Conferência SC 24 | O custo real de uma operação
Conferência SC 24 | O custo real de uma operaçãoConferência SC 24 | O custo real de uma operação
Conferência SC 24 | O custo real de uma operação
 
Conferência SC 24 | Estratégias de precificação: loja própria e marketplace
Conferência SC 24 | Estratégias de precificação: loja própria e marketplaceConferência SC 24 | Estratégias de precificação: loja própria e marketplace
Conferência SC 24 | Estratégias de precificação: loja própria e marketplace
 
Conferência SC 24 | Estratégias de precificação para múltiplos canais de venda
Conferência SC 24 | Estratégias de precificação para múltiplos canais de vendaConferência SC 24 | Estratégias de precificação para múltiplos canais de venda
Conferência SC 24 | Estratégias de precificação para múltiplos canais de venda
 
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...
Conferência SC 24 | Social commerce e recursos interativos: como aplicar no s...
 
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...
Products Catalogue-01-Electronics thin wall heat shrink tubing wire and cable...
 
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...
Conferência SC 24 | Estratégias de diversificação de investimento em mídias d...
 
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024
Conferência SC 2024 | Tendências e oportunidades de vender mais em 2024
 
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...
Conferência SC 24 | Estratégias omnicanal: transformando a logística em exper...
 
Conferência SC 24 | Gestão logística para redução de custos e fidelização
Conferência SC 24 | Gestão logística para redução de custos e fidelizaçãoConferência SC 24 | Gestão logística para redução de custos e fidelização
Conferência SC 24 | Gestão logística para redução de custos e fidelização
 
66ssssssssssssssssssssssssssssss4434.pptx
66ssssssssssssssssssssssssssssss4434.pptx66ssssssssssssssssssssssssssssss4434.pptx
66ssssssssssssssssssssssssssssss4434.pptx
 
Ética NO AMBIENTE DE TRABALHO, fundamentosdas relações.pdf
Ética NO AMBIENTE DE TRABALHO,  fundamentosdas relações.pdfÉtica NO AMBIENTE DE TRABALHO,  fundamentosdas relações.pdf
Ética NO AMBIENTE DE TRABALHO, fundamentosdas relações.pdf
 
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?
Conferência SC 24 | Omnichannel: uma cultura ou apenas um recurso comercial?
 
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagens
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagensEP GRUPO - Mídia Kit 2024 - conexão de marcas e personagens
EP GRUPO - Mídia Kit 2024 - conexão de marcas e personagens
 
representações cartograficas - 1 ano.pptx
representações cartograficas - 1 ano.pptxrepresentações cartograficas - 1 ano.pptx
representações cartograficas - 1 ano.pptx
 
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...Conferência SC 24 | Inteligência artificial no checkout: como a automatização...
Conferência SC 24 | Inteligência artificial no checkout: como a automatização...
 

Garbage in, garbage out - Qualidade dos Dados vs Dados de Qualidade

  • 1. Gilberto Pereira Project Manager gilberto.pereira@pessoaseprocessos.com Garbage in, garbage out. Para quem trabalha em projectos de BI, ou em qualquer outra área que contemple alguma componente de integração de dados, esta é uma verdade de La Palice. Traduzindo de uma forma muito simplista, não se pode esperar dados de qualidade como output de um processo, quando os dados de entrada do mesmo não têm a qualidade necessária. O que é então a qualidade dos dados? É a percepção de que esses dados servem os propósitos a que se destinam, tendo em conta o contexto de utilização. Cobre vários aspectos sobre os dados, que vão desde a sua integridade, completude, confiança, correcção, precisão, relevância, consistência, condições de acesso, estado de actualização, e muitos outros. Uma das tarefas de um consultor num projecto de BI é precisamente garantir a qualidade dos dados, por outras palavras, ser responsável pelo “Data Quality Management” do projecto. É nossa responsabilidade explorar a riqueza dos dados que o cliente dispõe, tentando sempre obter outputs de qualidade, mesmo quando os dados disponíveis têm uma qualidade, digamos, duvidosa. E para isso contamos com a ajuda do Data Quality Management Framework, que não é mais do que uma versão do nosso já bem conhecido ciclo de vida das aplicações. A primeira fase é o Data Assessment. É aqui que, após um processo de descoberta e validação dos dados, se decide quais os que não podem ser usados, por não apresentarem a qualidade mínima necessária. É aqui também que se seleccionam os dados que podem ser usados directamente, ou aqueles para os quais são necessárias alterações aos processos de geração, para que possam vir a ser usados. De seguida vem a fase do Data Transformation, onde se definem e implementam os processos de extracção, transformação e carga (ETL) necessários para garantir que temos os dados que necessitamos, onde necessitamos, e no formato que necessitamos. A 3ª fase é a fase de Data Monitoring, onde se certifica que os dados mantêm os critérios de qualidade necessários para cumprir com os objectivos do projecto. No decorrer destes processos de monitorização podem ocorrer necessidades de correcção ou novas descobertas, pelo que o ciclo deve ser reiniciado, transformando assim o Data Quality Management num processo contínuo que só termina verdadeiramente quando a aplicação para a qual foi implementado for descontinuada. Nota: Este texto não se encontra escrito ao abrigo do novo acordo ortográfico. Qualidade dos Dados vs Dados de Qualidade