Fonte: https://www.escolavirtual.gov.br/curso/270/
Lição módulo 1
1. Introdução
O que é importante em uma organização?
Pessoas, orçamento, equipamentos, imóveis, dados… é difícil pensar no funcionamento de
organizações na ausência de um desses elementos, o que prova a importância de todos eles. Vários
desses são ativos essenciais à maioria das entidades e, como tais, devem ser bem geridos e
governados, de modo a maximizar o seu valor.
Você sabe a distinção entre gerir e governar?
Em síntese, gerir é garantir que fazemos certo as coisas, enquanto governar é garantir que fazemos as
coisas certas. (WODZINSKI et al, 2015).
O que vem a ser Governança de Dados?
Em suma, a Governança de Dados é responsável por gerir os princípios de organização e controle de
dados e informações. Esta gestão envolve uma interface com diversas outras funções e estabelece
políticas e diretrizes corporativas para, além de atribuir papéis e responsabilidades, governar os dados.
O escopo de atuação da Governança de Dados é muito amplo. Engana-se quem acha que ela atua
somente no patamar das normas e dos padrões ou por meio de controles e permissões de acesso a
dados e informações.
A Governança de Dados também atua com uma visão mais apurada sobre os dados estratégicos da
organização, definindo e analisando os processos que produzem e se abastecem desses dados.
Governança de Dados, segundo consta no Inciso VI do Art. 2º da Portaria STI/MP nº 58, de 23 de
dezembro de 2016, é o conjunto de políticas, processos, pessoas e tecnologias que visam a estruturar
e administrar os ativos de informação, com o objetivo de aprimorar a eficiência dos processos de
gestão e da qualidade dos dados, a fim de promover eficiência operacional, bem como garantir a
confiabilidade das informações que suportam a tomada de decisão.
São objetivos da Governança de Dados:
 Definir e implementar estratégias de dados, políticas, normas, padrões, arquitetura, processos
e métricas.
 Patrocinar e monitorar os projetos relacionados à Gestão de Dados.
 Implementar e gerenciar a Gestão de Riscos relacionada ao compartilhamento de dados.
 Promover o valor dos dados como ativos estratégicos.
2. A Importância da Governança de Dados
Governança de Dados permite validar, qualificar, distribuir, organizar e armazenar as informações da
organização de maneira precisa, ágil e eficiente.
Um exemplo prático de uso da Governança de Dados pode ser verificado na implementação da
plataforma de Análise de Dados para Administração Pública, denominada GovData. Essa plataforma
disponibiliza infraestrutura de armazenamento e hospedagem, permitindo o cruzamento de grandes
volumes de dados, visando:
1. A utilização de ferramentas para análise e cruzamento de dados para geração de informações
para a tomada de decisões.
2. O favorecimento da desburocratização por meio de acesso centralizado a informações de
governo para simplificar a oferta de serviços públicos.
3. A ampliação da transparência permitindo a análise de contas públicas para combater fraudes.
4. A adoção de tecnologia de ponta no processamento de grande volume de dados com rápido
tempo de resposta.
5. A viabilização da segurança e garantia de sigilo e individualização das bases de dados.
6. A alavancagem da economicidade pelo uso compartilhado de infraestrutura e do consumo de
dados para redução de custos.
Os ganhos advindos do uso da Governança de Dados são muitos – alguns intangíveis – e variam para
cada organização. Os principais ganhos comuns à maioria das organizações que adotam a
Governança de Dados como parte de sua estrutura organizacional são:
 Mudança de cultura: dados e informações passam a ser reconhecidos como importantes
ativos estratégicos nas organizações.
 Melhor alinhamento entre as áreas de Tecnologia da Informação e Comunicação (TIC) e
de Negócio: esse alinhamento é premissa fundamental para o bom funcionamento da
Governança de Dados. Com isso, outras áreas como a de mapeamento de processos e a de
desenvolvimento de sistemas podem se beneficiar de alinhamentos já iniciados.
 A gestão das operações de captura, armazenamento, proteção, planejamento, controle e
garantia da qualidade dos ativos de dados é centralizada em uma única estrutura, permitindo a
redução de custos e a otimização do uso dos recursos.
 Criação de uma cultura do uso de indicadores de processo, qualidade e desempenho de
dados e informações: o objetivo é manter alinhados a Governança de Dados e o
Planejamento Estratégico da Organização.
 Conhecimento de dados e informações utilizados por meio da adoção de um vocabulário
único sobre as definições dos dados: ampliação e melhoria da disseminação do
conhecimento entre as pessoas – passagem do capital intelectual para o capital estrutural.
 Entendimento das principais necessidades de dados e informações da organização,
fornecendo um importante subsídio para estabelecer o planejamento para absorção, criação
e/ou transformação de novos dados e informações para a empresa: definir o que realmente é
importante em relação à utilização de dados e informações e estabelecer prioridades em
relação às futuras implementações e mudanças.
 Redução da quantidade de informações redundantes.
 Estabelecimento de mecanismos formais de segurança para acesso e disponibilização de
dados e informações.
 Reutilização de dados corporativos e/ou compartilhados, por meio do gerenciamento de dados
mestre e dados de referência.
 Total governança dos dados manipulados pela organização.
O tema Governança de Dados será mais detalhado no Item 3.1 do Módulo III.
3. Cadeia de Evolução dos Dados e Informações
Dado -> informação -> conhecimento e sabedoria constituem a cadeia de evolução de dados e
informações. Na verdade, quando falamos sobre “dados” estamos nos referindo à base da matéria-
prima necessária para conseguir o que todas as organizações desejam: utilizar o conhecimento das
informações para tomar decisões ágeis e corretas.
A cadeia de evolução de dados e informações representa a transformação gradual e progressiva sobre
o uso de dados e informações. Também serve como modelo para descobrir em que nível dessa cadeia
as informações de mais alto valor estratégico são utilizadas, possibilitando, desta forma, estabelecer
ações para melhorar o nível da maturidade de dados e informações.
 Dados - São a base de todo o processo de geração da sabedoria organizacional e o primeiro estágio
a ser atingido. Eles representam fatos por meio de um conjunto de caracteres primitivos e isolados,
geralmente representados através de textos, números, imagens, sons ou vídeos. Os dados não
possuem qualquer significado relevante dentro de um contexto de negócio (dados sem contexto).
Metadados - Representam os significados dos dados. Estes significados correspondem tanto ao
conteúdo técnico do dado, obtido por:
 informações sobre estrutura, formato, tamanho e restrições (metadados técnicos); e
 informações sobre definições, conceito, relevância e regras de negócio dos dados envolvidos
(metadados de negócio).
Informações - Correspondem aos dados processados com algum significado. As informações são
geradas e obtidas nos sistemas de processamento de transações e sistemas de apoio à decisão,
reduzindo a incerteza sobre alguma coisa, estado ou evento.
Quando os metadados são utilizados para leitura e interpretação dos dados, a cadeia de evolução do
dado já mudou de estágio, ou seja, já está no nível da informação.
Conhecimento - Corresponde ao processamento das informações com significados, premissas,
padrões de comportamento, tendências e valores agregados a partir de um conjunto de regras de
manipulação e características dessas informações.
São o subsídio para soluções de problemas e tomadas de decisão.
Atualmente, é impossível imaginar a evolução para este estágio da cadeia sem os sistemas de apoio à
decisão e as aplicações de inteligência analítica.
Sabedoria - É a utilização do conhecimento com efetividade.
Apesar das aplicações de inteligência analítica já serem uma realidade dentro do mercado, fornecendo
condições para a organização atingir o estágio anterior, muitas organizações que possuem estes
subsídios desejam a “sabedoria”, mas não a conseguem. Parte deste fracasso está na confiabilidade
dos dados, que não foram bem geridos no decorrer da evolução da cadeia e a outra parte na falta de
habilidade dos profissionais em extrair as informações e utilizá-las de forma vantajosa.
Algumas referências sobre Gestão de Dados, incluindo o guia DAMA-DMBOK©, não descrevem e não
reconhecem a sabedoria como último estágio dessa cadeia, justamente pelo fato dela, em grande
parte, depender da competência humana para atingir este estágio.
Na imagem abaixo, observe um exemplo dessa cadeia:
3.1. Organização da Informação na Administração Pública Federal - APF
É sabido que os órgãos públicos geram muitos dados e informações. Cobram taxas e impostos,
constroem estradas, abastecem hospitais, pagam benefícios e cancelam permissões de motoristas,
essas ações são sustentadas pelo primeiro item: a cobrança de impostos. Poderíamos, então, dizer
que a função do Estado é cobrar impostos e executar ações com esse dinheiro. Mas, para todas as
ações, desde a cobrança de impostos, o insumo básico é informação. Isso ocorre desde a renda
declarada e da renda verificada até a ocorrência de multas que justificarão, por exemplo, o
cancelamento da carteira de motorista.
O governo é uma instituição de informações. Ele consome informações (renda, salários, bens,
ocorrência de doenças, estoque de remédios, idade de pensionistas, multas de trânsito, etc.) e produz
informações (imposto devido, necessidade de reposição de medicamentos, valores de pensões
devidas, carteiras a serem canceladas). Seu desempenho, em todas as áreas, está ligado a essas
informações.
Com isso, a APF, diante de um cenário em que existe uma elevada geração de dados registrados em
diversas bases sem integração e compartilhamento promoveu a criação de instrumentos normativos e
adoção de soluções tecnológicas visando:
 Criar um ambiente de integração para simplificar a oferta de serviços públicos.
 Subsidiar e otimizar a formulação, a implementação, a avaliação e o monitoramento de
políticas públicas.
 Possibilitar a análise de condições para acesso a benefícios sociais e sua respectiva
manutenção.
 Fomentar a melhoria da qualidade e da fidedignidade dos dados custodiados pelo governo.
Neste contexto, podemos destacar a publicação do Decreto nº 10.046, de 9 de outubro de 2019 e a
criação da Plataforma de Interoperabilidade do Governo Federal - ConectaGov. Essas duas ações do
governo fomentaram mecanismos de compartilhamento de dados e a possibilidade de
interoperabilidade entre sistemas de governo, com garantia de requisitos de segurança necessários e
suficientes para prover a disponibilidade, a integridade, a autenticidade e a confidencialidade dos
dados.
Posto isso, considerando os objetivos da Governança de Dados, destacamos os instrumentos listados
na tabela abaixo como sendo mecanismos de Governança de Dados do governo federal que visam
promover o valor dos dados como ativos estratégicos e subsidiar o processo de transformação digital:
INSTRUMENTO FINALIDADE
Lei nº 12.527, de 18
de novembro de 2011
Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso
II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal.
Lei nº 13.460, de 26
de junho de 2017
Definiu que os cidadãos brasileiros não precisam mais apresentar a órgãos
públicos documentos, atestados ou certidões que já estejam de posse da
Administração Pública Federal. São os órgãos que devem integrar as bases
de dados e compartilhar essas informações. Esse compartilhamento pode ser
feito de forma automatizada, sem intervenção humana, por meio de uma API
– Application Programming Interface, uma forma padronizada de conexão e
troca de informações entre diferentes sistemas de diferentes órgãos.
Lei nº 13.709, de 14
de agosto de 2018
Lei Geral de Proteção de Dados Pessoais (LGPD).
Decreto nº 8.638, de
15 de janeiro de 2016
Institui a Política de Governança Digital no âmbito dos órgãos e das
entidades da Administração Pública Federal direta, autárquica e fundacional.
Decreto nº 8.777, de
11 de maio de 2016
Institui a Política de Dados Abertos do Poder Executivo Federal.
Decreto nº 10.046, de
9 de outubro de 2019
Dispõe sobre o compartilhamento de dados no âmbito da Administração
Pública Federal e institui o Cadastro base do Cidadão e o Comitê Central de
Governança de Dados.
Decreto nº 8.936, de
19 de dezembro de
2016
Institui a Plataforma de Cidadania Digital e dispõe sobre a oferta dos serviços
públicos digitais no âmbito dos órgãos e das entidades da Administração
Pública Federal direta, autárquica e fundacional.
Decreto nº 9.094, de
17 de julho de 2017
Dispõe sobre a simplificação do atendimento prestado aos usuários dos
serviços públicos. Institui o Cadastro de Pessoas Físicas - CPF como
instrumento suficiente e substitutivo para a apresentação de dados do
cidadão no exercício de obrigações e direitos e na obtenção de benefícios.
Ratifica a dispensa do reconhecimento de firma e da autenticação em
documentos produzidos no país. Institui a Carta de Serviços ao Usuário.
Decreto nº 9.203, de
22 de novembro de
2017
Dispõe sobre a política de governança da Administração Pública Federal
direta, autárquica e fundacional.
Decreto nº 9.723, de
11 de março de 2019
Altera o Decreto nº 9.094, de 17 de julho de 2017, o Decreto nº 8.936, de 19
de dezembro de 2016, e o Decreto nº 9.492, de 5 setembro de 2018, para
instituir o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e
substitutivo da apresentação de outros documentos do cidadão no exercício
de obrigações e direitos ou na obtenção de benefícios e regulamentar
dispositivos da Lei nº 13.460, de 26 de junho de 2017.
Decreto nº 9.929, de
22 de julho de 2019
Dispõe sobre o Sistema Nacional de Informações de Registro Civil - Sirc e
sobre o seu comitê gestor.
Portaria STI/MP nº 58,
de 23 de dezembro de
2016
Dispõe sobre procedimentos complementares para o compartilhamento de
bases de dados oficiais entre órgãos e entidades da Administração Pública
Federal direta e indireta e as demais entidades controladas direta ou
indiretamente pela União.
Em decorrência da publicação desses instrumentos, principalmente do Decreto nº 8.638/2016 e do
Decreto nº 10.046, de 9 de outubro de 2019, foram desenvolvidas as soluções tecnológicas, com suas
respectivas finalidades, apresentadas no quadro a seguir:
SOLUÇÃO FINALIDADE
PLATAFORMA
GOVDATA
Disponibiliza infraestrutura de Data Lake, que permite a hospedagem e o
cruzamento de grandes volumes de dados provenientes de várias bases dados
de órgãos da Administração Pública Federal - APF.
Nesse ambiente, é possível compartilhar informações entre órgãos, mantendo o
sigilo e confidencialidade daqueles dados que são de uso exclusivo.
PLATAFORMA
CONECTAGOV
Plataforma de Interoperabilidade do governo federal. Uma infraestrutura
tecnológica que propicia:
 A integração de serviços públicos.
 O compartilhamento de informações e mediação de aplicações.
 A governança dos ativos e processos de integração.
 Modelo simplificado de consumo de API's.
ACESSO ÚNICO
Ferramenta de autenticação para integrar os dados de cadastro dispersos na
Administração Pública Federal.
PORTAL GOV.BR
O Gov.br é um projeto de unificação dos canais digitais do governo federal que,
até dezembro de 2020, vai reunir os serviços públicos ofertados para o cidadão
e informações sobre a atuação de todas as áreas do governo em um só lugar.
Base de Dados Oficiais - As bases de dados do governo federal representam o conjunto de dados ou
informações coletadas a partir de vários sistemas de governo, independente de formato, tecnologia ou
tamanho; sendo o principal ativo de valor no que concerne ao processo de conhecimento das ações de
governo e de insumos para a formulação de políticas públicas.
3.2. A Informação de Qualidade
Os dados são um ativo valioso e devem ser gerenciados conforme são transferidos em uma
organização.
À medida que as fontes de informações estão se tornando mais numerosas e diversificadas e as
iniciativas de conformidade regulatória mais direcionadas, existe a necessidade de integrar e acessar
informações dessas fontes diferentes de forma consistente, confiável e reutilizável.
A informação de qualidade deriva de dados qualificados, característica essencial que determina a
confiabilidade dos dados para a tomada de decisões.
Sendo o governo uma organização de informações, seus resultados estão ligados às suas informações
e à qualidade dessas. Exemplo: Se o índice de erro no controle de estoque de medicamentos subir
muito, não apenas o governo irá gastar no que não precisa, como poderá deixar a população sem
atendimento médico adequado. A qualidade da informação inclui atualização, completude, detalhes
etc.
3.3. Legislação Correlata
O uso da informação no âmbito do governo federal é regulamentado por vários instrumentos
normativos.
O mais recente é a Lei Geral de Proteção de Dados (Lei nº 13.709/2018), entre outras produzidas na
medida em que a implementação de novos conceitos e tecnologias são agregados com a finalidade de
aumentar a efetividade das políticas públicas, bem como ampliar a oferta e digitalização de serviços
públicos da Administração Pública Federal.
Destaca-se, dentre esses instrumentos normativos, o Decreto nº 8.789, de 29 de junho de 2016, que
dispõe sobre o compartilhamento de bases de dados na Administração Pública Federal; e a Portaria
STI/MP nº 58, de 23 de dezembro de 2016, que dispõe sobre procedimentos complementares para o
compartilhamento de bases de dados oficiais entre órgãos e entidades da Administração Pública
Federal direta e indireta e as demais entidades controladas direta ou indiretamente pela União.
Esses dois instrumentos têm o objetivo de estabelecer os fundamentos legais para o compartilhamento
de bases de dados oficiais entre órgãos e entidades da Administração Pública Federal direta e indireta
e as demais entidades controladas direta ou indiretamente pela União, visando:
 Prover mecanismos para simplificar a oferta de serviços públicos.
 Subsidiar e otimizar a formulação, a implementação, a avaliação e o monitoramento de
políticas públicas; possibilitar a análise de condições para acesso a benefícios sociais e sua
respectiva manutenção.
 Fomentar a melhoria da qualidade e da fidedignidade dos dados custodiados pelo governo por
meio de mecanismos de compartilhamento de dados que garantam a confiabilidade das
informações, sua interoperabilidade e os requisitos de segurança da informação e
comunicações necessários e suficientes para prover a disponibilidade, a integridade, a
autenticidade e a confidencialidade.
4. Governança e Gestão
Segundo o Decreto nº 9.203, de 22 de novembro de 2017, que dispõe sobre a Política de Governança
da Administração Pública Federal direta, autárquica e fundacional, a Governança Pública compreende
o conjunto de mecanismos de liderança, estratégia e controle postos em prática para avaliar, direcionar
e monitorar a gestão, com vistas à condução de políticas públicas e à prestação de serviços de
interesse da sociedade.
Nesse sentido, a segunda edição do Guia Referencial Básico de Governança do Tribunal de Contas da
União - TCU (2015) apresenta um resumo das características sobre gestão e governança.
São funções da Governança:
 Definir o direcionamento estratégico.
 Supervisionar a gestão.
 Envolver as partes interessadas.
 Gerenciar riscos estratégicos.
 Gerenciar conflitos internos.
 Auditar e avaliar o sistema de gestão e controle.
 Promover a accountability (prestação de contas e responsabilidade) e a transparência.
De modo complementar, a Gestão diz respeito ao funcionamento do dia a dia de programas e de
organizações no contexto de estratégias, políticas, processos e procedimentos que tenham sido
estabelecidos pelo órgão1
; preocupa-se com a eficácia (cumprir as ações priorizadas) e a eficiência das
ações (realizar as ações da melhor forma possível, em termos de custo-benefício).
São funções da Gestão:
 Implementar programas.
 Garantir a conformidade com as regulamentações.
 Revisar e reportar o progresso de ações.
 Garantir a eficiência administrativa.
 Manter a comunicação com as partes interessadas.
 Avaliar o desempenho e aprender.
Concluindo:
 A Gestão é inerente e integrada aos processos organizacionais, sendo responsável pelo
planejamento, execução, controle e ação, enfim, pelo manejo dos recursos e poderes
colocados à disposição de órgãos e entidades para a consecução de seus objetivos.
 A Governança provê direcionamento, monitoramento, supervisão e avaliação da prática da
gestão, com vistas ao atendimento das necessidades e expectativas dos cidadãos e demais
partes interessadas.
Observe, na imagem a seguir, as funções de cada uma delas.
Neste contexto, a Governança de Dados está organizada da seguinte forma:
4.1. Tipos de Papéis
Até recentemente, as funções de Administrador de Dados - AD e Administrador de Banco de Dados -
DBA, eram os principais e mais conhecidos papéis ligados às atividades de gerenciamento dos dados
nas organizações.
Não menos importante, o papel do AD não era mais suficiente para fazer o alinhamento entre a
tecnologia e as demandas das áreas de negócio.
Com o advento da Governança de Dados, o dado é considerado um dos principais ativos. Com isso,
novos papéis surgiram com o propósito de fazer um melhor alinhamento entre a Tecnologia da
Informação, responsável por custodiar os dados organizacionais, e a área de negócio, que é a real
gestora dos dados coletados localmente e de outras bases de dados distribuídas por outras
organizações.
Nesse sentido, podemos categorizar esses papéis em três grupos distintos, considerando à área:
 De negócio.
 Estratégica.
 Técnica/tecnológica.
Essa distribuição é a mais comum nas organizações quer sejam privadas ou públicas, entretanto,
dependendo das características finalísticas e da estrutura organizacional, haverá necessidade de se
considerar alguns desses ou definir outros papéis, que poderão ser desempenhados por apenas uma
pessoa.
Nesse contexto, entendemos como papel o modo de se conduzir determinado ato ou negócio.
O framework DAMA-DMBOK©, principal subsídio utilizado na produção deste curso, enumera mais de
vinte papéis relacionados à Governança e Gestão de Dados. Assim sendo, serão abordados apenas
os principais papéis apropriados à Gestão e a Governança de Dados na Administração Pública.
4.2. Papéis Ligados à Governança de Dados
O Comitê de Curadores de Dados é uma Política de Governança de Dados com o objetivo de tomar
decisões de alto nível com base na visão centrada em dados e informações, artefatos da arquitetura
de dados e processos, conhecimento sobre negócio e as metas e objetivos que a organização deve
atingir na perspectiva da Gestão de Dados e Informações.
A imagem abaixo ilustra a Política de Governança de Dados.
Citamos, como exemplo, a Curadoria de Informações, definida na Política de Governança da
Informação do Banco Central do Brasil – BACEN (Portaria nº 90.187, de 17 de agosto de 2016), a qual
compreende o conjunto de ações que visa zelar pela existência, consistência, integridade, precisão,
relevância, autenticidade, segurança e documentação dos ativos de informação de uma base de
dados, respeitando-se os objetivos, princípios e diretrizes da Plano de Governança da Informação
(PGI).
Criar Políticas, Processos e Procedimentos é um dos principais resultados da Governança de Dados.
 As Políticas estabelecem um conjunto de metas e afirmam “o que deve ser feito” em
alinhamento com outros instrumentos estratégicos da organização.
 Os Processos indicam as atividades, pessoas, ferramentas e regras necessárias ao
cumprimento da Política.
 Os Procedimentos descrevem em detalhes como exatamente executar os Processos.
Partindo da premissa de que a Governança e a Gestão são disciplinas distintas que se
complementam, a Governança de Dados se utiliza do conhecimento e da competência das pessoas
para definir políticas, responsabilidades, glossários, metadados, fluxos de trabalho dos dados em
movimento, monitoramento e linhagem de dados que permitam à organização melhorar a qualidade,
descoberta e entendimento desses, de modo a simplificar a extração de informações e conhecimentos,
resultando em melhores análises e decisões de negócio.
A seguir, vamos conhecer quatro papeis ligados à Governança de Dados. São eles:
 Curador de Dados de Negócio.
 Curador de Dados Corporativos.
 Encarregado de Proteção de Dados ou Data Protection Officer – DPO.
 Curador de Dados Técnico e Operacional.
4.2.1. Curador de Dados de Negócio
Também conhecido como Business Data Steward, é o Gestor de Dados ligado à área de negócio da
organização. Trabalha e atua como o principal curador dos dados, representando os interesses da
área de negócios, atuando com responsabilidade e autoridade sobre o conjunto de dados do seu
escopo de negócio.
A ele compete:
 Definir os metadados corretos (glossário de termos, nomes de entidades e atributos, regras de
validação, valores válidos, regras de qualidade).
 Identificar problemas de qualidade de dados e suas causas.
 Acompanhar a resolução de problemas de qualidade.
 Acompanhar o desenvolvimento de novas soluções de tecnologia.
 Avaliar riscos e oportunidades no uso dos dados.
O perfil desejado para a posição é de uma pessoa especialista na área de negócio com sólidos
conhecimentos avançados em Gestão e Governança de Dados. Além disso, ele deve ter pleno
domínio sobre captura de requisitos de informação, regras de negócio e modelagem conceitual de
dados.
4.2.2. Curador de Dados Corporativos
Curadores de Dados Corporativos são escolhidos entre os gestores das áreas de negócio.
Geralmente, são ocupantes de cargos com poder de decisão.
A ele compete:
 Entender os processos da Gestão e Governança de Dados.
 Conhecer o modelo de processos da sua área de negócio em profundidade e os outros
processos de negócio.
 Conhecer as técnicas de modelagem de dados.
 Conhecer arquitetura de sistemas transacionais e Business Intelligence.
 Apoiar na criação e manutenção do glossário de termos de negócio.
 Apoiar na criação e manutenção do modelo de dados conceitual corporativo.
 Avaliar a o valor das informações e sua qualidade.
 Avaliar riscos e oportunidades associadas aos dados e negócio.
 Corrigir problemas de qualidade de dados.
4.2.3. Encarregado de Proteção de Dados ou Data Protection Officer – DPO
O Encarregado de Proteção de Dados ou Data Protection Officer – DPO, que teve como origem
a General Data Protection Regulation – GDPR , com adaptações pela Lei Geral de Proteção de Dados
– LGPD (Lei nº 13.709/2018), é o responsável por disseminar a cultura de proteção de dados na
empresa, além de criar normas e procedimentos adequados à lei. Será ele que receberá notificações
da Autoridade Nacional de Proteção de Dados – ANPD e dos titulares das informações e as colocará
em prática.
No art. 41, § 2º, da LGPD, temos algumas atividades do DPO, que consistem em:
I. – Aceitar reclamações e comunicações dos titulares, prestar esclarecimentos e adotar
providências;
II. – Receber comunicações da autoridade nacional e adotar providências;
III. – Orientar os funcionários e os contratados da entidade a respeito das práticas a
serem tomadas em relação à proteção de dados pessoais; e
IV. – Executar as demais atribuições determinadas pelo controlador ou estabelecidas em
normas complementares.
Devido a essas atividades, o DPO tem papel fundamental nas decisões estratégicas das organizações
e deve ter autonomia sobre as atividades que envolvam qualquer tipo de tratamento de dados e
contato direto com a direção da organização para poder tomar decisões que possam deixá-la
em compliance com a lei.
4.2.4. Curador de Dados Técnico e Operacional
Profissional responsável por projetar os mecanismos para integração dos dados. Ele deve dominar o
uso de ferramentas de integração e de extração de dados como SOA, ETL e mecanismos de
integração por meio de SGBDs. Destacam-se:
Responsabilidades:
 Emitir pareceres técnicos indicando a melhor forma de integração de dados.
 Manter atualizado o catálogo de serviços de integração de dados.
 Apoiar a especialização de mecanismos de integração.
 Apoiar o desenvolvimento de serviços na construção de dispositivos de integração de
dados.
Competências:
 Conhecimentos avançados de mecanismos de integração de dados.
 Conhecimentos avançados de utilização de repositórios de ativos de informação.
O primeiro benefício para a reutilização é obter cada ontologia em um tamanho compreensível. O
benefício relacionado à reutilização é que, às vezes, uma ontologia tem axiomas que conflitam
com a ontologia de importação. Ter módulos de tamanho razoável permite que um importador
selecione os módulos que deseja e evite axiomas que não deseja.
Lição módulo 2
1. A Importância do Gerenciamento de Dados
Mesmo antes do surgimento da Tecnologia da Informação, a informação e o conhecimento foram
fundamentais para a vantagem competitiva.
As organizações que possuem informações confiáveis e de alta qualidade sobre seus usuários,
produtos, serviços e operações podem tomar melhores decisões do que aquelas sem dados (ou com
dados não confiáveis). Porém, produzir dados de alta qualidade e gerenciá-los de maneiras que
permitam os seus usos com eficiência não é um processo simples.
Para aprimoramento dos recursos de gerenciamento de dados de qualquer organização, faz-se
necessário considerar os seguintes aspectos:
 Os dados estão em todo lugar.
 Dados como um ativo - valor.
 Gerenciamento de dados versus gerenciamento de tecnologia.
 Atividades de gerenciamento de dados.
 Áreas de conhecimento em gerenciamento de dados.
1.1. Os Dados Estão em Todo Lugar
As organizações sempre precisaram gerenciar seus dados, mas os avanços na tecnologia,
considerando a onipresença dos dados, expandiram o escopo dessa necessidade de gerenciamento.
Os dados são difundidos nas organizações. Quase todos os processos de negócios - desde a criação
de clientes, transações de compras, contato com clientes para feedback e serviços - usam dados como
entrada e produzem dados como saída. A maioria desses dados está em formato eletrônico, o que
significa maleabilidade: podem ser armazenados em grandes quantidades, manipulados, integrados e
agregados para diferentes usos, incluindo inteligência comercial e análise preditiva. Eles também
fornecem evidências de conformidade de uma organização (ou falta de conformidade) com leis e
regulamentos.
As mudanças técnicas permitiram que as organizações usassem os dados de novas maneiras para
criar produtos, compartilhar informações, criar conhecimento e melhorar o sucesso organizacional.
Mas, o rápido crescimento da tecnologia e, com ela, a capacidade humana de produzir, capturar e
extrair dados para obter significado intensificaram a necessidade de gerenciar dados de maneira
eficaz.
1.2. Dados Como um Ativo
Um ativo é um recurso econômico, que pode ser de propriedade ou controlado e que detém ou
produz valor. Os ativos são frequentemente vistos como propriedade, mas com a forte implicação
de que podem ser convertidos em dinheiro. Os dados são amplamente reconhecidos como um ativo
da organização, embora muitas organizações ainda lutem para gerenciar os dados como tal. Um
exemplo disso é o fato de que os dados ainda não são contabilizados no balanço da maioria das
organizações.
Se questionados, muitos usuários diriam que os dados de sua organização são um ativo valioso.
Os dados não são apenas necessários para as operações de negócio, mas também podem fornecer
informações sobre usuários, produtos e serviços. No entanto, pesquisas mostram que poucas
organizações tratam seus dados como um ativo e para muitas eles podem até ser um passivo. A
falha no gerenciamento de dados é semelhante à falha no gerenciamento de capital, isso resulta em
desperdício e em oportunidades perdidas. Além do mais, dados mal gerenciados apresentam riscos
éticos e de segurança.
Mesmo usuários que reconhecem os dados como um ativo podem não ser capazes de descrever
exatamente o que isso significa, pois os dados diferem de outros ativos de maneiras importantes. No
entanto, o principal fator para o gerenciamento de dados é permitir que as organizações obtenham
valor com seus dados, assim como o gerenciamento eficaz de ativos financeiros e físicos permite
que as organizações obtenham valor com esses ativos. A obtenção de valor dos dados não ocorre no
vácuo ou por acidente, pois além de gerenciamento, ela requer compromisso organizacional e
liderança.
1.3. Gerenciamento de Dados x Gerenciamento de Tecnologia
É necessário diferenciar Gerenciamento de Dados e Gerenciamento de Tecnologia!
Gerenciamento de Dados é o desenvolvimento, execução e supervisão de planos, políticas, programas
e práticas que entregam, controlam, protegem e aprimoram o valor dos ativos de dados e informações
durante todo o seu ciclo de vida.
Você pode se questionar: “Isso não é o que nosso departamento de tecnologia da informação tem
feito?” A resposta é: infelizmente, não.
A TI geralmente não se concentra nos dados. O foco é a tecnologia, os processos, as pessoas que
desenvolvem aplicações e as ferramentas usadas para fazer isso. Historicamente, a TI não se
concentra nos dados criados ou armazenados nas aplicações que gerencia. Não há direcionamento
estratégico para isso.
Embora o gerenciamento de dados seja altamente dependente da tecnologia e cruze com o
gerenciamento de TI, as atividades são separadas, independentes de processos e ferramentas
utilizadas.
Com isso, o que o Gerenciamento de Dados realmente envolve? O que significa gerenciar dados de
maneira eficaz?
O Gerenciamento de Dados envolve o planejamento e a coordenação de recursos e atividades para
atender aos objetivos organizacionais. As atividades em si variam desde as altamente técnicas, como
garantir que grandes bancos de dados sejam acessíveis com desempenho e segurança, até as
altamente estratégicas, como propor a interoperabilidade de dados entre entes de governo de maneira
eficiente e segura. Essas atividades de gerenciamento devem se esforçar para disponibilizar dados
confiáveis e de alta qualidade para a organização, garantindo que sejam acessíveis aos usuários
autorizados e protegidos contra uso indevido.
1.4. Atividades de Gerenciamento de Dados
Existe uma gama de atividades de Gerenciamento de Dados. Elas podem ser entendidas em três
grupos:
 As que focam na governança para garantir que a organização tome decisões consistentes e
alinhadas (atividades de governança).
 As que se concentram no gerenciamento do ciclo de vida dos dados, desde a obtenção dos
dados até a sua eliminação (atividades de ciclo de vida).
 As fundamentais, que focam em permitir o gerenciamento, manutenção e uso de dados ao
longo do tempo.
As atividades de governança ajudam a controlar o desenvolvimento de dados e reduzem os riscos
associados ao seu uso, ao mesmo tempo em que permitem que uma organização aproveite-os
estrategicamente.
Essas atividades estabelecem um sistema de direitos e responsabilidades de decisão por dados para
que uma organização possa tomar decisões consistentes nas verticais dos negócios.
Atenção, as atividades de governança incluem as seguintes ações:
 Definir a estratégia de dados.
 Definir a política de governança.
 Definir o valor dos dados para a organização.
 Preparar a organização para obter mais valor de seus dados.
 Avaliar práticas de gerenciamento de dados.
 Evoluir a mentalidade da organização em torno dos dados.
As atividades do ciclo de vida se concentram no planejamento e design dos dados, permitindo seu
uso, garantindo que eles sejam efetivamente mantidos e realmente utilizados. Geralmente, o uso de
dados resulta em aprimoramentos e inovações que têm seus próprios requisitos de ciclo de vida.
Esteja atento às atividades do ciclo de vida que consideram:
 Arquitetura de dados.
 Modelagem de dados.
 Construção e gerenciamento de data warehouses e marts.
 Integração de dados para uso por analistas de inteligência de negócios e cientistas de dados.
 Gerenciamento do ciclo de vida de dados compartilhados altamente críticos, como dados de
referência e dados mestres.
Atividades básicas são necessárias para o gerenciamento consistente dos dados ao longo do tempo.
Abaixo, ressaltamos as ações que são vitais a todo o ciclo de vida dos dados:
 Garantir a proteção dos dados.
 Gerenciar metadados.
 Gerenciar a qualidade dos dados.
As atividades fundamentais devem ser consideradas como parte do planejamento e design e devem
ser realizadas operacionalmente. Essas atividades também são essenciais para o sucesso das
estruturas de governança.
1.5. Áreas de Conhecimento em Gerenciamento de Dados
Atividades de Gerenciamento de Dados são realizadas por profissionais que atuam em diferentes
áreas de conhecimento, logo necessitam das habilidades e dos conhecimentos apresentados na
imagem a seguir.
O guia criado pela DAMA Internacional, organização que visa promover a compreensão, o
desenvolvimento e a prática da gestão de dados e informações como ativos chave de uma
organização, propõe o conjunto de dez funções para a Governança de Dados. Acesse, para conhecer
cada uma dessas funções, as abas a seguir:
Governança de Dados
A Governança de Dados fornece orientação e supervisão para atividades e funções de gerenciamento
de dados, estabelecendo um sistema de direitos e responsabilidades de decisão por dados. Esses
direitos e responsabilidades devem responder às necessidades da empresa como um todo.
Arquitetura de Dados
A Arquitetura de Dados define o modelo para o gerenciamento de ativos de dados, alinhando-se à
estratégia organizacional e estabelecendo projetos para atender aos requisitos de dados estratégicos.
Modelagem e Design de Dados
A Modelagem e Design de Dados é o processo de descoberta, análise, representação e comunicação
de requisitos de dados de uma forma precisa chamada Modelo de Dados.
Armazenamento e Operações de Dados
O Armazenamento e Operações de Dados inclui o design, implementação e suporte de dados
armazenados para maximizar seu valor. As operações fornecem suporte durante todo o ciclo de vida
dos dados, do planejamento à disposição dos dados.
Segurança de Dados
A Segurança de Dados garante que a privacidade e a confidencialidade dos dados sejam mantidas,
que os dados não sejam violados e que os dados sejam acessados adequadamente.
Integração e Interoperabilidade de Dados
A Integração e Interoperabilidade de Dados inclui processos relacionados à movimentação e
consolidação de dados dentro e entre repositórios de dados, aplicativos e organizações.
Gerenciamento de Documentos e Conteúdo
O Gerenciamento de Documentos e Conteúdo inclui atividades de planejamento, implementação e
controle para gerenciar o ciclo de vida de dados e informações encontrados em uma variedade de
mídias não estruturadas, especialmente os documentos necessários para suportar os requisitos de
conformidade legal e regulamentar.
Gerenciamento de Referência e Dados Mestre
O Gerenciamento de Referência e Dados Mestre inclui reconciliação e manutenção contínuas dos
principais dados compartilhados críticos para permitir o uso consistente entre os sistemas da versão
mais precisa, oportuna e relevante da verdade sobre entidades essenciais de negócios.
Data Warehousing e Business Intelligence
O Data Warehousing e o Business Intelligence incluem os processos de planejamento, implementação
e controle para gerenciar os dados de suporte à decisão e permitir que os profissionais do
conhecimento obtenham valor dos dados por meio de análise e relatório.
Gerenciamento de Metadados
O Gerenciamento de Metadados inclui atividades de planejamento, implementação e controle para
permitir o acesso a metadados integrados de alta qualidade, incluindo definições, modelos, fluxos de
dados e outras informações críticas para entender os dados e os sistemas através dos quais são
criados, mantidos e acessados.
Gerenciamento da Qualidade dos Dados
O Gerenciamento da Qualidade dos Dados inclui o planejamento e a implementação de técnicas de
gerenciamento da qualidade para medir, avaliar e melhorar a adequação dos dados para uso em uma
organização.
Essas áreas de conhecimento representam atividades no núcleo do Gerenciamento de Dados.
Qualquer organização que busque obter valor com seus dados deverá se envolver neles.
É bom lembrar-se que os dados também estão evoluindo.
Alterações em nossa capacidade de criar e usar dados significam que outros conceitos também podem
ser considerados "áreas de conhecimento" de Gerenciamento de Dados, tais como Ética de Dados,
Ciência de Dados, Gerenciamento de Big Data e Tecnologias Emergentes.
A estrutura DAMA define as áreas de conhecimento de Gerenciamento de Dados. Ela centraliza a
disciplina Governança de Dados das atividades de Gerenciamento de Dados, já que a governança é
necessária para a consistência e o equilíbrio entre as funções. As outras áreas de conhecimento
(Arquitetura de Dados, Modelagem de Dados etc.) são balanceadas em torno do centro. Todas são
partes necessárias de uma função madura de Gerenciamento de Dados, mas podem ser
implementadas em momentos diferentes, dependendo dos requisitos da organização.
Os profissionais de Gerenciamento de Dados que trabalham nessas áreas de conhecimento devem ter
como objetivo:
 Compreender e dar suporte às necessidades de informações da organização e de suas partes
interessadas, incluindo clientes, funcionários e parceiros de negócios.
 Capturar, armazenar e garantir a integridade e a qualidade dos dados para permitir seu uso pela
organização.
 Garantir a segurança, a privacidade e a confidencialidade dos dados, impedindo acesso,
manipulação ou uso inadequado.
2 Desafios no Gerenciamento de Dados
O gerenciamento de dados é uma disciplina focada em aprimorar o valor dos dados e informações. O
gerenciamento eficaz de dados beneficia a organização e sociedade de várias maneiras. No caso da
Administração Pública, é disciplina fundamental para alavancar o planejamento eficiente de Políticas
Públicas e de disponibilização de serviços digitais ao cidadão por meio da interoperabilidade de dados.
Existem dez funções principais de gerenciamento de dados que envolvem uma variedade de
indivíduos com habilidades diferentes. O gerenciamento de dados é mais uma função que, quando
implementado de forma eficiente, promove inúmeros resultados positivos.
Em termos gerais, podemos definir Gerenciamento de dados como o desenvolvimento, execução e
supervisão de planos, políticas, programas e práticas que entregam, controlam, protegem e aprimoram
o valor dos ativos de dados e informações ao longo de seus ciclos de vida.
Os dados são uma necessidade estratégica e operacional. Para gerenciar qualquer ativo, é necessário
trabalhar para obter valor. Neste contexto, abordaremos os seguintes tópicos:
 Os dados diferem de outros ativos.
 Dados representam risco.
 Dados de baixa qualidade custam tempo e dinheiro.
 A avaliação de dados não é padronizada.
 Gerenciamento de dados significa gerenciar o ciclo de vida dos dados.
 Diferentes tipos de dados têm diferentes requisitos de ciclo de vida.
 Os metadados devem ser gerenciados como parte do ciclo de vida dos dados.
 O gerenciamento de dados geralmente é confundido com o gerenciamento de tecnologia da
informação.
 O que o gerenciamento de dados requer.
2.1 Os dados diferem de outros ativos
Os dados têm características únicas que o diferenciam de outros ativos: os ativos físicos, por exemplo,
podem ser apontados, tocados e movimentados. Os ativos financeiros, por sua vez, são contabilizados
no balanço patrimonial. Mas os dados são diferentes, porque não são tangíveis. No entanto, são
duráveis e não se desgastam; são fáceis de copiar e transportar, mas não de serem reproduzidos se
perdidos ou destruídos. Por não serem consumidos quando usados, podem até ser roubados sem
desaparecer. Os dados são dinâmicos e podem ser usados para várias finalidades. Os mesmos dados
podem até ser usados por várias pessoas ao mesmo tempo - algo que é impossível com ativos físicos
ou financeiros. Muitos usos de dados geram mais dados.
Essas diferenças tornam desafiador simplesmente manter o controle dos dados e muito mais ainda
atribuir um valor monetário a eles. Sem esse valor monetário, pode ser difícil medir como os dados
contribuem para o sucesso organizacional.
Essas diferenças também levantam outros problemas que afetam o gerenciamento de dados, como:
 Inventariar a quantidade de dados que uma organização possui.
 Definir propriedade e responsabilidade dos dados.
 Proteger dados contra o uso indevido.
 Gerenciar riscos associados aos dados.
 Definir e aplicar padrões de qualidade para dados.
2.2 Dados representam risco
Os dados não representam apenas valor e oportunidade, também retratam riscos. Dados imprecisos,
incompletos ou desatualizados indicam riscos, porque suas informações não estão corretas. Além
disso, os dados apresentam outras ameaças, incluindo:
 Uso indevido: se os consumidores de dados não tiverem informações suficientes e corretas
(metadados) sobre os dados que eles usam, existe o risco de serem mal utilizados e/ou
compreendidos.
 Confiabilidade (Unreliability): Se a qualidade e a confiabilidade dos dados não forem
estabelecidas por meio de normas e métricas, então existe risco de que decisões sejam
baseadas em dados não confiáveis.
 Uso inadequado: se os dados não estiverem protegidos, existe o risco de que eles sejam
utilizados por pessoas não autorizadas para fins não autorizados.
O fato de os dados poderem ser facilmente copiados e replicados significa que eles podem ser
violados sem serem "retirados" de seus legítimos proprietários. Além disso, como os dados
representam pessoas, produtos e dinheiro, os legisladores e reguladores reconheceram os possíveis
usos e abusos das informações e criaram leis destinadas a mitigar riscos óbvios. Por exemplo:
 A Sarbanes-Oxley nos EUA concentra-se nos controles sobre a precisão e a validade dos
dados das transações financeiras, da transação ao balanço.
 O Solvência II na União Europeia concentra-se na linhagem de dados e na qualidade dos
dados subjacentes aos modelos de risco e adequação de capital no setor de seguros.
 Em todo o mundo, os regulamentos de privacidade de dados descrevem obrigações em
relação ao tratamento de dados de identificação pessoal (tais como: nome, endereço, afiliação
religiosa ou orientação sexual) e privacidade (acesso ou restrição a essas informações):
o Lei de Portabilidade e Responsabilidade do Seguro de Saúde (HIPPA), nos EUA.
o Lei de Proteção de Informações Pessoais e Documentos Eletrônicos (PIPEDA), no
Canadá.
o O Regulamento Geral de Proteção de Dados (RGPD), na União Europeia.
o Lei Geral de Proteção de Dados Pessoais (LGPD), Lei nº 13.709/2018, é a legislação
brasileira que regula as atividades de tratamento de dados pessoais e que também
altera os artigos 7º e 16 do Marco Civil da Internet, Lei n° 12.965/2014.
Destacamos a relevância da publicação do Decreto nº 10.046, de 09 de outubro de 2019 que
estabeleceu as regras e as diretrizes de compartilhamento de dados no âmbito da Administração
Pública Federal - APF. Esse decreto, instituiu também o Cadastro Base do Cidadão (CBC) e o Comitê
Central de Governança de Dados (CCGD). Sendo este último, o fórum legítimo para propor políticas e
normas sobre Governança de Dados, mediar e dirimir conflitos sobre compartilhamento de dados entre
órgãos e entidades da administração pública federal e demais Poderes da União.
 Regras e diretrizes do compartilhamento de dados na APF
As regras contidas no decreto não são aplicáveis ao compartilhamento de dados com os conselhos de
fiscalização de profissões regulamentadas e com o setor privado. Além disso, as regras do texto
excluem os dados protegidos por sigilo fiscal que estão sob gestão da Secretaria Especial da Receita
Federal do Brasil do Ministério da Economia.
A política de compartilhamento de dados terá como finalidades:
 simplificar a oferta de serviços públicos;
 orientar e otimizar a formulação, a implementação, a avaliação e o monitoramento de políticas
públicas;
 possibilitar a análise das condições de acesso e manutenção de benefícios sociais e fiscais;
 promover a melhoria da qualidade e da fidedignidade dos dados custodiados pela
administração pública federal; e,
 aumentar a qualidade e a eficiência das operações internas da administração pública federal.
O Decreto traz alguns conceitos de atributos dos dados, como o de atributos biográficos, que são os
dados de pessoa natural relativos aos fatos da sua vida, tais como nome civil ou social, data de
nascimento, filiação, naturalidade, nacionalidade, sexo, estado civil, grupo familiar, endereço e vínculos
empregatícios; o de atributos biométricos que são as características biológicas e comportamentais
mensuráveis da pessoa natural que podem ser coletadas para reconhecimento automatizado, tais
como a palma da mão, as digitais dos dedos, a retina ou a íris dos olhos, o formato da face, a voz e a
maneira de andar; e o de atributos genéticos, que são as características hereditárias da pessoa
natural, obtidas pela análise de ácidos nucleicos (DNA) ou por outras análises científicas. Além disso,
traz o conceito de dados cadastrais, que são informações identificadoras perante os cadastros de
órgãos públicos, tais como CPF, CNPJ, PIS, NIS, número de título de eleitor etc.
O compartilhamento de dados pelos entes da administração pública federal deverá seguir algumas
diretrizes.
No caso de informação de Estado, este compartilhamento deverá ser o mais amplo possível,
observadas as restrições legais, os requisitos de segurança da informação e comunicações e o
disposto na Lei nº 13.709, de 2018 (Lei Geral de Proteção de Dados Pessoais – LGPD).
E no caso dados sigilosos, será necessária a assunção (aceitação) pelo recebedor de dados, dos
deveres de sigilo e auditabilidade impostos ao custodiante dos dados. O Decreto assegura que nas
hipóteses de tratamento de dados pessoais serão observados o direito à preservação da intimidade e
da privacidade da pessoa natural, a proteção dos dados e as normas e os procedimentos previstos na
legislação e que a coleta, o tratamento e o compartilhamento de dados por cada órgão do Governo
Federal serão realizados nos termos do disposto na LGPD.
Está estabelecido também que o compartilhamento de dados entre os órgãos e as entidades do
Governo Federal é categorizado em três níveis, de acordo com sua confidencialidade, que serão
definidas pelo gestor dos dados:
 compartilhamento amplo – quando se tratar de dados públicos que não estão sujeitos a
nenhuma restrição de acesso, cuja divulgação deve ser pública e garantida a qualquer
interessado, na forma da legislação;
 compartilhamento restrito – quando se tratar de dados protegidos por sigilo, nos termos da
legislação, com concessão de acesso a todos os órgãos e entidades do Governo Federal para
a execução de políticas públicas, cujo mecanismo de compartilhamento e regras sejam
simplificados e estabelecidos pelo Comitê Central de Governança de Dados;
 compartilhamento específico – quando se tratar de dados protegidos por sigilo, nos termos da
legislação, com concessão de acesso a órgãos e entidades específicos, nas hipóteses e para
os fins previstos em lei, cujo compartilhamento e regras sejam definidos pelo gestor de dados.
 Cadastro Base do Cidadão
O Cadastro Base do Cidadão constitui um meio unificado de identificação do cidadão para a prestação
de serviços públicos. Ele funciona a partir do cruzamento de informações das bases dos dados
cadastrais partindo do número do CPF do cidadão.
A proposta envolve disponibilizar uma ferramenta unificada de atualização cadastral, suportada
tecnologicamente por todas as entidades e órgãos públicos participantes do cadastro.
Os dados que inicialmente serão disponibilizados serão os dados biográficos que constam na base do
CPF. São eles: número de inscrição no CPF; situação cadastral no CPF; nome completo; nome social;
data de nascimento; sexo; filiação; nacionalidade; naturalidade; indicador de óbito; data de óbito,
quando cabível; e data da inscrição ou da última alteração no CPF.
 Comitê Central de Governança de Dados
 O Comitê Central de Governança de Dados (CCGD) é responsável, dentre outras tarefas, de
elaborar as políticas e as diretrizes para a categorização de compartilhamento específico dos
dados. A entidade também será responsável pela forma e o meio de publicação dessa
categorização, tendo em mente a legislação pertinente, referente à proteção de dados
pessoais e as regras e os parâmetros para o compartilhamento restrito, incluídos os padrões
relativos à preservação do sigilo e da segurança.
 O CCGD será composto sete membros: dois do Ministérios da Economia, sendo um da
Secretaria Especial de Desburocratização, Gestão e Governo Digital, que será o presidente do
Comitê, e um da Secretaria Especial da Receita Federal do Brasil; um da Casa Civil da
Presidência da República; um da Secretaria de Transparência e Prevenção da Corrupção da
Controladoria-Geral da União; um da Secretaria Especial de Modernização do Estado da
Secretaria-Geral da Presidência da República; um da Advocacia-Geral da União; e um do
Instituto Nacional do Seguro Social (INSS).
 O Comitê terá reuniões ordinárias a cada dois meses e extraordinárias sempre que for
convocado pelo seu presidente ou um de seus membros. O quórum de reunião será dois
terços de seus membros e o quórum de aprovação é por consenso. Suas decisões serão
resoluções que serão publicadas pela Secretaria Especial de Desburocratização, Gestão e
Governo Digital do Ministério da Economia.
2.3 Dados de baixa qualidade custam dinheiro
Garantir que os dados sejam de alta qualidade é essencial para seu gerenciamento. Se os dados não
atenderem às necessidades de seus consumidores - se não forem "adequados ao objetivo" -, então o
esforço para coletar, armazenar, proteger e permitir o acesso a eles é desperdiçado. Para garantir que
os dados atendam às necessidades dos negócios, as equipes de gerenciamento de dados devem
trabalhar com os consumidores para definir as características que tornam os dados de alta qualidade.
A maioria dos usos dos dados envolve aprender com eles, a fim de aplicar esse aprendizado e criar
valor. Por exemplo, entender os hábitos do cliente para melhorar um produto ou serviço; avaliar o
desempenho organizacional ou as tendências do mercado, a fim de desenvolver uma melhor
estratégia de negócios, etc.
Dados de baixa qualidade são simplesmente caros para qualquer organização. As estimativas diferem,
mas os especialistas acreditam que as organizações gastam entre 10 a 30% da receita lidando com
problemas de qualidade de dados. A IBM estimou o custo de dados de baixa qualidade nos Estados
Unidos da América, em 2016, em US $ 3,1 trilhões.
Muitos dos custos de dados de baixa qualidade são ocultos e indiretos e, portanto, difíceis de
mensurar. No entanto, outros custos podem ser provenientes de:
 Retrabalho.
 Soluções alternativas e processos de correção ocultos.
 Ineficiências organizacionais ou baixa produtividade.
 Conflito organizacional.
 Insatisfação do usuário.
 Custos de oportunidade, incluindo a incapacidade de inovar.
 Custos ou multas de conformidade.
Os benefícios correspondentes de dados de alta qualidade incluem:
 Experiência aprimorada do usuário.
 Maior produtividade.
 Risco reduzido.
 Capacidade de atuar em oportunidades.
 Aumento de oportunidades.
 Vantagem competitiva obtida com insights sobre políticas, serviços, processos e
oportunidades.
 Vantagem competitiva obtida com segurança e qualidade demonstráveis dos dados.
Não é algo único como esses custos e benefícios implicam gerenciar a qualidade dos dados. A
produção de dados de alta qualidade requer planejamento, comprometimento e uma mentalidade que
agrega qualidade aos processos e sistemas, em conformidade com o padrão ISO.
2.4 A avaliação de dados não é padronizada
Você sabe quanto custa coletar e gerenciar dados? E quanto custaria reconstruir o histórico, caso
esses dados fossem perdidos?
Ainda assim, colocar atribuir valor aos dados é útil porque as decisões estratégicas se tornam a base
para a compreensão do valor das atividades de gerenciamento de dados. Uma abordagem para a
avaliação de dados é definir categorias gerais de custo e benefício que podem ser aplicadas de
maneira consistente em uma organização.
As categorias de exemplo incluem:
 Custo de obtenção e armazenamento de dados.
 Custo da substituição de dados se eles forem perdidos.
 Impacto para a organização se houver perda dados.
 Custos potenciais de riscos associados aos dados.
 Custo de mitigação de risco.
 Custo de melhoria de dados.
 Benefícios de dados de maior qualidade.
 Vantagens de compartilhar esses dados.
 Retorno esperado pelo uso inovador desses dados.
A avaliação de ativos de dados também deve reconhecer que o valor dos dados é contextual (ou seja,
o que é valioso para uma organização pode não o ser para outra) e geralmente temporal (ou seja, o
uso foi vantajoso ontem e pode não o ser hoje). Apesar disso, dentro de uma organização, é provável
que certos tipos de dados, como dados cadastrais, sejam consistentemente valiosos ao longo do
tempo; portanto, a maioria das organizações se concentra primeiro em garantir a qualidade desses
dados altamente críticos.
2.4 A avaliação de dados não é padronizada
Você sabe quanto custa coletar e gerenciar dados? E quanto custaria reconstruir o histórico, caso
esses dados fossem perdidos?
Ainda assim, colocar atribuir valor aos dados é útil porque as decisões estratégicas se tornam a base
para a compreensão do valor das atividades de gerenciamento de dados. Uma abordagem para a
avaliação de dados é definir categorias gerais de custo e benefício que podem ser aplicadas de
maneira consistente em uma organização.
As categorias de exemplo incluem:
 Custo de obtenção e armazenamento de dados.
 Custo da substituição de dados se eles forem perdidos.
 Impacto para a organização se houver perda dados.
 Custos potenciais de riscos associados aos dados.
 Custo de mitigação de risco.
 Custo de melhoria de dados.
 Benefícios de dados de maior qualidade.
 Vantagens de compartilhar esses dados.
 Retorno esperado pelo uso inovador desses dados.
A avaliação de ativos de dados também deve reconhecer que o valor dos dados é contextual (ou seja,
o que é valioso para uma organização pode não o ser para outra) e geralmente temporal (ou seja, o
uso foi vantajoso ontem e pode não o ser hoje). Apesar disso, dentro de uma organização, é provável
que certos tipos de dados, como dados cadastrais, sejam consistentemente valiosos ao longo do
tempo; portanto, a maioria das organizações se concentra primeiro em garantir a qualidade desses
dados altamente críticos.
2.5 Gerenciamento de dados significa gerenciar o ciclo de vida dos dados
Um dos motivos pelos quais as pessoas confundem gerenciamento de dados com gerenciamento de
tecnologia é que geralmente avaliam dados apenas de um ponto de vista: a aplicação do qual os
dados são acessados.
Pessoas não reconhecem que os dados podem ser separados das aplicações em que são criados ou
armazenados e que os dados têm um ciclo de vida. O ciclo de vida é baseado no ciclo de vida do
resultado. Concentra-se em garantir que os dados sejam criados, movidos e mantidos de maneira a
torná-los utilizáveis pelas pessoas e processos que os exigem. Embora dados e tecnologia estejam
interligados, o ciclo de vida dos dados não deve ser confundido com o ciclo de vida de
desenvolvimento de sistemas (systems development lifecycle - SDLC), que se concentra na conclusão
de projetos dentro do prazo e do orçamento.
Conceitualmente, o ciclo de vida dos dados é fácil de descrever: inclui processos que criam ou obtêm
dados, aqueles que os movem, transformam e armazenam e permitem que sejam mantidos e
compartilhados, e aqueles que os usam ou os aplicam, bem como aqueles que os descartam.
Os dados raramente são estáticos: durante todo o seu ciclo de vida, os dados podem ser limpos,
transformados, mesclados, aprimorados ou agregados. Os dados geralmente se movem
horizontalmente dentro da organização: à medida que os dados são usados ou aprimorados, novos
dados são criados, de modo que seu ciclo de vida possui iterações internas e os 'mesmos' dados
podem ter requisitos de ciclo de vida diferentes em diferentes partes da organização.
A complexidade é adicionada ao conceito do ciclo de vida pelo fato de que diferentes tipos de dados
têm requisitos de ciclo de vida diferentes. Por exemplo, os dados transacionais podem ser controlados
em grande parte por meio da aplicação de regras básicas, enquanto os Dados Mestre requerem
curadoria.
Conheça além desses, outros princípios que se aplicam ao ciclo de vida de qualquer dado:
Criação e uso são os pontos mais críticos no ciclo de vida dos dados
O gerenciamento de dados deve ser executado com um entendimento de como os dados são
produzidos ou obtidos, assim como os dados são usados. Custa dinheiro para produzir dados. Os
dados são valiosos somente quando são consumidos ou aplicados.
A qualidade dos dados deve ser gerenciada durante todo o ciclo de vida dos dados
Como a qualidade dos dados pode ser afetada por vários eventos do ciclo de vida, a qualidade deve
ser planejada como parte do ciclo de vida dos dados. Não é um complemento ou algo a ser 'feito mais
tarde'.
A qualidade dos metadados deve ser gerenciada por meio do ciclo de vida dos dados
Os metadados são tipos de dados utilizados para descrever outros dados. Como tal, é essencial para
todas as funções de gerenciamento de dados. Os metadados geralmente são criados como parte do
ciclo de vida de outros dados e devem ser vistos como um produto (e não como um subproduto) desse
ciclo de vida. A qualidade dos metadados deve ser gerenciada da mesma maneira que a qualidade de
outros dados.
A segurança dos dados deve ser gerenciada durante todo o ciclo de vida dos dados
Os esforços de gerenciamento de dados devem se concentrar nos dados mais críticos
O gerenciamento de dados inclui a garantia de segurança dos dados e redução dos riscos associados.
Os dados que requerem proteção devem ser protegidos por todo o ciclo de vida, desde a criação até o
descarte.
Os esforços de gerenciamento de dados devem se concentrar nos dados mais críticos
As organizações produzem muitos dados, muitos dos quais nunca são realmente usados. Tentar
gerenciar todos os dados não é possível nem desejável. O gerenciamento do ciclo de vida requer o
foco nos dados mais críticos de uma organização e a minimização do ROT de dados (ou seja, dados
redundantes, obsoletos ou triviais).
2.6 Diferentes tipos de dados têm diferentes requisitos de ciclo de vida
O gerenciamento de dados se torna mais complicado pelo fato de diferentes tipos de dados
apresentarem requisitos diferentes de gerenciamento do ciclo de vida.
Os dados podem ser classificados conforme:
 função que servem (por exemplo, dados transacionais, dados de referência, dados mestre,
metadados; alternativamente, dados de categoria, dados de recursos, dados de eventos,
dados detalhados de transações);
 conteúdo (domínios de dados, áreas de conhecimento);
 formato ou nível de proteção exigido pelos dados; e
 forma e onde são armazenados ou acessados.
Como diferentes tipos de dados têm requisitos diferentes, eles estão associados a riscos diferentes e
desempenham papéis diferentes dentro de uma organização. A maioria das ferramentas de
gerenciamento de dados estão focadas nos aspectos de classificação e controle. Por exemplo, os
Dados Mestre têm usos diferentes e, consequentemente, requisitos de gerenciamento diferentes dos
dados transacionais.
Como variados tipos de dados têm requisitos diferentes, eles estão associados a riscos distintos e
desempenham papéis diferentes dentro de uma organização. A maioria das ferramentas de
gerenciamento de dados estão focadas nos aspectos de classificação e controle.
Por exemplo, os Dados Mestre têm usos discrepantes e, consequentemente, requisitos de
gerenciamento desiguais dos dados transacionais.
O quadro a seguir, apresenta a análise sobre as fases do ciclo de vida dos dados, considerando a Lei
nº 13.709/2018, Lei Geral de Proteção de Dados (LGPD):
CICLO DE VIDA DOS DADOS
Fase do Ciclo Antes da LGPD Com a LGPD
Coleta
Os dados pessoais são coletados
indiscriminadamente.
Os dados pessoais coletados devem
obedecer ao princípio da necessidade e
da finalidade.
Processamento
Os dados podem ser processados sem
um tratamento específico.
O processamento de dados só poderá
ser realizado se o tratamento estiver
enquadrado no Art. 7º da LGPD.
Análise
A análise de dados é feita para
entender o mercado, conhecer o perfil
das pessoas e definir estratégias para
oferecer bens e serviços para o
público-alvo.
A análise dos dados deve levar em
consideração a finalidade da coleta.
Devem ser obedecidos os princípios de
tratamento com propósito legítimo
específico e explicito.
Compartilhamento
Os dados pessoais são compartilhados
sem a necessidade do consentimento
de seus titulares.
O compartilhamento de dados deve ser
consentido pelos seus titulares*
*Ver Inciso II do Art. 3º do Decreto nº
10.046/2019.
Armazenamento
Os dados pessoais são armazenados
e mantidos por tempo indeterminado.
Os dados pessoais devem ser
armazenados e mantidos por prazos
definidos, ou seja, até que a finalidade
seja alcançada ou deixem de ser
necessários ou pertinentes ao alcance da
finalidade.
Reutilização
Os dados pessoais são reutilizados
sem a necessidade de consentimento
de seus titulares.
Um novo consentimento deve ser
solicitado sempre que houver mudança
de finalidade.
Eliminação
Os dados pessoais são mantidos sem
a obrigatoriedade de serem
eliminados.
Os dados pessoais devem ser eliminados
após o término de seu tratamento.
A depender do objetivo da coleta do dado, segue-se um ciclo de vida. Após o finalizado o objetivo de
coleta de dados, os trabalhos devem continuar sobre os dados produzidos, a fim de que eles sejam
reutilizados após análises, citações e atualizações. Dessa forma, existe a possibilidade de reutilização
dos dados para outros fins, que seja até para alimentar sistemas que compõem um ecossistema
relacionado a uma política pública ou de pesquisas estatísticas para fins de planejamento de outras
políticas para atendimento de demandas de interesse da sociedade.
2.7 Os metadados devem ser gerenciados como parte do ciclo de vida dos dados.
Existe uma atenção especial dos profissionais de gerenciamento de dados em relação aos metadados
porque sabem da sua importância no processo de gestão de dados. No entanto, é um fato que estes
profissionais se limitam em utilizar o termo Metadados ao se direcionar à Alta Administração, visto que
essa gestão deve ser transparente aos usuários/consumidores e bastante eficiente no contexto
técnico.
Os metadados incluem uma variedade de informações que permitem às pessoas entender dados e os
sistemas que os contêm. Os metadados descrevem quais dados uma organização possui, o que
representa, como é classificado, sua origem, sua interoperabilidade dentro da organização, como
evolui por meio do uso, quem pode ou não acessá-los e se são de alta qualidade.
O desafio não é evidenciar a importância dos metadados para gerenciá-los, mas a forma de ser
gerenciados como tal. As organizações que não gerenciam bem seus dados geralmente não
gerenciam seus metadados. A resposta para esse desafio é que o gerenciamento de metadados
geralmente fornece um ponto de partida para melhorias no gerenciamento de dados em geral.
2.8 O gerenciamento de dados geralmente é confundido com o gerenciamento de
tecnologia da informação
Como quase todos os dados atuais são armazenados eletronicamente, o gerenciamento de dados está
intimamente ligado ao gerenciamento de tecnologia. Eles precisam ser vistos em relação um ao outro,
porque as decisões sobre a tecnologia afetam muitas facetas de como os dados são gerenciados.
Observe que:
 O gerenciamento de dados se concentra em garantir que os dados em si sejam utilizáveis e
confiáveis; e
 O gerenciamento de tecnologia se concentra na criação e manutenção de infraestrutura,
sistemas e aplicações.
Os dois estão fundamentalmente conectados pelo fato de que sistemas e aplicações automatizam
processos de negócios que coletam ou criam dados e diferentes opções tecnológicas impõem
restrições diferentes aos próprios dados. Os requisitos de gerenciamento de dados e gerenciamento
de tecnologia devem estar enraizados nos processos de negócios que criam ou usam dados e nas
necessidades das pessoas e processos que consomem dados.
Em muitas organizações, existe uma tensão contínua entre o desejo de construir novas tecnologias e o
desejo de ter dados mais confiáveis - como se os dois se opusessem um ao outro, em vez de
precisarem um do outro.
O gerenciamento bem-sucedido de dados requer decisões sólidas sobre tecnologia, mas gerenciar
tecnologia não é o mesmo que gerenciar dados. As organizações precisam entender o impacto da
tecnologia nos dados, para impedir que a tentação tecnológica direcione suas decisões sobre os
dados. Em vez disso, os requisitos de dados alinhados à estratégia de negócios devem orientar as
decisões sobre tecnologia.
2.9 O que o gerenciamento de dados requer
O gerenciamento de dados é multifuncional e requer habilidades e uma perspectiva corporativa.
Vamos conhecê-las.
Habilidades
O gerenciamento de dados envolve um conjunto de processos interconectados alinhados ao ciclo de
vida dos dados. Embora muitas organizações vejam o gerenciamento de dados como uma função de
tecnologia da informação, na verdade, requer uma ampla gama de pessoas com um conjunto
diversificado de habilidades trabalhando em diferentes partes de uma organização.
O gerenciamento de dados é um processo complexo porque é executado em toda a organização. Os
dados são gerenciados em diferentes locais da organização por equipes que são responsáveis por
diferentes fases do ciclo de vida dos dados.
O gerenciamento de dados requer:
 Habilidades de processos de negócios para entender e planejar a criação de dados confiáveis.
 Habilidades de design para planejar sistemas nos quais os dados serão armazenados ou
usados.
 Habilidades altamente técnicas para administrar hardware e criar software onde os dados são
mantidos.
 Habilidades de análise de dados para entender questões e problemas descobertos nos dados.
 Habilidades analíticas para interpretar dados e aplicá-los a novos problemas.
 Habilidades linguísticas para trazer consenso às definições e modelos para que as pessoas
possam entender dados.
 Pensamento estratégico para visualizar oportunidades de uso de dados para atender
usuários/consumidores e atingir metas.
O desafio é fazer com que as pessoas com esse rol de habilidades e perspectivas reconheçam como
as peças se encaixam e como o trabalho delas são transversais com o trabalho de outras partes da
organização, para que elas colaborem com sucesso e alcancem objetivos comuns.
Uma perspectiva corporativa
A maioria das organizações divide o trabalho por unidades ou funções de negócios, cada uma das
quais pode desenvolver suas próprias aplicações para executar seu trabalho. Como os dados
geralmente são vistos simplesmente como subprodutos de processos operacionais, nem sempre são
planejados para além da necessidade imediata. Pode até não ser reconhecido como algo que outras
pessoas e processos utilizam.
A menos que os padrões de dados corporativos sejam estabelecidos e aplicados, haverá diferenças na
forma como os dados são definidos e criados em diferentes áreas. Por exemplo, considere algo
aparentemente simples como um Número de Segurança Social (Social Security Number - SSN), um
identificador americano para indivíduos. Se uma aplicação captura o SSN como um valor numérico e
outro a captura em um campo de texto, os dados do SSN serão formatados de maneira diferente. Isso
pode resultar em problemas como a eliminação de zeros à esquerda nos SSNs.
Diferenças de formatação, diferenças na granularidade dos dados e diferenças sobre quais atributos
são obrigatórios para capturar - todas essas diferenças apresentam obstáculos à integração de dados
de diversas aplicações. Os obstáculos à integração limitam o valor que uma organização pode obter
com seus dados.
As organizações que veem os dados como um produto que eles criam ou compram tomarão melhores
decisões sobre como gerenciá-los ao longo de seu ciclo de vida. Essas decisões exigem o
reconhecimento de:
 As formas como os dados conectam processos de negócios que, de outra forma, poderiam ser
vistos como separados.
 A relação entre processos de negócios e a tecnologia que os suporta.
 O design e a arquitetura dos sistemas e os dados que eles produzem e armazenam.
 As maneiras pelas quais os dados podem ser usados para avançar a estratégia organizacional.
Planejar dados melhores requer uma abordagem estratégica da arquitetura, modelagem e outras
funções de design. Também depende da colaboração estratégica entre os negócios e a liderança de
TI. E, é claro, exige a capacidade de executar efetivamente em projetos individuais.
O desafio é que geralmente existem pressões organizacionais, bem como as constantes pressões de
tempo e dinheiro, que atrapalham o planejamento. As organizações devem equilibrar as metas de
longo e curto prazo à medida que executam sua estratégia. Ter clareza sobre as compensações leva a
melhores decisões.
O que você precisa saber:
 Os dados são um ativo valioso, mas também representam risco. Uma organização pode
começar a entender o valor de seus dados reconhecendo os custos de dados de baixa
qualidade e os benefícios de dados de alta qualidade.
 Os dados têm características únicas que dificultam o gerenciamento.
 A melhor abordagem para enfrentar esses desafios é gerenciar dados em todo o seu ciclo
de vida e adotar uma perspectiva corporativa.
 A falha no gerenciamento do ciclo de vida dos dados é cara, embora muitos custos estejam
ocultos.
 O gerenciamento de dados em todo o ciclo de vida requer planejamento, habilidade e
trabalho em equipe.
3. Princípios de gerenciamento de dados do DAMA (DATA MANAGEMENT ASSOCIATION)
O gerenciamento de dados apresenta desafios únicos conectados à natureza dos dados em si. Mesmo
com suas características exclusivas, o gerenciamento de dados ainda compartilha características com
outras formas de gerenciamento. Envolve conhecer quais dados uma organização possui e a melhor
forma de usar esses ativos para atingir as metas organizacionais. Como outros processos de
gerenciamento, deve-se equilibrar as necessidades estratégicas e operacionais.
Para ajudar as organizações a alcançar esse equilíbrio, o DAMA desenvolveu um conjunto de
princípios que reconhecem os desafios do gerenciamento de dados e auxiliam a orientar as práticas de
gerenciamento de dados.
Em nível mais estratégico, esses princípios se resumem a quatro asserções que examinaremos neste
módulo:
 Os dados possuem valor estratégico.
 Requisitos de gerenciamento de dados são requisitos de negócios.
 Gerenciamento de dados refere-se ao gerenciamento do ciclo de vida.
 O gerenciamento de dados depende de diversas habilidades.
Os princípios de gerenciamento de dados da DAMA fornecem uma lente para entender como sua
organização gerencia seus dados. Depois de revisar suas implicações, as examinaremos no contexto
da maturidade do gerenciamento de dados. Um modelo de maturidade define uma progressão do
controle crescente sobre um conjunto de processos. Quando uma organização obtém uma
compreensão das características do processo, pode estabelecer um plano para melhorar suas
capacidades. Ele também pode medir a melhoria e comparar-se aos concorrentes ou parceiros,
guiados pelos níveis do modelo.
Os modelos de maturidade do gerenciamento de dados descrevem detalhes dos processos de
gerenciamento de dados que podem ser usados para esse tipo de avaliação.
Princípios de Gerenciamento de Dados
Dados são estratégicos
 Dados são um ativo de propriedade exclusiva.
 O valor dos dados pode e deve ser expresso em termos econômicos/estratégicos.
 Gerenciamento eficaz de dados requer comprometimento da liderança.
Requisitos de gerenciamento de dados são requisitos de negócios
 Gerenciar dados significa gerenciar a qualidade dos dados.
 São necessários metadados para gerenciar dados.
 É preciso planejar o gerenciamento de dados.
 Requisitos de gerenciamento de dados devem orientar as decisões de Tecnologia da
Informação.
Gerenciamento de dados é
gerenciamento do ciclo de vida
Gerenciamento de dados depende
de diversas habilidades
 Tipos diferentes de dados têm
características diferentes do ciclo de vida.
 Gerenciamento de dados é multifuncional.
 Gerenciar dados inclui gerenciar o risco
associado aos dados.
 O gerenciamento de dados requer uma
perspectiva corporativa.
 O gerenciamento de dados deve levar em
conta uma variedade de perspectivas.
Fonte: Data Management Principles (Adapted from DMBOK2)
3.1. Os dados são valiosos
 Os dados são um ativo com propriedades exclusivas: os dados são um ativo, mas diferem
de outros ativos de maneiras importantes que afetam a maneira como são gerenciados. A mais
óbvia dessas propriedades é que os dados não são consumidos quando usados, assim como
os ativos financeiros e físicos.
 O valor dos dados pode e deve ser expresso em termos econômicos: Chamar dados de
um ativo implica ele ter valor. Embora existam técnicas para medir o valor qualitativo e
quantitativo dos dados, ainda não existem padrões para isso. As organizações que desejam
tomar melhores decisões sobre seus dados devem desenvolver maneiras consistentes de
quantificar esse valor. Eles também devem medir os custos de dados de baixa qualidade e os
benefícios de dados de alta qualidade.
 O gerenciamento eficaz de dados requer comprometimento da liderança: o gerenciamento
de dados envolve um conjunto complexo de processos que, para serem eficazes, requerem
coordenação, colaboração e comprometimento. Chegar lá exige não apenas habilidades de
gerenciamento, mas também a visão e o objetivo advindos da liderança comprometida.
3.2. Requisitos de gerenciamento de dados são requisitos de negócios
 Gerenciar dados significa gerir a sua qualidade: garantir que os dados sejam adequados ao
objetivo é um objetivo principal do gerenciamento de dados. Para gerenciar a qualidade, as
organizações devem garantir que compreendem os requisitos de qualidade das partes
interessadas e medem os dados em relação a esses requisitos.
 São necessários metadados para gerenciar dados: gerenciar qualquer ativo requer ter
dados sobre esse ativo (número de funcionários, códigos contábeis etc.). Os dados usados
para gerenciar e usar dados são chamados de metadados. Como os dados não podem ser
mantidos ou tocados, para entender o que são e como usá-los, requer definição e
conhecimento na forma de Metadados. Os metadados são originários de uma variedade de
processos relacionados à criação, processamento e uso de dados, incluindo arquitetura,
modelagem, administração, governança, gerenciamento da qualidade dos dados,
desenvolvimento de sistemas, operações de negócios e TI e análise.
 É preciso planejar o gerenciamento de dados: Mesmo pequenas organizações podem ter
cenários técnicos e de negócios complexos. Os dados são criados em muitos locais e transitam
entre vários locais para seu uso. Coordenar o trabalho e manter os resultados finais alinhados
requer planejamento da perspectiva de arquitetura e do processo.
 Os requisitos de gerenciamento de dados devem orientar as decisões em tecnologia da
informação: o gerenciamento de dados está extremamente interligado à tecnologia da
informação e ao gerenciamento da tecnologia da informação. O gerenciamento de dados
requer uma abordagem que garanta que a tecnologia atenda e direcione as necessidades
estratégicas de dados de uma organização.
3.3. Gerenciamento de dados é gerenciamento do ciclo de vida
 Gerenciamento de dados é gerenciamento do ciclo de vida: os dados têm um ciclo de vida
e o gerenciamento de dados requer a administração de seu ciclo de vida. Como os dados
geram mais dados, o próprio ciclo de vida dos dados pode ser muito complexo. As práticas de
gerenciamento de dados precisam levar em consideração o ciclo de vida em evolução dos
dados.
 Diferentes tipos de dados têm características diferentes de ciclo de vida: e por esse
motivo, eles têm requisitos de gerenciamento diferentes. As práticas de gerenciamento de
dados precisam reconhecer essas diferenças e ser flexíveis o suficiente para atender a
diferentes tipos de requisitos do ciclo de vida dos dados.
 O gerenciamento de dados inclui o controle dos riscos associado aos dados: além de
ativos, os dados também representam riscos para a organização. Os dados podem ser
perdidos, furtados ou mal utilizados. As organizações devem considerar as implicações éticas
de seu uso. Os riscos relacionados aos dados devem ser gerenciados como parte do ciclo de
vida dos dados.
3.4. O gerenciamento de dados depende de diversas habilidades
 O gerenciamento de dados é multifuncional: uma única equipe não pode gerenciar todos
os dados de uma organização. Fazer isso requer uma série de habilidades e conhecimentos.
O gerenciamento de dados requer habilidades técnicas e não técnicas além da capacidade de
colaborar.
 O gerenciamento de dados requer uma perspectiva corporativa: o gerenciamento de
dados possui aplicativos locais, mas deve ser aplicado em toda a instituição para ser o mais
eficaz possível. Essa é uma das razões pelas quais o gerenciamento e o controle de dados
estão interligados.
 O gerenciamento de dados deve dar conta de várias perspectivas: os dados são fluidos e
estão em mudança. O gerenciamento de dados deve evoluir constantemente para
acompanhar não somente a maneira como os dados são criados e usados, mas também os
consumidores que os usam.
3.5. Princípios e maturidade em gerenciamento de dados
Reconhecer a importância, identificar os desafios e conhecer os princípios do gerenciamento de dados
são relevantes para uma gestão eficiente. Sua organização está, sem dúvida, aplicando alguns desses
princípios, pois segue, certamente, algumas das práticas descritas aqui. Mas, a menos que a
organização aumente sua consciência por meio de um nível de autoavaliação, é improvável que ela
seja capaz de melhorar suas práticas.
A Avaliação da Maturidade da Capacidade (CMA) é uma abordagem para a melhoria de processos
com base em uma estrutura - um Modelo de Maturidade da Capacidade (CMM) - que descreve como
as características de um processo evoluem de ad hoc para o ideal.
O conceito de CMA surgiu dos esforços do Departamento de Defesa dos Estados Unidos para
estabelecer critérios através dos quais avaliar fornecedores de software. Em meados da década de
1980, o Capability Maturity Model for Software foi publicado pelo Instituto de Engenharia de Software
da Universidade Carnegie-Mellon. Embora aplicados pela primeira vez ao desenvolvimento de
software, os CMMs foram desenvolvidos para uma variedade de outros campos, incluindo
gerenciamento de dados.
Modelos de maturidade são definidos em termos de uma progressão através de níveis que descrevem
as características do processo. Quando uma organização obtém uma compreensão das características
do processo, pode avaliar seu nível de maturidade e implementar um plano para melhorar suas
capacidades. Há possibilidade de medir a melhoria e comparar-se aos concorrentes ou parceiros,
guiados pelos níveis do modelo.
A avaliação da maturidade da capacidade é um instrumento bastante eficiente para isso. Trata-se de
uma abordagem para a melhoria do processo com base em uma estrutura - um Modelo de Maturidade
da Capacidade - que descreve como as características de um processo evoluem de ad hoc para ideal.
A cada novo nível, a execução do processo se torna mais consistente, previsível e confiável. Os
processos melhoram à medida que assumem as características desses níveis. A progressão acontece
em uma ordem definida que deve ser cumprida a cada fase conforme segue:
 Nível 0 Ausência de capacidade
 Nível 1 Inicial ou ad hoc: o sucesso depende da competência dos indivíduos
 Nível 2 Repetível: a disciplina mínima do processo está em vigor
 Nível 3 Definido: os padrões são definidos e usados
 Nível 4 Gerenciável: os processos são quantificados e controlados
 Nível 5 Otimizável: as metas de melhoria de processo são quantificadas
Dentro de cada nível, os critérios são descritos nos recursos do processo. Por exemplo, um modelo de
maturidade pode incluir critérios relacionados à forma como os processos são executados, incluindo o
nível de automação desses processos. Pode se concentrar em políticas e controles, além de detalhes
do processo. Essa avaliação ajuda a identificar o que está funcionando bem, o que não está
funcionando bem e onde uma organização tem lacunas.
A maturidade do uso dos princípios de gerenciamento de dados pode progredir conforme ilustrado na
figura abaixo, onde uma organização passa do conhecimento limitado dos princípios de gerenciamento
de dados para um estado em que os princípios se tornam motores da melhoria organizacional.
Um DMMA (Data Management Maturity Assessment) pode ser usado para avaliar o gerenciamento de
dados em geral, ou para se concentrar em uma única área funcional ou de conhecimento, ou mesmo
em um único processo ou ideia (como o grau em que uma organização segue os dados).
Qualquer que seja o foco, um DMMA pode ajudar a preencher a lacuna entre as perspectivas de
negócios e de TI sobre a saúde e a eficácia das práticas de gerenciamento de dados. Um DMMA
fornece uma linguagem comum para descrever como é o progresso nas funções de gerenciamento de
dados e oferece um caminho para melhorias baseado em etapas, que pode ser adaptado às
prioridades estratégicas de uma organização. Assim, pode ser usado para definir e medir objetivos
organizacionais, bem como comparar a organização com outras organizações ou referências do setor.
Conheça um pouco mais sobre o DMMA
3.6. Reavaliar a maturidade
As reavaliações devem ser realizadas em intervalos regulares, convergindo para um ciclo de melhoria
contínua:
 Estabelecer uma classificação de linha de base através da primeira avaliação.
 Definir parâmetros de reavaliação, incluindo o escopo organizacional.
 Repetir a avaliação do DMM conforme necessário em um planejamento o publicado.
 Acompanhar tendências em relação à linha de base inicial.
 Desenvolver recomendações com base nos resultados da reavaliação.
A reavaliação também pode revigorar ou reorientar o esforço. O progresso mensurável ajuda a manter
o compromisso e o entusiasmo em toda a organização. Alterações em estruturas regulatórias, políticas
internas ou externas ou inovações que possam mudar a abordagem de governança e estratégias são
razões adicionais para reavaliar periodicamente.
3.7. Ferramentas de avaliação de maturidade
 Estrutura de maturidade do gerenciamento de dados: A principal ferramenta usada em uma
avaliação de maturidade é a própria estrutura do DMM.
 Plano de comunicação: Um plano de comunicação inclui um modelo de envolvimento das
partes interessadas, o tipo de informação a ser compartilhada e o cronograma para o
compartilhamento de informações.
 Ferramentas de colaboração: As ferramentas de colaboração permitem que os resultados da
avaliação sejam compartilhados. Além disso, evidências de práticas de gerenciamento de
dados podem ser encontradas nos e-mails, nos modelos concluídos e nos documentos de
revisão criados por meio de processos padrão para design colaborativo, operações,
rastreamento de incidentes, revisões e aprovações.
 Repositórios de gerenciamento e de conhecimento em metadados: padrões de dados,
políticas, métodos, agendas, atas de reuniões ou decisões e artefatos de negócio e técnicos
que servem como prova de prática podem ser gerenciados nesses repositórios. Em alguns
CMMs, a falta desses repositórios é um indicador de menor maturidade na organização. Os
repositórios de metadados podem existir em várias construções, o que pode não ser óbvio para
os participantes. Por exemplo, alguns aplicativos de Business Intelligence dependem
completamente dos metadados para compilar suas visualizações e relatórios, sem se referir a
ele como um repositório distinto separado.
3.8. Técnicas de avaliação de maturidade
Diversas técnicas relacionadas à execução de um DMMA são definidas pela metodologia da
estrutura de DMM escolhida. Técnicas mais gerais são descritas aqui.
Os seguintes critérios devem ser considerados ao selecionar uma estrutura DMM.
Acessibilidade
As práticas são declaradas em termos não técnicos que transmitem a essência funcional da atividade.
Abrangência
A estrutura trata de um amplo escopo de atividades de gerenciamento de dados e inclui o
envolvimento dos negócios, não apenas os processos de TI.
Extensível e flexível
o modelo está estruturado para permitir o aprimoramento de disciplinas específicas do setor ou
adicionais e pode ser usado no todo ou em parte, dependendo das necessidades da organização.
Caminho do progresso futuro incorporado
embora as prioridades específicas sejam diferentes de organização para organização, a estrutura do
DMM descreve um caminho lógico a seguir em cada uma das funções que descreve.
Agnóstico e específico do setor
algumas organizações se beneficiarão de uma abordagem específica do setor, outras de uma estrutura
mais genérica. Qualquer estrutura de DMM também deve aderir às melhores práticas de
gerenciamento de dados que cruzam verticais.
Nível de abstração ou detalhe
as práticas e os critérios de avaliação são expressos em um nível de detalhe suficiente para garantir
que eles possam estar relacionados à organização e ao trabalho que ela realiza.
Não prescritivo
A estrutura descreve o que precisa ser executado, não como deve ser executado.
Organizado por tópico
A estrutura coloca as atividades de gerenciamento de dados em seu contexto apropriado, permitindo
que cada uma seja avaliada separadamente, enquanto reconhece as dependências.
Repetível
A estrutura pode ser interpretada de forma consistente, suportando resultados repetíveis para
comparar uma organização com outras do setor e acompanhar o progresso ao longo do tempo.
Suportado por uma organização independente e neutra
O modelo deve ser neutro em relação ao fornecedor, a fim de evitar conflitos de interesse, e
amplamente disponível para garantir uma ampla representação das melhores práticas.
Tecnologia neutra
O foco do modelo deve estar nas práticas, e não nas ferramentas.
Suporte de treinamento incluído
O modelo é suportado por um treinamento abrangente para permitir que os profissionais dominem a
estrutura e otimizem seu uso.
3.9. Uso da estrutura DAMA-DMBOK
O DAMA-DMBOK pode ser usado para preparar ou estabelecer critérios para um DMMA.
Os responsáveis pela execução identificarão ligação direta entre funções segmentadas (as Áreas de
Conhecimento) e as tarefas correspondentes (atividades).
As áreas de conhecimento, atividades e produtos (produtos de trabalho) do DMBOK podem ser
configuradas para uma estrutura específica do DMM com base nas áreas medidas, suas atividades de
suporte, relevância e tempo disponível. Essa abordagem rápida, em conjunto com a lista de
verificação, pode ser usada para determinar áreas que precisam de análise mais profunda, que
representam lacunas ou que indicam pontos de acesso para correção.
O DMBOK oferece vantagem adicional como ferramenta de planejamento de avaliação: Há uma
grande comunidade de profissionais do conhecimento usando o DMBOK como um guia em vários
setores, criando uma comunidade de prática em torno de seu uso.
4. Ética na Gestão de Dados
Definida de maneira simples, a ética é um princípio de comportamento baseado em ideias de certo e
errado.
Os princípios éticos geralmente se concentram em ideias como justiça, respeito, responsabilidade,
integridade, justiça, qualidade, confiabilidade, transparência e confiança. A ética de manipulação de
dados preocupa-se em como adquirir, armazenar, gerenciar, usar e descartar dados de maneira
alinhada aos princípios éticos. Em outras palavras, eles se preocupam em fazer as coisas certas com
os dados e impedir que coisas erradas sejam feitas com os dados, mesmo quando ninguém está
olhando.
Manipular dados - não apenas gerenciá-los, mas usá-los e compartilhá-los com outras entidades - de
maneira ética é necessário para o sucesso a longo prazo de qualquer organização que deseja obter
valor de seus dados.
O tratamento antiético de dados pode resultar em perda de reputação e clientes, pois coloca em risco
as pessoas cujos dados estão expostos. Em alguns casos, práticas antiéticas também são ilegais.
Dada a conexão entre o direito à privacidade e outros direitos humanos, a ética dos dados também é
uma questão de responsabilidade social.
O tratamento ético dos dados, abrangerá:
 O porquê é importante gerenciar dados eticamente.
 Os princípios subjacentes ao tratamento ético de dados.
 Os benefícios de adotar uma abordagem ética para o gerenciamento de dados.
 O como estabelecer uma abordagem ética para o gerenciamento de dados.
4.1. Ética e gerenciamento de dados
A ética relacionada ao tema “manipulação de dados” apresenta alguns conceitos básicos. São eles:
 Impacto nas pessoas: Os dados geralmente representam características de pessoas
(Exemplos servidores, pacientes, fornecedores etc.) e são usados para tomar decisões que
afetam a vida das pessoas. A ética exige que os dados sejam usados apenas de maneira a
preservar a dignidade humana.
 Potencial de uso indevido: O uso indevido de dados pode afetar negativamente pessoas e
organizações. Isso leva a um imperativo ético para impedir o uso indevido de dados,
principalmente por meio de ações que prejudicam o bem maior.
 Valor econômico dos dados: os dados têm valor econômico. A ética da propriedade dos
dados deve determinar como esse valor pode ser acessado e por quem.
As organizações protegem os dados com base principalmente em normas legais e regulamentos. No
entanto, como os dados afetam as pessoas, os profissionais de gerenciamento de dados devem
reconhecer que existem razões éticas (e legais) para proteger os dados e garantir que não sejam mal
utilizados.
Mesmo dados que não representam diretamente indivíduos, como dados sobre acessibilidade ou
distribuição de recursos, ainda podem ser usados para tomar decisões que afetam a vida das pessoas.
Há um imperativo ético não apenas para proteger os dados, mas também para gerenciar sua
qualidade. As pessoas que tomam decisões, bem como as que são impactadas por elas, esperam que
os dados sejam completos e precisos para que eles tenham uma base sólida para as decisões.
Do ponto de vista comercial e técnico, os profissionais de gerenciamento de dados têm uma
responsabilidade ética de gerenciar os dados de uma maneira que reduz o risco de que eles possam
deturpar, ser mal utilizados ou ser mal interpretados. Essa responsabilidade se estende ao longo do
ciclo de vida dos dados, da criação à destruição dos dados.
Infelizmente, muitas organizações falham em reconhecer e responder às obrigações éticas inerentes
ao gerenciamento de dados. Elas podem adotar uma perspectiva técnica tradicional e declarar não
entender os dados. Ou elas assumem que, se seguirem a letra da lei, não terão riscos relacionados ao
tratamento de dados. Esta é uma suposição perigosa.
O ambiente de dados está evoluindo rapidamente. As organizações estão usando os dados de
maneiras que elas nem imaginariam há alguns anos atrás. O Google Analytics pode aprender coisas
com dados que diversas pessoas ainda não considerariam possíveis.
Embora as leis codifiquem alguns princípios éticos, a legislação não pode acompanhar os riscos
associados à evolução do ambiente de dados. As organizações devem reconhecer e responder à sua
obrigação ética de proteger os dados a eles confiados, promovendo e sustentando uma cultura que
valorize o manejo ético das informações.
4.2. Princípios éticos subjacentes à regulamentação da privacidade
As políticas e normas legais tentam codificar o certo e o errado com base em princípios éticos, mas
não é possível codificar todas as circunstâncias. Por exemplo, as leis de privacidade na União
Europeia, Canadá e Estados Unidos mostram diferentes abordagens para codificar a ética dos dados.
Esses princípios também podem fornecer uma estrutura para a política organizacional.
Destaca-se os princípios subjacentes ao Regulamento Geral de Proteção de Dados (RGPD) da União
Europeia incluem:
 Justiça, legalidade, transparência: os dados pessoais devem ser processados de maneira
legal, justa e transparente em relação ao titular dos dados.
 Limitação de finalidade: Os dados pessoais devem ser coletados para finalidades
especificadas, explícitas e legítimas, e não devem ser processados de maneira incompatível
com essas finalidades.
 Minimização de dados: os dados pessoais devem ser adequados, relevantes e limitados ao
necessário em relação aos propósitos para os quais são processados.
 Precisão: os dados pessoais devem ser precisos e, quando necessário, atualizados. Todas as
medidas razoáveis devem ser tomadas para garantir que os dados pessoais imprecisos...
sejam apagados ou retificados sem demora.
 Limitação de armazenamento: Os dados devem ser mantidos de uma forma que permita a
identificação dos titulares de dados [indivíduos] por não mais que o necessário para os fins
para os quais os dados pessoais são processados.
 Integridade e confidencialidade: Os dados devem ser processados de maneira a garantir a
segurança adequada dos dados pessoais, incluindo proteção contra processamento não
autorizado ou ilegal e contra perda, destruição ou dano acidental, usando medidas técnicas ou
organizacionais apropriadas.
 Responsabilidade: Os controladores de dados devem ser responsáveis por e ser capazes de
demonstrar conformidade com esses princípios.
Os princípios do RGPD são equilibrados e suportam certos direitos qualificados que os indivíduos têm
de seus dados, incluindo os direitos de acesso, retificação de dados imprecisos, portabilidade, o direito
de se opor ao processamento de dados pessoais que podem causar danos ou problemas e
apagamento.
Quando os dados pessoais são processados com base no consentimento, esse consentimento deve
ser uma ação afirmativa fornecida livremente, específica, informada e inequívoca. O RGPD exige
governança e documentação eficazes para permitir e demonstrar conformidade e determina a
Privacidade do Design.
A Lei de Proteção de Dados Pessoais e Documentos Eletrônicos (PIPEDA) é a lei federal canadense
de privacidade que combina um regime abrangente de proteção da privacidade com a autorregulação
do setor.
A PIPEDA (Lei de Proteção de Informações Pessoais e Documentos Eletrônicos) se aplica a toda
organização que coleta, usa e divulga informações pessoais no decorrer de atividades comerciais. Ela
estipula regras, com exceções, que as organizações devem seguir no uso das informações pessoais
dos consumidores.
Ressalta-se ainda que as obrigações estatutárias, baseadas na PIPEDA, consideram :
 Prestação de contas: Uma organização é responsável pelas informações pessoais sob seu
controle e deve designar um indivíduo para ser responsável pela conformidade da organização
com o princípio.
 Objetivos de identificação: Uma organização deve identificar os propósitos para os quais as
informações pessoais são coletadas antes ou no momento em que as informações são
coletadas.
 Consentimento: Uma organização deve obter o conhecimento e o consentimento do indivíduo
para a coleta, uso ou divulgação de informações pessoais, exceto quando inapropriado.
 Limitando a coleta, o uso, a divulgação e a retenção: A coleta de informações pessoais
deve ser limitada àquela necessária para os fins identificados pela organização. As
informações devem ser coletadas por meios justos e legais. As informações pessoais não
devem ser usadas ou divulgadas para outros fins que não aqueles para os quais foram
coletadas, exceto com o consentimento do indivíduo ou conforme exigido por lei. As
informações pessoais serão retidas apenas pelo tempo necessário para o cumprimento desses
propósitos.
 Precisão: as informações pessoais devem ser precisas, completas e atualizadas conforme o
necessário para os fins para os quais devem ser usadas.
 Salvaguardas: as informações pessoais devem ser protegidas por salvaguardas de segurança
adequadas à sensibilidade das informações.
 Abertura: Uma organização deve disponibilizar prontamente às pessoas informações
específicas sobre suas políticas e práticas relacionadas ao gerenciamento de suas
informações pessoais.
 Acesso Individual: Mediante solicitação, um indivíduo deve ser informado da existência, uso e
divulgação de suas informações pessoais e ter acesso a essas informações. Um indivíduo
deve ser capaz de contestar a precisão e a integridade das informações e alterá-las conforme
apropriado.
 Desafios de conformidade: Um indivíduo deve ser capaz de enfrentar um desafio relativo à
conformidade com os princípios acima ao indivíduo ou indivíduos designados responsáveis
pela conformidade da organização.
Saiba mais sobre proteção de dados
HIPAA (Lei de Portabilidade e Responsabilidade do Seguro de Saúde) nos EUA, PIPEDA (Lei de
Proteção de Informações Pessoais e Documentos Eletrônicos) no Canadá, o Regulamento Geral de
Proteção de Dados da UE (RGPD) e outras leis de proteção de dados / privacidade das informações
descrevem obrigações em relação ao manuseio de dados de identificação pessoal (por exemplo,
nome, endereço, afiliação religiosa ou orientação sexual) e privacidade (acesso ou restrição a essas
informações).
Em março de 2012, a Federal Trade Commission (FTC) dos EUA emitiu relatório recomendando que
as organizações projetassem e implementassem seus próprios programas de privacidade com base
nas melhores práticas descritas no relatório (ou seja, Privacidade por Design).
Evidencia-se que esse relatório reafirma o foco da FTC nos Princípios Justos de Processamento de
Informações. São eles:
 Aviso/conscientização: Os coletores de dados devem divulgar suas práticas de informações
antes de coletar informações pessoais dos consumidores.
 Escolha/Consentimento: Os consumidores devem ter opções em relação a como as
informações pessoais coletadas por eles podem ser usadas para fins além daqueles para os
quais as informações foram fornecidas.
 Acesso/Participação: Os consumidores devem poder visualizar e contestar a precisão e a
integridade dos dados coletados sobre eles.
 Integridade/Segurança: Os coletores de dados devem tomar medidas razoáveis para garantir
que as informações coletadas dos consumidores sejam precisas e seguras contra uso não
autorizado.
 Execução/reparação: O uso de um mecanismo confiável para impor sanções por não
conformidade com essas práticas de informações justas.
Existe uma tendência global no sentido de aumentar a proteção legislativa da privacidade das
informações dos indivíduos, seguindo os padrões estabelecidos pela legislação da União Europeia.
As leis em todo o mundo impõem diferentes tipos de restrições ao movimento de dados através das
fronteiras internacionais. Mesmo dentro de uma organização multinacional, haverá limites legais para o
compartilhamento de informações globalmente. Portanto, é importante que as organizações tenham
políticas e diretrizes que permitam que a equipe cumpra os requisitos legais, além de usar dados
dentro do apetite de risco da organização.
Acesse o Saiba Mais para conhecer os normativos brasileiros que regulamentam o tema em estudo.
Conforme estudado anteriormente, a Secretaria de Governo Digital da Secretaria Especial de
Desburocratização, Gestão e Governo Digital do Ministério da Economia publicou no Diário Oficial da
União (DOU) o Decreto nº 10.046, de 09 de outubro de 2019, que estabeleceu a Política de
Compartilhamento de Dados no âmbito da Administração Pública Federal, instituiu o Cadastro Base do
Cidadão (CBC) e o Comitê Central de Governança de Dados (CCGD).
4.3. Ética e vantagem competitiva
As organizações estão cada vez mais reconhecendo que uma abordagem ética ao uso de dados é
uma vantagem competitiva dos negócios. O tratamento ético dos dados pode aumentar a
confiabilidade de uma organização e os resultados dos processos da organização. Isso pode criar
melhores relacionamentos entre a organização e seus stakeholders. Criar uma cultura ética implica a
introdução de uma governança adequada, incluindo a instituição de controles para garantir que os
resultados pretendidos e resultantes do processamento de dados sejam éticos e não violem a
confiança ou violem a dignidade humana.
A manipulação de dados não acontece no vácuo. Enfatizamos as quatro fortes razões comerciais para
lidar com os dados de forma ética:
1. Expectativas das partes interessadas: os clientes e outras partes interessadas esperam
comportamentos e resultados éticos das empresas e de seus processos de dados.
2. Gerenciamento de risco: Reduzir o risco de que os dados pelos quais a organização é
responsável sejam utilizados indevidamente por usuários, clientes ou parceiros é o principal
motivo para cultivar princípios éticos para o tratamento de dados.
3. Prevenção de uso indevido: Também existe uma responsabilidade ética de proteger dados
de criminosos (ou seja, proteger contra hackers e possíveis praias de dados).
4. Respeitando a propriedade: Diferentes modelos de propriedade de dados influenciam a ética
do tratamento de dados. Por exemplo, a tecnologia melhorou a capacidade das organizações
de compartilhar dados entre si. Essa capacidade significa que as organizações precisam tomar
decisões éticas sobre sua responsabilidade pelo compartilhamento de dados que não lhes
pertencem.
As funções emergentes de Chief Data Officer, Chief Risk Officer, Chief Privacy Officer e Chief Analytics
Officer estão focadas no controle de riscos, estabelecendo práticas aceitáveis para o tratamento de
dados. Mas a responsabilidade se estende além das pessoas nesses papéis. O tratamento de dados
de forma ética requer o reconhecimento de toda a organização dos riscos associados ao uso indevido
de dados e o compromisso organizacional de lidar com dados com base em princípios que protegem
os indivíduos e respeitam os imperativos relacionados à propriedade dos dados.
A governança de dados pode ajudar a garantir que os princípios éticos sejam seguidos para processos
críticos, como decidir quem pode usar os dados e como eles podem usá-los. Os profissionais de
governança de dados devem considerar os riscos éticos de certos usos de dados sobre as partes
interessadas. Eles devem gerenciar esses riscos de maneira semelhante à maneira como gerenciam a
qualidade dos dados.
4.4. Estabelecer uma cultura de manipulação ética de dados
Estabelecer uma cultura de manipulação ética de dados requer entender as práticas existentes, definir
comportamentos esperados, codificá-los nas políticas e um código de ética e fornecer treinamento e
supervisão para aplicar os comportamentos esperados. Como em outras iniciativas relacionadas ao
controle de dados e a mudança de cultura, esse processo exige uma liderança forte.
O tratamento ético dos dados obviamente inclui seguir a lei. Também influencia como os dados são
analisados, interpretados e aproveitados interna e externamente. Uma cultura organizacional que
valorize o comportamento ético não apenas terá um código de conduta, mas também garantirá a
existência de controles claros de comunicação e governança para apoiar os usuários que tomam
conhecimento de práticas ou riscos antiéticos. Os usuários precisam poder relatar essas circunstâncias
sem medo de retaliação. Melhorar o comportamento ético de uma organização em relação aos dados
geralmente requer um processo formal de Gerenciamento de Mudanças
Organizacionais (Organizational Change Management - OCM).
Atenção, para o estabelecimento de uma cultura de manipulação ética de dados, é necessário cumprir
as seguintes etapas. Acesse cada uma das abas abaixo para conhecê-las.
Análise as práticas atuais de manipulação de dados do estado
Examine até que ponto as práticas atuais estão direta e explicitamente conectadas aos fatores éticos e
de conformidade; identificar até que ponto os usuários compreendem as implicações éticas das
práticas existentes na construção e preservação da confiança de clientes, parceiros e outras partes
interessadas.
Identifique princípios, práticas e fatores de risco
Considere o risco de que os dados sejam mal utilizados e causem danos a usuários, fornecedores,
outras partes interessadas ou a organização como um todo. Além dos riscos relacionados ao setor, a
maioria das organizações possui riscos específicos, que podem estar relacionados ao seu know-how
tecnológico, à taxa de rotatividade de usuários, aos meios pelos quais eles coletam dados de usuários
ou a outros fatores. Os princípios devem estar alinhados aos riscos (prejuízos que podem acontecer se
os princípios não forem respeitados) e práticas (a forma correta realizar atividades para que os riscos
sejam evitados). As práticas devem ser apoiadas por controles.
Adote um modelo de risco ético socialmente responsável
A execução de atividades de inteligência de negócios, análises e ciência de dados exige uma
perspectiva ética que olhe além dos limites da organização e explique as implicações para a
comunidade em geral. Uma perspectiva ética é necessária não apenas porque os dados podem ser
facilmente mal utilizados, mas também porque as organizações têm uma responsabilidade social de
não prejudicar seus dados. Um modelo de risco pode ser usado para determinar se um projeto deve
ser executado, ele também influenciará como executar o projeto. Como os projetos de análise de
dados são complexos, as pessoas podem não identificar os desafios éticos. As organizações precisam
identificar ativamente riscos potenciais. Um modelo de risco pode ajudá-las a fazer o que a figura a
seguir sugere.
Crie uma estratégia e roteiro éticos para o tratamento de dados
Após uma revisão do estado atual e o desenvolvimento de um conjunto de princípios, a organização
pode formalizar uma estratégia para melhorar suas práticas de tratamento de dados. Essa estratégia
deve refletir princípios éticos e o comportamento esperado relacionado aos dados, expresso em
declarações de valores e código de comportamento ético.
Lição módulo 3
1. Governança de Dados
O termo gerenciamento de dados foi originalmente usado para descrever o trabalho que os
Administradores de Banco de Dados (DBAs) e outras pessoas altamente técnicas fizeram para garantir
que os dados em grandes bancos de dados estivessem disponíveis e acessíveis. Por esse infeliz
acidente histórico ainda hoje ele está fortemente associado a essas atividades.
A expressão governança de dados foi introduzida, em parte, para deixar claro que o gerenciamento de
dados vai além do gerenciamento de bancos de dados. Mais importante, a governança de dados
descreve os processos pelos quais as organizações tomam decisões sobre dados que precisam ser
executadas por pessoas em toda a organização.
Na maioria das organizações, o fluxo de dados ocorre horizontalmente, entre as verticais dos
negócios.
Se uma organização deve alavancar seus dados efetivamente entre funções, precisa estabelecer
estruturas e políticas comuns para tomar decisões consistentes entre os diversos setores da
organização.
A governança de dados deve desempenhar um papel muito semelhante à governança financeira
dentro de uma organização.
A governança de dados (GD) é definida como o exercício de autoridade e de controle (por exemplo,
planejamento, monitoramento e execução) sobre o gerenciamento de ativos de dados.
As atividades de governança ajudam a controlar o desenvolvimento e o seu uso. Também promovem a
redução dos riscos associados e permitem que uma organização aproveite os dados de forma
estratégica.
Todas as organizações tomam decisões sobre dados, independentemente de terem uma função formal
de governança de dados. Aqueles que estabelecem um programa formal de governança de dados
exercem autoridade e controle com maior intencionalidade e consistência. Tais organizações são mais
propensas a alavancar estrategicamente o valor dos seus ativos de dados.
Esse tópico abordará:
 A definição da governança de dados e discutir sua importância.
 Apresentar os diferentes modelos para organizar as funções de governança de dados.
 Discutir como as atividades de gestão de dados contribuem para a governança e
gerenciamento de dados.
1.1. Governança de dados como supervisão
A função de controle de dados orienta todas as outras funções de gerenciamento de dados.
O objetivo do controle de dados é garantir que os dados sejam gerenciados corretamente, de acordo
com políticas e práticas recomendadas. Uma analogia comum é equiparar governança de dados a
auditoria e contabilidade.
Auditores e controladores definem as regras para o gerenciamento de ativos financeiros. Os
profissionais de governança de dados definem regras para gerenciar ativos de dados. Outras áreas
cumprem essas regras. Em ambos os casos, a governança de dados não é única; essa função de
supervisão deve ser mantida depois de estabelecida.
Os princípios para governança de dados precisam ser incorporados ao ciclo de vida de gerenciamento
de dados e às atividades fundamentais. Em um programa contínuo, a governança de dados requer
compromisso contínuo para garantir que uma organização obtenha valor de seus dados e reduz os
riscos relacionados a dados. O principal foco do gerenciamento de dados é garantir que uma
organização obtenha valor com seus dados.
A governança de dados se concentra em como as decisões são tomadas sobre os dados e como as
pessoas e os processos se comportam em relação aos dados.
Atenção, o escopo e o objetivo de um programa de governança de dados dependerão das
necessidades da organização que incluem:
 Supervisão: garantindo que todas as áreas funcionais de governança de dados sigam os
princípios orientadores em benefício da organização.
 Estratégia: definindo, comunicando e direcionando a execução da estratégia e da governança
de dados.
 Política: definir e aplicando políticas relacionadas ao gerenciamento, acesso, uso, segurança e
qualidade de dados e metadados.
 Padrões e qualidade: definindo e aplicando padrões de qualidade e arquitetura de dados.
 Administração: fornecendo observação prática, auditoria e correção nas principais áreas de
qualidade, política e gerenciamento de dados.
 Conformidade: garantindo que a organização possa atender aos requisitos de conformidade
regulamentar relacionado a dados.
 Gerenciamento de problemas: identificando, definindo, escalando e resolvendo problemas
relacionados à segurança, acesso, qualidade, conformidade regulamentar, propriedade de
dados, política, padrões, terminologia ou procedimentos de governança de dados.
 Projetos de gerenciamento de dados: patrocinando esforços para melhorar as práticas de
gerenciamento de dados.
 Avaliação de ativos de dados: definindo padrões e processos para demarcar
consistentemente o valor estratégico dos ativos de dados.
Um programa de governança de dados articulará princípios, desenvolverá políticas e procedimentos,
cultivará práticas de administração de dados, em vários níveis da organização, e se envolverá nos
esforços de gerenciamento de mudanças organizacionais. Tais mudanças comunicam ativamente os
benefícios de uma melhor governança de dados e os comportamentos necessários para gerenciar com
êxito os dados como um ativo ao longo do ciclo de vida dos dados.
Em parte, os programas de governança planejam seus roteiros com base em um modelo de
maturidade de capacidade que lhes permite crescer e aprimorar suas práticas. Em boa parte das
organizações, a adoção de governança formal de dados requer o apoio do gerenciamento de
mudanças organizacionais, bem como o patrocínio de um executivo, como Chief Risk
Officer e/ou Chief Data Officer. Ambos poderão atuar como Curador de Dados ou Data Steward -
papel fundamental para as atividades operacionais de governança. São estas atividades práticas que
levam a melhoria da qualidade de dados e informações e permitem a organização fazer a gestão dos
seus ativos de dados de forma completa e aderente às necessidades de negócio.
Saiba mais sobre o papel do Diretor de Riscos e sobre Diretor de Dados.
1.2. Direcionadores (Drivers) de negócios para governança de dados
O que é mais comum para a governança de dados é a conformidade regulamentar, especialmente
para setores fortemente regulamentados, como serviços financeiros, de saúde, de transportes, etc.
Atender a uma legislação sempre em evolução requer processos aprimorados de governança de
dados. A explosão das análises avançadas por meio da ciência de dados criou um motivo adicional
para se implementar estruturas de governança de dados.
Embora a conformidade e/ou análise de dados possam impulsionar a implementação de governança,
muitas organizações avaliam a governança de dados apenas do ponto de vista de um programa de
gerenciamento de informações direcionado por outras necessidades de negócios, como o Master Data
Management (MDM) . Um cenário típico: uma organização precisa dos melhores dados cadastrais e
escolhe desenvolver o MDM de diversas bases e percebe que o MDM bem-sucedido requer boa
política proveniente de uma governança de dados atuante.
A governança de dados não é um fim em si mesma. Ela precisa se alinhar diretamente à estratégia de
negócio da organização. Quanto mais claramente ajudar a resolver problemas organizacionais, maior
será a probabilidade de as pessoas mudarem comportamentos e adotarem práticas de governança. Os
drivers para governança de dados geralmente se concentram em:
 Reduzir riscos, como os relacionados à conformidade, à reputação geral da organização ou à
segurança e privacidade dos dados.
 Melhorar processos, como a capacidade de cumprir com a regulamentação, gerenciar serviços
e operar com eficiência.
Em termos de computação, Master Data Management (MDM) compreende um conjunto de processos
e ferramentas que definem consistentemente e gerenciam os dados mestres (i.e. não transacionais) de
uma organização (que pode conter dados referenciais). MDM tem o objetivo de prover processos para
coletar, agregar, combinar, consolidar, garantir a qualidade, persistir e distribuir estes dados a toda a
organização para garantir a consistência e o controle nas futuras manutenções e uso desta
informação.
O termo remete ao conceito de arquivo mestre de uma antiga era da computação. MDM seria o
mesmo que virtual or federated database management.
Aqui cabe sua atenção ao Cadastro Base do Cidadão - CBC, instituído pela art.16 do Decreto nº
10.046/2019.
Como você sabe todo o cidadão, ao longo da vida cível, precisa realizar seu cadastro em diversos
órgãos públicos para emitir documentos de identificação, como certidão de nascimento, RG, CPF,
título de eleitor, carteira de habilitação, etc. Apesar de que cada desses documentos tem um propósito
específico, todos eles tratam de dados biográficos do cidadão, tais como: nome, data de nascimento,
sexo, etc.
Apesar de termos alcançado grandes avanços tecnológicos na prestação desses serviços públicos,
eles ocorreram de maneira individualizada. O resultado negativo disso é que, além do custo do
cidadão de ter de se apresentar diversas vezes ao Estado, temos seu cadastro replicado em diversas
bases de dados do governo. É difícil identificar o mesmo cidadão nestas diversas bases, o que
inviabiliza a integração entre os sistemas governamentais e a composição de sua trajetória pelos
diversos serviços estatais. Além disso, a replicação permite que os dados estejam diferentes entre as
bases de dados e não se sabe qual é o registro mais atualizado ou correto, o que gera inconsistências
e perda de confiabilidade nestes dados.
O CBC será a base integradora dessas informações do cidadão e referência para as diversos órgãos
e entidades da administração pública, estando disponível para a integração dos sistemas que precisem
de dados cadastrais de pessoas.
Benefícios:
 Os usuários de serviços públicos terão acesso a processos e procedimentos de atendimento
simplificados e confiáveis, além da eliminação de formalidades e exigências de comprovação
de identidade.
 O Estado será beneficiado pela aplicação de solução tecnológica que simplificará processos e
procedimentos de atendimento aos usuários dos serviços públicos e proporcionará melhores
condições para o compartilhamento das informações entre órgãos de governo, aumento da
segurança da informação em função da garantia de sua autenticidade.
Resultados pretendidos:
 Desonerar o cidadão de manter atualizado todos os seus cadastros nos diversos órgãos do
governo.
 Simplificação de serviços públicos, pois o cidadão precisará apenas se identificar com apenas
um documento e, a partir dele, o governo poderá rastrear os cadastros nas demais bases de
dados cadastrais.
 Segurança na prestação de serviço público, pois os dados serão conferidos de forma eletrônica
com garantia.
 Qualificar os dados biográficos da população brasileira, para que, a partir das bases de dados
existentes, se obtenha uma base de referência, para uso por toda a administração pública de
forma que seja possível identificar a trajetória de pessoas pelos diversos serviços públicos.
1.3. Características do programa de controle de dados
O objetivo da governança de dados é subsidiar as decisões estratégicas permitindo que uma
organização gerencie os dados como ativos. A governança de dados fornece os princípios, políticas,
processos, estrutura, métricas e supervisão para gerenciar dados como um ativo e orientar as
atividades de gerenciamento de dados em todos os níveis.
Para atingir esse objetivo geral, um programa de governança de dados deve ser:
 Sustentável: a governança de dados é um processo contínuo que requer compromisso
da organização. Exige mudanças na maneira como os dados são gerenciados e usados.
Isso significa gerenciar as mudanças de maneira sustentável, além da implementação
inicial de qualquer componente de controle de dados.
 Incorporado: a governança de dados não é um processo complementar. As atividades
de governança precisam ser incorporadas aos métodos de desenvolvimento de software,
uso de dados para análise, gerenciamento de dados mestre e gerenciamento de riscos.
 Medido: a governança de dados bem implementada gera impactos positivos, mas
demonstrar esse impacto requer a compreensão do ponto de partida, do planejamento e
definição de indicadores que represente o quanto a GD gera melhorias mensuráveis.
Ressaltamos que a implementação de um programa de governança de dados requer compromisso
com a mudança. Nesse sentido, desde o início dos anos 2000, princípios foram desenvolvidos para
favorecer o estabelecimento de uma base sólida para essas situações de empreendimento do
programa. São eles:
 Liderança e estratégia: a governança de dados bem-sucedida começa com uma liderança
visionária, comprometida e alinhada à estratégia de negócios da organização.
 Orientado aos negócios: a governança de dados é um programa de negócios que deve
governar as decisões de TIC relacionadas aos dados, assim como governa a interação dos
negócios com os dados.
 Responsabilidade compartilhada: a governança de dados é uma responsabilidade
compartilhada entre gestores de negócios e profissionais de gerenciamento de dados.
 Multicamada: a governança de dados atua nos níveis corporativo, local e nos níveis
intermediários.
 Baseado em estrutura: como as atividades de governança de dados exigem coordenação
entre áreas funcionais, o programa de governança de dados deve estabelecer uma estrutura
operacional que defina responsabilidades e interações.
 Baseado em princípios: os princípios orientadores são a base das atividades de governança
de dados e, principalmente, da política de governança de dados.
A palavra central em governança é governar. A governança de dados pode ser entendida em termos
de governança política, que abrange:
 Funções legislativas (Legislative-like functions): definição de políticas, padrões e
arquitetura de dados corporativos.
 Funções judiciais (Judicial-like functions): gerenciamento e escalonamento de problemas.
 Funções executivas (Executive functions): proteger e servir, responsabilidades
administrativas.
Para gerenciar melhor os riscos, a maioria das organizações adota uma forma representativa de
governança de dados, para que todas as partes interessadas possam ser ouvidas.
1.4. Modelos de Governança de Dados
Cada organização deve adotar um modelo de governança que apoie sua estratégia de negócios em
prol do sucesso dentro de seu próprio contexto.
Os modelos diferem em relação à sua estrutura organizacional, nível de formalidade e abordagem à
tomada de decisão. Alguns modelos são organizados de forma centralizada, enquanto outros são
distribuídos. Todos os modelos precisam de certo grau de flexibilidade. As organizações também
devem estar preparadas para desenvolver seu modelo para enfrentar novos desafios e se adaptar à
medida que a cultura organizacional evoluir.
As organizações de governança de dados também podem ter distintas formas de abordar
preocupações em diferentes níveis dentro de uma organização. O trabalho de governança geralmente
é dividido entre vários comitês, cada um com objetivo e nível de supervisão diferente dos outros. Esse
trabalho precisa ser coordenado para que a organização se beneficie dessa sinergia.
A imagem a seguir apresenta um modelo genérico de governança de dados. O modelo envolve
atividades em váriados níveis da organização (conforme observado no eixo vertical), bem como a
separação das responsabilidades de governança nas funções da organização e entre negócios (lado
esquerdo) e TIC (lado direito).
Parte do trabalho de governança de dados é realizado no nível “0” por gestores de dados integrantes
de um escritório de governança de dados. Eles serão responsáveis por diferentes tipos de dados,
dependendo da necessidade da organização. Frequentemente, lideram grupos de trabalho de áreas ou
funções que se reportam por meio de um Conselho de Governança de Dados.
No nível estratégico, diversas organizações têm um Comitê Gestor de Governança de Dados. Esse
Comitê tem caráter diretivo/deliberativo e monitora a aplicação da política de GD e atua também como
Fórum para discussão de controvérsias relacionadas à gestão de dados e atua na criação de
subcomitês para analisar e avaliar soluções.
No lado da TIC, o trabalho geralmente é dividido entre programas com alguns projetos, implementados
por meio de equipes de projeto e responsabilidades operacionais executadas por serviços de
gerenciamento de dados ou equipes de suporte/operações de produção.
Implementar um nível de gestão também é necessário. A maioria das organizações precisará de
estruturas de governança nas áreas de negócio e de TIC, além de uma função de supervisão. As
diferentes partes da organização encarregadas das atividades de governança precisam colaborar e
coordenar ativamente. A figura a seguir apresenta esse tipo de modelo que pode ser implementado de
diferentes maneiras, dependendo das necessidades e das restrições da organização.
As opções organizacionais para governança de dados dependem da estrutura existente na instituição,
dos objetivos da governança de dados e da disposição cultural da organização para centralização e
colaboração.
 Em um modelo centralizado, uma organização de governança de dados supervisiona todas as
atividades em todas as áreas de assunto.
 Em um modelo replicado, o mesmo modelo operacional e padrões da GD são adotados por
cada unidade de negócios.
 Em um modelo federado, uma organização de governança de dados coordena-se com várias
unidades de negócios para manter definições e padrões consistentes.
Além de organizar as pessoas para governança de dados, também é útil estabelecer um modelo
operacional que estabeleça a interação entre a organização de governança e as pessoas responsáveis
por projetos ou iniciativas de gerenciamento de dados, o envolvimento de atividades de gerenciamento
de mudanças para introduzir este novo programa e o modelo para caminhos de resolução de
gerenciamento de problemas por meio da governança.
A figura a seguir ilustra um exemplo que você pode adaptar para atender aos requisitos e corresponder
à cultura da sua organização. Independentemente da sua situação, várias facetas permanecerão as
mesmas.
As funções executivas fornecem supervisão. O DGO (Data Governance Operations) trabalha em
domínios. A política é rebaixada e os problemas são escalonados. Os administradores e as partes
interessadas se envolvem em vários níveis.
1.5. Gerenciamento de dados
Data Stewardship é um daqueles conceitos que as pessoas nem sempre entendem!
O Data Stewards tem a função de gerenciar ativos de dados em nome de terceiros e no melhor
interesse da organização. Esse conceito surgiu do reconhecimento de que, em qualquer organização,
sempre houve pessoas que têm experiência nos dados e se preocupam genuinamente com a forma de
uma organização manter os dados e disponibilizá-los para uso. À medida que a importância dos dados
cresce, o mesmo ocorre com o reconhecimento formal dessa função.
Os Data Stewards representam os interesses de todas as partes envolvidas e devem adotar uma
perspectiva corporativa para garantir que os dados corporativos sejam de alta qualidade e possam ser
usados com eficiência. Os Data Stewards eficazes são conscientes e responsáveis pelas atividades de
governança de dados e dedicam parte de seu tempo a essas atividades.
O foco das atividades de Data Stewards diferirá de organização para organização, dependendo da
estratégia de cada uma delas. No entanto, na maioria dos casos, as atividades de Data Stewards se
concentram em algumas premissas, destacadas a seguir:
 Criação e gerenciamento de metadados principais: padronização, definição e
gerenciamento de terminologia de negócios, valores de dados válidos e outros metadados
críticos.
 Regras e padrões de documentação: definição/documentação de regras de negócios,
padrões e regras de qualidade de dados. As expectativas usadas para definir dados de alta
qualidade são frequentemente formuladas em termos de regras fundamentadas nos processos
de negócios que criam ou consomem dados.
 Gerenciamento de problemas de qualidade de dados: Os organizadores geralmente estão
envolvidos na identificação, priorização e resolução de problemas relacionados a dados ou na
facilitação do processo de resolução.
 Execução de atividades operacionais de governança de dados: Os organizadores são
responsáveis por garantir que as políticas e iniciativas de governança de dados sejam
cumpridas diariamente. Influenciam as decisões para garantir que os dados sejam gerenciados
de maneira a apoiar os objetivos gerais da organização.
Saiba mais sobre as regulamentações globais em gerenciamento de dados.
Neste contexto, pode-se destacar as principais normas e legislações que são afetas ao tema
Governança e Gestão de Dados no âmbito da Administração Pública Federal, as quais é possível
considerar como mecanismos de GD que visam promover o valor dos dados como ativos estratégicos
e subsidiar o processo de transformação digital e de planejamento de Políticas Públicas.
Acesse as abas a seguir para conhecer a finalidade de cada um desses instrumentos normativos.
Lei nº 12.527, de 18 de novembro de 2011
Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no §
2º do art. 216 da Constituição Federal;
Lei nº 13.460, de 26 de junho de 2017
Definiu que os cidadãos brasileiros não precisam mais apresentar a órgãos públicos documentos,
atestados ou certidões que já estejam de posse da administração pública federal. São os órgãos que
devem integrar as bases de dados e compartilhar essas informações. Esse compartilhamento pode ser
feito de forma automatizada, sem intervenção humana, por meio de uma API.
Lei nº 13.709, de 14 de agosto de 2018
Lei Geral de Proteção de Dados Pessoais (LGPD)
Decreto nº 8.638, de 15 de janeiro de 2016
Institui a Política de Governança Digital no âmbito dos órgãos e das entidades da administração
pública federal direta, autárquica e fundacional.
Decreto nº 8.777, de 11 de maio de 2016
Institui a Política de Dados Abertos do Poder Executivo federal.
Decreto nº 8.789, de 29 de junho de 2016
Dispõe sobre o compartilhamento de bases de dados na administração pública federal.
Decreto nº 8.936, de 19 de dezembro de 2016
Institui a Plataforma de Cidadania Digital e dispõe sobre a oferta dos serviços públicos digitais, no
âmbito dos órgãos e das entidades da administração pública federal direta, autárquica e fundacional.
Decreto nº 9.094, de 17 de julho de 2017
Dispõe sobre a simplificação do atendimento prestado aos usuários dos serviços públicos, institui o
Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo para a apresentação de
dados do cidadão no exercício de obrigações e direitos e na obtenção de benefícios, ratifica a
dispensa do reconhecimento de firma e da autenticação em documentos produzidos no País e institui a
Carta de Serviços ao Usuário.
Decreto nº 9.203, de 22 de novembro de 2017
Dispõe sobre a política de governança da administração pública federal direta, autárquica e
fundacional.
Decreto nº 9.723, de 11 de março de 2019
Altera o Decreto nº 9.094, de 17 de julho de 2017, o Decreto nº 8.936, de 19 de dezembro de 2016, e o
Decreto nº 9.492, de 5 setembro de 2018, para instituir o Cadastro de Pessoas Físicas - CPF como
instrumento suficiente e substitutivo da apresentação de outros documentos do cidadão no exercício
de obrigações e direitos ou na obtenção de benefícios e regulamentar dispositivos da Lei nº 13.460, de
26 de junho de 2017.
Decreto nº 9.929, de 22 de julho de 2019
Dispõe sobre o Sistema Nacional de Informações de Registro Civil - Sirc e sobre o seu comitê gestor.
Decreto nº 10.046, de 09 de outubro de 2019
Dispõe sobre a governança no compartilhamento de dados no âmbito da administração pública federal
e institui o Cadastro Base do Cidadão e o Comitê Central de Governança de Dados.
Portaria STI/MP nº 58, de 23 de dezembro de 2016
Dispõe sobre procedimentos complementares para o compartilhamento de bases de dados oficiais
entre órgãos e entidades da administração pública federal direta e indireta e as demais entidades
controladas direta ou indiretamente pela União.
1.6. Iniciando o controle de dados
A governança de dados permite compartilhar responsabilidades relacionadas à gestão de dados e
suas atividades são transversais aos setores da organização.
Antes de um programa de GD ser configurado, a equipe precisará internalizar a estratégia e os
desafios específicos no que tange a gestão dos dados da organização.
Enfatizamos a seguir, os seguintes aspectos que deverão ser considerados nas avaliações iniciais:
 Avaliação da maturidade do gerenciamento de dados: determine como a organização
utiliza o potencial humano, processos e tecnologia para gerenciar e obter valor com seus
dados. Essa avaliação pode ajudar a determinar os níveis de gestão, os padrões existentes e a
identificar oportunidades de melhoria.
 Avaliação da capacidade de mudar: determine a capacidade da organização para adotar
comportamentos necessários para uma governança de dados bem-sucedida. Identifique
possíveis obstáculos e ações de superação.
 Prontidão colaborativa: caracterize a capacidade da organização de colaborar entre funções
para administrar e tomar decisões holísticas e consistentes sobre dados.
 Alinhamento: avalie o quão a organização alinha seus objetivos ao gerenciamento de dados
com a estratégia de negócio. Identifique pontos críticos da governança de dados (por exemplo:
conformidade regulatória e padrões SDLC).
 Avaliação da qualidade dos dados: identifique dados críticos e pontos problemáticos
existentes para fornecer informações sobre riscos existentes associados aos dados e
processos de negócios.
 Avaliação da conformidade regulatória: entenda a relação dos riscos de dados com os
requisitos de conformidade e como eles são gerenciados atualmente. Identifique controles e
monitoramento que possam melhorar a capacidade da organização de cumprir com os
regulamentos.
As avaliações iniciais contribuem para o caso de negócios da governança de dados. As avaliações de
maturidade, qualidade dos dados e conformidade devem identificar pontos de partida concretos para
melhoria, mas a abordagem geral deve ser orientada por uma estratégia que defina o escopo e a
abordagem dos esforços de governança de dados em relação às metas de negócios.
Sobre a estratégia, destacamos os aspectos que devem ser considerados para sua definição e após
definida.
Antes, para definição da estratégia Depois da estratégia definida
 Instrumento formal que estabeleça metas e
princípios.
 Matriz de responsabilidades.
 Plano de implementação estratégico e
operacional que descreva:
a. O objetivo das atividades de governança
de dados e como elas serão incorporadas
nos processos de TIC.
b. O conjunto de iniciativas para melhorar
os recursos de gerenciamento e da
qualidade dos dados.
c. Os benefícios esperados.
d. A definição das métricas que demonstre
os benefícios.
 Definir políticas.
 Subscrição dos projetos de melhoria
de dados.
 Gerenciar mudanças para
impulsionar a adoção dos
comportamentos desejados.
 Gerenciar problemas e conflitos que
podem surgir durante o processo de
implementação.
1.7. Governança de dados sustentável
A governança de dados orienta o gerenciamento de dados, estabelecendo políticas e práticas
recomendadas para gerenciar ativos de dados e fornecendo supervisão contínua de sua
implementação.
Como essas práticas devem ser realizadas por outras áreas, os princípios devem ser incorporados ao
ciclo de vida de gerenciamento de dados e às atividades fundamentais.
Atenção, um programa de governança de dados bem-sucedido requer:
 Estabelecer uma estratégia que se alinhe e suporte a estratégia de negócios
 Definir e aplicar políticas que definem comportamentos com base nos princípios de
gerenciamento de dados
 Definir padrões para a qualidade dos dados
 Fornecer gerenciamento de dados críticos
 Garantir que a organização esteja em conformidade com os regulamentos relacionados a
dados.
 Gerenciar problemas relacionados a aspectos de dados e governança.
Um programa de GD bem-sucedido implicará na mudança da organização em relação à priorização de
ações que incidam na curva de maturidade do gerenciamento de dados, com a finalidade de:
 Patrocinar projetos de gerenciamento de dados.
 Padronizar a avaliação de ativos de dados.
 Envolver-se em comunicação contínua sobre os comportamentos necessários para obter valor
dos dados.
1.8. Governança de dados e compromisso de liderança
Mais do que qualquer outro aspecto do gerenciamento de dados, a governança de dados requer
compromisso de liderança e patrocínio estratégico. Existem muitos obstáculos potenciais para o
sucesso.
A governança se concentra em fazer com que as pessoas se comportem de maneira diferente em
relação aos dados. Mudar comportamentos é um desafio, especialmente para iniciativas em toda a
organização porque a governança, de qualquer tipo, pode ser vista como uma imposição, e não como
um meio de melhorar os processos e possibilitar o sucesso.
No entanto, caso você se instrua sobre as maneiras pelas quais os dados suportam sua estratégia de
negócios, rapidamente perceberá e endossará os benefícios da governança de dados.
Destacam-se alguns benefícios:
 Tomar decisões sobre dados no contexto da estratégia geral de negócios faz mais sentido do
que tomar essas decisões projeto por projeto.
 A codificação do comportamento esperado em relação aos dados nas políticas de governança
estabelece diretrizes claras para os funcionários e outras partes interessadas.
 Definir os dados uma vez e defini-los de forma consistente economiza tempo, esforço e
rotatividade organizacional.
 Estabelecer e aplicar padrões de dados são meios eficientes de definir e melhorar a qualidade
dos dados mais críticos da organização.
 Reduzir os riscos relacionados à privacidade dos dados ajuda a evitar violações de dados e é
bom para a reputação e resultados da organização.
2. Planejamento e design no gerenciamento do ciclo de vida dos dados
As atividades de gerenciamento do ciclo de vida dos dados se concentram no planejamento e design
de dados, permitindo o uso, a manutenção para atender às metas organizacionais. Arquitetos de
dados e modeladores de dados são os que planejam e projetam dados.
Este tópico descreverá:
 O papel da arquitetura corporativa no planejamento e design da organização
 A função crítica da arquitetura de dados no gerenciamento de dados
 Os objetivos e artefatos associados à modelagem de dados
2.1. Arquitetura de Negócio
Arquitetura refere-se a um arranjo organizado de elementos destinados a otimizar a função, o
desempenho, a viabilidade, o custo e a estética de uma estrutura ou sistema geral. O termo arquitetura
foi adotado para descrever várias facetas do design de sistemas de informação. Mesmo em pequenas
organizações, a tecnologia da informação é complicada.
Artefatos arquitetônicos e documentação que descrevem sistemas e fluxos de dados mostram às
pessoas como sistemas, processos e dados funcionam juntos. Uma abordagem estratégica da
arquitetura permite que uma organização tome melhores decisões sobre seus sistemas e dados.
Uma prática de arquitetura corporativa bem gerenciada pode ajudar uma organização a entender o
estado atual de seus sistemas, promover mudanças desejáveis em relação ao estado futuro, habilitar a
conformidade regulatória e melhorar a eficácia. O gerenciamento eficaz de dados e os sistemas em
que os dados são armazenados e usados é um objetivo comum da amplitude das disciplinas de
arquitetura.
A prática de arquitetura é realizada em diferentes níveis dentro de uma organização (incluindo
organização, domínio ou projeto) e com diferentes áreas de foco (por exemplo, infraestrutura,
aplicações ou dados).
A tabela abaixo descreve e compara os domínios de arquitetura. Arquitetos de diferentes domínios
devem atender aos requisitos de desenvolvimento de forma colaborativa, pois cada domínio influencia
os outros domínios.
Tipo de
Arquitetura
Objetivo Elementos Dependências Papéis
Arquitetura de
Negócios
Corporativos
Identificar como
uma corporação
cria valor para
clientes/usuários e
outras partes
interessadas.
Modelos de
negócio, processos,
serviços de
recursos, eventos,
estratégias,
vocabulário.
Estabelece
requisitos para os
outros domínios.
Arquitetos e
analistas de
negócio, Gestores
de dados de
negócios.
Arquitetura de
Dados
Corporativos
Descrever como os
dados devem ser
organizados e
gerenciados.
Modelos de dados,
definições de
dados,
especificações de
mapeamento de
dados, fluxos de
dados, APIs de
dados estruturados.
Gerencia dados
criados e exigidos
pela arquitetura de
negócios.
Arquitetos e
modeladores de
dados, Gestores de
dados.
Arquitetura de
Aplicações
Corporativas
Descrever a
estrutura e a
funcionalidade das
aplicações em uma
organização.
Sistemas de
negócios, pacotes
de software, bancos
de dados.
Atua nos dados
especificados de
acordo com os
requisitos de
negócios.
Arquitetos de
aplicações.
Arquitetura de
Tecnologia
Corporativa
Descrever a
tecnologia física
necessária para
permitir que os
sistemas funcionem
e agreguem valor.
Plataformas
técnicas, redes,
ferramentas de
integração de
segurança.
Hospeda e executa
a arquitetura de
aplicações.
Arquitetos de
infraestrutura.
Domínios da Arquitetura (DMBOK2)
2.2. O Quadro Zachman
Uma estrutura de arquitetura é uma estrutura fundamental usada para desenvolver uma ampla
variedade de arquiteturas relacionadas. Ela fornece uma maneira de pensar e entender a arquitetura e
representa uma 'arquitetura para arquitetura' geral. As estruturas descritas na forma do diagrama
permitem que profissionais sem a formação específica compreendam os relacionamentos (se não as
diferenças detalhadas) entre esses conceitos.
A estrutura de arquitetura corporativa mais conhecida, o Zachman Framework, foi desenvolvida por
John A. Zachman na década de 1980. Continuou a evoluir. Zachman reconheceu que, ao criar
edifícios, aviões, empresas, cadeias de valor, projetos ou sistemas, existem muitas partes interessadas
e cada uma tem uma perspectiva diferente sobre arquitetura. Ele aplicou esse conceito aos requisitos
para diferentes tipos e níveis de arquitetura em uma organização.
O Zachman Framework é representado por uma matriz 6x6 que resume o conjunto completo de
modelos necessários para descrever uma organização e os relacionamentos entre eles.
O Framework não define como criar os modelos, mas demonstra quais modelos devem existir.
Atenção à estrutura de Zachman! Ela resume as respostas a um conjunto simples de perguntas (ou
seja, o que, como, onde, quem, quando, por que) que podem ser feitas pelas partes interessadas com
diferentes perspectivas. São as seguintes perspectivas:
 executiva (contexto de negócios): Lista os elementos de negócios que definem o escopo nos
modelos de identificação.
 de gerenciamento de negócios (conceitos de negócios): Esclarecimento das relações entre
os conceitos de negócios definidos pelos líderes executivos como proprietários nos modelos de
definição.
 do arquiteto (lógica de negócios): Modelos lógicos do sistema detalhando os requisitos do
sistema e o design sem restrições representados pelos arquitetos como designers nos modelos
de representação.
 do engenheiro (física dos negócios): Modelos físicos otimizando o design para
implementação para uso específico sob as restrições de tecnologia, pessoas, custos e prazos
específicos especificados pelos engenheiros como construtores nos modelos de especificação.
 do técnico (montagens de componentes): Uma visão fora de contexto, específica da
tecnologia, de como os componentes são montados e operados, configurados pelos técnicos
como implementadores nos modelos de configuração.
 do usuário (classes de operações): Instâncias de funcionamento reais usadas por
Trabalhadores como Participantes. Não há modelos nessa perspectiva.
A estrutura então identifica quais tipos de artefatos de arquitetura são necessários para responder a
essas perguntas fundamentais.
2.3. Arquitetura de Dados
A arquitetura de dados é fundamental para o gerenciamento de dados. Como a maioria das
organizações possui mais dados do que as pessoas podem compreender, é necessário representar
dados organizacionais em diferentes níveis de abstração para que a alta Administração possa analisá-
los e tomar decisões sobre eles.
A disciplina especializada da arquitetura de dados pode ser entendida sob alguns pontos de vista,
apresentados a seguir:
 Resultados da arquitetura de dados, tais como modelos, definições e fluxos de dados em
vários níveis (geralmente referidos como artefatos da arquitetura de dados).
 Atividades de arquitetura de dados para formar, implantar e cumprir intenções de arquitetura
de dados.
 Comportamento da arquitetura de dados, assim como colaboração e habilidades entre as
várias funções que afetam a arquitetura de dados da organização.
A arquitetura de dados de uma organização é descrita por uma coleção integrada de documentos de
projeto mestre em diferentes níveis de abstração, incluindo padrões que governam como os dados são
coletados, armazenados, organizados, usados e removidos. Também é classificada por descrições de
todos os contêineres e caminhos que os dados percorrem nos sistemas de uma organização.
Os artefatos da arquitetura de dados incluem especificações usadas para descrever o estado
existente, definir requisitos de dados, orientar a integração de dados e controlar ativos de dados,
conforme apresentado em uma estratégia de dados.
O documento de design da arquitetura de dados mais detalhado é um modelo formal de dados
corporativos, contendo nomes de dados, definições abrangentes de dados e metadados, entidades e
relacionamentos conceituais e lógicos e regras de negócios. Modelos de dados físicos estão incluídos,
mas como um produto de modelagem e design de dados ao invés de uma arquitetura de dados.
A arquitetura de dados agrega mais valor quando suporta as necessidades de gestão de dados de
toda a organização. A arquitetura de dados corporativos define termos e designs padrão para os
elementos importantes para toda a organização.
O design de uma arquitetura de dados corporativos inclui a representação dos dados de negócio como
tais, englobando a coleta, armazenamento, integração, movimentação e distribuição de dados. A
arquitetura de dados corporativos permite padronização e integração consistentes de dados em toda a
organização.
A arquitetura de dados servirá como uma ponte entre a estratégia de negócios e a execução da
tecnologia. Vale alertar que como parte da arquitetura corporativa os arquitetos de dados devem:
 Preparar estrategicamente as organizações para evoluir rapidamente seus produtos, serviços e
dados para aproveitar as oportunidades de negócios inerentes às tecnologias emergentes.
 Traduzir necessidades de negócios em requisitos de dados e de sistema, para que os
processos tenham consistentemente os dados necessários.
 Gerenciar entrega complexa de dados e informações em toda a organização.
 Facilitar o alinhamento entre negócios e TI.
 Agir como agentes de mudança e transformação.
Esses direcionadores de negócios devem influenciar as medidas do valor da arquitetura de dados.
2.4. Artefatos de arquitetura de dados
À medida que os dados fluem dentro de uma organização, por meio de feeds ou interfaces, eles são
protegidos, integrados, armazenados, registrados, catalogados, compartilhados, relatados, analisados
e entregues às partes interessadas.
Ao longo do caminho, os dados podem ser verificados, aprimorados, vinculados, certificados,
agregados, anonimizados e usados para análises até serem arquivados ou eliminados. As descrições
da arquitetura de dados corporativos devem, portanto, incluir modelos de dados corporativos (por
exemplo, estruturas e especificações de dados), bem como projetos de fluxo de dados.
Os arquitetos de dados criam e mantêm o conhecimento organizacional sobre os dados e os sistemas
pelos quais eles se movem. Esse conhecimento permite que uma organização gerencie seus dados
como um ativo e aumente o valor que obtém de seus dados, identificando oportunidades para uso de
dados, redução de custos e mitigação de riscos.
Os arquitetos buscam projetar de maneira a agregar valor à organização. Esse valor é obtido por meio
de presença técnica ideal, eficiências operacionais e de projetos e maior capacidade da organização
de usar seus dados. Para chegar lá, são necessários: bom design, planejamento e capacidade de
garantir que os projetos e planos sejam executados de maneira eficaz.
Nesse sentido, serão apresentados, a seguir, alguns artefatos da arquitetura de dados.
a. Modelo de Dados Corporativos (Enterprise Data Model - EDM)
O Enterprise Data Model - EDM é um modelo de dados conceitual ou lógico holístico, que
independente da implementação, fornece uma visão comum e consistente dos dados da organização.
Um EDM inclui as principais entidades de dados corporativos (ou seja, conceitos de negócios), seus
relacionamentos, regras críticas de negócios orientadoras e alguns atributos críticos. Estabelece a
base para todos os dados e projetos relacionados a dados.
Qualquer modelo de dados no nível de projeto deve ser baseado no EDM. O EDM deve ser revisado
pelas partes interessadas em concordância com a estratégia de negócio da organização.
Uma organização que reconhece a necessidade de um modelo de dados corporativo deve decidir
quanto tempo e esforço pode dedicar à sua construção.
Os EDMs podem ser criados em diferentes níveis de detalhes, portanto, a disponibilidade de recursos
influenciará o escopo inicial. Com o tempo, conforme as necessidades da organização exigem, o
escopo e o nível de detalhes capturados em um modelo de dados corporativos geralmente se
expandem. Os modelos de dados corporativos mais bem-sucedidos são criados de forma incremental
e iterativa, usando camadas.
A imagem a seguir apresenta os diferentes tipos de modelos e mostra como os modelos conceituais
são vinculados aos modelos de dados de aplicações lógicas e físicas.
Com relação à imagem acima, que apresenta o Modelo de Dados Corporativos, vale ressaltar que ela
permite reconhecer:
 a perspectiva conceitual sobre as áreas temáticas da organização.
 as entidades e relacionamentos para cada área temática.
 perspectiva lógica detalhada e parcialmente atribuída a cada uma dessas áreas temáticas.
 os modelos lógicos e físicos específicos de uma aplicação ou projeto.
Todos os níveis fazem parte desse modelo e as vinculações criam caminhos para rastrear uma
entidade de cima para baixo e entre modelos no mesmo nível.
b. Design de Fluxo de Dados
O design do fluxo de dados define os requisitos e o plano mestre para armazenamento e
processamento em bancos de dados, aplicações, plataformas e redes (os componentes). Esses fluxos
de dados mapeiam a movimentação de dados para processos, locais, funções de negócios e
componentes técnicos.
Os fluxos de dados são um tipo de documentação de linhagem de dados que descreve como os dados
transitam pelos processos e sistemas de negócios.
Os fluxos de dados de ponta a ponta ilustram onde os dados se originaram, onde são armazenados e
usados e como são transformados à medida que se movem dentro e entre diversos processos e
sistemas.
A análise de linhagem de dados pode ajudar a explicar o estado dos dados em um determinado ponto
no fluxo.
Ressalta-se que os fluxos de dados mapeiam e documentam os relacionamentos entre:
 Aplicações em um processo de negócios.
 Armazenamentos de dados ou bancos de dados em um ambiente.
 Segmentos de rede (úteis para mapeamento de segurança).
 Funções de negócio, representando quais funções são responsáveis por criar, atualizar, usar e
excluir dados (CRUD – Acrônomo de Create, Read, Update e Delete, na língua inglesa).
 Locais onde ocorrem as diferenças.
Os fluxos de dados podem ser documentados em diferentes níveis de detalhe: área de assunto,
entidade ou mesmo no nível do atributo. Os sistemas podem ser representados por segmentos de
rede, plataformas, conjuntos de aplicações comuns ou servidores individuais.
Os fluxos de dados podem ser representados por matrizes bidimensionais e diagrama de fluxo de
dados.:
 Matrizes Bidimensionais
O Modelo de Dados Corporativos e o Design do Fluxo de Dados precisam estar bem alinhados. Como
mencionado, ambos precisam refletir o estado atual em relação à perspectiva da arquitetura de dados e
também o estado de transição em relação à perspectiva do projeto.
c. Arquitetura, Qualidade e Inovação de Gerenciamento de Dados
Os dados e a arquitetura corporativa lidam com a complexidade de dois indicadores, que pedem
abordagens distintas, conforme apresentado na tabela a seguir.
Direcionadores/Drivers Foco Abordagem
Orientação para a qualidade
Concentre-se em melhorar a
execução nos ciclos de negócios
e desenvolvimento de TI. A
menos que a arquitetura seja
gerenciada, a arquitetura se
deteriorará.
Os sistemas gradualmente se
tornarão mais complexos e
inflexíveis, criando riscos para
uma organização. Entrega
descontrolada de dados, cópias
de dados e relacionamentos de
"espaguete" de interface tornam
as organizações menos
eficientes e reduzem a confiança
nos dados.
Alinha-se ao trabalho tradicional
de arquitetura de dados, no qual
as melhorias na qualidade da
arquitetura são realizadas de
forma incremental por meio da
conexão do arquiteto com os
projetos.
Normalmente, o arquiteto
mantém em mente toda a
arquitetura e se concentra nos
objetivos de longo prazo
diretamente conectados à
governança, padronização e
desenvolvimento estruturado.
Orientação para a inovação
Concentre-se na transformação
dos negócios e da TI para
atender novas expectativas e
oportunidades.
Impulsionar a inovação com
tecnologias disruptivas e uso de
dados tornou-se um papel do
arquiteto corporativo moderno.
Pode ter uma perspectiva de
curto prazo e usar lógica de
negócios não comprovada e
tecnologias de ponta.
Essa orientação geralmente
exige que os arquitetos entrem
em contato com pessoas da
organização com as quais os
profissionais de TI geralmente
não interagem; por exemplo,
representantes de
desenvolvimento de produtos e
designers de negócios.
Ao se trabalhar na arquitetura corporativa ou como uma equipe de arquitetura de dados, os arquitetos
de dados são responsáveis por desenvolver um roteiro, gerenciar requisitos de dados corporativos nos
projetos e integrar-se à arquitetura corporativa geral.
O sucesso depende da definição e adesão aos padrões e da criação e manutenção de artefatos de
arquitetura úteis e utilizáveis. Uma prática de arquitetura disciplinada pode melhorar a eficiência e a
qualidade, criando soluções reutilizáveis e extensíveis.
2.5. Modelagem de dados
Um modelo é uma representação de algo que existe ou um padrão para algo a ser feito. Mapas,
organogramas e plantas de construção são exemplos de modelos em uso todos os dias. Os diagramas
de modelos usam símbolos padrão que permitem entender seu conteúdo.
A modelagem de dados é o processo de descoberta, análise e escopo de requisitos de dados e, em
seguida, representação e comunicação desses requisitos de dados de uma forma precisa chamada
modelo de dados. A modelagem de dados é um componente crítico do gerenciamento de dados. O
processo de modelagem exige que as organizações descubram e documentem como seus dados se
encaixam. Modelos de dados permitem que uma organização entenda seus ativos de dados.
Os modelos de dados incluem e contêm metadados essenciais para os consumidores de dados. Boa
parte desses metadados descobertos durante o processo de modelagem é essencial para outras
funções de gerenciamento de dados, como, por exemplo, definições para controle de dados e
linhagem para armazenamento e análise de dados.
Um modelo de dados descreve os dados de uma organização como a organização os entende ou
como a organização deseja que sejam. Um modelo de dados contém um conjunto de símbolos com
rótulos de texto que tentam representar visualmente os requisitos de dados comunicados ao
modelador de dados, para um conjunto específico de dados que pode variar em tamanho, de pequeno
(para um projeto) a grande (para uma organização).
O modelo é, portanto, uma forma de documentação para requisitos e definições de dados resultantes
do processo de modelagem. Os modelos de dados são o principal meio usado para comunicar os
requisitos de dados da organização para a TI e, dentro da TI, de analistas e arquitetos, para designers
e desenvolvedores de bancos de dados.
Atenção, os modelos de dados são críticos para o gerenciamento eficaz dos dados, pois:
 Fornecem um vocabulário comum sobre dados.
 Capturam e documentam o conhecimento explícito (metadados) sobre os dados e sistemas de
uma organização.
 Servem como principal ferramenta de comunicação durante os projetos.
 Fornecem o ponto de partida para personalização, integração ou mesmo substituição de uma
aplicação.
Objetivos de modelagem de dados
O objetivo da modelagem de dados é confirmar e documentar o entendimento de diferentes
perspectivas sobre os dados. Esse entendimento leva a aplicações e dados que se alinham mais com
os requisitos de negócios atuais e futuros. Esse entendimento também cria uma base para concluir
com êxito iniciativas de escopo amplo, como Master Data Management e programas de governança de
dados.
A modelagem de dados adequada leva a custos de suporte mais baixos e aumenta as oportunidades
de reutilização para iniciativas futuras, reduzindo assim os custos de construção de novas aplicações.
Além disso, os próprios modelos de dados são uma forma importante de metadados.
Alertamos que, confirmar e documentar a compreensão de diferentes perspectivas facilita à:
 Formalização - Um modelo de dados documenta uma definição concisa de estruturas e
relacionamentos de dados. Ele permite avaliar como os dados são afetados pelas regras de
negócios implementadas, para os estados atuais (como estão) ou os estados de destino
desejados. A definição formal impõe uma estrutura disciplinada aos dados que reduz a
possibilidade de anomalias nos dados ao acessar e persistir dados. Ao ilustrar as estruturas e
os relacionamentos nos dados, um modelo de dados facilita o consumo dos dados.
 Definição do escopo - Um modelo de dados pode ajudar a explicar os limites do contexto de
dados e implementação de pacotes de aplicativos, projetos, iniciativas ou sistemas existentes.
 Retenção/documentação de conhecimento - Um modelo de dados pode preservar a memória
corporativa em relação a um sistema ou projeto capturando conhecimento de forma explícita.
Ele serve como documentação para futuros projetos a serem usados como estão.
Os modelos de dados nos ajudam a entender uma organização ou área de negócios, um aplicativo
existente ou o impacto da modificação de uma estrutura de dados existente. O modelo de dados se
torna um mapa reutilizável para ajudar profissionais de negócios, gerentes de projeto, analistas,
modeladores e desenvolvedores a entender a estrutura de dados no ambiente. Da mesma maneira
que o cartógrafo aprendeu e documentou um cenário geográfico para outros usarem na navegação, o
modelador permite que outros entendam um cenário de informações.
Blocos de construção
Existem diferentes variedades de modelos de dados, incluindo relacionais, dimensionais etc. Os
profissionais de design utilizam tipos apropriados de modelos com base nas necessidades da
organização, nos dados que estão sendo modelados e no sistema para o qual o modelo está sendo
desenvolvido. Cada espécie de modelo utiliza convenções visuais diferentes para capturar
informações.
Os modelos também diferem com base no nível de abstração das informações que representam
(conceitual com um alto nível de abstração; lógico com um nível médio de abstração; e físico que
representa um sistema específico ou instanciação de dados). Entretanto, todos os modelos usam os
mesmos blocos de construção: entidades, relacionamentos, atributos e domínios.
Como líder em sua organização, não é necessário que você possa ler modelos de dados. No entanto,
é útil você entender como eles descrevem dados. As definições aqui fornecem um panorama de como
os modelos de dados funcionam.
Entidade
Fora da modelagem de dados, a definição de entidade é algo que existe separado de outras coisas.
Na modelagem de dados, uma entidade é algo sobre o qual uma organização coleta informações. Às
vezes, as entidades são chamadas de 'substantivos de uma organização. Nos modelos de dados
relacionais, as entidades são as caixas que identificam o conceito que está sendo modelado.
Uma entidade pode ser pensada como a resposta a esses questionamentos: Quem? O que? Quando?
Onde? Por quê? Como? Pode também ser definida porra combinação dessas perguntas.
Relação
Um relacionamento é uma associação entre entidades. Ele captura as interações de alto nível entre
entidades conceituais, as interações detalhadas entre entidades lógicas e as restrições entre entidades
físicas. Os relacionamentos são mostrados como linhas no diagrama de modelagem de dados.
Em uma relação entre duas entidades, a cardinalidade captura quantas de uma entidade (instâncias de
entidade) participam do relacionamento com quantas da outra entidade. Por exemplo, uma
organização pode ter um ou vários funcionários.
Cardinalidade
A cardinalidade é representada pelos símbolos que aparecem nas duas extremidades de uma linha de
relacionamento. Para cardinalidade, as opções são simples: zero, um ou muitos ("muitos" referentes a
qualquer número maior que um). Cada lado de um relacionamento pode ter qualquer combinação de
zero, um ou muitos.
O diagrama abaixo apresenta diferentes relações de cardinalidade. Uma organização emprega um ou
mais funcionários. Um funcionário pode suportar zero, um ou muitos dependentes. Mas um
Funcionário tem um e apenas um Trabalho durante um período de tempo.
Os relacionamentos de cardinalidade são uma maneira de capturar regras e expectativas relacionadas
aos dados. Se os dados mostrarem que um Funcionário mantém mais de um Trabalho durante um
período de tempo definido, há um erro nos dados ou a organização está violando uma regra.
Atributo
Um atributo é uma propriedade que identifica, descreve ou mede uma entidade. O correspondente
físico de um atributo em uma entidade é uma coluna, campo, tag ou nó em uma tabela, visualização,
documento, gráfico ou arquivo.
No exemplo abaixo, a entidade Organization possui os atributos de ID fiscal da organização, Número
de telefone da organização e Nome da organização. O funcionário possui os atributos: Número do
funcionário, Nome do funcionário, Sobrenome do funcionário e Data de nascimento do funcionário. Os
detalhes Dependente e Trabalho têm atributos que descrevem suas características.
Domínio
Na modelagem de dados, um domínio é o conjunto completo de valores possíveis aos quais um
atributo pode ser atribuído. Um domínio fornece um meio de padronizar as características dos atributos
e restringe os dados que podem ser preenchidos no campo.
Por exemplo, o domínio Data, que contém todas as datas válidas possíveis, pode ser atribuído a
qualquer atributo de data em um modelo de dados lógico ou a colunas/campos de data em um modelo
de dados físico, como:
 EmployeeHireDate
 OrderEntryDate
 ClaimSubmitDate
 CourseStartDate
Os domínios são críticos para entender a qualidade dos dados. Todos os valores dentro do domínio
são válidos. Aqueles fora do domínio são chamados de valores inválidos. Um atributo não deve conter
valores fora do domínio atribuído. O domínio para EmployeeHireDate pode ser definido simplesmente
como datas válidas. Sob essa regra, o domínio para EmployeeHireDate não inclui 30 de fevereiro de
qualquer ano.
Modelagem e gerenciamento de dados
A Modelagem de Dados é um processo de descoberta e documentação de informações críticas para o
entendimento de uma organização por meio de seus dados. Os modelos capturam e permitem o uso
do conhecimento dentro de uma organização (ou seja, são uma forma crítica e uma fonte de
metadados). Eles podem até ser usados para melhorar a qualidade dessas informações, por meio da
aplicação de convenções de nomenclatura e outros padrões que tornam as informações mais
consistentes e confiáveis.
Os analistas e designers de dados atuam como intermediários entre os consumidores de informações
(as pessoas com requisitos de negócios para dados) e os produtores de dados que capturam os dados
de forma utilizável. Os profissionais de dados devem equilibrar os requisitos de dados dos
consumidores de informações e os requisitos de aplicação dos produtores de dados.
Os projetistas de dados também devem equilibrar os interesses de curto e de longo prazo. Os
consumidores de informações precisam de dados em tempo hábil para atender demandas de curto
prazo e avaliar oportunidades. As equipes de projeto de desenvolvimento do sistema devem atender
às restrições de tempo e orçamento. No entanto, eles também devem atender aos interesses de longo
prazo de todas as partes interessadas, garantindo que os dados de uma organização residam em
estruturas de dados seguras, recuperáveis, compartilháveis e reutilizáveis, e que esses dados sejam
os íntegros, oportunos, relevantes e utilizáveis.
Portanto, modelos de dados e projetos de banco de dados devem fornecer um equilíbrio razoável entre
as necessidades de curto e de longo prazo da organização.
3. Habilitando e Mantendo Dados
O foco do trabalho de design, como arquitetura e modelagem de dados, é fornecer informações sobre
a melhor forma de configurar as aplicações que disponibilizam dados utilizáveis, acessíveis e atuais
para a organização. Depois que os dados são configurados em armazéns e aplicações é necessário
um trabalho operacional significativo para que eles continuem a atender aos requisitos
organizacionais.
Este tópico visa descrever as funções de gerenciamento de dados que se concentram na ativação e
manutenção de dados. São elas:
 Armazenamento e Operações de Dados.
 Integração e interoperabilidade de dados.
 Armazenamento de dados.
 Gerenciamento de dados de referência.
 Gerenciamento de dados mestre.
 Gerenciamento de Documentos e Conteúdo.
 Armazenamento de Big Data.
3.1. Armazenamento e operações de dados
A função de armazenamento e operações de dados é o que muitas pessoas entendem quando
pensam no gerenciamento tradicional de dados. Esse é o trabalho, altamente técnico, realizado pelos
administradores de banco de dados (Data Base Administrators - DBAs) e Administradores de
Armazenamento em Rede (Network Storage Administrators - NSAs) para garantir que os sistemas de
armazenamento de dados estejam acessíveis, com bom desempenho e que a integridade dos dados
seja mantida.
O trabalho de armazenamento e operações de dados é essencial para as organizações que dependem
de dados para realizar diversos tipos de transações.
A administração do banco de dados é vista como uma função monolítica na qual os DBAs
desempenham papéis diferentes. Podem suportar ambientes de produção, trabalho de
desenvolvimento e procedimentos específicos.
O trabalho do DBA é influenciado pela arquitetura de dados de uma organização (por exemplo,
centralizada, distribuída, federada; fortemente ou fracamente acoplada), bem como pela maneira como
os próprios bancos de dados são organizados (hierárquicos, relacional, etc.).
Com o surgimento de novas tecnologias, os DBAs e NSAs são responsáveis por criar e gerenciar
ambientes virtuais (computação em nuvem). Como os ambientes de armazenamento de dados são
bastante complexos, os DBAs procuram maneiras de reduzir ou pelo menos gerenciar a complexidade
por meio da automação, reutilização e aplicação de padrões e práticas recomendadas.
Embora os DBAs possam parecer muito distantes da função de governança de dados, seu
conhecimento do ambiente técnico é essencial para implementar diretivas de governança de dados
relacionadas a itens como controle de acesso, privacidade e segurança de dados. DBAs experientes
também são fundamentais para permitir que as organizações adotem e incrementem novas
tecnologias.
O armazenamento e as operações de dados são parte do gerenciamento de dados em todo o seu ciclo
de vida, desde a obtenção até a eliminação.
Atenção, os DBAs contribuem para esse processo:
 Definindo requisitos de armazenamento.
 Definindo requisitos de acesso.
 Desenvolvendo instâncias.
 Gerenciando o ambiente de armazenamento físico.
 Carregando dados.
 Replicando dados.
 Rastreando padrões de uso.
 Planejando a continuidade dos negócios.
 Gerenciando backup e recuperação.
 Gerenciando o desempenho e a disponibilidade do banco de dados.
 Gerenciando ambientes alternativos (por exemplo, para desenvolvimento e teste).
 Gerenciando a migração de dados.
 Rastreando ativos de dados.
 Habilitando auditorias e validação de dados.
Em resumo, os DBAs garantem que os mecanismos estejam funcionando. Eles também são os
primeiros em cena quando os bancos de dados se tornam indisponíveis.
3.2. Integração e interoperabilidade de dados
Enquanto as atividades de armazenamento e operações de dados se concentram nos ambientes para
armazenamento e manutenção de dados, as atividades de Integração e Interoperabilidade de Dados
(DII) incluem processos para mover e consolidar dados dentro e entre repositórios de dados e
aplicações.
A integração consolida os dados em formas consistentes, físicas ou virtuais. Interoperabilidade de
dados é a capacidade de vários sistemas se comunicarem. Os dados a serem integrados geralmente
se originam de diferentes sistemas dentro de uma organização. Cada vez mais, as organizações
também integram dados externos aos dados que produzem.
As soluções DII permitem funções básicas de gerenciamento de dados das quais a maioria das
organizações depende para:
 Migração e conversão de dados.
 Consolidação de dados em Hubs ou Marts.
 Integração de pacotes de software de fornecedores ao portfólio de aplicações da organização
 Compartilhamento de dados entre aplicações e organizações.
 Distribuição dados entre repositórios de dados e datacenters.
 Arquivamento de dados.
 Gerenciamento de interfaces de dados.
 Obtenção e ingestão de dados externos.
 Integração de dados estruturados e não estruturados.
 Fornecimento de inteligência operacional e suporte a decisões de gerenciamento
A implementação de práticas e soluções de integração e interoperabilidade de dados visa:
 Disponibilizar dados no formato e prazo necessários para os consumidores de dados, humanos
e do sistema.
 Consolidar dados fisicamente e virtualmente em hubs de dados.
 Reduzir o custo e a complexidade do gerenciamento de soluções, desenvolvendo modelos e
interfaces compartilhados.
 Identificar eventos significativos (oportunidades e ameaças) e acionar alertas e ações
automaticamente.
 Apoiar os esforços de Business Intelligence, analytics, Master Data Management e eficiência
operacional.
O design das soluções DII precisa levar em consideração a:
 Captura de dados alterados: como garantir que os dados sejam atualizados corretamente.
 Latência: a quantidade de tempo entre quando os dados são criados ou capturados e quando
são disponibilizados para consumo.
 Replicação: como os dados são distribuídos para garantir o desempenho.
 Orquestração: como diferentes processos são organizados e executados para preservar a
consistência e a continuidade dos dados.
O principal fator para o DII é garantir que os dados sejam interoperáveis eficientemente para diferentes
meios de armazenamentos, tanto dentro da organização quanto entre organizações. É muito
importante projetar com o objetivo de reduzir a complexidade. A maioria das organizações possuem
centenas de bancos de dados. Se o DII não for gerenciado com eficiência, apenas o gerenciamento de
interfaces poderá sobrecarregar uma organização de TI.
Devido à sua complexidade, o DII depende de outras áreas do gerenciamento de dados, incluindo:
 Governança de dados: para definir e governar as regras e políticas de transformação de dados
e estruturas.
 Arquitetura de dados: para projetar soluções.
 Segurança de dados: para garantir que as soluções de segurança sejam eficientes nas
diversas aplicações de transações de dados entre as organizações.
 Metadados: para rastrear o inventário técnico de dados (persistente, virtual e em movimento), o
significado estratégico dos dados, as regras para transformar os dados e o histórico
operacional e a linhagem dos dados.
 Armazenamento e operações de dados: para gerenciar as diversas instancias física das
soluções.
 Modelagem e Design de Dados: para projetar estruturas de dados, incluindo persistência física
em bancos de dados, estruturas de dados virtuais e tráfego que transmitem informações entre
aplicações.
A integração e a interoperabilidade de dados são essenciais para o Data Warehousing & Business
Intelligence, bem como para o gerenciamento de dados de referência e de dados mestre, porque tudo
isso transforma e integra dados de sistemas de origem múltipla para hubs de dados consolidados e de
hubs para os sistemas de destino onde eles podem ser entregues aos consumidores de dados, tanto
do sistema quanto humanos.
A integração e interoperabilidade de dados também é central para a área emergente do gerenciamento
de Big Data. O Big Data procura integrar vários tipos de dados, incluindo dados estruturados e
armazenados em bancos de dados, dados de texto não estruturados em documentos ou arquivos,
outros tipos de dados não estruturados, como dados de áudio, vídeo e streaming. Esses dados
integrados podem ser extraídos, usados para desenvolver modelos preditivos e implantados em
atividades de inteligência operacional.
Ao implementar o DII A organização deve seguir determinados princípios ao implementar o DII. São
eles:
 Adotar uma perspectiva corporativa no design para garantir a extensibilidade futura, mas
implemente por meio de entrega iterativa e incremental.
 Equilibrar as necessidades de dados locais com as necessidades de dados corporativos,
incluindo suporte e manutenção.
 Garantir a responsabilidade pelo design e atividade do DII. Os especialistas em negócios
devem estar envolvidos no design e modificação das regras de transformação de dados,
persistentes e virtuais.
O processo de integração refere-se à possibilidade de dois ou mais sistemas ou aplicações de se
comunicarem, compartilhando informações suficientes entre eles para que determinado processo
ocorra.
Geralmente, o uso da palavra integração refere-se à capacidade dos sistemas de enviarem
informações e processá-las de modo que completem ou complementem um processo ou uma
necessidade.
Interoperar é a capacidade de um produto ou sistema trabalhar com outros produtos ou sistemas
existentes, ou futuros produtos e sistemas sem restringir o acesso ou a implementação.
Saiba Mais sobre interoperabilidade.
Interoperabilidade
Um dos pontos-chave das políticas de governo eletrônico é a interoperabilidade entre os entes que
trabalham dentro e fora do governo (cidadãos, empresários, outras esferas de governo, etc.). Mas, o
que é interoperabilidade?
A interoperabilidade pode ser entendida como uma característica que se refere à capacidade de
diversos sistemas e organizações trabalharem em conjunto (interoperar) de modo a garantir que
pessoas, organizações e sistemas computacionais interajam para trocar informações de maneira
eficaz e eficiente.
Importância e Vantagens:
“As principais questões de governança endereçadas pelas instituições abordam cinco itens inter-
relacionados: os princípios de TIC; a arquitetura de TIC; a infraestrutura de TIC; as necessidades de
aplicações para o negócio; e os investimentos e priorização de TI.” (Governança de Tecnologia da
Informação, Peter Weil e Jeanne W. Ross).
A Governança de TIC relacionada à questão da interoperabilidade aborda os “princípios de TIC” e
“arquitetura de TI” com o objetivo de definir a abordagem conceitual e tecnológica para interoperar os
sistemas de governo, do modo mais eficiente, efetivo e econômico, para o alcance das metas do
Governo Federal no atendimento das necessidades da sociedade.
Um importante desafio para o governo eletrônico é prestar serviços públicos com maior eficiência e
eficácia para os cidadãos. A interoperabilidade gera instrumentos aos gestores para uma melhor
tomada de decisão, uma melhor coordenação dos programas e serviços de governo e redução de
custos, por meio da visão integrada dos processos do governo e do reuso de soluções tecnológicas.
A interoperabilidade também auxilia no atendimento ao Decreto nº 9.723/2019, que dispõe sobre a
simplificação do atendimento prestado aos usuários dos serviços públicos, institui o Cadastro de
Pessoas Físicas - CPF como instrumento suficiente e substitutivo para a apresentação de dados do
cidadão no exercício de obrigações e direitos e na obtenção de benefícios, ratifica a dispensa do
reconhecimento de firma e da autenticação em documentos produzidos no País e institui a Carta de
Serviços ao Usuário.”
Os conceitos de interoperabilidade e integração são muitas vezes utilizados como sinônimos na área
de TIC. Entretanto, esses conceitos são distintos, embora complementares.
Integração refere-se ao processo de conectar dois ou mais sistemas gerando uma dependência
tecnológica entre os mesmos.
Interoperabilidade refere-se ao processo de comunicação de dois ou mais sistemas sem a geração de
uma dependência tecnológica entre os mesmos.
Em muitos casos, a integração entre sistemas é a melhor solução, mas não é o foco da e-PING, que
trata principalmente da interoperabilidade entre órgãos.
Dimensões da Interoperabilidade:
A interoperabilidade pode ser organizada em três dimensões que se comunicam e se complementam:
organizacional, semântica e técnica.
A interoperabilidade organizacional diz respeito à colaboração entre organizações que desejam trocar
informações mantendo diferentes estruturas internas e processos de negócios variados. Mesmo
contando com a padronização de conceitos, as organizações possuem distintos modelos de operação,
ou processos de trabalho. Isto quer dizer que elas realizam suas atividades em tempos diferentes e de
maneiras diferentes.
A interoperabilidade semântica é a capacidade de dois ou mais sistemas heterogêneos e distribuídos
trabalharem em conjunto, compartilhando as informações entre eles com entendimento comum de seu
significado (Buranarach, 2004). A interoperabilidade semântica garante que os dados trocados tenham
seu efetivo significado corretamente interpretado dentro do contexto de uma dada transação ou busca
de informação, dentro da cultura, convenções e terminologias adotadas por cada setor ou organização
e, assim, compartilhados pelas partes envolvidas.
A interoperabilidade técnica trata da ligação entre sistemas e serviços de computação pela utilização
de padrões para apresentação, coleta, troca, processamento e transporte de dados. Esses padrões
podem abranger hardware, software, protocolos e processos de negócio. Uma vez que foram
identificados os motivos e os momentos adequados para interoperar, e que foram estabelecidos
vocabulários comuns, é preciso haver também um padrão para fazer isso, ou seja, para tratar o “como
fazer”.
Fonte: Manual do Gestor de Interoperabilidade, 2012 -
https://www.governodigital.gov.br/transformacao/compras/orientacoes/interoperabilidade/material-de-
apoio
A existência de uma infraestrutura de Tecnologia da Informação e Comunicação (TICs) estruturada e
com fundamentos consolidados para a criação dos serviços de governo digital é o pré-requisito para o
fornecimento de melhores serviços à sociedade com custo mais baixos.
Um governo moderno e integrado exige sistemas igualmente modernos e integrados, interoperáveis,
trabalhando de forma íntegra, segura e coerente em todo o setor público.
Políticas e especificações claramente definidas para interoperabilidade e gerenciamento das
informações são fundamentais para propiciar a conexão do governo, tanto no âmbito interno como na
interação com a sociedade e, em maior nível de abrangência, com o resto do mundo, como outros
governos e organizações atuantes no mercado mundial.
A arquitetura ePING (Padrões de Interoperabilidade de Governo Eletrônico – Portaria nº 92, de 24 de
dezembro de 2014) define um conjunto mínimo de premissas, políticas e especificações técnicas que
regulamentam a utilização da Tecnologia de Informação e Comunicação no Governo Federal,
estabelecendo as condições de interação com os demais Poderes e esferas de governo e com a
sociedade em geral, com mais ênfase nos órgãos e entidades integrantes do Sistema de
Administração dos Recursos de Tecnologia da Informação (SISP).
Os recursos de informação do governo constituem valiosos ativos econômicos ao garantir que a
informação governamental possa ser rapidamente localizada e transmitida entre os diversos órgãos
públicos, mantidas as obrigações de privacidade e segurança. Esse processo é essencial para que o
governo utilize da melhor forma esses ativos, melhorando a prestação de serviços públicos no país.
Para mais informações: http://eping.governoeletronico.gov.br/
3.3. Armazenamento de dados
Os data warehouses – ou armazém de dados – permitem que as organizações integrem dados de
sistemas diferentes em um modelo de dados comum, a fim de suportar funções operacionais,
requisitos de conformidade e atividades de Business Intelligence (BI).
A tecnologia de armazém surgiu nos anos 1980 e as organizações começaram a construir armazéns
com viés corporativo a partir dos anos 1990. Os armazéns permitiram que as organizações usassem
seus dados com mais eficiência, reduzindo a redundância de dados e proporcionando mais
consistência.
O termo armazém de dados implica que todos os dados estão em um único local, como em um
armazém físico. No entanto, o conceito de data warehouses é mais complicado do que isso. Eles
consistem em várias partes pelas quais os dados são movidos. Durante seu movimento, a estrutura e
o formato dos dados podem ser alterados, para que possam ser reunidos em tabelas comuns, a partir
das quais podem ser acessados. Pode ser usado diretamente para relatórios ou como entrada para
aplicações downstream.
A construção de um armazém requer habilidades de todo o espectro de gerenciamento de dados,
desde as habilidades altamente técnicas necessárias para armazenamento, operações e integração de
dados até as habilidades de tomada de decisão dos líderes de governança e estratégia de dados.
Também significa gerenciar os processos fundamentais que permitem que os dados sejam seguros,
utilizáveis (via metadados confiáveis) e de alta qualidade.
Existem diferentes maneiras de construir um armazém. A abordagem adotada por uma organização
dependerá de seus objetivos, estratégia e arquitetura. Qualquer que seja a abordagem, os armazéns
compartilham as seguintes características comuns:
 Armazenam dados de outros sistemas e os tornam acessíveis e utilizáveis para análise.
 O ato de armazenamento inclui organizar os dados de maneira a agregar valor. Em muitos
casos, isso significa que os armazéns efetivamente criam novos dados que não estão
disponíveis em outros lugares.
 As organizações constroem armazéns porque precisam disponibilizar dados confiáveis e
integrados para as partes interessadas autorizadas.
 Os dados do armazém servem a muitos propósitos, desde o suporte ao fluxo de trabalho até o
gerenciamento operacional e a análise preditiva.
As abordagens mais conhecidas para data warehousing foram conduzidas por dois líderes
influentes, Bill Inmon e Ralph Kimball.
Bill Inmon define um data warehouse como "uma coleta de dados orientada ao assunto, integrada,
variável no tempo e não volátil, para apoiar o processo de tomada de decisão da gerência". Um
modelo relacional normalizado é usado para armazenar e gerenciar dados.
A figura abaixo ilustra a abordagem da Inmon, que é chamada de "Fábrica de informações
corporativas".
Ralph Kimball define um data warehouse como "uma cópia dos dados de transação estruturados
especificamente para consulta e análise". A imagem a seguir ilustra a abordagem de Kimball, que
exige um modelo dimensional.
À medida que nos aproximamos da terceira década do milênio, muitas organizações estão construindo
armazéns de segunda e terceira geração ou adotando lagos de dados para disponibilizar dados. Os
lagos de dados (Data lake) disponibilizam mais dados a uma velocidade mais elevada, criando a
oportunidade de passar da análise retrospectiva das tendências de negócios para a análise preditiva.
O gerenciamento de dados requer conhecimento e planejamento, além de exigir a adoção dos
seguintes princípios fundamentais:
Foco nos objetivos de negócios
Verifique se o data warehouse (DW) atende às prioridades organizacionais e resolve problemas de
negócios. Fazer isso requer uma perspectiva estratégica, que, na maioria das vezes, é uma
perspectiva da organização.
Finalidade em mente
O conteúdo do DW deve ser orientado pelas prioridades de negócios e pelo escopo da entrega de
dados finais para Business Intelligence - BI.
Pensamento global, construção local
Permita que a visão final guie a arquitetura, mas construa e forneça de forma incremental, por meio de
projetos ou sprints focados que permitem um retorno mais imediato do investimento.
Resumo e otimização por último
Observe que o resumo e otimização por último e não primeiro. Crie dados atômicos. Agregue e
resuma para atender aos requisitos e garantir o desempenho, não para substituir os detalhes.
Promoção da transparência e do autoatendimento
Quanto mais contexto (por exemplo, incluindo metadados de vários tipos) fornecido, maiores serão os
consumidores de dados mais capazes de obter valor com os dados. Mantenha as partes interessadas
informadas sobre os dados e os processos pelos quais eles são integrados.
Criação de metadados
É fundamental para o sucesso da DW a capacidade de explicar os dados. Por exemplo, ser capaz de
responder a perguntas básicas como "Por que essa soma é X?" "Como isso foi calculado?" E "De onde
vêm os dados?" Os metadados devem ser capturados como parte do ciclo de desenvolvimento e
gerenciados como parte das operações em andamento.
Colaboração
Associar-se com outras iniciativas de dados, especialmente as de governança, qualidade e
metadados.
Um tamanho não serve para todos
Use as ferramentas e produtos certos para cada grupo de consumidores de dados.
3.4. Gerenciamento de dados de referência (Reference Data Management - RDM)
Diferentes tipos de dados desempenham diferentes funções dentro de uma organização e têm
diferentes requisitos de gerenciamento de dados. Dados de referência (por exemplo, tabelas de código
e descrição) são dados usados apenas para caracterizar outros dados em uma organização ou apenas
para relacionar dados em um banco de dados a informações além dos limites da organização.
Os Dados de referência fornecem um contexto crítico para a criação e uso de dados mestre e
transacionais. Permite que outros dados sejam compreendidos de maneira significativa. Importante, é
um recurso compartilhado que deve ser gerenciado no nível da organização. Ter várias instâncias dos
mesmos Dados de Referência é ineficiente e inevitavelmente leva à inconsistência entre eles. A
inconsistência leva à ambiguidade e a ambiguidade introduz riscos para uma organização.
O RDM envolve controle sobre valores de domínio definidos e suas definições. O objetivo do RDM é
garantir que a organização tenha acesso a um conjunto completo de valores precisos e atuais para
cada conceito representado.
Por ser um recurso compartilhado e ultrapassar os limites organizacionais internos, a propriedade e a
responsabilidade pelos Dados de Referência são um desafio para algumas organizações. Alguns
dados de referência se originam fora da organização, outros Dados de Referência podem ser criados e
mantidos dentro de um departamento, mas têm um valor potencial em outra parte da organização.
Determinar a responsabilidade de obter dados e aplicar atualizações faz parte do gerenciamento. A
falta de responsabilização introduz riscos, pois as diferenças nos Dados de referência podem causar
um mal-entendido no contexto dos dados (por exemplo, quando duas unidades de negócios têm
valores diferentes para classificar o mesmo conceito).
Os dados de referência geralmente parecem mais simples do que outros dados. Isso porque o
conjunto de dados de referência geralmente são menores que outros tipos de dados. Os dados de
referência também são geralmente menos voláteis do que outras formas de dados. Com algumas
exceções notáveis (como dados da taxa de câmbio) os dados de referência são alterados com pouca
frequência.
O desafio com o RDM surge com o seu uso. Para que o Gerenciamento de dados de referência seja
eficaz (valores atualizados e consistentes em várias aplicações e usos) ele precisa ser gerenciado por
meio de tecnologia que permita aos consumidores de dados humanos e de sistema acessá-lo de
maneira oportuna e eficiente em várias plataformas.
Assim como no gerenciamento de outras formas de dados, o RDM requer planejamento e design. A
arquitetura e os modelos de dados de referência devem levar em conta como os dados de referência
serão armazenados, mantidos e compartilhados.
Por ser um recurso compartilhado, requer um alto grau de administração. Para obter o máximo valor
de um sistema de dados de referência gerenciado centralmente, uma organização deve estabelecer
políticas de governança que exijam o uso desse sistema e impedir que as pessoas mantenham suas
próprias cópias dos conjuntos de dados de referência. Isso pode exigir um nível de atividade de
gerenciamento de mudanças organizacionais, pois pode ser desafiador levar as pessoas a desistir de
suas planilhas para o bem da organização.
3.5. Gerenciamento de dados mestre (Master Data Management - MDM)
Como os Dados de referência, os Dados mestre são um recurso compartilhado. Dados mestre são
dados sobre as entidades que fornecem contexto para transações e análises de negócios. Uma
entidade é um objeto do mundo real (como uma pessoa, organização, local ou coisa).
As entidades são representadas por instâncias de entidade, na forma de dados/registros. Os dados
mestres devem representar os dados oficiais e mais precisos disponíveis sobre as principais
entidades. Quando bem gerenciados, os valores dos Dados Mestres são confiáveis e podem ser
usados com confiança.
O MDM envolve controle sobre os valores e identificadores dos Dados mestre, que permitem o uso
consistente, entre sistemas, dos dados mais precisos e oportunos sobre entidades comerciais
essenciais. Os objetivos incluem garantir a disponibilidade de valores atuais precisos e reduzir o risco
de identificadores ambíguos.
Simplificando: quando as pessoas pensam em dados de alta qualidade, geralmente pensam em Dados
Mestre bem gerenciados. Por exemplo, um registro de um cliente completo, preciso, atual e utilizável é
considerado "bem gerenciado". A partir desse registro, eles devem ser capazes de reunir um
entendimento histórico desse cliente. Se eles tiverem informações suficientes, poderão predizer ou
influenciar as ações desse usuário.
O MDM é um desafio. Isso ilustra um desafio fundamental com os dados: as pessoas escolhem
maneiras diferentes de representar conceitos semelhantes e a reconciliação entre essas
representações nem sempre é direta. É importante ressaltar que as informações são alteradas com o
tempo e a contabilização sistemática dessas mudanças exige planejamento, conhecimento de dados e
habilidades técnicas. Em resumo, é preciso trabalho, incluindo gerenciamento de dados e trabalho de
governança, para gerenciar os Dados Mestre.
Qualquer organização que tenha reconhecido a necessidade do MDM provavelmente já possui um
cenário de sistema complexo, com várias maneiras de capturar e armazenar referências a entidades
do mundo real. Como resultado do crescimento orgânico ao longo do tempo e de fusões e aquisições,
os sistemas que forneceram informações para o processo MDM podem ter definições diferentes das
próprias entidades e, muito provavelmente, padrões diferentes para a qualidade dos dados. Devido a
essa complexidade, é melhor abordar o gerenciamento de dados mestre, um domínio de dados por
vez. Comece pequeno, com alguns atributos, e desenvolva-se com o tempo.
O planejamento para o MDM inclui várias etapas básicas dentro de um domínio, são elas:
 Identificar fontes candidatas que fornecerão uma visão abrangente das entidades de dados
mestre.
 Desenvolver regras para corresponder e mesclar com precisão instâncias de entidade.
 Estabelecer uma abordagem para identificar e restaurar dados combinados e mesclados de
maneira inadequada.
 Definir uma abordagem para distribuir dados confiáveis para sistemas em toda a organização.
A execução do processo, no entanto, não é tão simples quanto essas etapas fazem parecer. MDM é
um processo de gerenciamento do ciclo de vida. Além disso, os dados mestre não devem ser
gerenciados apenas dentro de um sistema MDM, mas também disponibilizados para uso por outros
sistemas e processos. Isso requer tecnologia que permita compartilhamento e feedback. Também
deve ser apoiada por políticas que exijam que os sistemas e processos de negócios usem os valores
dos dados Principais e os impeçam de criar suas próprias "versões da verdade".
Ainda assim, o MDM tem muitos benefícios. Os Dados Mestres bem gerenciados melhoram a
eficiência organizacional e reduzem os riscos associados a diferenças na estrutura de dados entre
sistemas e processos.
3.6. Gerenciamento de documentos, registros e conteúdo
Documentos, registros e conteúdo (por exemplo, as informações armazenadas nos sites da Internet e
da intranet) compreendem uma forma de dados com requisitos de gerenciamento distintos.
O gerenciamento de documentos, registros e conteúdo envolve controlar a captura, armazenamento,
acesso e uso de dados e informações armazenados fora dos bancos de dados relacionais. Como
outros tipos de dados, espera-se que documentos, registros e conteúdo não estruturado sejam
seguros e de alta qualidade. Garantir sua segurança e qualidade requer governança, arquitetura
confiável e metadados bem gerenciados.
O gerenciamento de documentos, registros e de conteúdo se concentra em manter a integridade e
permitir o acesso a documentos e outras informações não estruturadas ou semiestruturadas; isso o
torna aproximadamente equivalente ao gerenciamento de operações de dados para bancos de dados
relacionais. No entanto, também possui direcionadores estratégicos.
Os principais fatores de negócios para gerenciamento de documentos, registros e conteúdo incluem
conformidade regulamentar, capacidade de responder a solicitações de litígio e descoberta eletrônica e
requisitos de continuidade de negócios.
Conheça a seguir a conceituação de cada um desses gerenciamentos:
Gerenciamento de documentos
Termo geral usado para descrever armazenamento, inventário e controle de documentos eletrônicos e
em papel. Ele abrange as técnicas e tecnologias para controlar e organizar documentos ao longo de
seu ciclo de vida.
Gerenciamento de registros
Forma especializada de gerenciamento de documentos que se concentra nos registros - documentos
que fornecem evidências das atividades de uma organização. Essas atividades podem ser eventos,
transações, contratos, correspondência, políticas, decisões, procedimentos, operações, arquivos de
pessoal e demonstrações financeiras. Os registros podem ser documentos físicos, arquivos e
mensagens eletrônicos ou conteúdo do banco de dados.
Gerenciamento de conteúdo
Refere-se aos processos, técnicas e tecnologias para organizar, categorizar e estruturar recursos de
informações para que eles possam ser armazenados, publicados e reutilizados de várias maneiras. O
conteúdo pode ser volátil ou estático (documentos e outros ativos digitais, como vídeos, fotografias,
etc.). Pode ser gerenciado formalmente (estritamente armazenado, gerenciado, auditado, retido ou
descartado) ou informalmente por meio de atualizações ad hoc. O gerenciamento de conteúdo é
particularmente importante em sites e portais, mas as técnicas de indexação com base em palavras-
chave e organização com base em taxonomias podem ser aplicadas em plataformas tecnológicas.
O gerenciamento bem-sucedido de documentos, registros e outras formas de conteúdo compartilhado
requer:
 Planejamento, incluindo a criação de políticas para diferentes tipos de acesso e manipulação.
 Definição da arquitetura da informação e dos metadados necessários para suportar uma
estratégia de conteúdo.
 Permissão do gerenciamento de terminologia, incluindo ontologias e taxonomias, necessárias
para organizar, armazenar e recuperar várias formas de conteúdo.
 Adoção de tecnologias que permitem o gerenciamento do ciclo de vida do conteúdo, desde a
criação ou captura de conteúdo até a versão e assegurando a segurança do conteúdo.
Para os registros, as políticas de retenção e descarte são críticas. Os registros devem ser mantidos
pelo período de tempo necessário e devem ser destruídos assim que os requisitos de retenção forem
atendidos. Embora existam, os registros devem estar acessíveis às pessoas e processos apropriados
e, como outros conteúdos, devem ser entregues por meio dos canais apropriados.
Para atingir esses objetivos, as organizações exigem sistemas de gerenciamento de conteúdo
(Content Management Systems - CMS), além de ferramentas para criar e gerenciar os metadados que
suportam o uso do conteúdo. Eles também exigem que a governança supervisione as políticas e
procedimentos que suportam o uso de conteúdo e evitam o uso indevido; essa governança permite
que a organização responda ao litígio de maneira consistente e apropriada.
3.7. Armazenamento de Big Data
O Big data e a ciência de dados estão conectados a mudanças tecnológicas significativas que
permitiram às pessoas gerar, armazenar e analisar quantidades cada vez maiores de dados e usá-los
para prever e influenciar comportamentos, além de obter informações sobre uma série assuntos como
práticas de saúde, gestão de recursos naturais e desenvolvimento econômico.
Os primeiros esforços para definir o significado de Big Data caracterizaram-no em termos dos Três V's:
Volume, Velocidade, Variedade. À medida que mais organizações começaram a aproveitar o potencial
do Big Data, a lista de V’s se expandiu. Hoje são seis os “v”, conforme especificado abaixo.
 Volume: refere-se à quantidade de dados. O Big Data geralmente possui milhares de
entidades ou elementos em bilhões de registros.
 Velocidade: refere-se à velocidade na qual os dados são capturados, gerados ou
compartilhados. O Big Data geralmente é gerado e também pode ser distribuído e até
analisado em tempo real.
 Variedade/variabilidade: refere-se às formas em que os dados são capturados ou entregues.
O Big Data vem requer armazenamento de vários formatos. A estrutura de dados geralmente é
inconsistente dentro ou entre conjuntos de dados.
 Viscosidade: refere-se à dificuldade em usar ou integrar os dados.
 Volatilidade: refere-se à frequência com que os dados são alterados e, portanto, quanto
tempo os dados são úteis.
 Veracidade: refere-se à confiabilidade dos dados.
Tirar proveito do Big Data requer mudanças na tecnologia e nos processos de negócios e na maneira
como os dados são gerenciados. A maioria dos data warehouses é baseada em modelos relacionais.
O Big Data geralmente não é organizado em um modelo relacional. O data warehousing depende do
conceito de ETL (loading and then transforming - extrair, transformar, carregar).
As soluções de Big Data, como os lagos de dados, dependem do conceito de E L T - carregar e depois
transformar (loading and then transforming). Isso significa que grande parte do trabalho inicial
necessário para a integração não é feito para o Big Data, pois é para criar um data warehouse com
base em um modelo de dados. Para algumas organizações e para alguns usos de dados, essa
abordagem funciona, mas para outras, é necessário se concentrar na preparação de dados para uso.
A velocidade e o volume dos dados apresentam desafios que exigem abordagens diferentes para
aspectos críticos do gerenciamento de dados, não apenas a integração de dados, mas também o
Gerenciamento de metadados, a avaliação da qualidade dos dados e o armazenamento de dados (por
exemplo, no local, em um data center ou a nuvem).
A promessa do Big Data - de que ele fornecerá um tipo diferente de insight - depende da capacidade
de gerenciar o Big Data. De várias maneiras, devido à grande variação de fontes e formatos, o
gerenciamento de Big Data requer mais disciplina do que o gerenciamento de dados relacionais. Cada
um dos V's apresenta a oportunidade para o caos.
Os princípios relacionados ao gerenciamento de Big Data ainda não foram totalmente formados, mas
um é muito claro: as organizações devem gerenciar cuidadosamente os metadados relacionados às
fontes de Big Data para ter um inventário preciso dos arquivos de dados, suas origens e seu valor.
Algumas pessoas questionaram se há necessidade de gerenciar a qualidade do Big Data, mas a
pergunta em si reflete uma falta de entendimento da definição de qualidade - adequação ao objetivo. A
grandeza, por si só, não torna os dados adequados ao objetivo. O Big Data também representa novos
riscos éticos e de segurança que precisam ser contabilizados pelas organizações de governança de
dados.
O Big Data pode ser usado para uma série de atividades, de mineração de dados a aprendizado de
máquina e análise preditiva. Mas, para chegar lá, uma organização deve ter um ponto de partida e
uma estratégia.
A estratégia de Big Data de uma organização necessita estar alinhada e apoiar a estratégia geral de
negócios da instituição.
Sua atenção, para que isso ocorra, deve-se avaliar:
 Quais são os problemas a organização está tentando resolver. Uma organização pode
determinar que os dados devem ser usados para entender os negócios ou o ambiente de
negócios; provar ideias sobre o valor de novos produtos; explorar uma hipótese; ou inventar
uma nova maneira de fazer negócios. É importante estabelecer um processo de fechamento e
verificação para avaliar o valor e a viabilidade das iniciativas.
 Quais fontes de dados usar ou adquirir: As fontes internas podem ser fáceis de usar, mas
também podem ter escopo limitado. Fontes externas podem ser úteis, mas estão fora do
controle operacional (gerenciado por terceiros ou não controlado por ninguém, como no caso
das mídias sociais). Muitos fornecedores estão competindo como intermediários de dados e
geralmente existem várias fontes para os conjuntos de dados desejados. A aquisição de dados
que se integra aos itens de ingestão existentes pode reduzir os custos gerais de investimento.
 A pontualidade e o escopo dos dados a serem provisionados: Vários elementos podem
ser fornecidos em feeds em tempo real, instantâneos em um determinado momento ou até
integrados e resumidos. Dados de baixa latência são ideais, mas costumam custar recursos de
aprendizado de máquina - há uma enorme diferença entre algoritmos computacionais
direcionados para dados em repouso versus streaming. Não minimize o nível de integração
necessário para o uso downstream.
 O impacto e a relação com outras estruturas de dados: Pode ser necessário fazer
alterações na estrutura ou no conteúdo de outras estruturas de dados para torná-los
adequados para integração com os conjuntos de Big Data.
 Influências nos dados modelados existentes: Isso inclui a ampliação do conhecimento
sobre clientes, produtos e abordagens de marketing.
A estratégia orientará o escopo e o cronograma do roteiro de recursos de Big Data da organização.
Muitas organizações estão integrando Big Data em seu ambiente geral de gerenciamento de dados.
Os dados são transferidos dos sistemas de origem para uma área intermediária, onde podem ser
limpos e enriquecidos. Em seguida, é integrado e armazenado no data warehouse (DW) e/ou em um
armazenamento de dados operacional (Operational Data Store - ODS).
A partir do DW, os usuários podem acessar dados por meio de marcadores ou cubos e utilizá-los para
vários tipos de relatórios. O Big Data passa por um processo semelhante, mas com uma diferença
significativa: enquanto a maioria dos armazéns integra dados antes de colocá-los em tabelas, as
soluções de Big Data ingerem dados antes de integrá-los. O Big Data BI pode incluir análise preditiva e
mineração de dados, além de formas mais tradicionais de geração de relatórios.
4. Usando e aprimorando dados
Uma característica dos dados que os diferencia de outros ativos é que eles não são "consumidos"
quando usados. Pessoas e processos diferentes utilizam dados ao mesmo tempo ou utilizam os
mesmos dados várias vezes sem esgotá-los. Os dados não se esgotam como também o uso de dados
cria mais dados. Por exemplo, agregações e cálculos de conjuntos de dados existentes criam novos
conjuntos de dados, assim como modelos preditivos criados por cientistas de dados. Em muitos casos,
esses novos conjuntos de dados continuaram sendo produzidos e atualizados. Eles exigem
gerenciamento. Eles precisam ser definidos e suportados por meio de metadados. Expectativas
relacionadas à sua qualidade também devem ser definidas. Seu acesso e uso devem ser regidos.
Este tópico examinará as atividades do ciclo de vida em que os dados são utilizados e aprimorados,
incluindo:
 Uso de dados mestre.
 Business Intelligence.
 Ciência de Dados.
 Ferramenta Google Analytics.
 Visualização de dados.
 Monetização de dados.
4.1. Uso de dados mestre
O uso de dados mestre fornece uma boa ilustração de como o uso de dados está diretamente
conectado à melhoria de dados. Os dados mestre bem gerenciados permitem que uma organização
tenha um bom entendimento das entidades (usuários, fornecedores, serviços etc.) com as quais
interage e transaciona os negócios.
No processo transacional de dados, uma organização aprende mais sobre essas entidades. O que se
aprende pode ser armazenado no nível da transação, mas as organizações coletam dados
necessários para manter seus dados mestre (por exemplo, alterações de endereço, atualizações nas
informações de contato etc.).
Os dados transacionais também permitem que eles obtenham dados adicionais (por exemplo: quais
benefícios assistenciais determinado usuário tem acesso, etc.) que podem aprimorar seus dados
mestre. Embora a interação dinâmica entre diferentes usos de dados deva ser considerada no
planejamento do gerenciamento de dados, esse é o foco particular do gerenciamento de dados mestre.
4.2. Inteligência do Negócio
O desenvolvimento de relatórios de Business Intelligence é outra atividade em que o uso de dados
resulta na criação de novos dados que exigem um nível de gerenciamento contínuo.
Vale ressaltar que o termo Business Intelligence (BI) apresenta dois significados:
1. Tipo de análise de dados que visa entender as atividades e oportunidades organizacionais.
Quando as pessoas dizem que os dados possuem a chave da vantagem competitiva, estão
articulando a promessa inerente à atividade de Business Intelligence: que se uma organização
fizer as perguntas certas de seus próprios dados, poderá obter insights sobre seus usuários,
produtos e serviços que permitem tomar as melhores decisões sobre como cumprir seus
objetivos estratégicos.
2. Conjunto de tecnologias que suportam esse tipo de análise de dados. As ferramentas
de BI permitem consultas, mineração de dados, análise estatística, geração de relatórios,
modelagem de cenários, visualização de dados e painel de controle, desde orçamento,
relatórios operacionais e métricas de desempenho de negócios até análises avançadas.
O BI é o principal direcionador (driver) do armazenamento de dados, pois as atividades tradicionais
de BI exigem fontes de dados confiáveis e integradas para uso. As ferramentas de BI devem suportar
a exploração de dados, bem como os relatórios.
O BI pode evoluir rapidamente à medida que os analistas utilizam os dados.
Sua atenção, pois um programa de análise de dados utilizando BI deve se orientar por processos
confiáveis, tais como:
 Manter e aprimorar os dados estratégicos utilizados nos relatórios de BI e permitir a
incorporação de novos dados.
 Manter e aprimorar o conjunto de ferramentas de BI.
 Gerenciar metadados relacionados aos relatórios de BI, para que as partes interessadas
entendam os próprios relatórios.
 Documentar a linhagem de dados para as partes interessadas.
 Fornecer um ciclo de feedback da qualidade dos dados para que permaneçam confiáveis e
sejam identificadas oportunidades para aprimorá-los.
Em resumo, o gerenciamento dos dados criados por um programa de BI segue as etapas de
gerenciamento do ciclo de vida que fazem parte do gerenciamento de dados.
4.3. Ciência de dados
A ciência de dados existe há muito tempo. Costumava ser chamado de estatística aplicada. Mas a
capacidade de explorar padrões de dados evoluiu rapidamente no século XXI com o advento das
tecnologias de coleta e armazenamento de Big Data.
A ciência de dados mescla mineração de dados, análise estatística e aprendizado de máquina com
recursos de integração e modelagem de dados para se criar modelos preditivos que exploram padrões
de conteúdo de dados. O termo ciência de dados refere-se ao processo de desenvolvimento de
modelos preditivos. O analista de dados (ou cientista de dados) usa o método científico (observação,
hipótese, experimentação, análise e conclusão) para desenvolver e avaliar um modelo analítico ou
preditivo.
O cientista de dados desenvolve uma hipótese sobre o comportamento que pode ser observado nos
dados antes de uma ação específica. Por exemplo, a compra de um tipo de item geralmente é seguida
pela compra de outro tipo de item (a compra de uma casa geralmente é seguida pela compra de
móveis). Em seguida, o cientista de dados analisa grandes quantidades de dados históricos para
determinar com que frequência a hipótese foi verdadeira no passado e para verificar estatisticamente a
precisão provável do modelo.
Se uma hipótese é válida com frequência suficiente e se o comportamento previsto é útil, o modelo
pode se tornar a base de um processo de inteligência operacional para prever o comportamento futuro,
possivelmente até mesmo em tempo real.
De certa forma, a ciência de dados pode ser entendida como uma extensão do BI. De outras formas,
no entanto, leva a análise de dados e o uso a um nível muito diferente. O Business
Intelligence tradicional fornece relatórios do 'espelho retrovisor' - análise de dados estruturados para
descrever tendências passadas. Em alguns casos, os padrões de BI são utilizados para prever o
comportamento futuro, mas com ausência de precisão confiável.
4.4. Análise preditiva e prescritiva
Grande parte da ciência de dados está focada no desejo de criar modelos preditivos, embora nem
todos que criam e utilizam esses modelos sejam cientistas de dados. A forma mais simples de modelo
preditivo é a previsão.
O Predictive Analytics é o subcampo do aprendizado de máquina supervisionado, enraizado nas
estatísticas em que os usuários tentam modelar elementos de dados e prever resultados futuros por
meio da avaliação de estimativas de probabilidade.
O Predictive Analytics utiliza modelos de probabilidade com base em variáveis (incluindo dados
históricos) relacionadas a possíveis eventos. Quando recebe outras informações, o modelo
desencadeia uma reação da organização.
O fator desencadeante pode ser um evento como um feed de notícias ou dados de sensores de
utilidade ou um aumento no volume de solicitações de serviço. O fator de disparo pode ser um evento
externo. As notícias relatadas sobre uma organização podem servir como um preditor de uma
mudança no preço das ações. A previsão do movimento das ações deve incluir o monitoramento de
notícias e determinar se as notícias sobre uma organização provavelmente serão boas ou ruins para o
preço das ações.
Frequentemente, o fator desencadeante é o acúmulo de um grande volume de dados em tempo real
como um número extremamente alto de negociações ou solicitações de serviço ou volatilidade do
ambiente. O monitoramento de um fluxo de eventos de dados inclui a criação incremental dos modelos
preenchidos até que seja atingido um limite que ativa o acionador.
A quantidade de tempo que um modelo preditivo fornece entre a previsão e o evento previsto é
frequentemente muito pequena (em segundos ou menos). O investimento em soluções de tecnologia
de latência muito baixa como bancos de dados em memória, redes de alta velocidade e até
proximidade física da fonte dos dados, otimiza a capacidade da organização de reagir à previsão.
A análise prescritiva leva a análise preditiva um passo adiante para definir ações que afetarão os
resultados, em vez de apenas prever os resultados das ações que ocorreram.
A análise prescritiva antecipa o que acontecerá, quando acontecerá e implica por que isso acontecerá.
Como a análise prescritiva pode mostrar as implicações de várias decisões, pode sugerir como
aproveitar uma oportunidade ou evitar um risco. A análise prescritiva pode captar continuamente novos
dados para re-prever e re-prescrever. Esse processo pode melhorar a precisão da previsão e resultar
em melhores prescrições. A tabela a seguir resume a relação entre BI tradicional e ciência de dados.
A tabela abaixo, revela a Progressão analítica.
Data Werehouse / BI
Tradicional
Ciência de Dados / Análise
Preditiva
Ciência de Dados / Análise Prescritiva
Retrospectiva Percepção Predição
Baseado no histórico:
O que aconteceu?
Por que isso aconteceu?
Com base em modelos
preditivos:
O que é provável que
aconteça?
Com base em cenários:
O que devemos fazer para que as coisas
aconteçam?
Descritivo Preditivo Prescritivo
Até recentemente, a análise aprofundada de enormes conjuntos de dados era limitada pela tecnologia.
As análises basearam-se em amostragem ou outros meios de abstração para aproximar padrões. À
medida que cresce a capacidade de coletar e analisar grandes conjuntos de dados, os cientistas de
dados estão integrando métodos de matemática, estatística, ciência da computação, processamento
de sinais, modelagem de probabilidade, reconhecimento de padrões, aprendizado de máquina,
modelagem de incertezas e visualização de dados para obter insights e prever comportamentos com
base em conjuntos de Big Data.
Em suma, a ciência de dados encontrou novas maneiras de analisar e extrair conhecimento dos
dados. Em muitos casos, esse conhecimento pode ser traduzido em valor econômico.
Como o Big Data foi introduzido nos ambientes de data warehouse e BI, as técnicas de ciência de
dados podem fornecer uma visão prospectiva ('para-brisa') da organização. Recursos preditivos, em
tempo real e baseados em modelo, usando diferentes tipos de fontes de dados, oferecem às
organizações uma melhor visão para onde estão caminhando.
Os modelos de ciência de dados se tornam fontes de dados. Eles precisam ser monitorados e
explorados para obter informações. Como outras formas de ciência, a ciência de dados cria novos
conhecimentos e também novas hipóteses. Testar hipóteses resulta em novos modelos e novos
dados. Todas essas peças requerem gerenciamento para criar valor ao longo do tempo. Os modelos
precisam ser 'treinados' e avaliados. Novas fontes de dados podem ser incorporadas aos modelos
existentes. O ciclo de vida dos dados deve compor os esforços de ciência de dados que precisa ser
contabilizado como parte do planejamento e da estratégia.
Os modelos de ciência de dados que contêm lógica (algoritmos) para processar dados e fazer
previsões a partir deles, não são a mesma coisa que os modelos de dados descritos no tópico
“Habilitando e Mantendo Dados” que documentam a estrutura dos dados e os relacionamentos entre
entidades e atributos de dados.
4.5. Visualização de dados
Visualização é o processo de interpretação de conceitos, ideias e fatos usando figuras ou
representações gráficas. A visualização de dados facilita a compreensão dos dados subjacentes,
resumindo-os em uma forma visual, como um gráfico. As visualizações de dados condensam e
encapsulam dados de características, facilitando sua visualização. Dessa forma podem revelar
oportunidades, identificar riscos ou destacar novas análises.
A visualização tem sido fundamental para a análise de dados. As ferramentas tradicionais
de BI incluem opções de visualização, como tabelas, gráficos de diversos modelos, histogramas,
dentre outras formas.
Os princípios nesses exemplos simples são estendidos significativamente em aplicações de ciência de
dados. A visualização de dados é fundamental para a ciência de dados porque, sem ela, a
interpretação dos dados é quase impossível. Padrões em um grande conjunto de dados podem ser
difíceis, se não impossíveis, de reconhecer em uma exibição de números. Um padrão pode ser
capturado rapidamente, quando milhares de pontos de dados são apresentados em uma exibição
visual.
As visualizações de dados podem ser entregues em um formato estático, como um relatório publicado
ou em um formato online mais interativo. Algumas tecnologias de visualização permitem que os
analistas se movam entre as camadas de dados, por meio de filtros ou a capacidade de 'aprofundar' os
dados. Outros permitem que a visualização seja alterada pelo usuário sob demanda por meio de
displays inovadores, como mapas de dados e paisagens em movimento de dados ao longo do tempo.
Para atender à crescente necessidade de entender dados, o número de ferramentas de visualização
aumentou e as técnicas melhoraram.
À medida que a análise de dados amadurece, a visualização apresenta novas maneiras de exibição
oferecendo vantagens estratégicas. Ver novos padrões nos dados pode resultar em novas
oportunidades de negócios.
À medida que a visualização de dados continua a evoluir, as organizações terão que aumentar suas
equipes de Business Intelligence para competir em um mundo cada vez mais orientado a dados. Os
departamentos de análise de negócios buscarão especialistas em dados com habilidades de
visualização (incluindo cientistas de dados, artistas de dados e especialistas em visão de dados), além
de arquitetos e modeladores de informações tradicionais, especialmente devido aos riscos associados
à visualização enganosa.
Um fator crítico de sucesso na implementação de uma abordagem de ciência de dados é o
alinhamento das ferramentas de visualização apropriadas à comunidade de usuários. Dependendo do
tamanho e da natureza da organização, é provável que muitas ferramentas de visualização diferentes
sejam aplicadas em uma variedade de processos.
Certifique-se de que os usuários entendam a complexidade relativa das ferramentas de visualização.
Usuários sofisticados terão demandas cada vez mais complexas. A coordenação entre as equipes de
arquitetura corporativa, gerenciamento de portfólio e manutenção será necessária para controlar os
canais de visualização dentro e por meio do portfólio. Esteja ciente de que a mudança de provedores
de dados ou critérios de seleção provavelmente terá impactos a jusante nos elementos disponíveis
para visualização que podem afetar a eficácia das ferramentas.
É uma prática recomendada estabelecer uma comunidade que defina e publique padrões e diretrizes
de visualização e revise artefatos dentro de um método de entrega especificado; isso é particularmente
vital para o conteúdo voltado para clientes e regulamentações.
Assim como outros usos dos dados, a visualização de dados cria novos conjuntos de dados, na forma
das próprias visualizações e nos métodos pelos quais os dados são combinados para que possam ser
apresentados em um formato gráfico. Você adivinhou!!! Esses dados também devem ser gerenciados.
A visualização de dados é um campo em evolução, mas os princípios que o guiam se baseiam nos
princípios de design. Ver Tufte (2001) e McCandless (2012). Existem vários recursos baseados na
Web com exemplos e exemplos contrários. Consulte a Tabela Periódica de Métodos de Visualização
em Visual Literacy.Org https://bit.ly/IX1bvI.
4.6. Monetização de dados
É provável que qualquer organização envolvida na Data Science ou outras formas de análise obtenha
informações valiosas sobre seus próprios clientes, produtos, serviços e processos. A análise avançada
também pode gerar informações sobre entidades externas.
É possível que essa organização desenvolva técnicas que possam ser valiosas para outras pessoas.
Se essas ideias e técnicas puderem ser empacotadas e vendidas, uma organização estaria
aproveitando seus dados não apenas como um ativo, mas como um produto. Em alguns círculos, a
monetização direta de dados é percebida como o santo graal do gerenciamento de dados. Algumas
organizações (Dun & Bradstreet, Google, Amazon) fizeram um negócio de monetizar seus dados. Mas
vender dados e informações não é a única maneira de obter valor dos ativos de dados.
Em Monetizing Data Management, Peter Aiken e Juanita Billings apontam que poucas organizações
exploram a vantagem estratégica que podem obter com os dados, “o único ativo estratégico não
esgotável, não degradante, durável e duradouro da organização”. Eles argumentam que melhorar as
práticas de gerenciamento de dados é o primeiro meio de obter mais valor dos dados. Uma
organização que coloca um valor monetário em práticas eficazes de gerenciamento de dados
produzirá dados de maior qualidade e poderá fazer mais com eles.
Aiken e Billings afirmam que boas práticas de gerenciamento de dados também são a base para a
inovação bem-sucedida do uso de dados. As práticas precárias de gerenciamento de dados, por outro
lado, custam dinheiro e introduzem riscos em novas iniciativas e processos existentes.
Esses autores apresentam estudos de caso que documentam que más práticas de gerenciamento de
dados podem resultar em desperdício direto por meio de trabalho redundante e, com ele, a criação de
dados redundantes, metadados ruins ou ausentes, processos confusos e informações incorretas.
Eles também fornecem exemplos dos benefícios de práticas disciplinadas de gerenciamento de dados.
Por exemplo, práticas claras e executáveis de gerenciamento de metadados aumentam o
conhecimento organizacional e tornam esse conhecimento transferível.
Infonomics, de Douglas Laney, um estudo completo sobre gerenciamento de informações como um
ativo, apresenta uma ampla variedade de estudos de caso que demonstram como as organizações
aproveitaram seus ativos de informações para criar valor. Enquanto as indústrias, atividades e
produtos diferem, o valor econômico derivado dos dados se resume a dois métodos básicos:
 Troca de informações por bens, serviços ou dinheiro.
 Usando informações para aumentar a receita, reduzir despesas e gerenciar riscos.
Laney apresenta 12 (doze) drivers (direcionadores) de negócio para monetizar dados. Uma das
primeiras maneiras de obter valor é usar os dados organizacionais com mais eficiência para reter
clientes existentes, entrar em novos mercados e criar novos produtos. Mas Laney vai além do óbvio.
Por exemplo, dados melhores podem melhorar a eficiência organizacional, permitindo que uma
organização reduza os custos de manutenção, negocie melhores termos e condições, detecte fraudes
e desperdícios ou pague os custos de gerenciamento de dados.
Para alguns, como mostram os estudos de caso de Aiken e Billings e Laney e outras pesquisas
confirmam, dados de baixa qualidade são um passivo significativo. Outros, no entanto, conseguiram
avançar, com melhorias operacionais e monetização direta. Os estudos de caso mostram que o uso
inovador de dados requer gerenciamento confiável de dados. Embora nem toda organização almeje
vender seus dados, todas as organizações vislumbram ter confiança nas decisões com base em seus
dados. O primeiro passo nessa direção é gerenciar bem os dados.
Lição módulo 4
1. Gerenciamento de metadados
Como princípio, os metadados são essenciais para o gerenciamento de dados.
Em outras palavras, você precisa de dados para gerenciar dados. Os metadados descrevem quais
dados você possui e, se não souber isso, não poderá gerenciá-los. O gerenciamento de metadados é
uma atividade fundamental que precisa ser realizada durante todo o ciclo de vida dos dados. O ciclo de
vida dos metadados também precisa ser gerenciado.
A definição mais comum de metadados – "dados sobre dados" – é aparentemente simples. Para
alguns, infelizmente, é uma fonte de confusão e não de esclarecimento, porque muitos tipos de
informações podem ser classificados como metadados e não existe uma linha clara entre "dados" e
"metadados". Em vez de tentar traçar essa linha, descreveremos como os metadados são usados e
por que são tão importantes.
Para entender o papel vital dos metadados no gerenciamento de dados, imagine uma grande
biblioteca, com centenas de milhares de livros e revistas, mas sem catálogo. Sem um catálogo, os
leitores podem nem saber como começar a procurar um livro específico ou mesmo um tópico
específico.
O catálogo não apenas fornece as informações necessárias (quais livros e materiais a biblioteca
possui e onde estão guardadas), mas também permite que os clientes encontrem materiais usando
diferentes pontos de partida (área de assunto, autor ou título). Sem o catálogo, encontrar um livro
específico seria difícil, se não impossível. Uma organização sem metadados é como uma biblioteca
sem um catálogo.
Como outros dados, os metadados requerem gerenciamento. À medida que a capacidade das
organizações de coletar e armazenar dados aumenta, o papel dos metadados no gerenciamento de
dados cresce em importância. O gerenciamento de metadados, no entanto, não é um fim em si; é um
meio pelo qual uma organização pode obter mais valor com seus dados. Para ser guiada por dados,
uma organização deve ser guiada por metadados.
1.1 Metadados e seus benefícios
No gerenciamento de dados, os metadados incluem informações sobre processos técnicos e de
negócio, regras e restrições de dados e estruturas de dados lógicas e físicas. Ele descreve os próprios
dados (por exemplo, bancos de dados, elementos de dados, modelos de dados), os conceitos que os
dados representam (por exemplo, processos de negócios, sistemas de aplicativos, código de software,
infraestrutura de tecnologia) e as conexões (relacionamentos) entre os dados e os conceitos.
Os metadados auxiliam uma organização a entender seus dados, sistemas e fluxos de trabalho. Ele
permite a avaliação da qualidade dos dados e faz parte do gerenciamento de bancos de dados e
outros aplicativos. Contribui para a capacidade de processar, manter, integrar, proteger, auditar e
governar outros dados.
Os dados não podem ser gerenciados sem os metadados. Além disso, os próprios metadados devem
ser gerenciados.
Atenção, metadados confiáveis e bem gerenciados ajudam a:
 Aumentar a confiança nos dados, fornecendo contexto, permitindo a representação consistente
dos mesmos conceitos e a medição da qualidade dos dados.
 Ampliar o valor das informações estratégicas (por exemplo, dados mestre), possibilitando
vários usos.
 Identificar dados e processos redundantes e assim melhorar a eficiência operacional.
 Impedir o uso de dados desatualizados ou incorretos.
 Proteger informações confidenciais.
 Reduzir o tempo de pesquisa orientada a dados.
 Aperfeiçoar a comunicação entre consumidores de dados e profissionais de TI.
 Criar análise de impacto precisa, reduzindo assim o risco de falha do projeto.
 Melhorar o tempo de implementação, reduzindo o tempo do ciclo de vida do desenvolvimento
do sistema.
 Reduzir os custos de treinamento e diminuir o impacto da rotatividade de pessoal por meio de
documentação completa do contexto, histórico e origem dos dados.
 Dar suporte à conformidade regulamentar.
As organizações obtêm mais valor de seus ativos de dados se os dados forem de alta qualidade. Os
dados de qualidade dependem da governança. Como explicam os dados e processos que permitem
que as organizações funcionem, os metadados são críticos para a governança de dados. Se os
metadados são um guia para os dados em uma organização, eles devem ser bem gerenciados.
Convém atenção também ao fato que Metadados mal gerenciados levam a:
 Dados redundantes e processos de gerenciamento de dados.
 Dicionários, repositórios e outros armazenamentos de metadados replicados e redundantes.
 Definições inconsistentes de elementos de dados e riscos associados ao uso indevido de
dados.
 Origens e versões concorrentes e conflitantes dos metadados que reduzem a confiança dos
consumidores de dados.
 Dúvida sobre a confiabilidade de metadados e dados.
O gerenciamento bem executado de metadados permite um entendimento consistente dos recursos de
dados e um desenvolvimento Interorganizacional mais eficiente.
1.2 Tipos de metadados
Os metadados são geralmente classificados em três tipos: estratégico, técnico ou operacional.
Os metadados de negócio se concentram amplamente no conteúdo e na condição dos dados e
também incluem detalhes relacionados à governança de dados.
Os metadados incluem nomes e definições não técnicos de conceitos, áreas de assunto, entidades e
atributos; tipos de dados de atributo e outras propriedades de atributo; descrições de faixa; cálculos;
algoritmos e regras de negócios; valores de domínio válidos e suas definições.
Seguem exemplos de metadados de negócios:
 Modelos de dados, definições e descrições de conjuntos de dados, tabelas e colunas.
 Regras de negócios, regras de qualidade de dados e regras de transformação, cálculos e
derivações.
 Origem e linhagem dos dados.
 Padrões e restrições de dados.
 Nível de segurança / privacidade dos dados.
 Problemas conhecidos com dados.
 Notas de uso de dados.
Os metadados técnicos fornecem informações sobre os detalhes técnicos dos dados, os sistemas que
armazenam dados e os processos que os movem dentro e entre sistemas.
São exemplos de metadados técnicos:
 Nomes e propriedades da tabela e da coluna do banco de dados físico.
 Direitos de acesso a dados, grupos, funções.
 Regras de CRUD de dados (Criar, Substituir, Atualizar e Excluir).
 Detalhes do trabalho ETL de dados (Extração, Transformação e Carregamento).
 Documentação da linhagem de dados, incluindo informações de impacto de alterações a
montante e a jusante.
 Agendas e dependências do ciclo de atualização de conteúdo.
Atenção, metadados operacionais descrevem detalhes do processamento e acesso aos dados, como:
 Logs de execução de tarefas para programas em lote.
 Resultados de auditoria, balanceamento, medidas de controle e registros de erros.
 Relatórios e padrões de acesso à consulta, frequência e tempo de execução.
 Patches e plano e execução de manutenção de versão, nível de patch atual.
 Provisões de backup, retenção, data de criação, recuperação de desastres.
Essas categorias auxiliam as pessoas a entender o conjunto de informações que se enquadram nos
metadados, bem como as funções que produzem metadados. No entanto, as categorias também
podem levar a confusão. As pessoas podem ser envolvidas em perguntas sobre a qual categoria um
conjunto de metadados pertence ou quem deve usá-lo.
É melhor pensar nessas categorias em relação à origem dos metadados, e não como eles são usados.
Em relação ao uso, as distinções entre os tipos de metadados não são rigorosas. Determinada equipe
pode utilizar metadados técnicos e/ou operacionais, conforme o tipo de demanda a ser atendida.
1.3 Metadados são dados
Embora os metadados possam ser entendidos por meio de seus usos e categorias, é importante
destacar que os metadados são dados. Como outros dados, ele tem um ciclo de vida. Devemos
gerenciá-lo em relação ao seu ciclo de vida.
Uma organização deve planejar os metadados de que precisa, projetar processos para que os
metadados de alta qualidade possam ser criados e mantidos e aumentar seus metadados à medida
que aprende com seus dados.
1.4 Metadados e gerenciamento de dados
Os metadados são essenciais para o gerenciamento de dados e o uso de dados. Todas as grandes
organizações produzem e utilizam muitos dados. Em uma organização, indivíduos diferentes terão
níveis diferentes de conhecimento de dados, mas nenhum indivíduo saberá tudo sobre os dados.
Essas informações devem ser documentadas ou a organização corre o risco de perder um
conhecimento valioso sobre si mesma. Os metadados fornecem o principal meio de capturar e
gerenciar o conhecimento organizacional sobre dados.
O gerenciamento de metadados, entretanto, não é apenas um desafio de gerenciamento de
conhecimento, é também uma necessidade de gerenciamento de riscos. Os metadados são
necessários para garantir que uma organização possa identificar dados particulares ou confidenciais e
que possa gerenciar o ciclo de vida dos dados para seu próprio benefício e para atender aos requisitos
de conformidade e minimizar a exposição ao risco.
Sem metadados confiáveis, uma organização não sabe quais dados possui, o que representa, onde se
origina, como transita pelos sistemas, quem tem acesso a eles ou o que significa, quais dados são de
alta qualidade. Sem os metadados, uma organização não pode gerenciar seus dados como um ativo.
De fato, sem os metadados, uma organização pode não ser capaz de gerenciar seus dados.
Na imagem a seguir, conheça o ciclo de vida dos metadados:
Planejar – definir requisitos de metadados
Projetar e habilitar – identificar oportunidades para criar e gerenciar metadados como parte de
gerenciamento de dados em andamento.
Criar e obter – verificar como os metadados são criados e quais os requisitos de qualidade.
Armazenar e manter – verificar se os metadados permanecem e continuam a atender aos requisitos.
Utilizar – utilizar os metadados para obter valor dos dados. Habilitar um loop de feedback para melhorar a
qualidade dos metadados.
Aprimorar – evolua os metadados com os novos conhecimentos. Implemente novos requisitos de
metadados.
Descartar – limpar ou excluir os metadados obsoletos.
1.5 Metadados e interoperabilidade
À medida que a tecnologia evoluiu, a velocidade na qual os dados são gerados também aumentou.
Os metadados técnicos tornaram-se absolutamente essenciais para a maneira como os dados são
movidos e integrados. O Padrão de Registro de Metadados da ISO, ISO/IEC 11179, visa permitir a
troca de dados orientada por metadados em um ambiente heterogêneo, com base em definições
exatas de dados.
Os metadados presentes no XML e em outros formatos permitem o uso dos dados. Outros tipos de
marcação de metadados permitem que os dados sejam trocados, mantendo os significantes de
propriedade, requisitos de segurança, etc.
Saiba Mais sobre o Padrão de Registro de Metadados da ISO/IEC 11179:
Padrão de Registro de Metadados ISO/IEC 11179
O Padrão de Registro de Metadados da ISO, ISO/IEC 11179 fornece uma estrutura para definir um
registro de Metadados.
Este padrão foi projetado para permitir a troca de dados orientada por metadados, com base em
definições exatas de dados, começando com elementos de dados. O padrão está estruturado em seis
partes:
Parte 1: Estrutura para geração e padronização de elementos de dados.
Parte 2: Fornece um modelo conceitual para gerenciar esquemas de classificação.
Parte 3: Atributos básicos dos elementos de dados.
Parte 4: Regras e diretrizes para a formulação de definições de dados.
Parte 5: Princípios de nomeação e identificação para elementos de dados.
Parte 6: Registro de elementos de dados.
Mais informações: http://metadata-standards.org/11179/.
1.6 Estratégia de metadados
Conforme você já percebeu, os tipos de informações que podem ser usados como metadados são
amplos. Os metadados são criados em vários setores da organização. Os desafios vêm com a união
de metadados para que pessoas e processos possam utilizá-los.
Uma estratégia de metadados descreve como uma organização pretende gerenciá-los e como ela
passará do estado atual para as práticas avançadas e inovadoras (estado futuro).
Uma estratégia de metadados deve fornecer uma estrutura para as equipes de desenvolvimento
melhorarem o gerenciamento de metadados. O desenvolvimento de requisitos de metadados ajudará a
esclarecer os direcionadores da estratégia e a identificar possíveis obstáculos à sua implementação.
A estratégia inclui definir o conteúdo e a arquitetura de metadados da situação atual e a ser alcançada
pela organização, bem como as fases de implementação necessárias para atender aos objetivos
estratégicos.
Os passos para a estratégia de metadados incluem:
Iniciar o planejamento da estratégia de metadados
O objetivo do início e do planejamento é permitir que a equipe de estratégia de metadados defina suas
metas de curto e longo prazo. O planejamento inclui a elaboração de uma carta, escopo e objetivos
alinhados aos esforços gerais de governança e o estabelecimento de um plano de comunicação para
apoiar o esforço. As principais partes interessadas devem estar envolvidas no planejamento.
Realizar entrevistas com as principais partes interessadas
As entrevistas com as partes interessadas técnicas e de negócios fornecem uma base de
conhecimento para a estratégia de Metadados.
Avaliar fontes de metadados existentes e arquitetura da informação
A avaliação determina o grau relativo de dificuldade na solução dos problemas de metadados e
sistemas identificados nas entrevistas e na revisão da documentação. Durante esse estágio, realize
entrevistas detalhadas da equipe principal de TI e revise a documentação das arquiteturas do sistema,
modelos de dados, etc.
Desenvolver a arquitetura futura de metadados
Refine e confirme a visão futura e desenvolva a arquitetura de destino de longo prazo para o ambiente
de metadados gerenciados neste estágio. Essa fase deve levar em consideração componentes
estratégicos, como estrutura organizacional, alinhamento com administração e administração de
dados, arquitetura de metadados gerenciados, arquitetura de entrega de metadados, arquitetura
técnica e arquitetura de segurança.
Desenvolver plano de implementação em fases
Valide, integre e priorize os resultados das entrevistas e análises de dados. Documente a estratégia de
metadados e defina uma abordagem de implementação em fases para passar do ambiente de
metadados gerenciado existente para o futuro.
A estratégia evoluirá com o tempo, à medida que os requisitos de metadados, a arquitetura e o ciclo de
vida dos metadados forem mais bem compreendidos.
1.7 Entender os requisitos de metadados
Os requisitos de metadados começam com o conteúdo: quais metadados são necessários e em que
nível. Por exemplo, nomes físicos e lógicos precisam ser capturados para colunas e tabelas. O
conteúdo de metadados é amplo e os requisitos virão dos consumidores de dados estratégicos a
técnicos.
Existem ainda diversos requisitos focados na funcionalidade associados a uma solução abrangente de
metadados. São eles:
 Frequência com a qual os atributos e conjuntos de metadados serão atualizados.
 Tempo das atualizações em relação às alterações de origem.
 Se as versões históricas dos metadados precisam ser mantidas.
 Quem pode acessar os metadados.
 Como os usuários acessam (funcionalidade específica da interface do usuário para acessar).
 Como os metadados serão modelados para armazenamento.
 O grau de integração de metadados de diferentes fontes; regras para integração.
 Processos e regras para atualização de metadados (registro e referência para aprovação).
 Funções e responsabilidades para gerenciar metadados.
 Requisitos de qualidade de metadados.
 Segurança para metadados - alguns metadados não podem ser expostos porque revelam a
existência de dados altamente protegidos).
1.8 Arquitetura de Metadados
Como outras formas de dados, os metadados têm um ciclo de vida.
Embora existam maneiras diferentes de arquitetar uma solução de metadados, conceitualmente todas
as soluções de gerenciamento de metadados incluem camadas de arquiteturas que correspondem a
pontos no ciclo de vida dos metadados. São elas:
 Criação e fornecimento de metadados.
 Armazenamento de metadados em um ou mais repositórios.
 Integração de metadados.
 Entrega de metadados.
 Acesso e uso de metadados.
 Controle e gerenciamento de metadados.
Um sistema de gerenciamento de metadados deve ser capaz de reunir metadados de várias fontes
diferentes. Os sistemas diferem dependendo do grau de integração e do papel do sistema de
integração na manutenção dos metadados.
Um ambiente de metadados gerenciados deve isolar o usuário final das várias e diferentes fontes de
metadados. A arquitetura deve fornecer um único ponto de acesso para os metadados necessários. O
design da arquitetura depende dos requisitos específicos da organização.
Conheça a seguir, as três abordagens arquiteturais técnicas para a construção de um repositório
comum de metadados refletem as abordagens para projetar data warehouses:
 Centralizada
Uma arquitetura centralizada consiste em um único repositório de metadados que contém cópias dos
metadados das várias fontes. As organizações com recursos limitados de TI, ou aquelas que procuram
automatizar o máximo possível, podem optar por evitar essa opção de arquitetura. As organizações
que buscam um alto grau de consistência no repositório comum de metadados podem se beneficiar de
uma arquitetura centralizada.
 Distribuída
Uma arquitetura completamente distribuída mantém um único ponto de acesso. O mecanismo de
recuperação de metadados responde às solicitações do usuário, recuperando dados dos sistemas de
origem em tempo real; não há repositório persistente.
Nessa arquitetura, o ambiente de gerenciamento de metadados mantém os catálogos do sistema de
origem e as informações de pesquisa necessárias para processar efetivamente as consultas e
pesquisas do usuário.
Um broker de solicitação de objeto comum ou protocolo de middleware semelhante acessa esses
sistemas de origem.
 Híbrida
Uma arquitetura híbrida combina características de arquiteturas centralizadas e distribuídas. Os
metadados ainda transitam diretamente dos sistemas de origem para um repositório centralizado. No
entanto, o design do repositório considera apenas os metadados adicionados pelo usuário, os itens
padronizados críticos e as adições de fontes manuais.
Implementar um ambiente de metadados gerenciados de forma incremental visa minimizar riscos e
facilitar a aceitação.
O conteúdo do repositório deve ser genérico no design. Não deve meramente refletir os projetos de
banco de dados do sistema de origem.
Os especialistas da área empresarial devem ajudar a criar um modelo abrangente de metadados para
o conteúdo. O planejamento deve considerar a integração de metadados para que os consumidores de
dados possam ver em diferentes fontes de dados. A capacidade de fazer isso será um dos principais
recursos estratégicos do repositório. Ele deve abrigar versões atuais, planejadas e históricas dos
metadados.
Frequentemente, a primeira implementação é um piloto para provar conceitos e aprender sobre o
gerenciamento do ambiente de metadados.
1.9 Qualidade de metadados
Ao gerenciar a qualidade dos metadados é importante reconhecer que diversos metadados se
originam por meio dos processos existentes. Por exemplo, o processo de modelagem de dados produz
definições de tabela e coluna e outros metadados essenciais para a criação de modelos de dados.
Para obter metadados de alta qualidade, os metadados devem ser vistos como um produto desses
processos e não como um subproduto deles.
Novamente, os metadados seguem o ciclo de vida dos dados. Os metadados confiáveis começam com
um plano e aumentam o valor à medida que são usados, mantidos e aprimorados. As fontes de
metadados, como o modelo de dados, a documentação de mapeamento de origem para o destino, os
logs de ETL e similares devem ser tratadas como fontes de dados. Eles devem implementar processos
e controles para garantir que produzam um produto de dados confiável e utilizável.
Todos os processos, sistemas e dados precisam de algum nível de meta-informação; isto é, uma
descrição de suas partes componentes e como elas funcionam. Além disso, à medida que o processo,
sistema ou dados são usados, as meta-informações crescem e mudam. Com isso, o sistema precisa
ser mantido e aprimorado.
O uso de metadados geralmente resulta no reconhecimento de requisitos para metadados adicionais.
Por exemplo, os consumidores que utilizam dados de usuários de dois sistemas diferentes podem
precisar saber de onde os dados foram originados para entender melhor o perfil dos usuários.
Alguns princípios gerais do gerenciamento de metadados descrevem os meios para gerenciar sua
qualidade, são eles:
 Responsabilidade: Reconhecer que os metadados geralmente são produzidos por meio de
processos existentes (modelagem de dados, SDLC (systems development life cycle), definição
de processos de negócios) e responsabilizar os proprietários dos processos pela qualidade dos
metadados (tanto na criação inicial quanto na manutenção).
 Padrões: Definir, impor e auditar os padrões dos metadados para simplificar a integração e
permitir o uso.
 Melhorar: Criar um mecanismo de feedback para que os consumidores possam informar a
equipe de Gerenciamento de Metadados de que estão incorretos ou desatualizados.
Como outros dados, os metadados podem ser perfilados e inspecionados quanto à qualidade. Sua
manutenção deve ser agendada ou concluída como uma parte auditável do trabalho do projeto.
1.10 Governança de Metadados
Mudar de um ambiente de metadados não gerenciado para um gerenciado exige trabalho e disciplina.
Não é fácil, mesmo que a maioria das pessoas reconheça o valor de metadados confiáveis. A
prontidão organizacional é uma grande preocupação, assim como os métodos de governança e
controle. Uma abordagem abrangente de metadados exige que a equipe de negócios e a de tecnologia
possam trabalhar em conjunto de maneira multifuncional.
O gerenciamento de metadados é de baixa prioridade em muitas organizações.
Um conjunto essencial de metadados precisa de coordenação e compromisso. Do ponto de vista do
gerenciamento de dados, os metadados essenciais dos negócios incluem definições, modelos e
arquitetura de dados. Os metadados técnicos essenciais incluem descrições técnicas de arquivos e
conjuntos de dados, nomes de tarefas, agendas de processamento etc.
As organizações devem determinar seus requisitos específicos para o gerenciamento do ciclo de vida
de metadados críticos e estabelecer processos de governança para permitir esses requisitos.
Recomenda-se atribuir funções e responsabilidades formais a recursos dedicados, especialmente em
áreas grandes ou críticas aos negócios. A governança de metadados requer metadados e controles,
para que a equipe encarregada de gerenciar os metadados possa testar os princípios nos metadados
criados e utilizados.
2. Gerenciamento de qualidade de dados
O gerenciamento eficaz de dados envolve um conjunto de processos inter-relacionados que permitem
a organização utilizar seus dados para atingir objetivos estratégicos. O gerenciamento de dados inclui
a capacidade de projetar dados para desenvolver aplicações, armazená-los e acessá-los com
segurança, compartilhá-los adequadamente e aprender com eles para atender aos objetivos
estratégicos e operacionais.
Atenção, as organizações que almejam obter valor com seus dados precisam saber se eles são
confiáveis. Em outras palavras, se os dados são de alta qualidade. Entretanto, vários fatores podem
prejudicar a qualidade dos dados, tais como:
 Falta de entendimento sobre os efeitos de dados de baixa qualidade no sucesso
organizacional.
 Planejamento ruim ou insuficiente.
 Projeto isolado de processos e sistemas (silos).
 Processos de desenvolvimento técnico inconsistentes.
 Documentação incompleta e metadados.
 Falta de padrões e governança.
Uma parcela das organizações não prioriza definir o que torna os dados adequados ao objetivo
estratégico e, consequentemente, não têm compromisso com a qualidade dos dados.
Todas as disciplinas de gerenciamento de dados contribuem para a qualidade dos dados. Como as
decisões ou ações desinformadas de qualquer pessoa que interaja com dados podem resultar em
dados de baixa qualidade, a produção de dados de alta qualidade requer comprometimento e
coordenação multifuncionais.
As organizações e as equipes devem estar cientes disso e planejar dados de alta qualidade,
executando processos e projetos de maneira a responder pelos riscos relacionados a condições
inesperadas ou inaceitáveis nos dados.
Como nenhuma organização possui processos técnicos perfeitos ou práticas perfeitas de
gerenciamento de dados, todas as organizações enfrentam problemas relacionados à qualidade de
seus dados. Esses problemas podem gerar prejuízos elevados. As organizações que gerenciam
formalmente a qualidade dos dados têm menos problemas em relação aquelas que não priorizam a
qualidade dos dados.
A qualidade dos dados está se tornando uma necessidade estratégica. A capacidade de demonstrar
que os dados são de alta qualidade, como a capacidade de demonstrar que os dados foram protegidos
adequadamente, é exigida por alguns regulamentos. Os parceiros de negócios e os usuários
(consumidores de dados) esperam que os dados sejam confiáveis. Uma organização que pode
mostrar que gerencia bem seus dados obtém uma vantagem competitiva.
O objetivo deste tópico é definir os principais conceitos relacionados à qualidade dos dados e discutir o
gerenciamento da qualidade em relação a governança de dados.
2.1 Qualidade dos dados
O termo qualidade dos dados é usado para se referir às características associada aos dados de alta
qualidade e aos processos utilizados para medir ou melhorar essa qualidade. Nesse sentido,
começaremos a observar o significado de dados de alta qualidade e, logo após, será examinada a
definição de gerenciamento da qualidade dos dados.
Os dados são de alta qualidade, na medida em que atendem às expectativas e necessidades dos
consumidores de dados. Quando este proposito não for atendido ou parcialmente atendido, podemos
avaliar como dados de baixa qualidade. A qualidade dos dados depende, portanto, do contexto e das
necessidades dos consumidores de dados.
Um dos desafios no gerenciamento da qualidade dos dados é que as expectativas relacionadas à
qualidade nem sempre são conhecidas ou mensuradas. Os profissionais que gerenciam dados nem
sempre fazem levantamento sobre esses requisitos e, tampouco, inexiste uma avaliação consolidada
de informações dos consumidores finais sobre a confiabilidade dos dados.
O processo de avaliação da qualidade e das expectativas das partes interessadas precisa ser
contínuo, visto que os requisitos sofrem mudanças com o tempo, à medida que as necessidades dos
negócios e a influência das forças externas evoluem.
2.2 Dimensões da qualidade dos dados
Uma dimensão da qualidade de dados é um recurso ou característica mensurável dos dados.
O termo dimensão é usado para fazer a conexão com as dimensões na medição de objetos físicos (por
exemplo, comprimento, largura, altura). As dimensões da qualidade dos dados fornecem um
vocabulário para definir os requisitos de qualidade dos dados. A partir daí, eles podem ser utilizados
para definir os resultados da avaliação inicial da qualidade dos dados, bem como das medições em
andamento.
Para medir a qualidade dos dados, uma organização precisa estabelecer características que não são
apenas importantes para os processos de negócios, mas também mensuráveis e factíveis.
As dimensões fornecem uma base para regras mensuráveis, as quais devem estar diretamente
vinculadas aos riscos potenciais em processos críticos. Atenção ao exemplo a seguir:
 Risco: Se os dados no campo de endereço de e-mail do usuário estiverem incompletos,
haverá prejuízo no processo de comunicação.
 Um meio de mitigar o risco: Deve ser medida a porcentagem de usuários para os quais se
tem endereços de e-mail utilizáveis para aprimorar os processos até se obter um endereço de
e-mail utilizável para pelo menos 98% de usuários.
Diversos pensadores importantes escreveram sobre as dimensões da qualidade dos dados. Embora
não haja um único conjunto de dimensões de qualidade de dados acordadas, todos os conjuntos
contêm ideias comuns.
As dimensões incluem algumas características que podem ser medidas objetivamente (integridade,
validade, conformidade do formato) e outras que dependem muito do contexto ou da interpretação
subjetiva (usabilidade, confiabilidade, reputação). Quaisquer que sejam os nomes usados, as
dimensões focam se há dados suficientes (integridade), se estão corretos (precisão, validade), quão
bem eles se encaixam (consistência, integridade, exclusividade), se estão atualizados (pontualidade),
acessível, utilizável e seguro.
Em 2013, o DAMA (The Data Management Association) do Reino Unido produziu um documento
técnico propondo seis dimensões principais da qualidade dos dados. O conjunto inclui:
 Completude: a proporção de dados armazenados contra o potencial de 100%.
 Exclusividade: nenhuma instância de entidade será registrada mais de uma vez após
identificada.
 Oportunidade: o grau em que os dados representam a realidade a partir do momento
requerido.
 Validade: os dados são válidos se estiverem em conformidade com a sintaxe (formato, tipo,
intervalo) de sua definição.
 Precisão: o grau em que os dados descrevem corretamente o objeto ou evento do 'mundo real'
sendo descrito.
 Consistência: A ausência de diferença ao comparar duas ou mais representações de uma
instancia com uma definição.
Além dessas dimensões, o documento oficial da DAMA UK descreve outras características que têm
impacto na qualidade.
 Usabilidade: os dados são compreensíveis, relevantes, acessíveis, mantidos e no nível certo
de precisão?
 Problemas de tempo (além da própria tempestividade): é estável, mas responde a
solicitações de mudança legítimas?
 Flexibilidade: os dados são comparáveis e compatíveis com outros dados? Possui
agrupamentos e classificações úteis? Pode ser reaproveitado? É fácil de manipular?
 Confiança: a governança, a proteção e a segurança dos dados estão vigentes? Qual é a
credibilidade dos dados? É verificável?
 Valor: existe um levantamento de custo/benefício para os dados? É ou serão utilizados da
melhor maneira possível? Põe em risco a segurança ou a privacidade das pessoas ou as
responsabilidades legais da organização? Apoia ou contradiz a imagem corporativa ou a visão
estratégica corporativa?
Qualquer organização que almeja melhorar a qualidade de seus dados deve adotar ou desenvolver um
conjunto de dimensões por meio das quais possa mensurar a qualidade e alcançar um consenso sobre
as dimensões que podem fornecer um ponto de partida para a construção de um vocabulário comum
sobre o tema.
2.3 Gerenciamento da qualidade dos dados
Conforme observado anteriormente, às vezes o termo qualidade dos dados é usado para se referir aos
processos usados para medir ou melhorar a qualidade dos dados. Esses processos constituem o
gerenciamento da qualidade dos dados. Embora todas as funções de gerenciamento de dados tenham
potencial para afetar a qualidade.
Atenção, o gerenciamento formal da qualidade dos dados concentra-se em ajudar a organização a:
 Definir dados de alta qualidade: por meio de padrões, regras e requisitos de qualidade de
dados.
 Avaliar os dados: em relação a esses padrões e comunicar resultados às partes
interessadas.
 Monitorar e relatar: a qualidade dos dados em aplicações e armazenamentos de dados.
 Identificar problemas: e avaliar e defender oportunidades de melhoria.
O gerenciamento formal da qualidade dos dados é semelhante ao gerenciamento contínuo da
qualidade de outros serviços. Ele inclui o gerenciamento de dados durante o seu ciclo de vida,
definindo padrões, incorporando qualidade aos processos que criam, transformam e armazenam
dados e medindo dados em relação aos padrões. Gerenciar dados para esse nível geralmente requer
uma equipe de programa de qualidade de dados.
A equipe do programa de qualidade de dados é responsável por envolver os profissionais de
gerenciamento de dados técnicos e de negócios e conduzir o trabalho de aplicação de técnicas de
gerenciamento de qualidade aos dados, para garantir que os dados sejam adequados ao consumo
para uma variedade de propósitos.
A equipe provavelmente estará envolvida em uma série de projetos por meio dos quais eles podem
estabelecer processos e práticas recomendadas enquanto abordam problemas de dados de alta
prioridade. Como o gerenciamento da qualidade dos dados envolve o gerenciamento do ciclo de vida
dos dados, um programa de qualidade dos dados também terá responsabilidades operacionais
relacionadas ao uso dos dados. Por exemplo, relatórios sobre os níveis de qualidade dos dados e
participação na análise, quantificação e priorização de problemas de dados.
A equipe ainda é responsável por trabalhar com aqueles que precisam de dados para realizar suas
tarefas, para garantir que os dados atendam às suas necessidades e por trabalhar com aqueles que
criam, atualizam ou excluem dados no decorrer de suas tarefas para garantir que eles estejam
manipulando os dados corretamente. A qualidade dos dados depende de todos que interagem com os
dados, não apenas dos profissionais de gerenciamento de dados.
Como é o caso da governança de dados e do gerenciamento de dados como um todo, o
gerenciamento da qualidade dos dados é um programa, não um projeto. Incluirá o trabalho de projeto e
manutenção, juntamente com o compromisso com as comunicações e o treinamento.
Mais importante, o sucesso a longo prazo do programa de melhoria da qualidade dos dados depende
de uma organização mudar sua cultura e adotar uma mentalidade de qualidade. Conforme declarado
no Manifesto de dados do líder: mudanças fundamentais e duradouras exigem liderança e
envolvimento comprometidos de pessoas em todos os níveis de uma organização.
As pessoas que utilizam dados para realizar seu trabalho – o que significa um percentual elevado -
precisam promover mudanças. E uma das mudanças mais críticas a serem focadas é como as
organizações gerenciam e melhoram a qualidade de seus dados.
PLANEJAR: Definir características de dados de alta qualidade.
PROJETAR e HABILITAR: Definir controle de sistema e de processo para evitar erros que
prejudiquem o suporte a qualidade contínua dos dados.
CRIAR / OBTER: Medir ou inspecionar os dados para garantir que atendam aos requisitos de
qualidade.
ARMAZENAR / MANTER: Monitorar a qualidade dos dados nos sistemas e dos processos para
garantir que continuem a atender às expectativas.
UTILIZAR: Habilitar um loop de feedback que identifique maneiras de melhorar a qualidade dos dados.
APRIMORAR: Atuar nas oportunidades de melhoria da qualidade dos dados.
DESCARTAR: Identificar e limpar corretamente os dados com base nos requisitos.
Os princípios de gerenciamento de dados da DAMA afirmam que o gerenciamento de dados é o
gerenciamento do ciclo de vida dos dados e que gerenciar dados significa gerenciar a qualidade dos
dados.
Durante o ciclo de vida dos dados, as atividades de gerenciamento da qualidade dos dados ajudam
uma organização a definir e medir as expectativas relacionadas aos seus dados. Essas expectativas
podem mudar ao longo do tempo à medida que os usos organizacionais dos dados evoluem.
2.4 Qualidade dos dados e outras funções de gerenciamento de dados
Conforme citado anteriormente, todas as áreas do gerenciamento de dados têm o potencial de afetar a
qualidade dos dados.
Governança e administração de dados, modelagem de dados e gerenciamento de metadados têm
efeitos diretos na definição dados de alta qualidade. Se estes não forem bem executados, é muito
difícil ter dados confiáveis. Os três estão relacionados na medida em que estabelecem padrões,
definições e regras relacionadas aos dados. A qualidade de dados visa atender às expectativas de
forma coletiva descrevendo um conjunto de expectativas comuns.
A qualidade dos dados é baseada na premissa de que atende aos requisitos dos consumidores de
dados. Ter um processo robusto pelo qual os dados são definidos suporta a capacidade de uma
organização formalizar e documentar os padrões e requisitos pelos quais a qualidade dos dados pode
ser medida.
Os metadados definem o que os dados representam. A administração de dados e os processos de
modelagem de dados são fontes de metadados críticos. Metadados bem gerenciados também podem
apoiar o esforço para melhorar a qualidade dos dados.
Um repositório de metadados pode abrigar resultados de medições de qualidade de dados que podem
ser compartilhados por toda a organização, de forma que a equipe de qualidade de dados possa ter
insumos para produzir consenso sobre as prioridades e fatores de melhoria do Programa de Qualidade
de Dados.
Um programa de qualidade de dados é mais eficaz quando faz parte de um programa de governança
de dados, uma vez que isto que esse alinhamento visa identificar problemas de qualidade de dados e
propor soluções a serem discutidas e avaliadas para como a política de governança de dados na
organização.
A incorporação dos esforços de qualidade dos dados no escopo da governança de dados permite que
a equipe do programa de qualidade dos dados trabalhe com uma variedade de partes interessadas e
facilitadores, tais como:
 Equipe de risco e segurança que pode ajudar a identificar vulnerabilidades organizacionais
relacionadas a dados.
 Equipe de engenharia e treinamento de processos de negócios que pode ajudar as equipes a
implementar melhorias de processos que aumentam a eficiência e resultam em dados mais
adequados para usos posteriores.
 Gestores de dados de negócio, operacionais e proprietários de dados que podem identificar
dados críticos, definir padrões e expectativas de qualidade e priorizar a correção de problemas
de dados.
Atenção, uma organização de governança pode acelerar o trabalho de um programa de qualidade de
dados, por meio das seguintes ações:
 Definindo as prioridades.
 Desenvolvendo e agindo na manutenção de padrões e políticas para a qualidade dos dados.
 Estabelecendo mecanismos de comunicação e compartilhamento de conhecimento.
 Monitoramento e geração de relatórios sobre desempenho e medições de qualidade de dados.
 Compartilhando resultados da inspeção da qualidade dos dados para conscientizar e identificar
oportunidades de melhoria.
Os programas de governança também costumam ser responsáveis pelo gerenciamento de dados
mestre e gerenciamento de dados de referência. Vale ressaltar que o gerenciamento de dados mestre
e o gerenciamento de dados de referência são exemplos de processos focados na curadoria de tipos
específicos de dados com o objetivo de garantir sua qualidade. Simplesmente rotular um conjunto de
dados de "Dados Mestre" implica certas expectativas sobre seu conteúdo e confiabilidade.
2.5 Qualidade e regulação de dados
A qualidade como a segurança dos dados proporciona uma vantagem estratégica.
Usuários e parceiros de negócios esperam e estão começando a exigir dados completos e precisos. A
qualidade dos dados também é um requisito regulatório em alguns casos. As práticas de
gerenciamento de dados podem ser auditadas.
Os regulamentos diretamente conectados às práticas de qualidade dos dados consideram os
seguintes exemplos:
 Sarbanes-Oxley (EUA), que se concentra na precisão e validade das transações financeiras.
 Solvência II (UE), que se concentra na linhagem de dados e na qualidade dos dados
subjacentes aos modelos de risco.
 O Regulamento Geral de Proteção de Dados (GDPR, União Européia) afirma que os dados
pessoais devem ser precisos e, quando necessário, mantidos atualizados. Devem ser tomadas
medidas razoáveis para apagar ou corrigir dados pessoais imprecisos.
 A Lei de Proteção de Informações Pessoais e Documentos Eletrônicos (PIPEDA, Canadá)
afirma que os dados pessoais devem ser tão precisos, completos e atualizados para seus fins.
Vale ressaltar que, mesmo quando os requisitos de qualidade dos dados não são especificamente
mencionados, a capacidade de proteger dados pessoais depende, em parte, da alta qualidade desses
dados.
2.6 Ciclo de melhoria da qualidade dos dados
A maioria das abordagens para melhoria da qualidade dos dados baseia-se nas técnicas de melhoria
da qualidade na fabricação de produtos físicos. Nesse paradigma, os dados são entendidos como o
produto de um conjunto de processos.
Em sua forma mais simples, um processo é definido como uma série de etapas que transforma
entradas em saídas.
Um processo que cria dados pode consistir em uma etapa (coleta de dados) ou várias etapas: coleta
de dados, integração em um data warehouse, agregação em um data mart, etc. Em qualquer etapa, os
dados podem ser afetados negativamente, por ter sido coletado incorretamente, eliminado ou
duplicado entre sistemas, alinhado ou agregado incorretamente, etc.
Melhorar a qualidade dos dados requer a capacidade de avaliar o relacionamento entre entradas e
saídas para garantir que as entradas atendam aos requisitos do processo e as saídas estejam em
conformidade com as expectativas. Como as saídas de um processo se tornam entradas para outros
processos, os requisitos devem ser definidos ao longo de toda a cadeia de dados.
Uma abordagem geral para a melhoria da qualidade dos dados é uma versão do
ciclo Shewhart/Deming.
Com base em método científico, o ciclo de Shewhart/Deming é um modelo de solução de problemas
conhecido como 'planejar-fazer-verificar-agir'. A melhoria ocorre por meio de um conjunto definido de
etapas.
A condição dos dados deve ser medida em relação aos padrões e, se não atender aos padrões, a(s)
causa(s) raiz(es) da discrepância em relação aos padrões deve(m) ser identificada(s) e remediada(s).
As causas-raízes podem ser encontradas em qualquer uma das etapas do processo, técnicas ou não
técnicas.
Uma vez remediados, os dados devem ser monitorados para garantir que continuem a atender aos
requisitos.
Conheça a seguir o ciclo de Shewhart/Deming
Para um determinado conjunto de dados, um ciclo de melhoria da qualidade começa identificando os
dados que não atendem aos requisitos dos consumidores, que são problemas e geram obstáculos à
consecução dos objetivos de negócios.
Os dados precisam ser avaliados em relação às principais dimensões da qualidade e aos requisitos de
negócio conhecidos. As causas principais dos problemas precisarão ser identificadas para que as
partes interessadas possam entender os custos da correção e os riscos de não remediá-los.
Esse trabalho geralmente é realizado em conjunto com o Data Stewards e outras partes interessadas.
Acesse as abas a seguir para conhecer mais sobre as etapas do ciclo.
Clique no(s) item(s) abaixo para navegar pelo infográfico
 Planejar
No estágio Planejar (Plan), a equipe de qualidade dos dados (QD) avalia o escopo, o impacto e a
prioridade dos problemas conhecidos e avalia alternativas para resolvê-los. Esse plano deve ser
baseado em uma base sólida de análise das causas dos problemas. A partir do conhecimento das
causas e do impacto dos problemas, é possível entender o custo / benefício, determinar a prioridade e
formular um plano básico para resolvê-los.
 Fazer
No estágio Fazer (Do), a equipe de qualidade de dados lidera os esforços para abordar as causas
principais dos problemas e planejar o monitoramento contínuo dos dados. Para causas raízes
baseadas em processos não técnicos, a equipe de QD pode trabalhar com os responsáveis pelos
processos para implementar mudanças. Para causas raiz que exigem alterações técnicas, a equipe de
QD deve trabalhar com equipes técnicas e garantir que os requisitos sejam implementados
corretamente e que nenhum erro não intencional seja introduzido por alterações técnicas.
 Verificar
O estágio de Verificar (Check) envolve o monitoramento ativo da qualidade dos dados, conforme
medido em relação aos requisitos. Desde que os dados atendam aos limites definidos para a
qualidade, ações adicionais não são necessárias. Os processos serão considerados sob controle e
atendendo aos requisitos de negócios. No entanto, se os dados estiverem abaixo dos limites de
qualidade aceitáveis, ações adicionais deverão ser tomadas para elevá-lo a níveis aceitáveis.
 Agir
O estágio Agir (Act) é para atividades que abordam e resolvem problemas emergentes de qualidade
de dados. O ciclo é reiniciado, à medida que as causas dos problemas são avaliadas e as soluções
propostas. A melhoria contínua é alcançada iniciando um novo ciclo.
Novos ciclos começam como:
As medidas existentes caem abaixo dos limites.
Novos conjuntos de dados estão sob investigação.
Novos requisitos de qualidade de dados emergem para conjuntos de dados existentes.
Regras, padrões ou expectativas de negócios mudam.
Estabelecer critérios para a qualidade dos dados no início de um processo ou construção do sistema é
um sinal de uma organização com maturidade no gerenciamento de dados. Fazer isso exige
governança e disciplina, além de colaboração multifuncional.
Integrar a qualidade nos processos de gerenciamento de dados desde o início custa menos do que
modernizá-la. Manter dados de alta qualidade em todo o ciclo de vida dos dados é menos arriscado do
que tentar melhorar a qualidade em um processo existente. Isso também cria um impacto muito menor
na organização.
É melhor fazer as coisas corretamente da primeira vez, embora poucas organizações tenham o
cuidado de fazê-lo. Mesmo se o fizerem, gerenciar a qualidade é um processo contínuo. As demandas
em mudança e o crescimento orgânico ao longo do tempo podem causar problemas de qualidade dos
dados que podem ser onerosos se desmarcados, mas podem ser cortados pela raiz se uma
organização estiver atenta aos riscos potenciais.
2.7 Qualidade dos dados e comprometimento da liderança
Os problemas de qualidade dos dados podem surgir em qualquer ponto do ciclo de vida dos dados,
desde a criação até o descarte.
Ao investigar as causas principais, os analistas devem procurar possíveis culpados, como problemas
com entrada de dados, processamento de dados, design de sistema e intervenção manual em
processos automatizados.
Muitos problemas terão múltiplas causas e fatores contribuintes (especialmente se as pessoas tiverem
criado maneiras de contorná-los). Essas causas de problemas também implicam que problemas de
qualidade de dados podem ser evitados por meio de:
 Melhoria no design de interface.
 Teste de regras de qualidade de dados como parte do processamento.
 Foco na qualidade dos dados no design do sistema.
 Controles rigorosos da intervenção manual em processos automatizados.
Obviamente, táticas preventivas devem ser usadas. No entanto, o senso comum diz e pesquisas
indicam que muitos problemas de qualidade dos dados são causados pela falta de comprometimento
organizacional, que por sua vez resultam da falta de liderança de governança e de gerenciamento.
Toda organização possui ativos de informação e dados que são estratégicos para suas operações. De
fato, as operações dependem da capacidade de compartilhar informações. Apesar disso, poucas
organizações gerenciam esses ativos com rigor.
Vários programas de controle e ativos de informações são orientados apenas pela conformidade e não
pelo valor potencial dos dados como um ativo. A falta de reconhecimento por parte da liderança
significa falta de compromisso dentro de uma organização para gerenciar dados como um ativo,
incluindo o gerenciamento de sua qualidade.
Sua atenção, às barreiras para o gerenciamento eficaz da qualidade dos dados englobam:
 Falta de conscientização por parte da liderança e da equipe.
 Falta de governança de negócios.
 Falta de liderança e gestão.
 Dificuldade em justificar melhorias.
 Instrumentos inadequados ou ineficazes para medir o valor.
Essas barreiras têm efeitos negativos na experiência do cliente, produtividade, moral, eficácia
organizacional, receita e vantagem competitiva. Eles aumentam os custos de administração da
organização e também introduzem riscos.
Assim como no entendimento da causa raiz de qualquer problema, o reconhecimento dessas barreiras
- as causas principais dos dados de baixa qualidade - fornece à organização uma visão de como
melhorar sua qualidade.
Se a organização perceber que não possui governança, propriedade e responsabilidade corporativa
fortes, poderá resolver o problema estabelecendo governança, propriedade e responsabilidade
empresarial.
Se a liderança perceber que a organização não sabe como colocar as informações em funcionamento,
a liderança poderá implementar processos para que a organização possa aprender a fazê-lo.
O reconhecimento de um problema é o primeiro passo para resolvê-lo!
Realmente, resolver problemas exige trabalho. A maioria das barreiras ao gerenciamento de
informações como um ativo é cultural. Para resolvê-los, é necessário um processo formal de
gerenciamento de mudanças organizacionais.
A imagem a seguir apresenta as barreiras ao gerenciamento de dados como um ativo estratégico,
apresentadas na DMBOK2.
2.8 Organização e mudança cultural
A qualidade dos dados não será aprimorada por meio de uma coleção de ferramentas e conceitos,
mas por mentalidade que ajuda os consumidores e as partes interessadas a priorizarem a qualidade
dos dados necessários para atender sua organização e seus usuários.
Conseguir que a organização seja consciente da qualidade dos dados geralmente requer mudança
cultural significativa. Essa mudança requer visão e liderança!
O primeiro passo é promover a conscientização sobre o papel e a importância dos dados para a
organização e definir as características dos dados de alta qualidade. Todos os consumidores de dados
devem agir com responsabilidade e levantar problemas de qualidade dos dados; solicitar dados de boa
qualidade como consumidores e fornecer informações de qualidade a terceiros.
Toda pessoa que toca nos dados pode afetar a qualidade desses dados. A qualidade dos dados não é
apenas responsabilidade de uma equipe de QD, de uma equipe de governança de dados ou de um
grupo de TI.
Os consumidores de dados precisam pensar e agir de maneira diferente para produzir e gerenciar
dados de melhor qualidade. Isso requer não apenas treinamento, mas também comprometimento da
liderança.
3 Maturidade em Gerenciamento de dados
Dados confiáveis não são produzidos por acidente. Tentamos mostrar que dados bem gerenciados
dependem do planejamento, governança e comprometimento com a qualidade e segurança, bem
como da execução disciplinada dos processos contínuos de gerenciamento de dados.
Este tópico abordará as etapas críticas para iniciar melhorias na maturidade organizacional em torno
do gerenciamento de dados. Esses incluem:
 Avaliar o estado atual
 Compreender as opções de melhoria para desenvolver um roteiro para gerenciamento de
dados
 Iniciar um programa de Gerenciamento de Mudanças na Organização para apoiar a execução
do modelo
3.1 Avaliar o estado atual
Antes de definir qualquer nova organização ou tentar melhorar uma já existente, é importante avaliar o
estado atual da gestão dos dados, especialmente porque elas se relacionam à cultura, ao modelo
operacional existente e às pessoas. Embora as especificidades da mudança cultural sejam diferentes
de organização para organização.
A avaliação do estado atual foca na melhoria do gerenciamento de dados e precisará considerar:
 O papel dos dados na organização: Quais processos principais são orientados por dados?
Como os requisitos de dados são definidos e entendidos? Quão bem reconhecido é o papel
que os dados desempenham na estratégia organizacional? De que maneira a organização está
ciente dos custos de dados de baixa qualidade?
 Normas culturais sobre dados: Existem possíveis obstáculos culturais para implementar ou
melhorar as estruturas de gerenciamento e governança de dados? Os proprietários de
processos de negócios upstream estão cientes dos usos downstream de seus dados?
 Práticas de gerenciamento e governança de dados: Quem e como é executado as
atividades relacionadas à gestão de dados? Como e quem toma as decisões sobre o
gerenciamento de dados?
 Como o trabalho é organizado e executado: A execução das atividades é baseada em
projetos? Quais estruturas de comitê existem para apoiar o esforço de gerenciamento de
dados? Qual é o modelo operacional para interações de TI/Negócios? Como os projetos são
patrocinados?
 Relacionamentos de relatórios: A organização é centralizada ou descentralizada, hierárquica
ou plana? Quão colaborativas são as equipes?
 Níveis de habilidade: Qual é o nível de conhecimento de dados e de gerenciamento de dados
das partes interessadas? Existem especialistas no assunto?
A avaliação do estado atual também deve incluir o nível de satisfação, isso fornecerá informações
sobre as necessidades e prioridades de gerenciamento de dados da organização. Atenção aos
exemplos:
 Tomada de decisão: A organização possui as informações necessárias para tomar decisões
estratégicas, oportunas e sólidas?
 Relatórios: A organização confia em seus relatórios?
 Principais indicadores de desempenho (Key Performance Indicator - KPI): Com que eficácia
a organização rastreia seus KPIs?
 Conformidade: A organização está em conformidade com todas as normas legais
relacionadas à governança de dados?
O meio mais eficaz para conduzir essa avaliação é usar um modelo confiável de maturidade em
gerenciamento de dados que forneça informações sobre como a organização se compara a outras
organizações e orientações sobre os próximos passos.
Os modelos de maturidade definem cinco ou seis níveis de maturidade, cada um com suas próprias
características, que variam de inexistentes (nível 0), ad hoc (nível 1) a otimizados ou de alto
desempenho (nível 5).
Uma avaliação detalhada incluiria critérios para categorias amplas, como pessoas, processos e
tecnologia; e para subcategorias como estratégia, política, padrões, definição de função,
tecnologia/automação etc. dentro de cada função de gerenciamento de dados ou área de
conhecimento.
Acesse as abas para obter um resumo dos níveis macro da maturidade do gerenciamento de dados.
Nível 0 - Ausência de Capacidade
Não existem práticas organizadas ou processos corporativos formais para gerenciamento de dados.
Há uma parcela considerável de organizações no nível 0. Esse nível é reconhecido apenas para fins
de conceito.
Nível 1 - Inicial/Ad Hoc
Gerenciamento de dados utilizando um conjunto de ferramentas limitado, com pouca ou nenhuma
governança.
O tratamento de dados é altamente dependente de alguns especialistas.
Papéis e responsabilidades são definidos em silos.
Cada gestor de dados recebe, gera e envia dados de forma autônoma.
Os controles, se existirem, são aplicados de forma inconsistente.
As soluções para gerenciamento de dados são limitadas.
Os problemas de qualidade dos dados são difundidos e não são abordados.
Os suportes de infraestrutura estão no nível da unidade de negócios.
Os critérios de avaliação podem incluir a presença de qualquer controle de processo, como registro de
problemas de qualidade de dados.
Nível 2 - Repetível
Surgimento de ferramentas consistentes e definição de função para apoiar a execução do processo.
No nível 2, a organização começa a usar ferramentas centralizadas e a fornecer mais supervisão para
o gerenciamento de dados.
As funções são definidas e os processos não dependem apenas de um especialista.
Existe conscientização organizacional sobre questões e conceitos de qualidade de dados.
Os conceitos de gerenciamento de dados mestre e de referência começam a ser reconhecidos.
Os critérios de avaliação podem incluir a definição formal de função em artefatos, como descrições de
tarefas, a existência de documentação do processo e a capacidade de alavancar conjuntos de
ferramentas.
Nível 3 - Definido
Capacidade emergente de gerenciamento de dados.
O Nível 3 vê a introdução e a institucionalização de processos escaláveis e uma visão do
gerenciamento de dados como um facilitador organizacional.
As características incluem a replicação de dados em uma organização com alguns controles em vigor
e um aumento na qualidade dos dados, juntamente com definição e gerenciamento coordenados de
políticas.
Uma definição de processo mais formal leva a uma redução significativa na intervenção manual. Isso,
junto com um processo de design centralizado, significa que os resultados do processo são mais
previsíveis.
Os critérios de avaliação podem incluir a existência de políticas de gerenciamento de dados, o uso de
processos escalonáveis e a consistência de modelos de dados e controles do sistema.
Nível 4 - Gerenciado
O conhecimento institucional adquirido com o crescimento nos níveis 1 a 3 permite que a organização
preveja resultados ao abordar novos projetos e tarefas e comece a gerenciar os riscos relacionados
aos dados.
O gerenciamento de dados inclui métricas de desempenho.
As características do nível 4 incluem ferramentas padronizadas para gerenciamento de dados, das
estações de trabalho à infraestrutura, juntamente com uma função centralizada de planejamento e
governança.
As expressões desse nível são um aumento mensurável na qualidade dos dados e nos recursos de
toda a organização, como auditorias de dados de ponta a ponta.
Os critérios de avaliação podem incluir métricas relacionadas ao sucesso do projeto, métricas
operacionais para sistemas e métricas de qualidade dos dados.
Nível 5 - Otimizado
Quando as práticas de gerenciamento de dados são otimizadas, elas são altamente previsíveis, devido
à automação de processos e gerenciamento de mudanças tecnológicas.
As organizações nesse nível de maturidade se concentram na melhoria contínua.
No nível 5, as ferramentas permitem uma visualização dos dados entre os processos.
A proliferação de dados é controlada para evitar duplicação desnecessária.
Métricas bem entendidas são usadas para gerenciar e medir a qualidade e os processos dos dados.
Os critérios de avaliação podem incluir artefatos e métricas de gerenciamento de mudanças na
melhoria do processo.
Na sequência, conheça o Modelo de Níveis de Maturidade em Gerenciamento de Dados.
O gráfico espiral a seguir apresenta um exemplo de demonstração de resultado das descobertas após
a aplicação da metodologia de Avaliação de Maturidade de Gerenciamento de Dados (Data
Management Maturity Assessment - DMMA).
Para cada um dos recursos (Governança, Arquitetura, etc.), o anel externo da tela mostra o nível de
capacidade que a organização determinou que precisa para competir com sucesso. O anel interno
exibe o nível de capacidade conforme determinado pela avaliação. As áreas em que a distância entre
os dois anéis é maior representam os maiores riscos para a organização. Esse relatório pode ajudar a
definir prioridades, como também, ser utilizado para medir o progresso ao longo do tempo.
O objetivo de uma avaliação do estado atual é compreender o ponto de partida da organização para
planejar a melhoria. Uma avaliação precisa é mais importante que uma pontuação alta. Uma avaliação
formal da maturidade do gerenciamento de dados coloca a organização na escala de maturidade,
esclarecendo os pontos fortes e fracos de atividades críticas de gerenciamento de dados. Ajuda a
organização a identificar, priorizar e implementar oportunidades de melhoria.
Ao atingir seu objetivo principal, um DMMA pode ter um impacto positivo na cultura. Isso auxilia a:
 Conscientizar as partes interessadas sobre os conceitos, princípios e práticas de
gerenciamento de dados.
 Esclarecer as funções e responsabilidades das partes interessadas em relação aos dados
organizacionais.
 Destacar a necessidade de gerenciar dados como um ativo crítico.
 Ampliar o reconhecimento das atividades de gerenciamento de dados em toda a organização.
 Contribuir para melhorar a efetividade da governança de dados.
Com base nos resultados da avaliação, uma organização pode aprimorar seu programa de
gerenciamento de dados, de forma a apoiar as atividades estratégicas da organização. Normalmente,
os programas de gerenciamento de dados são desenvolvidos em silos organizacionais. Raramente
começam com uma visão corporativa dos dados.
Um estudo de DMMA pode prover à organização meios para desenvolver uma visão coesa e
estratégica; além de permitir uma avaliação clara e criteriosa de suas prioridades, redefinição de
objetivos e desenvolvimento de um plano integrado de melhoria.
3.2 Uso dos resultados para planejar melhorias
Uma avaliação do estado atual ajuda a determinar o que está funcionando bem, o que não está
funcionando e onde uma organização apresenta lacunas.
As conclusões fornecem a base para os objetivos do programa de mapeamento de trilhas que auxiliam
a determinar por onde começar e com qual velocidade avançar.
Atenção, os objetivos devem se concentrar em:
 Oportunidades de melhoria de alto valor relacionadas a processos, métodos, recursos e
automação.
 Recursos alinhados à estratégia de negócios.
 Processos de governança para avaliação periódica do progresso organizacional com base nas
características do modelo.
As especificidades dos planos de ação dependerão dos resultados da avaliação.
A tabela abaixo apresenta um modelo simplificadíssimo que considera apenas a adoção de uma
metodologia padrão e o grau de automação do processo.
Nível de Maturidade
Qualidade de Dados (QD) – Características de
Medição
Grau de Automação
Nível 5 – Otimizado: As
metas de melhoria e de
processo são
quantificadas
Os relatórios de QD são amplamente compartilhados
entre os acionistas da gerência. Os resultados da
medição da qualidade dos dados são usados para
identificar oportunidades de melhorias no sistema e nos
processos de negócios e o impacto dessas melhorias é
relatado.
Relatórios e Painéis
otimizados e automatizados,
incluindo alertas.
Nível 4 – Gerenciado:
Processos são
quantificados e
controlados
Os gestores de sistemas e de negócios são obrigados a
medir a qualidade de seus dados e a reportar resultados,
para que os consumidores tenham um conhecimento
consistente da qualidade dos dados.
O processo de medição é
totalmente automatizado.
Nível 3 – Definido: Os
padrões são definidos
e usados
Os padrões são definidos para estabelecimento das
métricas de qualidade dos dados e se estão sendo
aplicados nas equipes.
Uma abordagem padrão foi
adotada para iniciar o
processo de automação.
Nível 2 – Repetível:
Existe uma prática
mínima repetível no
processo
As partes envolvidas aprenderam práticas para medir a
qualidade dos dados e estão desenvolvendo habilidades
para replicar essas práticas.
Os processos ainda são
amplamente manuais, mas
algumas equipes testaram a
automação.
Nível 1 - Inicial (Ad
Hoc): O sucesso
depende da
competência dos
indivíduos
Há um esforço dos indivíduos em medir a qualidade dos
dados, mas isso não faz parte diretamente da rotina de
atividades e não existe uma metodologia definida.
Nenhum. Os processos de
acompanhamento dos
indicadores são realizados de
forma manual.
Nível 0 - Ausência de
capacidade
Não existe definição de métricas e acompanhamento da
qualidade dos dados.
Não aplicável.
Níveis de maturidade para medição da qualidade dos dados
Digamos que uma organização reconheça a necessidade de melhorar a qualidade de seus dados. No
entanto, sua avaliação atual do estado mostra que encontra-se no Nível 1. Ainda não estabeleceu
práticas repetíveis em torno da medição da qualidade dos dados, mas há indivíduos que testaram as
águas e descobriram algumas coisas. Com base em sua estratégia geral, estabelece uma meta de
passar do Nível 1 para o Nível 3 dentro de 18 meses.
Atingir esse objetivo requer um plano de ação que explique vários fluxos de trabalho:
 Pesquisa de abordagens para medir a qualidade dos dados e adoção de uma abordagem
alinhada com os pontos problemáticos da organização, as metas de medição e o setor.
 Treinamento de equipe sobre a metodologia.
 Identificação e adoção de ferramentas para apoiar a execução da metodologia.
Além de executar planos para atingir essas metas, os líderes também devem levar em consideração o
desenvolvimento futuro (ou seja, ao passar para o Nível 3, a organização também deverá se preparar
para passar para o Nível 4).
Esse exemplo simples mostra o processo de pensamento em torno do planejamento para a melhoria
de um componente do gerenciamento de dados. As avaliações de maturidade do gerenciamento de
dados podem ter diferentes áreas de foco.
Se sua organização avaliar de forma abrangente suas práticas de gerenciamento de dados, a saída
identificará diversas oportunidades de melhoria. Eles precisarão ser priorizados para apoiar a
estratégia de negócios.
Um modelo de maturidade de gerenciamento de dados inclui orientações internas, descrevendo como
é o progresso dentro e entre as áreas funcionais de gerenciamento de dados. O caminho para a
melhoria baseado em etapas pode ser adaptado às necessidades e prioridades de uma organização.
3.3 Gerenciamento de mudanças organizacionais
A maioria das organizações que busca melhorar suas práticas de gerenciamento ou governança de
dados está no meio da escala de maturidade de capacidade (ou seja, não são 0 ou 5). O que significa
que quase todas precisam melhorar suas práticas.
Para a maior parte das organizações, melhorar as práticas de gerenciamento de dados requer alterar a
maneira como as pessoas trabalham juntas e como elas entendem o papel dos dados em suas
organizações, bem como a maneira como utilizam os dados e implementam a tecnologia para dar
suporte aos processos organizacionais.
Atenção às práticas bem-sucedidas de gerenciamento de dados, pois elas exigem, entre outros
fatores:
 Aprender a gerenciar horizontalmente, alinhando responsabilidades ao longo da cadeia de
valor das informações.
 Mudar o foco da responsabilidade vertical (silo) para a gestão compartilhada de informações.
 Evoluir a qualidade da informação de uma expectativa do negócio de nicho ou trabalho do
departamento de TI para um valor central da organização.
 Mudar o pensamento sobre a qualidade das informações de 'limpeza de dados e scorecards'
para uma capacidade organizacional mais fundamentada em transformar a qualidade em
processos.
 Implementar processos para mensurar o custo do gerenciamento de dados informal e o valor
do gerenciamento de dados formalizado.
Esse nível de mudança não é alcançado por meio da tecnologia (mesmo que o uso apropriado de
ferramentas de software possa dar suporte à entrega). Em vez disso, é realizado por meio de uma
abordagem cuidadosa e estruturada para o gerenciamento de mudanças na organização. A mudança
será necessária em todos os níveis. É fundamental que seja gerenciado e coordenado a fim de evitar
iniciativas sem saída, perda de confiança e danos à credibilidade da função de gerenciamento de
informações e de sua liderança.
A mudança na cultura da organização requer planejamento, treinamento e persistência. Consciência e
responsabilidade são essenciais para motivar e envolver as pessoas em iniciativas, políticas e
processos de gerenciamento de dados.
Os fatores críticos de sucesso para o gerenciamento de mudanças organizacionais são bem
conhecidos.
Demonstrou-se consistentemente que dez fatores desempenham um papel fundamental no sucesso
de organizações eficazes de gerenciamento de dados, independentemente de sua estrutura. São eles:
Patrocínio da alta administração
A alta administração deve internalizar e acreditar na iniciativa. Deve ser capaz de se envolver
efetivamente e mobilizar outros líderes no apoio às mudanças.
Visão clara
Os líderes devem garantir que todas as partes interessadas afetadas pelo gerenciamento de dados -
tanto internas quanto externas - entendam e internalizem o que é gerenciamento de dados, por que é
importante e como o trabalho deles afetará e será afetado por eles.
Gerenciamento proativo de mudanças
A aplicação do gerenciamento organizacional de mudanças para o estabelecimento de uma prática de
gerenciamento de dados aborda os desafios das pessoas e aumenta a probabilidade de práticas e
estruturas organizacionais serem sustentáveis ao longo do tempo.
Alinhamento da liderança
O alinhamento da liderança garante que haja acordo - e suporte unificado para - a necessidade de um
programa de gerenciamento de dados e que haja acordo sobre como o sucesso será definido. O
alinhamento da liderança inclui o alinhamento entre as metas dos líderes e os resultados do
gerenciamento de dados, além de valor e alinhamento de propósito entre os líderes.
Comunicação
A organização deve garantir que as partes interessadas tenham um entendimento claro do que é o
gerenciamento de dados e a sua importância. O que sofrerá transformações e quais mudanças no
comportamento são necessárias.
Engajamento das partes interessadas
Indivíduos e grupos afetados por uma iniciativa de gerenciamento de dados reagirão de maneiras
diferentes ao novo programa e sua função. O modo como a organização envolve essas partes
interessadas - como elas se comunicam, respondem e envolvem - terá um impacto significativo no
sucesso da iniciativa.
Orientação e treinamento
A capacitação é essencial para que o gerenciamento de dados aconteça. Diferentes grupos de
pessoas (líderes, gestores de dados, equipes técnicas) exigirão diferentes tipos e níveis de educação
para que possam desempenhar suas funções de maneira eficiente. Diversas pessoas precisarão de
treinamento em novas políticas, processos, técnicas, procedimentos e até ferramentas.
Avaliação da adoção
Crie métricas em torno do progresso e da adoção das diretrizes de gerenciamento de dados visando
manter a continuidade da execução do programa de gerenciamento de dados. O aspecto facilitador do
gerenciamento de dados pode se concentrar na melhoria dos processos centrados em dados, como
identificação de risco e eficiência da execução do projeto. O aspecto de inovação do gerenciamento de
dados pode se concentrar na melhoria na tomada de decisão e na análise por meio de dados
aprimorados e confiáveis.
Adesão aos princípios orientadores
Princípios de gerenciamento de dados do DAMA servem como pontos de referência a partir dos quais
todas as decisões serão tomadas. Estabelecê-los é um primeiro passo para a criação de um programa
de gerenciamento de dados que efetivamente conduz mudanças no comportamento.
Evolução, não revolução
Em todos os aspectos do gerenciamento de dados, a filosofia de 'evolução não revolução' ajuda a
minimizar grandes mudanças ou projetos de alto risco e em larga escala. O estabelecimento de uma
organização que evolua e amadureça ao longo do tempo, melhorando de forma incremental a maneira
como os dados são gerenciados e priorizados pelos objetivos de negócios, garantirá que novas
políticas e processos sejam adotados e que as mudanças comportamentais sejam sustentadas.
3.4. Governança da Gestão da Maturidade
Um DMMA faz parte de um conjunto de atividades de governança de dados. O ciclo de vida de um
DMMA consiste no planejamento e na avaliação inicial, seguido de recomendações, um plano de ação
e reavaliação periódica.
Supervisão do Processo DMMA
A supervisão do processo DMMA é exercido pela equipe de Governança de Dados. Se a Governança
de Dados formal não possuir know-how, os padrões de supervisão serão adotados pelo Comitê Diretor
ou pela camada de gerenciamento que iniciou o DMMA. O processo deve ter um patrocinador da alta
Administração para garantir que as melhorias nas atividades de gerenciamento de dados sejam
mapeadas conforme os objetivos de negócios.
A amplitude e profundidade da supervisão dependem do escopo da DMMA. Cada função envolvida no
processo tem sua responsabilidade na execução, método, resultados e roteiros provenientes da
avaliação. Cada área de gerenciamento de dados estará envolvida de forma interdependente, mas
também utilizaram uma linguagem comum por meio da estrutura do DMMA.
Métricas
Além de ser um componente central de qualquer estratégia de melhoria, as métricas são uma
ferramenta de comunicação essencial. As métricas iniciais do DMMA são as classificações que
representam o estado atual do gerenciamento de dados. As métricas podem ser reavaliadas
periodicamente para demonstrar tendências de melhoria.
Cada organização deve desenvolver métricas adaptadas à sua situação. Métricas podem incluir:
Classificações DMMA
As classificações DMMA apresentam, por meio de níveis, a capacidade da organização. As
classificações podem ser acompanhadas de uma descrição, talvez uma ponderação personalizada
para a classificação em uma avaliação ou área temática específica e um resultado esperado.
Taxas de utilização de recursos
Utilizar exemplos de métricas que ajudam a expressar o custo do gerenciamento de dados com base
em cálculos percentuais como: "Todo recurso da organização gasta 10% do tempo agregando dados
manualmente".
A exposição ao risco: Exposição ao risco
Exposição ao risco ou a capacidade de responder a cenários de risco expressa os recursos de uma
organização em relação às classificações de DMMA. Por exemplo, se uma organização quisesse
iniciar um novo negócio que exigisse um alto nível de automação, mas seu modelo operacional atual
se baseia no gerenciamento manual de dados (Nível 1), incorreria no risco de não entregar.
O gerenciamento de gastos
Expressa como o custo do gerenciamento de dados é alocado em uma organização e identifica os
impactos desse custo na sustentabilidade e no valor. Essas métricas se sobrepõem às métricas de
governança de dados.
 Sustentabilidade no gerenciamento de dados
 Realização das metas e objetivos
 Eficácia da comunicação
 Eficácia da capacitação de pessoal
 Velocidade de adoção das mudanças
 Valor agregado com práticas de gerenciamento de dados
 Contribuições para os objetivos de negócios
 Reduções de riscos
As entradas para o DMMA
São importantes para gerenciar, pois falam sobre a abrangência da cobertura, nível de investigação e
detalhes do escopo relevante para a interpretação dos resultados da pontuação. As entradas principais
podem incluir o seguinte: contagem, cobertura, disponibilidade, número de sistemas, volumes de
dados, equipes envolvidas etc.
Taxa de mudança
A taxa na qual uma organização está melhorando sua capacidade. Uma linha de base é estabelecida
por meio do DMMA. A reavaliação periódica é usada para melhorar a tendência.
3.5. Elementos do modelo de maturidade
Temos acesso a mais dados do que nunca, mas isso se tornou confuso e contraditório, a ponto de a
qualidade dos dados ser considerada uma disciplina por si só.
Em que ponto paramos de confiar nos dados? Não é apenas o volume de dados que os torna
confusos, é como os usamos.
Podemos usar os dados para obter muitos resultados diferentes, dependendo do que fazemos com
eles. Se não pararmos para verificar se estamos de acordo em que manipulamos ou extrapolamos,
estamos caminhando em direções muito diferentes e concorrentes.
O primeiro passo será proceder uma avaliação da maturidade dos dados para ajudá-lo a entender com
qual cenário está inserido - forneça uma imagem de como organização encontra-se em seu ponto de
partida no mapa.
A avaliação da maturidade dos dados é uma ferramenta útil não só para compreender a situação atual
da organização, antes de iniciar (ou a partir de quando o processo será iniciado), mas também para
demonstrar o progresso das iniciativas de melhoria. Visto que essas informações serão utilizadas
como insumos da linha de base.
Diversas mudanças falham porque não houve tempo para compreender a real posição da organização.
Uma lagarta pode ser uma lagarta perfeitamente boa, mas para atingir seu verdadeiro potencial, ela
precisa se transformar em uma borboleta. Embora não estamos sugerindo que é possível saber tudo
com antecedência, é possível em pouco tempo compreender a posição da sua organização sobre os
fatores importantes em relação à forma como trata os dados.
A linha de base pode demonstrar o que a organização tem realizado e onde fez a diferença. Com isso
é possível determinar se existe retorno relevante para a organização e com isso decidir se mantém ou
não esse processo. Uma das coisas que é difícil quando se algum tipo de mudança é demonstrar os
benefícios - sem isso é realmente fácil para qualquer organização se preocupar que não está no
caminho certo. As partes interessadas e os usuários podem consumir uma grande quantidade de
energia para gerenciar e também podem inviabilizar completamente os programas, se houver medidas
preventivas. Uma maneira simples de ajudá-los a entender se estão na direção certa é demonstrar o
progresso em relação à sua linha de base - que é a primeira avaliação de maturidade.
Conheça alguns pontos relevantes ao se conduzir um modelo de maturidade:
 Toda interação é importante. O trabalho de preparação foi realizado para que haja alinhamento
das motivações e expectativas.
 Nem todo mundo será um defensor ou até um pouco positivo sobre o que propõe a fazer. É
necessário avaliar e decidir se o esforço para mudar a posição de alguns é factível.
 Se forem positivos, não presumam que permanecerão assim, continue se engajado para
garantir um bom nível de aceitação.
 Aproveite todas as oportunidades para mudar a atitude das pessoas em relação aos dados!
Atenção aos principais elementos do modelo de maturidade são:
Estratégia
Organizações com níveis de maturidade altas comunicam a visão. Ou seja, o caminho da liderança a
seguir com uma estratégia de negócios e fornecer os princípios para estratégias detalhadas
relacionadas às principais áreas de negócios, das quais a estratégia de dados deve se alinhar.
Governança corporativa
Os elementos principais da boa governança corporativa estão vigentes e estão bem implantados?
Operam isoladamente um do outro ou garantem uma abordagem sincronizada? As atividades
relevantes e adaptáveis são realizadas regularmente e de forma eficiente? A governança deve alinhar-
se conformidade.
Liderança e patrocínio
Existem pessoas chaves nos níveis estratégicos da organização que compreendem a importância e o
valor do que está sendo feito? Apoiarão para garantir que se obtenha o tempo necessário para
demonstrar o verdadeiro valor advindo desse processo.
Estrutura, processo e ferramentas
Sua organização possui estrutura coerente para fazer com que os demais setores se mantenham
alinhados? Como as políticas são atualizadas? As ferramentas disponíveis ajudam ou atrapalham?
Quantos sistemas relacionados a dados estão em operação no momento? As pessoas utilizam esses
sistemas de dados de forma correta? Compreende o ciclo de vida das informações na sua
organização?
Políticas
Existem políticas, padrões, procedimentos para garantir que as pessoas da organização tenham um
instrumento de alinhamento estratégico? Essas políticas, procedimentos e padrões são claras,
consistentes e fáceis de utilizar? Existe uma estrutura para demonstrar a inter-relação entre essas
políticas?
Risco de informação
O risco das informações está bem definido e em que nível, tendo em vista a importância do negócio?
As ferramentas vigentes para auxiliar o gerenciamento de dados e adequada para mitigar os riscos
adequadamente?
Arquitetura
Como as informações de toda a organização são estruturadas e como transitam entre os silos? As
arquiteturas estão mapeadas? Quais são os responsáveis?
Organização, funções e responsabilidade
As funções são claras e acordadas em toda a organização? Existe uma equipe dedicada pela gestão
dos dados da organização? Foram definidas funções para abordar elementos de gerenciamento e
garantia de informações em seus diferentes domínios? Existe um conselho diretor com poderes para
tomar decisões relacionadas a dados e informações?
Habilidades
Quais habilidades são necessárias para alcançar os objetivos de gerenciamento de dados definidos
pela organização? A organização dispõe de programas de treinamento para os profissionais de dados
e de informações?
Métricas
As funções de gerenciamento de dados são mensuradas do ponto de vista de desempenho e
demonstrada por meio de relatórios que apontam os benefícios alcançados? O resultado do processo
de mensuração é direcionado para as mudanças comportamentais pretendidos pela cultura de
valorização de dados?
Comportamento da tutela da informação
Valoriza-se os dados e o que pode ser realizado pelo seu uso? Os investimentos no gerenciamento de
dados foram positivos resultado em resultados mensuráveis?
Tecnologia
A tecnologia disponível é facilmente escalável e adequada para atender os processos de
gerenciamento de dados
Referências Bibliográficas
The Data-Centric Revolution: Restoring Sanity to Enterprise Information Systems by Dave McComb
Publisher: Technics Publications, Release Date: September 2019.
Non-Invasive Data Governance by Robert S. Seiner, Publisher: Technics Publications, Release Date:
July 2014.
Gestão e Governança de Dados – Promovendo dados como ativo de valor nas empresas. Rêgo,
Bergson Lopes. Editora Brasport, 2013.
Navigating the Labyrinth: An Executive Guide to Data Management by Laura Sebastian-Coleman for
DAMA International Publisher: Technics Publications Release Date: June 2018.
DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition) by DAMA International Publisher:
Technics Publications, Release Date: July 2017.
Data Driven Business Transformation by Caroline Carruthers, Peter Jackson, Publisher: Wiley, Release
Date: May 2019.
Outra fontes.
http://www.datagovernance.com/goals-and-principles-for-data-governance/
Aqui estão os Princípios Orientadores de Governança de Dados do Data Governance Institute,
juntamente com os comentários.
1. Princípio - Integridade
Os participantes da Governança de Dados praticarão integridade com suas relações entre si; eles
serão sinceros e imediatos ao discutir drivers, restrições, opções e impactos para decisões
relacionadas a dados.
Isto é essencial. Seu programa está fadado a problemas, a menos que sua equipe do DGO atue como
"intermediários confiáveis" de informações ao transmitir mensagens entre diferentes partes
interessadas e participantes.
2. Princípio - Transparência
Os processos de administração e administração de dados exibirão transparência; deve ficar claro para
todos os participantes e auditores como e quando as decisões e controles relacionados aos dados
foram introduzidos nos processos.
Nem tudo pode ser transparente, é claro. Para ser eficaz, às vezes as medidas de segurança não
podem ser óbvias. Porém, para qualquer atividade relacionada a dados, as pessoas da DIREITA
devem descobrir o que está acontecendo.
3. Princípio - Auditabilidade
As decisões, processos e controles relacionados a dados sujeitos ao Data Governace serão
auditáveis; eles serão acompanhados de documentação para suportar os requisitos de auditoria
operacional e baseada em conformidade.
Se o foco do seu programa for algo diferente da conformidade, é fácil esquecer que outras pessoas
podem precisar revisar seu trabalho e suas decisões. Esse princípio exige equilíbrio; você precisa
deixar rastros quando apropriado, mas não quer gastar horas criando documentação que ninguém
precisa.
4. Princípio - Responsabilização
O Data Governance definirá responsabilidades para decisões, processos e controles multifuncionais
relacionados a dados.
Freqüentemente, o Data Governance pode fornecer um ótimo serviço, abordando “lacunas e
sobreposições” nas responsabilidades relacionadas aos dados. Procure situações em que NINGUÉM é
responsável ou MUITOS grupos estão listados como responsáveis e é provável que ninguém
realmente seja.
5. Princípio - Administração
O Data Governance definirá responsabilidades por atividades de administração que são de
responsabilidade de colaboradores individuais, bem como responsabilidades por grupos de Data
Stewards.
Não negligencie situações em que alguém não recebeu a designação formal de Data Steward. Eles
ainda podem ter responsabilidades de mordomia que devem ser incorporadas às suas
responsabilidades formais.
6. Princípio – Verificações e contrapesos
O Data Governance definirá responsabilidades de maneira a introduzir verificações e ponderações
equilibradas entre as equipes de negócios e tecnologia, bem como entre aqueles que criam / coletam
informações, quem os gerencia, quem os utiliza e quem introduz padrões e requisitos de
conformidade.
O estabelecimento de verificações e balanços apropriados que possam orientar os esforços de
gerenciamento é provavelmente o papel mais importante de Governança de Dados.
7. Princípio - Padronização
O Data Governance apresentará e dará suporte à padronização de dados corporativos.
Nem tudo pode ser padronizado - nem deveria ser. Mas alcançar a padronização de dados é um pré-
requisito para muitos projetos de negócios e TI de alto valor. E NUNCA é alcançado de maneira
sustentável sem Governança e Administração de Dados.
8. Princípio - Gerenciamento de Mudanças
O Data Governance oferecerá suporte a atividades proativas e reativas de gerenciamento de
mudanças para valores de dados de referência e a estrutura / uso de dados mestre e metadados.
Se você deseja sucesso sustentável para projetos que envolvem dados, você precisa controlar como
esses dados são alterados. Sim, alguns dados devem mudar com frequência. Outros dados - como
uma lista de valores válidos para o campo "Estado ou província" em um endereço - devem mudar
raramente, e apenas com ótimas deliberações e análises de impacto. A maioria dos programas de
Governança de Dados se envolve em atividades de gerenciamento de alterações relacionadas a
dados, mesmo que apenas incorporando atividades de notificação de alterações nas
responsabilidades do Data Stewardship.
Esses princípios estão imbuídos em todos os programas, processos e projetos bem-sucedidos de
Governança e Administração de Dados. São os princípios que ajudam as partes interessadas a se
unirem para resolver os tipos de conflitos relacionados a dados que são inerentes a todas as
organizações.

GOVERNANCA DE DADOS.pdf

  • 1.
    Fonte: https://www.escolavirtual.gov.br/curso/270/ Lição módulo1 1. Introdução O que é importante em uma organização? Pessoas, orçamento, equipamentos, imóveis, dados… é difícil pensar no funcionamento de organizações na ausência de um desses elementos, o que prova a importância de todos eles. Vários desses são ativos essenciais à maioria das entidades e, como tais, devem ser bem geridos e governados, de modo a maximizar o seu valor. Você sabe a distinção entre gerir e governar? Em síntese, gerir é garantir que fazemos certo as coisas, enquanto governar é garantir que fazemos as coisas certas. (WODZINSKI et al, 2015). O que vem a ser Governança de Dados? Em suma, a Governança de Dados é responsável por gerir os princípios de organização e controle de dados e informações. Esta gestão envolve uma interface com diversas outras funções e estabelece políticas e diretrizes corporativas para, além de atribuir papéis e responsabilidades, governar os dados. O escopo de atuação da Governança de Dados é muito amplo. Engana-se quem acha que ela atua somente no patamar das normas e dos padrões ou por meio de controles e permissões de acesso a dados e informações. A Governança de Dados também atua com uma visão mais apurada sobre os dados estratégicos da organização, definindo e analisando os processos que produzem e se abastecem desses dados. Governança de Dados, segundo consta no Inciso VI do Art. 2º da Portaria STI/MP nº 58, de 23 de dezembro de 2016, é o conjunto de políticas, processos, pessoas e tecnologias que visam a estruturar e administrar os ativos de informação, com o objetivo de aprimorar a eficiência dos processos de gestão e da qualidade dos dados, a fim de promover eficiência operacional, bem como garantir a confiabilidade das informações que suportam a tomada de decisão. São objetivos da Governança de Dados:  Definir e implementar estratégias de dados, políticas, normas, padrões, arquitetura, processos e métricas.  Patrocinar e monitorar os projetos relacionados à Gestão de Dados.  Implementar e gerenciar a Gestão de Riscos relacionada ao compartilhamento de dados.  Promover o valor dos dados como ativos estratégicos. 2. A Importância da Governança de Dados Governança de Dados permite validar, qualificar, distribuir, organizar e armazenar as informações da organização de maneira precisa, ágil e eficiente. Um exemplo prático de uso da Governança de Dados pode ser verificado na implementação da plataforma de Análise de Dados para Administração Pública, denominada GovData. Essa plataforma
  • 2.
    disponibiliza infraestrutura dearmazenamento e hospedagem, permitindo o cruzamento de grandes volumes de dados, visando: 1. A utilização de ferramentas para análise e cruzamento de dados para geração de informações para a tomada de decisões. 2. O favorecimento da desburocratização por meio de acesso centralizado a informações de governo para simplificar a oferta de serviços públicos. 3. A ampliação da transparência permitindo a análise de contas públicas para combater fraudes. 4. A adoção de tecnologia de ponta no processamento de grande volume de dados com rápido tempo de resposta. 5. A viabilização da segurança e garantia de sigilo e individualização das bases de dados. 6. A alavancagem da economicidade pelo uso compartilhado de infraestrutura e do consumo de dados para redução de custos. Os ganhos advindos do uso da Governança de Dados são muitos – alguns intangíveis – e variam para cada organização. Os principais ganhos comuns à maioria das organizações que adotam a Governança de Dados como parte de sua estrutura organizacional são:  Mudança de cultura: dados e informações passam a ser reconhecidos como importantes ativos estratégicos nas organizações.  Melhor alinhamento entre as áreas de Tecnologia da Informação e Comunicação (TIC) e de Negócio: esse alinhamento é premissa fundamental para o bom funcionamento da Governança de Dados. Com isso, outras áreas como a de mapeamento de processos e a de desenvolvimento de sistemas podem se beneficiar de alinhamentos já iniciados.  A gestão das operações de captura, armazenamento, proteção, planejamento, controle e garantia da qualidade dos ativos de dados é centralizada em uma única estrutura, permitindo a redução de custos e a otimização do uso dos recursos.  Criação de uma cultura do uso de indicadores de processo, qualidade e desempenho de dados e informações: o objetivo é manter alinhados a Governança de Dados e o Planejamento Estratégico da Organização.  Conhecimento de dados e informações utilizados por meio da adoção de um vocabulário único sobre as definições dos dados: ampliação e melhoria da disseminação do conhecimento entre as pessoas – passagem do capital intelectual para o capital estrutural.  Entendimento das principais necessidades de dados e informações da organização, fornecendo um importante subsídio para estabelecer o planejamento para absorção, criação e/ou transformação de novos dados e informações para a empresa: definir o que realmente é importante em relação à utilização de dados e informações e estabelecer prioridades em relação às futuras implementações e mudanças.  Redução da quantidade de informações redundantes.  Estabelecimento de mecanismos formais de segurança para acesso e disponibilização de dados e informações.  Reutilização de dados corporativos e/ou compartilhados, por meio do gerenciamento de dados mestre e dados de referência.  Total governança dos dados manipulados pela organização. O tema Governança de Dados será mais detalhado no Item 3.1 do Módulo III. 3. Cadeia de Evolução dos Dados e Informações Dado -> informação -> conhecimento e sabedoria constituem a cadeia de evolução de dados e informações. Na verdade, quando falamos sobre “dados” estamos nos referindo à base da matéria- prima necessária para conseguir o que todas as organizações desejam: utilizar o conhecimento das informações para tomar decisões ágeis e corretas. A cadeia de evolução de dados e informações representa a transformação gradual e progressiva sobre o uso de dados e informações. Também serve como modelo para descobrir em que nível dessa cadeia
  • 3.
    as informações demais alto valor estratégico são utilizadas, possibilitando, desta forma, estabelecer ações para melhorar o nível da maturidade de dados e informações.  Dados - São a base de todo o processo de geração da sabedoria organizacional e o primeiro estágio a ser atingido. Eles representam fatos por meio de um conjunto de caracteres primitivos e isolados, geralmente representados através de textos, números, imagens, sons ou vídeos. Os dados não possuem qualquer significado relevante dentro de um contexto de negócio (dados sem contexto). Metadados - Representam os significados dos dados. Estes significados correspondem tanto ao conteúdo técnico do dado, obtido por:  informações sobre estrutura, formato, tamanho e restrições (metadados técnicos); e  informações sobre definições, conceito, relevância e regras de negócio dos dados envolvidos (metadados de negócio). Informações - Correspondem aos dados processados com algum significado. As informações são geradas e obtidas nos sistemas de processamento de transações e sistemas de apoio à decisão, reduzindo a incerteza sobre alguma coisa, estado ou evento. Quando os metadados são utilizados para leitura e interpretação dos dados, a cadeia de evolução do dado já mudou de estágio, ou seja, já está no nível da informação. Conhecimento - Corresponde ao processamento das informações com significados, premissas, padrões de comportamento, tendências e valores agregados a partir de um conjunto de regras de manipulação e características dessas informações. São o subsídio para soluções de problemas e tomadas de decisão. Atualmente, é impossível imaginar a evolução para este estágio da cadeia sem os sistemas de apoio à decisão e as aplicações de inteligência analítica. Sabedoria - É a utilização do conhecimento com efetividade. Apesar das aplicações de inteligência analítica já serem uma realidade dentro do mercado, fornecendo condições para a organização atingir o estágio anterior, muitas organizações que possuem estes subsídios desejam a “sabedoria”, mas não a conseguem. Parte deste fracasso está na confiabilidade dos dados, que não foram bem geridos no decorrer da evolução da cadeia e a outra parte na falta de habilidade dos profissionais em extrair as informações e utilizá-las de forma vantajosa. Algumas referências sobre Gestão de Dados, incluindo o guia DAMA-DMBOK©, não descrevem e não reconhecem a sabedoria como último estágio dessa cadeia, justamente pelo fato dela, em grande parte, depender da competência humana para atingir este estágio. Na imagem abaixo, observe um exemplo dessa cadeia:
  • 4.
    3.1. Organização daInformação na Administração Pública Federal - APF É sabido que os órgãos públicos geram muitos dados e informações. Cobram taxas e impostos, constroem estradas, abastecem hospitais, pagam benefícios e cancelam permissões de motoristas, essas ações são sustentadas pelo primeiro item: a cobrança de impostos. Poderíamos, então, dizer que a função do Estado é cobrar impostos e executar ações com esse dinheiro. Mas, para todas as ações, desde a cobrança de impostos, o insumo básico é informação. Isso ocorre desde a renda declarada e da renda verificada até a ocorrência de multas que justificarão, por exemplo, o cancelamento da carteira de motorista. O governo é uma instituição de informações. Ele consome informações (renda, salários, bens, ocorrência de doenças, estoque de remédios, idade de pensionistas, multas de trânsito, etc.) e produz informações (imposto devido, necessidade de reposição de medicamentos, valores de pensões devidas, carteiras a serem canceladas). Seu desempenho, em todas as áreas, está ligado a essas informações. Com isso, a APF, diante de um cenário em que existe uma elevada geração de dados registrados em diversas bases sem integração e compartilhamento promoveu a criação de instrumentos normativos e adoção de soluções tecnológicas visando:  Criar um ambiente de integração para simplificar a oferta de serviços públicos.  Subsidiar e otimizar a formulação, a implementação, a avaliação e o monitoramento de políticas públicas.  Possibilitar a análise de condições para acesso a benefícios sociais e sua respectiva manutenção.  Fomentar a melhoria da qualidade e da fidedignidade dos dados custodiados pelo governo. Neste contexto, podemos destacar a publicação do Decreto nº 10.046, de 9 de outubro de 2019 e a criação da Plataforma de Interoperabilidade do Governo Federal - ConectaGov. Essas duas ações do governo fomentaram mecanismos de compartilhamento de dados e a possibilidade de interoperabilidade entre sistemas de governo, com garantia de requisitos de segurança necessários e suficientes para prover a disponibilidade, a integridade, a autenticidade e a confidencialidade dos dados.
  • 5.
    Posto isso, considerandoos objetivos da Governança de Dados, destacamos os instrumentos listados na tabela abaixo como sendo mecanismos de Governança de Dados do governo federal que visam promover o valor dos dados como ativos estratégicos e subsidiar o processo de transformação digital: INSTRUMENTO FINALIDADE Lei nº 12.527, de 18 de novembro de 2011 Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal. Lei nº 13.460, de 26 de junho de 2017 Definiu que os cidadãos brasileiros não precisam mais apresentar a órgãos públicos documentos, atestados ou certidões que já estejam de posse da Administração Pública Federal. São os órgãos que devem integrar as bases de dados e compartilhar essas informações. Esse compartilhamento pode ser feito de forma automatizada, sem intervenção humana, por meio de uma API – Application Programming Interface, uma forma padronizada de conexão e troca de informações entre diferentes sistemas de diferentes órgãos. Lei nº 13.709, de 14 de agosto de 2018 Lei Geral de Proteção de Dados Pessoais (LGPD). Decreto nº 8.638, de 15 de janeiro de 2016 Institui a Política de Governança Digital no âmbito dos órgãos e das entidades da Administração Pública Federal direta, autárquica e fundacional. Decreto nº 8.777, de 11 de maio de 2016 Institui a Política de Dados Abertos do Poder Executivo Federal. Decreto nº 10.046, de 9 de outubro de 2019 Dispõe sobre o compartilhamento de dados no âmbito da Administração Pública Federal e institui o Cadastro base do Cidadão e o Comitê Central de Governança de Dados. Decreto nº 8.936, de 19 de dezembro de 2016 Institui a Plataforma de Cidadania Digital e dispõe sobre a oferta dos serviços públicos digitais no âmbito dos órgãos e das entidades da Administração Pública Federal direta, autárquica e fundacional. Decreto nº 9.094, de 17 de julho de 2017 Dispõe sobre a simplificação do atendimento prestado aos usuários dos serviços públicos. Institui o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo para a apresentação de dados do cidadão no exercício de obrigações e direitos e na obtenção de benefícios. Ratifica a dispensa do reconhecimento de firma e da autenticação em documentos produzidos no país. Institui a Carta de Serviços ao Usuário. Decreto nº 9.203, de 22 de novembro de 2017 Dispõe sobre a política de governança da Administração Pública Federal direta, autárquica e fundacional. Decreto nº 9.723, de 11 de março de 2019 Altera o Decreto nº 9.094, de 17 de julho de 2017, o Decreto nº 8.936, de 19 de dezembro de 2016, e o Decreto nº 9.492, de 5 setembro de 2018, para instituir o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo da apresentação de outros documentos do cidadão no exercício de obrigações e direitos ou na obtenção de benefícios e regulamentar dispositivos da Lei nº 13.460, de 26 de junho de 2017. Decreto nº 9.929, de 22 de julho de 2019 Dispõe sobre o Sistema Nacional de Informações de Registro Civil - Sirc e sobre o seu comitê gestor.
  • 6.
    Portaria STI/MP nº58, de 23 de dezembro de 2016 Dispõe sobre procedimentos complementares para o compartilhamento de bases de dados oficiais entre órgãos e entidades da Administração Pública Federal direta e indireta e as demais entidades controladas direta ou indiretamente pela União. Em decorrência da publicação desses instrumentos, principalmente do Decreto nº 8.638/2016 e do Decreto nº 10.046, de 9 de outubro de 2019, foram desenvolvidas as soluções tecnológicas, com suas respectivas finalidades, apresentadas no quadro a seguir: SOLUÇÃO FINALIDADE PLATAFORMA GOVDATA Disponibiliza infraestrutura de Data Lake, que permite a hospedagem e o cruzamento de grandes volumes de dados provenientes de várias bases dados de órgãos da Administração Pública Federal - APF. Nesse ambiente, é possível compartilhar informações entre órgãos, mantendo o sigilo e confidencialidade daqueles dados que são de uso exclusivo. PLATAFORMA CONECTAGOV Plataforma de Interoperabilidade do governo federal. Uma infraestrutura tecnológica que propicia:  A integração de serviços públicos.  O compartilhamento de informações e mediação de aplicações.  A governança dos ativos e processos de integração.  Modelo simplificado de consumo de API's. ACESSO ÚNICO Ferramenta de autenticação para integrar os dados de cadastro dispersos na Administração Pública Federal. PORTAL GOV.BR O Gov.br é um projeto de unificação dos canais digitais do governo federal que, até dezembro de 2020, vai reunir os serviços públicos ofertados para o cidadão e informações sobre a atuação de todas as áreas do governo em um só lugar. Base de Dados Oficiais - As bases de dados do governo federal representam o conjunto de dados ou informações coletadas a partir de vários sistemas de governo, independente de formato, tecnologia ou tamanho; sendo o principal ativo de valor no que concerne ao processo de conhecimento das ações de governo e de insumos para a formulação de políticas públicas. 3.2. A Informação de Qualidade Os dados são um ativo valioso e devem ser gerenciados conforme são transferidos em uma organização. À medida que as fontes de informações estão se tornando mais numerosas e diversificadas e as iniciativas de conformidade regulatória mais direcionadas, existe a necessidade de integrar e acessar informações dessas fontes diferentes de forma consistente, confiável e reutilizável. A informação de qualidade deriva de dados qualificados, característica essencial que determina a confiabilidade dos dados para a tomada de decisões.
  • 7.
    Sendo o governouma organização de informações, seus resultados estão ligados às suas informações e à qualidade dessas. Exemplo: Se o índice de erro no controle de estoque de medicamentos subir muito, não apenas o governo irá gastar no que não precisa, como poderá deixar a população sem atendimento médico adequado. A qualidade da informação inclui atualização, completude, detalhes etc. 3.3. Legislação Correlata O uso da informação no âmbito do governo federal é regulamentado por vários instrumentos normativos. O mais recente é a Lei Geral de Proteção de Dados (Lei nº 13.709/2018), entre outras produzidas na medida em que a implementação de novos conceitos e tecnologias são agregados com a finalidade de aumentar a efetividade das políticas públicas, bem como ampliar a oferta e digitalização de serviços públicos da Administração Pública Federal. Destaca-se, dentre esses instrumentos normativos, o Decreto nº 8.789, de 29 de junho de 2016, que dispõe sobre o compartilhamento de bases de dados na Administração Pública Federal; e a Portaria STI/MP nº 58, de 23 de dezembro de 2016, que dispõe sobre procedimentos complementares para o compartilhamento de bases de dados oficiais entre órgãos e entidades da Administração Pública Federal direta e indireta e as demais entidades controladas direta ou indiretamente pela União. Esses dois instrumentos têm o objetivo de estabelecer os fundamentos legais para o compartilhamento de bases de dados oficiais entre órgãos e entidades da Administração Pública Federal direta e indireta e as demais entidades controladas direta ou indiretamente pela União, visando:  Prover mecanismos para simplificar a oferta de serviços públicos.  Subsidiar e otimizar a formulação, a implementação, a avaliação e o monitoramento de políticas públicas; possibilitar a análise de condições para acesso a benefícios sociais e sua respectiva manutenção.  Fomentar a melhoria da qualidade e da fidedignidade dos dados custodiados pelo governo por meio de mecanismos de compartilhamento de dados que garantam a confiabilidade das informações, sua interoperabilidade e os requisitos de segurança da informação e comunicações necessários e suficientes para prover a disponibilidade, a integridade, a autenticidade e a confidencialidade. 4. Governança e Gestão Segundo o Decreto nº 9.203, de 22 de novembro de 2017, que dispõe sobre a Política de Governança da Administração Pública Federal direta, autárquica e fundacional, a Governança Pública compreende o conjunto de mecanismos de liderança, estratégia e controle postos em prática para avaliar, direcionar e monitorar a gestão, com vistas à condução de políticas públicas e à prestação de serviços de interesse da sociedade. Nesse sentido, a segunda edição do Guia Referencial Básico de Governança do Tribunal de Contas da União - TCU (2015) apresenta um resumo das características sobre gestão e governança. São funções da Governança:  Definir o direcionamento estratégico.  Supervisionar a gestão.
  • 8.
     Envolver aspartes interessadas.  Gerenciar riscos estratégicos.  Gerenciar conflitos internos.  Auditar e avaliar o sistema de gestão e controle.  Promover a accountability (prestação de contas e responsabilidade) e a transparência. De modo complementar, a Gestão diz respeito ao funcionamento do dia a dia de programas e de organizações no contexto de estratégias, políticas, processos e procedimentos que tenham sido estabelecidos pelo órgão1 ; preocupa-se com a eficácia (cumprir as ações priorizadas) e a eficiência das ações (realizar as ações da melhor forma possível, em termos de custo-benefício). São funções da Gestão:  Implementar programas.  Garantir a conformidade com as regulamentações.  Revisar e reportar o progresso de ações.  Garantir a eficiência administrativa.  Manter a comunicação com as partes interessadas.  Avaliar o desempenho e aprender. Concluindo:  A Gestão é inerente e integrada aos processos organizacionais, sendo responsável pelo planejamento, execução, controle e ação, enfim, pelo manejo dos recursos e poderes colocados à disposição de órgãos e entidades para a consecução de seus objetivos.  A Governança provê direcionamento, monitoramento, supervisão e avaliação da prática da gestão, com vistas ao atendimento das necessidades e expectativas dos cidadãos e demais partes interessadas. Observe, na imagem a seguir, as funções de cada uma delas. Neste contexto, a Governança de Dados está organizada da seguinte forma:
  • 9.
    4.1. Tipos dePapéis Até recentemente, as funções de Administrador de Dados - AD e Administrador de Banco de Dados - DBA, eram os principais e mais conhecidos papéis ligados às atividades de gerenciamento dos dados nas organizações. Não menos importante, o papel do AD não era mais suficiente para fazer o alinhamento entre a tecnologia e as demandas das áreas de negócio. Com o advento da Governança de Dados, o dado é considerado um dos principais ativos. Com isso, novos papéis surgiram com o propósito de fazer um melhor alinhamento entre a Tecnologia da Informação, responsável por custodiar os dados organizacionais, e a área de negócio, que é a real gestora dos dados coletados localmente e de outras bases de dados distribuídas por outras organizações. Nesse sentido, podemos categorizar esses papéis em três grupos distintos, considerando à área:  De negócio.  Estratégica.  Técnica/tecnológica. Essa distribuição é a mais comum nas organizações quer sejam privadas ou públicas, entretanto, dependendo das características finalísticas e da estrutura organizacional, haverá necessidade de se considerar alguns desses ou definir outros papéis, que poderão ser desempenhados por apenas uma pessoa. Nesse contexto, entendemos como papel o modo de se conduzir determinado ato ou negócio. O framework DAMA-DMBOK©, principal subsídio utilizado na produção deste curso, enumera mais de vinte papéis relacionados à Governança e Gestão de Dados. Assim sendo, serão abordados apenas os principais papéis apropriados à Gestão e a Governança de Dados na Administração Pública.
  • 10.
    4.2. Papéis Ligadosà Governança de Dados O Comitê de Curadores de Dados é uma Política de Governança de Dados com o objetivo de tomar decisões de alto nível com base na visão centrada em dados e informações, artefatos da arquitetura de dados e processos, conhecimento sobre negócio e as metas e objetivos que a organização deve atingir na perspectiva da Gestão de Dados e Informações. A imagem abaixo ilustra a Política de Governança de Dados. Citamos, como exemplo, a Curadoria de Informações, definida na Política de Governança da Informação do Banco Central do Brasil – BACEN (Portaria nº 90.187, de 17 de agosto de 2016), a qual compreende o conjunto de ações que visa zelar pela existência, consistência, integridade, precisão, relevância, autenticidade, segurança e documentação dos ativos de informação de uma base de dados, respeitando-se os objetivos, princípios e diretrizes da Plano de Governança da Informação (PGI). Criar Políticas, Processos e Procedimentos é um dos principais resultados da Governança de Dados.  As Políticas estabelecem um conjunto de metas e afirmam “o que deve ser feito” em alinhamento com outros instrumentos estratégicos da organização.  Os Processos indicam as atividades, pessoas, ferramentas e regras necessárias ao cumprimento da Política.  Os Procedimentos descrevem em detalhes como exatamente executar os Processos. Partindo da premissa de que a Governança e a Gestão são disciplinas distintas que se complementam, a Governança de Dados se utiliza do conhecimento e da competência das pessoas para definir políticas, responsabilidades, glossários, metadados, fluxos de trabalho dos dados em movimento, monitoramento e linhagem de dados que permitam à organização melhorar a qualidade, descoberta e entendimento desses, de modo a simplificar a extração de informações e conhecimentos, resultando em melhores análises e decisões de negócio.
  • 11.
    A seguir, vamosconhecer quatro papeis ligados à Governança de Dados. São eles:  Curador de Dados de Negócio.  Curador de Dados Corporativos.  Encarregado de Proteção de Dados ou Data Protection Officer – DPO.  Curador de Dados Técnico e Operacional. 4.2.1. Curador de Dados de Negócio Também conhecido como Business Data Steward, é o Gestor de Dados ligado à área de negócio da organização. Trabalha e atua como o principal curador dos dados, representando os interesses da área de negócios, atuando com responsabilidade e autoridade sobre o conjunto de dados do seu escopo de negócio. A ele compete:  Definir os metadados corretos (glossário de termos, nomes de entidades e atributos, regras de validação, valores válidos, regras de qualidade).  Identificar problemas de qualidade de dados e suas causas.  Acompanhar a resolução de problemas de qualidade.  Acompanhar o desenvolvimento de novas soluções de tecnologia.  Avaliar riscos e oportunidades no uso dos dados. O perfil desejado para a posição é de uma pessoa especialista na área de negócio com sólidos conhecimentos avançados em Gestão e Governança de Dados. Além disso, ele deve ter pleno domínio sobre captura de requisitos de informação, regras de negócio e modelagem conceitual de dados.
  • 12.
    4.2.2. Curador deDados Corporativos Curadores de Dados Corporativos são escolhidos entre os gestores das áreas de negócio. Geralmente, são ocupantes de cargos com poder de decisão. A ele compete:  Entender os processos da Gestão e Governança de Dados.  Conhecer o modelo de processos da sua área de negócio em profundidade e os outros processos de negócio.  Conhecer as técnicas de modelagem de dados.  Conhecer arquitetura de sistemas transacionais e Business Intelligence.  Apoiar na criação e manutenção do glossário de termos de negócio.  Apoiar na criação e manutenção do modelo de dados conceitual corporativo.  Avaliar a o valor das informações e sua qualidade.  Avaliar riscos e oportunidades associadas aos dados e negócio.  Corrigir problemas de qualidade de dados. 4.2.3. Encarregado de Proteção de Dados ou Data Protection Officer – DPO O Encarregado de Proteção de Dados ou Data Protection Officer – DPO, que teve como origem a General Data Protection Regulation – GDPR , com adaptações pela Lei Geral de Proteção de Dados – LGPD (Lei nº 13.709/2018), é o responsável por disseminar a cultura de proteção de dados na empresa, além de criar normas e procedimentos adequados à lei. Será ele que receberá notificações da Autoridade Nacional de Proteção de Dados – ANPD e dos titulares das informações e as colocará em prática. No art. 41, § 2º, da LGPD, temos algumas atividades do DPO, que consistem em: I. – Aceitar reclamações e comunicações dos titulares, prestar esclarecimentos e adotar providências; II. – Receber comunicações da autoridade nacional e adotar providências; III. – Orientar os funcionários e os contratados da entidade a respeito das práticas a serem tomadas em relação à proteção de dados pessoais; e IV. – Executar as demais atribuições determinadas pelo controlador ou estabelecidas em normas complementares. Devido a essas atividades, o DPO tem papel fundamental nas decisões estratégicas das organizações e deve ter autonomia sobre as atividades que envolvam qualquer tipo de tratamento de dados e contato direto com a direção da organização para poder tomar decisões que possam deixá-la em compliance com a lei. 4.2.4. Curador de Dados Técnico e Operacional Profissional responsável por projetar os mecanismos para integração dos dados. Ele deve dominar o uso de ferramentas de integração e de extração de dados como SOA, ETL e mecanismos de integração por meio de SGBDs. Destacam-se: Responsabilidades:  Emitir pareceres técnicos indicando a melhor forma de integração de dados.  Manter atualizado o catálogo de serviços de integração de dados.
  • 13.
     Apoiar aespecialização de mecanismos de integração.  Apoiar o desenvolvimento de serviços na construção de dispositivos de integração de dados. Competências:  Conhecimentos avançados de mecanismos de integração de dados.  Conhecimentos avançados de utilização de repositórios de ativos de informação. O primeiro benefício para a reutilização é obter cada ontologia em um tamanho compreensível. O benefício relacionado à reutilização é que, às vezes, uma ontologia tem axiomas que conflitam com a ontologia de importação. Ter módulos de tamanho razoável permite que um importador selecione os módulos que deseja e evite axiomas que não deseja.
  • 14.
    Lição módulo 2 1.A Importância do Gerenciamento de Dados Mesmo antes do surgimento da Tecnologia da Informação, a informação e o conhecimento foram fundamentais para a vantagem competitiva. As organizações que possuem informações confiáveis e de alta qualidade sobre seus usuários, produtos, serviços e operações podem tomar melhores decisões do que aquelas sem dados (ou com dados não confiáveis). Porém, produzir dados de alta qualidade e gerenciá-los de maneiras que permitam os seus usos com eficiência não é um processo simples. Para aprimoramento dos recursos de gerenciamento de dados de qualquer organização, faz-se necessário considerar os seguintes aspectos:  Os dados estão em todo lugar.  Dados como um ativo - valor.  Gerenciamento de dados versus gerenciamento de tecnologia.  Atividades de gerenciamento de dados.  Áreas de conhecimento em gerenciamento de dados. 1.1. Os Dados Estão em Todo Lugar As organizações sempre precisaram gerenciar seus dados, mas os avanços na tecnologia, considerando a onipresença dos dados, expandiram o escopo dessa necessidade de gerenciamento. Os dados são difundidos nas organizações. Quase todos os processos de negócios - desde a criação de clientes, transações de compras, contato com clientes para feedback e serviços - usam dados como entrada e produzem dados como saída. A maioria desses dados está em formato eletrônico, o que significa maleabilidade: podem ser armazenados em grandes quantidades, manipulados, integrados e agregados para diferentes usos, incluindo inteligência comercial e análise preditiva. Eles também fornecem evidências de conformidade de uma organização (ou falta de conformidade) com leis e regulamentos. As mudanças técnicas permitiram que as organizações usassem os dados de novas maneiras para criar produtos, compartilhar informações, criar conhecimento e melhorar o sucesso organizacional. Mas, o rápido crescimento da tecnologia e, com ela, a capacidade humana de produzir, capturar e extrair dados para obter significado intensificaram a necessidade de gerenciar dados de maneira eficaz. 1.2. Dados Como um Ativo Um ativo é um recurso econômico, que pode ser de propriedade ou controlado e que detém ou produz valor. Os ativos são frequentemente vistos como propriedade, mas com a forte implicação de que podem ser convertidos em dinheiro. Os dados são amplamente reconhecidos como um ativo da organização, embora muitas organizações ainda lutem para gerenciar os dados como tal. Um exemplo disso é o fato de que os dados ainda não são contabilizados no balanço da maioria das organizações. Se questionados, muitos usuários diriam que os dados de sua organização são um ativo valioso.
  • 15.
    Os dados nãosão apenas necessários para as operações de negócio, mas também podem fornecer informações sobre usuários, produtos e serviços. No entanto, pesquisas mostram que poucas organizações tratam seus dados como um ativo e para muitas eles podem até ser um passivo. A falha no gerenciamento de dados é semelhante à falha no gerenciamento de capital, isso resulta em desperdício e em oportunidades perdidas. Além do mais, dados mal gerenciados apresentam riscos éticos e de segurança. Mesmo usuários que reconhecem os dados como um ativo podem não ser capazes de descrever exatamente o que isso significa, pois os dados diferem de outros ativos de maneiras importantes. No entanto, o principal fator para o gerenciamento de dados é permitir que as organizações obtenham valor com seus dados, assim como o gerenciamento eficaz de ativos financeiros e físicos permite que as organizações obtenham valor com esses ativos. A obtenção de valor dos dados não ocorre no vácuo ou por acidente, pois além de gerenciamento, ela requer compromisso organizacional e liderança. 1.3. Gerenciamento de Dados x Gerenciamento de Tecnologia É necessário diferenciar Gerenciamento de Dados e Gerenciamento de Tecnologia! Gerenciamento de Dados é o desenvolvimento, execução e supervisão de planos, políticas, programas e práticas que entregam, controlam, protegem e aprimoram o valor dos ativos de dados e informações durante todo o seu ciclo de vida. Você pode se questionar: “Isso não é o que nosso departamento de tecnologia da informação tem feito?” A resposta é: infelizmente, não. A TI geralmente não se concentra nos dados. O foco é a tecnologia, os processos, as pessoas que desenvolvem aplicações e as ferramentas usadas para fazer isso. Historicamente, a TI não se concentra nos dados criados ou armazenados nas aplicações que gerencia. Não há direcionamento estratégico para isso. Embora o gerenciamento de dados seja altamente dependente da tecnologia e cruze com o gerenciamento de TI, as atividades são separadas, independentes de processos e ferramentas utilizadas. Com isso, o que o Gerenciamento de Dados realmente envolve? O que significa gerenciar dados de maneira eficaz? O Gerenciamento de Dados envolve o planejamento e a coordenação de recursos e atividades para atender aos objetivos organizacionais. As atividades em si variam desde as altamente técnicas, como garantir que grandes bancos de dados sejam acessíveis com desempenho e segurança, até as altamente estratégicas, como propor a interoperabilidade de dados entre entes de governo de maneira eficiente e segura. Essas atividades de gerenciamento devem se esforçar para disponibilizar dados confiáveis e de alta qualidade para a organização, garantindo que sejam acessíveis aos usuários autorizados e protegidos contra uso indevido. 1.4. Atividades de Gerenciamento de Dados Existe uma gama de atividades de Gerenciamento de Dados. Elas podem ser entendidas em três grupos:
  • 16.
     As quefocam na governança para garantir que a organização tome decisões consistentes e alinhadas (atividades de governança).  As que se concentram no gerenciamento do ciclo de vida dos dados, desde a obtenção dos dados até a sua eliminação (atividades de ciclo de vida).  As fundamentais, que focam em permitir o gerenciamento, manutenção e uso de dados ao longo do tempo. As atividades de governança ajudam a controlar o desenvolvimento de dados e reduzem os riscos associados ao seu uso, ao mesmo tempo em que permitem que uma organização aproveite-os estrategicamente. Essas atividades estabelecem um sistema de direitos e responsabilidades de decisão por dados para que uma organização possa tomar decisões consistentes nas verticais dos negócios. Atenção, as atividades de governança incluem as seguintes ações:  Definir a estratégia de dados.  Definir a política de governança.  Definir o valor dos dados para a organização.  Preparar a organização para obter mais valor de seus dados.  Avaliar práticas de gerenciamento de dados.  Evoluir a mentalidade da organização em torno dos dados. As atividades do ciclo de vida se concentram no planejamento e design dos dados, permitindo seu uso, garantindo que eles sejam efetivamente mantidos e realmente utilizados. Geralmente, o uso de dados resulta em aprimoramentos e inovações que têm seus próprios requisitos de ciclo de vida. Esteja atento às atividades do ciclo de vida que consideram:  Arquitetura de dados.  Modelagem de dados.  Construção e gerenciamento de data warehouses e marts.  Integração de dados para uso por analistas de inteligência de negócios e cientistas de dados.  Gerenciamento do ciclo de vida de dados compartilhados altamente críticos, como dados de referência e dados mestres. Atividades básicas são necessárias para o gerenciamento consistente dos dados ao longo do tempo. Abaixo, ressaltamos as ações que são vitais a todo o ciclo de vida dos dados:  Garantir a proteção dos dados.  Gerenciar metadados.  Gerenciar a qualidade dos dados. As atividades fundamentais devem ser consideradas como parte do planejamento e design e devem ser realizadas operacionalmente. Essas atividades também são essenciais para o sucesso das estruturas de governança. 1.5. Áreas de Conhecimento em Gerenciamento de Dados Atividades de Gerenciamento de Dados são realizadas por profissionais que atuam em diferentes áreas de conhecimento, logo necessitam das habilidades e dos conhecimentos apresentados na imagem a seguir.
  • 17.
    O guia criadopela DAMA Internacional, organização que visa promover a compreensão, o desenvolvimento e a prática da gestão de dados e informações como ativos chave de uma organização, propõe o conjunto de dez funções para a Governança de Dados. Acesse, para conhecer cada uma dessas funções, as abas a seguir: Governança de Dados A Governança de Dados fornece orientação e supervisão para atividades e funções de gerenciamento de dados, estabelecendo um sistema de direitos e responsabilidades de decisão por dados. Esses direitos e responsabilidades devem responder às necessidades da empresa como um todo. Arquitetura de Dados A Arquitetura de Dados define o modelo para o gerenciamento de ativos de dados, alinhando-se à estratégia organizacional e estabelecendo projetos para atender aos requisitos de dados estratégicos. Modelagem e Design de Dados A Modelagem e Design de Dados é o processo de descoberta, análise, representação e comunicação de requisitos de dados de uma forma precisa chamada Modelo de Dados. Armazenamento e Operações de Dados O Armazenamento e Operações de Dados inclui o design, implementação e suporte de dados armazenados para maximizar seu valor. As operações fornecem suporte durante todo o ciclo de vida dos dados, do planejamento à disposição dos dados.
  • 18.
    Segurança de Dados ASegurança de Dados garante que a privacidade e a confidencialidade dos dados sejam mantidas, que os dados não sejam violados e que os dados sejam acessados adequadamente. Integração e Interoperabilidade de Dados A Integração e Interoperabilidade de Dados inclui processos relacionados à movimentação e consolidação de dados dentro e entre repositórios de dados, aplicativos e organizações. Gerenciamento de Documentos e Conteúdo O Gerenciamento de Documentos e Conteúdo inclui atividades de planejamento, implementação e controle para gerenciar o ciclo de vida de dados e informações encontrados em uma variedade de mídias não estruturadas, especialmente os documentos necessários para suportar os requisitos de conformidade legal e regulamentar. Gerenciamento de Referência e Dados Mestre O Gerenciamento de Referência e Dados Mestre inclui reconciliação e manutenção contínuas dos principais dados compartilhados críticos para permitir o uso consistente entre os sistemas da versão mais precisa, oportuna e relevante da verdade sobre entidades essenciais de negócios. Data Warehousing e Business Intelligence O Data Warehousing e o Business Intelligence incluem os processos de planejamento, implementação e controle para gerenciar os dados de suporte à decisão e permitir que os profissionais do conhecimento obtenham valor dos dados por meio de análise e relatório. Gerenciamento de Metadados O Gerenciamento de Metadados inclui atividades de planejamento, implementação e controle para permitir o acesso a metadados integrados de alta qualidade, incluindo definições, modelos, fluxos de dados e outras informações críticas para entender os dados e os sistemas através dos quais são criados, mantidos e acessados. Gerenciamento da Qualidade dos Dados O Gerenciamento da Qualidade dos Dados inclui o planejamento e a implementação de técnicas de gerenciamento da qualidade para medir, avaliar e melhorar a adequação dos dados para uso em uma organização. Essas áreas de conhecimento representam atividades no núcleo do Gerenciamento de Dados. Qualquer organização que busque obter valor com seus dados deverá se envolver neles. É bom lembrar-se que os dados também estão evoluindo. Alterações em nossa capacidade de criar e usar dados significam que outros conceitos também podem ser considerados "áreas de conhecimento" de Gerenciamento de Dados, tais como Ética de Dados, Ciência de Dados, Gerenciamento de Big Data e Tecnologias Emergentes. A estrutura DAMA define as áreas de conhecimento de Gerenciamento de Dados. Ela centraliza a disciplina Governança de Dados das atividades de Gerenciamento de Dados, já que a governança é necessária para a consistência e o equilíbrio entre as funções. As outras áreas de conhecimento (Arquitetura de Dados, Modelagem de Dados etc.) são balanceadas em torno do centro. Todas são partes necessárias de uma função madura de Gerenciamento de Dados, mas podem ser implementadas em momentos diferentes, dependendo dos requisitos da organização.
  • 19.
    Os profissionais deGerenciamento de Dados que trabalham nessas áreas de conhecimento devem ter como objetivo:  Compreender e dar suporte às necessidades de informações da organização e de suas partes interessadas, incluindo clientes, funcionários e parceiros de negócios.  Capturar, armazenar e garantir a integridade e a qualidade dos dados para permitir seu uso pela organização.  Garantir a segurança, a privacidade e a confidencialidade dos dados, impedindo acesso, manipulação ou uso inadequado. 2 Desafios no Gerenciamento de Dados O gerenciamento de dados é uma disciplina focada em aprimorar o valor dos dados e informações. O gerenciamento eficaz de dados beneficia a organização e sociedade de várias maneiras. No caso da Administração Pública, é disciplina fundamental para alavancar o planejamento eficiente de Políticas Públicas e de disponibilização de serviços digitais ao cidadão por meio da interoperabilidade de dados. Existem dez funções principais de gerenciamento de dados que envolvem uma variedade de indivíduos com habilidades diferentes. O gerenciamento de dados é mais uma função que, quando implementado de forma eficiente, promove inúmeros resultados positivos. Em termos gerais, podemos definir Gerenciamento de dados como o desenvolvimento, execução e supervisão de planos, políticas, programas e práticas que entregam, controlam, protegem e aprimoram o valor dos ativos de dados e informações ao longo de seus ciclos de vida. Os dados são uma necessidade estratégica e operacional. Para gerenciar qualquer ativo, é necessário trabalhar para obter valor. Neste contexto, abordaremos os seguintes tópicos:  Os dados diferem de outros ativos.  Dados representam risco.  Dados de baixa qualidade custam tempo e dinheiro.  A avaliação de dados não é padronizada.  Gerenciamento de dados significa gerenciar o ciclo de vida dos dados.  Diferentes tipos de dados têm diferentes requisitos de ciclo de vida.  Os metadados devem ser gerenciados como parte do ciclo de vida dos dados.  O gerenciamento de dados geralmente é confundido com o gerenciamento de tecnologia da informação.  O que o gerenciamento de dados requer. 2.1 Os dados diferem de outros ativos Os dados têm características únicas que o diferenciam de outros ativos: os ativos físicos, por exemplo, podem ser apontados, tocados e movimentados. Os ativos financeiros, por sua vez, são contabilizados no balanço patrimonial. Mas os dados são diferentes, porque não são tangíveis. No entanto, são duráveis e não se desgastam; são fáceis de copiar e transportar, mas não de serem reproduzidos se perdidos ou destruídos. Por não serem consumidos quando usados, podem até ser roubados sem desaparecer. Os dados são dinâmicos e podem ser usados para várias finalidades. Os mesmos dados podem até ser usados por várias pessoas ao mesmo tempo - algo que é impossível com ativos físicos ou financeiros. Muitos usos de dados geram mais dados. Essas diferenças tornam desafiador simplesmente manter o controle dos dados e muito mais ainda atribuir um valor monetário a eles. Sem esse valor monetário, pode ser difícil medir como os dados contribuem para o sucesso organizacional.
  • 20.
    Essas diferenças tambémlevantam outros problemas que afetam o gerenciamento de dados, como:  Inventariar a quantidade de dados que uma organização possui.  Definir propriedade e responsabilidade dos dados.  Proteger dados contra o uso indevido.  Gerenciar riscos associados aos dados.  Definir e aplicar padrões de qualidade para dados. 2.2 Dados representam risco Os dados não representam apenas valor e oportunidade, também retratam riscos. Dados imprecisos, incompletos ou desatualizados indicam riscos, porque suas informações não estão corretas. Além disso, os dados apresentam outras ameaças, incluindo:  Uso indevido: se os consumidores de dados não tiverem informações suficientes e corretas (metadados) sobre os dados que eles usam, existe o risco de serem mal utilizados e/ou compreendidos.  Confiabilidade (Unreliability): Se a qualidade e a confiabilidade dos dados não forem estabelecidas por meio de normas e métricas, então existe risco de que decisões sejam baseadas em dados não confiáveis.  Uso inadequado: se os dados não estiverem protegidos, existe o risco de que eles sejam utilizados por pessoas não autorizadas para fins não autorizados. O fato de os dados poderem ser facilmente copiados e replicados significa que eles podem ser violados sem serem "retirados" de seus legítimos proprietários. Além disso, como os dados representam pessoas, produtos e dinheiro, os legisladores e reguladores reconheceram os possíveis usos e abusos das informações e criaram leis destinadas a mitigar riscos óbvios. Por exemplo:  A Sarbanes-Oxley nos EUA concentra-se nos controles sobre a precisão e a validade dos dados das transações financeiras, da transação ao balanço.  O Solvência II na União Europeia concentra-se na linhagem de dados e na qualidade dos dados subjacentes aos modelos de risco e adequação de capital no setor de seguros.  Em todo o mundo, os regulamentos de privacidade de dados descrevem obrigações em relação ao tratamento de dados de identificação pessoal (tais como: nome, endereço, afiliação religiosa ou orientação sexual) e privacidade (acesso ou restrição a essas informações): o Lei de Portabilidade e Responsabilidade do Seguro de Saúde (HIPPA), nos EUA. o Lei de Proteção de Informações Pessoais e Documentos Eletrônicos (PIPEDA), no Canadá. o O Regulamento Geral de Proteção de Dados (RGPD), na União Europeia. o Lei Geral de Proteção de Dados Pessoais (LGPD), Lei nº 13.709/2018, é a legislação brasileira que regula as atividades de tratamento de dados pessoais e que também altera os artigos 7º e 16 do Marco Civil da Internet, Lei n° 12.965/2014. Destacamos a relevância da publicação do Decreto nº 10.046, de 09 de outubro de 2019 que estabeleceu as regras e as diretrizes de compartilhamento de dados no âmbito da Administração Pública Federal - APF. Esse decreto, instituiu também o Cadastro Base do Cidadão (CBC) e o Comitê Central de Governança de Dados (CCGD). Sendo este último, o fórum legítimo para propor políticas e normas sobre Governança de Dados, mediar e dirimir conflitos sobre compartilhamento de dados entre órgãos e entidades da administração pública federal e demais Poderes da União.
  • 21.
     Regras ediretrizes do compartilhamento de dados na APF As regras contidas no decreto não são aplicáveis ao compartilhamento de dados com os conselhos de fiscalização de profissões regulamentadas e com o setor privado. Além disso, as regras do texto excluem os dados protegidos por sigilo fiscal que estão sob gestão da Secretaria Especial da Receita Federal do Brasil do Ministério da Economia. A política de compartilhamento de dados terá como finalidades:  simplificar a oferta de serviços públicos;  orientar e otimizar a formulação, a implementação, a avaliação e o monitoramento de políticas públicas;  possibilitar a análise das condições de acesso e manutenção de benefícios sociais e fiscais;  promover a melhoria da qualidade e da fidedignidade dos dados custodiados pela administração pública federal; e,  aumentar a qualidade e a eficiência das operações internas da administração pública federal. O Decreto traz alguns conceitos de atributos dos dados, como o de atributos biográficos, que são os dados de pessoa natural relativos aos fatos da sua vida, tais como nome civil ou social, data de nascimento, filiação, naturalidade, nacionalidade, sexo, estado civil, grupo familiar, endereço e vínculos empregatícios; o de atributos biométricos que são as características biológicas e comportamentais mensuráveis da pessoa natural que podem ser coletadas para reconhecimento automatizado, tais como a palma da mão, as digitais dos dedos, a retina ou a íris dos olhos, o formato da face, a voz e a maneira de andar; e o de atributos genéticos, que são as características hereditárias da pessoa natural, obtidas pela análise de ácidos nucleicos (DNA) ou por outras análises científicas. Além disso, traz o conceito de dados cadastrais, que são informações identificadoras perante os cadastros de órgãos públicos, tais como CPF, CNPJ, PIS, NIS, número de título de eleitor etc. O compartilhamento de dados pelos entes da administração pública federal deverá seguir algumas diretrizes. No caso de informação de Estado, este compartilhamento deverá ser o mais amplo possível, observadas as restrições legais, os requisitos de segurança da informação e comunicações e o disposto na Lei nº 13.709, de 2018 (Lei Geral de Proteção de Dados Pessoais – LGPD). E no caso dados sigilosos, será necessária a assunção (aceitação) pelo recebedor de dados, dos deveres de sigilo e auditabilidade impostos ao custodiante dos dados. O Decreto assegura que nas hipóteses de tratamento de dados pessoais serão observados o direito à preservação da intimidade e da privacidade da pessoa natural, a proteção dos dados e as normas e os procedimentos previstos na legislação e que a coleta, o tratamento e o compartilhamento de dados por cada órgão do Governo Federal serão realizados nos termos do disposto na LGPD. Está estabelecido também que o compartilhamento de dados entre os órgãos e as entidades do Governo Federal é categorizado em três níveis, de acordo com sua confidencialidade, que serão definidas pelo gestor dos dados:  compartilhamento amplo – quando se tratar de dados públicos que não estão sujeitos a nenhuma restrição de acesso, cuja divulgação deve ser pública e garantida a qualquer interessado, na forma da legislação;  compartilhamento restrito – quando se tratar de dados protegidos por sigilo, nos termos da legislação, com concessão de acesso a todos os órgãos e entidades do Governo Federal para a execução de políticas públicas, cujo mecanismo de compartilhamento e regras sejam simplificados e estabelecidos pelo Comitê Central de Governança de Dados;  compartilhamento específico – quando se tratar de dados protegidos por sigilo, nos termos da legislação, com concessão de acesso a órgãos e entidades específicos, nas hipóteses e para os fins previstos em lei, cujo compartilhamento e regras sejam definidos pelo gestor de dados.
  • 22.
     Cadastro Basedo Cidadão O Cadastro Base do Cidadão constitui um meio unificado de identificação do cidadão para a prestação de serviços públicos. Ele funciona a partir do cruzamento de informações das bases dos dados cadastrais partindo do número do CPF do cidadão. A proposta envolve disponibilizar uma ferramenta unificada de atualização cadastral, suportada tecnologicamente por todas as entidades e órgãos públicos participantes do cadastro. Os dados que inicialmente serão disponibilizados serão os dados biográficos que constam na base do CPF. São eles: número de inscrição no CPF; situação cadastral no CPF; nome completo; nome social; data de nascimento; sexo; filiação; nacionalidade; naturalidade; indicador de óbito; data de óbito, quando cabível; e data da inscrição ou da última alteração no CPF.  Comitê Central de Governança de Dados  O Comitê Central de Governança de Dados (CCGD) é responsável, dentre outras tarefas, de elaborar as políticas e as diretrizes para a categorização de compartilhamento específico dos dados. A entidade também será responsável pela forma e o meio de publicação dessa categorização, tendo em mente a legislação pertinente, referente à proteção de dados pessoais e as regras e os parâmetros para o compartilhamento restrito, incluídos os padrões relativos à preservação do sigilo e da segurança.  O CCGD será composto sete membros: dois do Ministérios da Economia, sendo um da Secretaria Especial de Desburocratização, Gestão e Governo Digital, que será o presidente do Comitê, e um da Secretaria Especial da Receita Federal do Brasil; um da Casa Civil da Presidência da República; um da Secretaria de Transparência e Prevenção da Corrupção da Controladoria-Geral da União; um da Secretaria Especial de Modernização do Estado da Secretaria-Geral da Presidência da República; um da Advocacia-Geral da União; e um do Instituto Nacional do Seguro Social (INSS).  O Comitê terá reuniões ordinárias a cada dois meses e extraordinárias sempre que for convocado pelo seu presidente ou um de seus membros. O quórum de reunião será dois terços de seus membros e o quórum de aprovação é por consenso. Suas decisões serão resoluções que serão publicadas pela Secretaria Especial de Desburocratização, Gestão e Governo Digital do Ministério da Economia. 2.3 Dados de baixa qualidade custam dinheiro Garantir que os dados sejam de alta qualidade é essencial para seu gerenciamento. Se os dados não atenderem às necessidades de seus consumidores - se não forem "adequados ao objetivo" -, então o esforço para coletar, armazenar, proteger e permitir o acesso a eles é desperdiçado. Para garantir que os dados atendam às necessidades dos negócios, as equipes de gerenciamento de dados devem trabalhar com os consumidores para definir as características que tornam os dados de alta qualidade. A maioria dos usos dos dados envolve aprender com eles, a fim de aplicar esse aprendizado e criar valor. Por exemplo, entender os hábitos do cliente para melhorar um produto ou serviço; avaliar o desempenho organizacional ou as tendências do mercado, a fim de desenvolver uma melhor estratégia de negócios, etc. Dados de baixa qualidade são simplesmente caros para qualquer organização. As estimativas diferem, mas os especialistas acreditam que as organizações gastam entre 10 a 30% da receita lidando com problemas de qualidade de dados. A IBM estimou o custo de dados de baixa qualidade nos Estados Unidos da América, em 2016, em US $ 3,1 trilhões.
  • 23.
    Muitos dos custosde dados de baixa qualidade são ocultos e indiretos e, portanto, difíceis de mensurar. No entanto, outros custos podem ser provenientes de:  Retrabalho.  Soluções alternativas e processos de correção ocultos.  Ineficiências organizacionais ou baixa produtividade.  Conflito organizacional.  Insatisfação do usuário.  Custos de oportunidade, incluindo a incapacidade de inovar.  Custos ou multas de conformidade. Os benefícios correspondentes de dados de alta qualidade incluem:  Experiência aprimorada do usuário.  Maior produtividade.  Risco reduzido.  Capacidade de atuar em oportunidades.  Aumento de oportunidades.  Vantagem competitiva obtida com insights sobre políticas, serviços, processos e oportunidades.  Vantagem competitiva obtida com segurança e qualidade demonstráveis dos dados. Não é algo único como esses custos e benefícios implicam gerenciar a qualidade dos dados. A produção de dados de alta qualidade requer planejamento, comprometimento e uma mentalidade que agrega qualidade aos processos e sistemas, em conformidade com o padrão ISO. 2.4 A avaliação de dados não é padronizada Você sabe quanto custa coletar e gerenciar dados? E quanto custaria reconstruir o histórico, caso esses dados fossem perdidos? Ainda assim, colocar atribuir valor aos dados é útil porque as decisões estratégicas se tornam a base para a compreensão do valor das atividades de gerenciamento de dados. Uma abordagem para a avaliação de dados é definir categorias gerais de custo e benefício que podem ser aplicadas de maneira consistente em uma organização. As categorias de exemplo incluem:  Custo de obtenção e armazenamento de dados.  Custo da substituição de dados se eles forem perdidos.  Impacto para a organização se houver perda dados.  Custos potenciais de riscos associados aos dados.  Custo de mitigação de risco.  Custo de melhoria de dados.  Benefícios de dados de maior qualidade.  Vantagens de compartilhar esses dados.  Retorno esperado pelo uso inovador desses dados. A avaliação de ativos de dados também deve reconhecer que o valor dos dados é contextual (ou seja, o que é valioso para uma organização pode não o ser para outra) e geralmente temporal (ou seja, o uso foi vantajoso ontem e pode não o ser hoje). Apesar disso, dentro de uma organização, é provável que certos tipos de dados, como dados cadastrais, sejam consistentemente valiosos ao longo do tempo; portanto, a maioria das organizações se concentra primeiro em garantir a qualidade desses dados altamente críticos.
  • 24.
    2.4 A avaliaçãode dados não é padronizada Você sabe quanto custa coletar e gerenciar dados? E quanto custaria reconstruir o histórico, caso esses dados fossem perdidos? Ainda assim, colocar atribuir valor aos dados é útil porque as decisões estratégicas se tornam a base para a compreensão do valor das atividades de gerenciamento de dados. Uma abordagem para a avaliação de dados é definir categorias gerais de custo e benefício que podem ser aplicadas de maneira consistente em uma organização. As categorias de exemplo incluem:  Custo de obtenção e armazenamento de dados.  Custo da substituição de dados se eles forem perdidos.  Impacto para a organização se houver perda dados.  Custos potenciais de riscos associados aos dados.  Custo de mitigação de risco.  Custo de melhoria de dados.  Benefícios de dados de maior qualidade.  Vantagens de compartilhar esses dados.  Retorno esperado pelo uso inovador desses dados. A avaliação de ativos de dados também deve reconhecer que o valor dos dados é contextual (ou seja, o que é valioso para uma organização pode não o ser para outra) e geralmente temporal (ou seja, o uso foi vantajoso ontem e pode não o ser hoje). Apesar disso, dentro de uma organização, é provável que certos tipos de dados, como dados cadastrais, sejam consistentemente valiosos ao longo do tempo; portanto, a maioria das organizações se concentra primeiro em garantir a qualidade desses dados altamente críticos. 2.5 Gerenciamento de dados significa gerenciar o ciclo de vida dos dados Um dos motivos pelos quais as pessoas confundem gerenciamento de dados com gerenciamento de tecnologia é que geralmente avaliam dados apenas de um ponto de vista: a aplicação do qual os dados são acessados. Pessoas não reconhecem que os dados podem ser separados das aplicações em que são criados ou armazenados e que os dados têm um ciclo de vida. O ciclo de vida é baseado no ciclo de vida do resultado. Concentra-se em garantir que os dados sejam criados, movidos e mantidos de maneira a torná-los utilizáveis pelas pessoas e processos que os exigem. Embora dados e tecnologia estejam interligados, o ciclo de vida dos dados não deve ser confundido com o ciclo de vida de desenvolvimento de sistemas (systems development lifecycle - SDLC), que se concentra na conclusão de projetos dentro do prazo e do orçamento. Conceitualmente, o ciclo de vida dos dados é fácil de descrever: inclui processos que criam ou obtêm dados, aqueles que os movem, transformam e armazenam e permitem que sejam mantidos e compartilhados, e aqueles que os usam ou os aplicam, bem como aqueles que os descartam. Os dados raramente são estáticos: durante todo o seu ciclo de vida, os dados podem ser limpos, transformados, mesclados, aprimorados ou agregados. Os dados geralmente se movem horizontalmente dentro da organização: à medida que os dados são usados ou aprimorados, novos dados são criados, de modo que seu ciclo de vida possui iterações internas e os 'mesmos' dados podem ter requisitos de ciclo de vida diferentes em diferentes partes da organização. A complexidade é adicionada ao conceito do ciclo de vida pelo fato de que diferentes tipos de dados têm requisitos de ciclo de vida diferentes. Por exemplo, os dados transacionais podem ser controlados
  • 25.
    em grande partepor meio da aplicação de regras básicas, enquanto os Dados Mestre requerem curadoria. Conheça além desses, outros princípios que se aplicam ao ciclo de vida de qualquer dado: Criação e uso são os pontos mais críticos no ciclo de vida dos dados O gerenciamento de dados deve ser executado com um entendimento de como os dados são produzidos ou obtidos, assim como os dados são usados. Custa dinheiro para produzir dados. Os dados são valiosos somente quando são consumidos ou aplicados. A qualidade dos dados deve ser gerenciada durante todo o ciclo de vida dos dados Como a qualidade dos dados pode ser afetada por vários eventos do ciclo de vida, a qualidade deve ser planejada como parte do ciclo de vida dos dados. Não é um complemento ou algo a ser 'feito mais tarde'. A qualidade dos metadados deve ser gerenciada por meio do ciclo de vida dos dados Os metadados são tipos de dados utilizados para descrever outros dados. Como tal, é essencial para todas as funções de gerenciamento de dados. Os metadados geralmente são criados como parte do ciclo de vida de outros dados e devem ser vistos como um produto (e não como um subproduto) desse ciclo de vida. A qualidade dos metadados deve ser gerenciada da mesma maneira que a qualidade de outros dados. A segurança dos dados deve ser gerenciada durante todo o ciclo de vida dos dados Os esforços de gerenciamento de dados devem se concentrar nos dados mais críticos O gerenciamento de dados inclui a garantia de segurança dos dados e redução dos riscos associados. Os dados que requerem proteção devem ser protegidos por todo o ciclo de vida, desde a criação até o descarte. Os esforços de gerenciamento de dados devem se concentrar nos dados mais críticos As organizações produzem muitos dados, muitos dos quais nunca são realmente usados. Tentar gerenciar todos os dados não é possível nem desejável. O gerenciamento do ciclo de vida requer o foco nos dados mais críticos de uma organização e a minimização do ROT de dados (ou seja, dados redundantes, obsoletos ou triviais).
  • 26.
    2.6 Diferentes tiposde dados têm diferentes requisitos de ciclo de vida O gerenciamento de dados se torna mais complicado pelo fato de diferentes tipos de dados apresentarem requisitos diferentes de gerenciamento do ciclo de vida. Os dados podem ser classificados conforme:  função que servem (por exemplo, dados transacionais, dados de referência, dados mestre, metadados; alternativamente, dados de categoria, dados de recursos, dados de eventos, dados detalhados de transações);  conteúdo (domínios de dados, áreas de conhecimento);  formato ou nível de proteção exigido pelos dados; e  forma e onde são armazenados ou acessados. Como diferentes tipos de dados têm requisitos diferentes, eles estão associados a riscos diferentes e desempenham papéis diferentes dentro de uma organização. A maioria das ferramentas de gerenciamento de dados estão focadas nos aspectos de classificação e controle. Por exemplo, os Dados Mestre têm usos diferentes e, consequentemente, requisitos de gerenciamento diferentes dos dados transacionais.
  • 27.
    Como variados tiposde dados têm requisitos diferentes, eles estão associados a riscos distintos e desempenham papéis diferentes dentro de uma organização. A maioria das ferramentas de gerenciamento de dados estão focadas nos aspectos de classificação e controle. Por exemplo, os Dados Mestre têm usos discrepantes e, consequentemente, requisitos de gerenciamento desiguais dos dados transacionais. O quadro a seguir, apresenta a análise sobre as fases do ciclo de vida dos dados, considerando a Lei nº 13.709/2018, Lei Geral de Proteção de Dados (LGPD): CICLO DE VIDA DOS DADOS Fase do Ciclo Antes da LGPD Com a LGPD Coleta Os dados pessoais são coletados indiscriminadamente. Os dados pessoais coletados devem obedecer ao princípio da necessidade e da finalidade. Processamento Os dados podem ser processados sem um tratamento específico. O processamento de dados só poderá ser realizado se o tratamento estiver enquadrado no Art. 7º da LGPD. Análise A análise de dados é feita para entender o mercado, conhecer o perfil das pessoas e definir estratégias para oferecer bens e serviços para o público-alvo. A análise dos dados deve levar em consideração a finalidade da coleta. Devem ser obedecidos os princípios de tratamento com propósito legítimo específico e explicito. Compartilhamento Os dados pessoais são compartilhados sem a necessidade do consentimento de seus titulares. O compartilhamento de dados deve ser consentido pelos seus titulares* *Ver Inciso II do Art. 3º do Decreto nº 10.046/2019. Armazenamento Os dados pessoais são armazenados e mantidos por tempo indeterminado. Os dados pessoais devem ser armazenados e mantidos por prazos definidos, ou seja, até que a finalidade seja alcançada ou deixem de ser necessários ou pertinentes ao alcance da finalidade. Reutilização Os dados pessoais são reutilizados sem a necessidade de consentimento de seus titulares. Um novo consentimento deve ser solicitado sempre que houver mudança de finalidade. Eliminação Os dados pessoais são mantidos sem a obrigatoriedade de serem eliminados. Os dados pessoais devem ser eliminados após o término de seu tratamento. A depender do objetivo da coleta do dado, segue-se um ciclo de vida. Após o finalizado o objetivo de coleta de dados, os trabalhos devem continuar sobre os dados produzidos, a fim de que eles sejam reutilizados após análises, citações e atualizações. Dessa forma, existe a possibilidade de reutilização dos dados para outros fins, que seja até para alimentar sistemas que compõem um ecossistema relacionado a uma política pública ou de pesquisas estatísticas para fins de planejamento de outras políticas para atendimento de demandas de interesse da sociedade.
  • 28.
    2.7 Os metadadosdevem ser gerenciados como parte do ciclo de vida dos dados. Existe uma atenção especial dos profissionais de gerenciamento de dados em relação aos metadados porque sabem da sua importância no processo de gestão de dados. No entanto, é um fato que estes profissionais se limitam em utilizar o termo Metadados ao se direcionar à Alta Administração, visto que essa gestão deve ser transparente aos usuários/consumidores e bastante eficiente no contexto técnico. Os metadados incluem uma variedade de informações que permitem às pessoas entender dados e os sistemas que os contêm. Os metadados descrevem quais dados uma organização possui, o que representa, como é classificado, sua origem, sua interoperabilidade dentro da organização, como evolui por meio do uso, quem pode ou não acessá-los e se são de alta qualidade. O desafio não é evidenciar a importância dos metadados para gerenciá-los, mas a forma de ser gerenciados como tal. As organizações que não gerenciam bem seus dados geralmente não gerenciam seus metadados. A resposta para esse desafio é que o gerenciamento de metadados geralmente fornece um ponto de partida para melhorias no gerenciamento de dados em geral. 2.8 O gerenciamento de dados geralmente é confundido com o gerenciamento de tecnologia da informação Como quase todos os dados atuais são armazenados eletronicamente, o gerenciamento de dados está intimamente ligado ao gerenciamento de tecnologia. Eles precisam ser vistos em relação um ao outro, porque as decisões sobre a tecnologia afetam muitas facetas de como os dados são gerenciados. Observe que:  O gerenciamento de dados se concentra em garantir que os dados em si sejam utilizáveis e confiáveis; e  O gerenciamento de tecnologia se concentra na criação e manutenção de infraestrutura, sistemas e aplicações. Os dois estão fundamentalmente conectados pelo fato de que sistemas e aplicações automatizam processos de negócios que coletam ou criam dados e diferentes opções tecnológicas impõem restrições diferentes aos próprios dados. Os requisitos de gerenciamento de dados e gerenciamento de tecnologia devem estar enraizados nos processos de negócios que criam ou usam dados e nas necessidades das pessoas e processos que consomem dados. Em muitas organizações, existe uma tensão contínua entre o desejo de construir novas tecnologias e o desejo de ter dados mais confiáveis - como se os dois se opusessem um ao outro, em vez de precisarem um do outro. O gerenciamento bem-sucedido de dados requer decisões sólidas sobre tecnologia, mas gerenciar tecnologia não é o mesmo que gerenciar dados. As organizações precisam entender o impacto da tecnologia nos dados, para impedir que a tentação tecnológica direcione suas decisões sobre os dados. Em vez disso, os requisitos de dados alinhados à estratégia de negócios devem orientar as decisões sobre tecnologia. 2.9 O que o gerenciamento de dados requer O gerenciamento de dados é multifuncional e requer habilidades e uma perspectiva corporativa. Vamos conhecê-las. Habilidades
  • 29.
    O gerenciamento dedados envolve um conjunto de processos interconectados alinhados ao ciclo de vida dos dados. Embora muitas organizações vejam o gerenciamento de dados como uma função de tecnologia da informação, na verdade, requer uma ampla gama de pessoas com um conjunto diversificado de habilidades trabalhando em diferentes partes de uma organização. O gerenciamento de dados é um processo complexo porque é executado em toda a organização. Os dados são gerenciados em diferentes locais da organização por equipes que são responsáveis por diferentes fases do ciclo de vida dos dados. O gerenciamento de dados requer:  Habilidades de processos de negócios para entender e planejar a criação de dados confiáveis.  Habilidades de design para planejar sistemas nos quais os dados serão armazenados ou usados.  Habilidades altamente técnicas para administrar hardware e criar software onde os dados são mantidos.  Habilidades de análise de dados para entender questões e problemas descobertos nos dados.  Habilidades analíticas para interpretar dados e aplicá-los a novos problemas.  Habilidades linguísticas para trazer consenso às definições e modelos para que as pessoas possam entender dados.  Pensamento estratégico para visualizar oportunidades de uso de dados para atender usuários/consumidores e atingir metas. O desafio é fazer com que as pessoas com esse rol de habilidades e perspectivas reconheçam como as peças se encaixam e como o trabalho delas são transversais com o trabalho de outras partes da organização, para que elas colaborem com sucesso e alcancem objetivos comuns. Uma perspectiva corporativa A maioria das organizações divide o trabalho por unidades ou funções de negócios, cada uma das quais pode desenvolver suas próprias aplicações para executar seu trabalho. Como os dados geralmente são vistos simplesmente como subprodutos de processos operacionais, nem sempre são planejados para além da necessidade imediata. Pode até não ser reconhecido como algo que outras pessoas e processos utilizam. A menos que os padrões de dados corporativos sejam estabelecidos e aplicados, haverá diferenças na forma como os dados são definidos e criados em diferentes áreas. Por exemplo, considere algo aparentemente simples como um Número de Segurança Social (Social Security Number - SSN), um identificador americano para indivíduos. Se uma aplicação captura o SSN como um valor numérico e outro a captura em um campo de texto, os dados do SSN serão formatados de maneira diferente. Isso pode resultar em problemas como a eliminação de zeros à esquerda nos SSNs. Diferenças de formatação, diferenças na granularidade dos dados e diferenças sobre quais atributos são obrigatórios para capturar - todas essas diferenças apresentam obstáculos à integração de dados de diversas aplicações. Os obstáculos à integração limitam o valor que uma organização pode obter com seus dados. As organizações que veem os dados como um produto que eles criam ou compram tomarão melhores decisões sobre como gerenciá-los ao longo de seu ciclo de vida. Essas decisões exigem o reconhecimento de:  As formas como os dados conectam processos de negócios que, de outra forma, poderiam ser vistos como separados.  A relação entre processos de negócios e a tecnologia que os suporta.  O design e a arquitetura dos sistemas e os dados que eles produzem e armazenam.  As maneiras pelas quais os dados podem ser usados para avançar a estratégia organizacional.
  • 30.
    Planejar dados melhoresrequer uma abordagem estratégica da arquitetura, modelagem e outras funções de design. Também depende da colaboração estratégica entre os negócios e a liderança de TI. E, é claro, exige a capacidade de executar efetivamente em projetos individuais. O desafio é que geralmente existem pressões organizacionais, bem como as constantes pressões de tempo e dinheiro, que atrapalham o planejamento. As organizações devem equilibrar as metas de longo e curto prazo à medida que executam sua estratégia. Ter clareza sobre as compensações leva a melhores decisões. O que você precisa saber:  Os dados são um ativo valioso, mas também representam risco. Uma organização pode começar a entender o valor de seus dados reconhecendo os custos de dados de baixa qualidade e os benefícios de dados de alta qualidade.  Os dados têm características únicas que dificultam o gerenciamento.  A melhor abordagem para enfrentar esses desafios é gerenciar dados em todo o seu ciclo de vida e adotar uma perspectiva corporativa.  A falha no gerenciamento do ciclo de vida dos dados é cara, embora muitos custos estejam ocultos.  O gerenciamento de dados em todo o ciclo de vida requer planejamento, habilidade e trabalho em equipe. 3. Princípios de gerenciamento de dados do DAMA (DATA MANAGEMENT ASSOCIATION) O gerenciamento de dados apresenta desafios únicos conectados à natureza dos dados em si. Mesmo com suas características exclusivas, o gerenciamento de dados ainda compartilha características com outras formas de gerenciamento. Envolve conhecer quais dados uma organização possui e a melhor forma de usar esses ativos para atingir as metas organizacionais. Como outros processos de gerenciamento, deve-se equilibrar as necessidades estratégicas e operacionais. Para ajudar as organizações a alcançar esse equilíbrio, o DAMA desenvolveu um conjunto de princípios que reconhecem os desafios do gerenciamento de dados e auxiliam a orientar as práticas de gerenciamento de dados. Em nível mais estratégico, esses princípios se resumem a quatro asserções que examinaremos neste módulo:  Os dados possuem valor estratégico.  Requisitos de gerenciamento de dados são requisitos de negócios.  Gerenciamento de dados refere-se ao gerenciamento do ciclo de vida.  O gerenciamento de dados depende de diversas habilidades. Os princípios de gerenciamento de dados da DAMA fornecem uma lente para entender como sua organização gerencia seus dados. Depois de revisar suas implicações, as examinaremos no contexto da maturidade do gerenciamento de dados. Um modelo de maturidade define uma progressão do controle crescente sobre um conjunto de processos. Quando uma organização obtém uma compreensão das características do processo, pode estabelecer um plano para melhorar suas capacidades. Ele também pode medir a melhoria e comparar-se aos concorrentes ou parceiros, guiados pelos níveis do modelo. Os modelos de maturidade do gerenciamento de dados descrevem detalhes dos processos de gerenciamento de dados que podem ser usados para esse tipo de avaliação.
  • 31.
    Princípios de Gerenciamentode Dados Dados são estratégicos  Dados são um ativo de propriedade exclusiva.  O valor dos dados pode e deve ser expresso em termos econômicos/estratégicos.  Gerenciamento eficaz de dados requer comprometimento da liderança. Requisitos de gerenciamento de dados são requisitos de negócios  Gerenciar dados significa gerenciar a qualidade dos dados.  São necessários metadados para gerenciar dados.  É preciso planejar o gerenciamento de dados.  Requisitos de gerenciamento de dados devem orientar as decisões de Tecnologia da Informação. Gerenciamento de dados é gerenciamento do ciclo de vida Gerenciamento de dados depende de diversas habilidades  Tipos diferentes de dados têm características diferentes do ciclo de vida.  Gerenciamento de dados é multifuncional.  Gerenciar dados inclui gerenciar o risco associado aos dados.  O gerenciamento de dados requer uma perspectiva corporativa.  O gerenciamento de dados deve levar em conta uma variedade de perspectivas. Fonte: Data Management Principles (Adapted from DMBOK2) 3.1. Os dados são valiosos  Os dados são um ativo com propriedades exclusivas: os dados são um ativo, mas diferem de outros ativos de maneiras importantes que afetam a maneira como são gerenciados. A mais óbvia dessas propriedades é que os dados não são consumidos quando usados, assim como os ativos financeiros e físicos.  O valor dos dados pode e deve ser expresso em termos econômicos: Chamar dados de um ativo implica ele ter valor. Embora existam técnicas para medir o valor qualitativo e quantitativo dos dados, ainda não existem padrões para isso. As organizações que desejam tomar melhores decisões sobre seus dados devem desenvolver maneiras consistentes de quantificar esse valor. Eles também devem medir os custos de dados de baixa qualidade e os benefícios de dados de alta qualidade.  O gerenciamento eficaz de dados requer comprometimento da liderança: o gerenciamento de dados envolve um conjunto complexo de processos que, para serem eficazes, requerem coordenação, colaboração e comprometimento. Chegar lá exige não apenas habilidades de gerenciamento, mas também a visão e o objetivo advindos da liderança comprometida. 3.2. Requisitos de gerenciamento de dados são requisitos de negócios  Gerenciar dados significa gerir a sua qualidade: garantir que os dados sejam adequados ao objetivo é um objetivo principal do gerenciamento de dados. Para gerenciar a qualidade, as organizações devem garantir que compreendem os requisitos de qualidade das partes interessadas e medem os dados em relação a esses requisitos.  São necessários metadados para gerenciar dados: gerenciar qualquer ativo requer ter dados sobre esse ativo (número de funcionários, códigos contábeis etc.). Os dados usados para gerenciar e usar dados são chamados de metadados. Como os dados não podem ser mantidos ou tocados, para entender o que são e como usá-los, requer definição e conhecimento na forma de Metadados. Os metadados são originários de uma variedade de
  • 32.
    processos relacionados àcriação, processamento e uso de dados, incluindo arquitetura, modelagem, administração, governança, gerenciamento da qualidade dos dados, desenvolvimento de sistemas, operações de negócios e TI e análise.  É preciso planejar o gerenciamento de dados: Mesmo pequenas organizações podem ter cenários técnicos e de negócios complexos. Os dados são criados em muitos locais e transitam entre vários locais para seu uso. Coordenar o trabalho e manter os resultados finais alinhados requer planejamento da perspectiva de arquitetura e do processo.  Os requisitos de gerenciamento de dados devem orientar as decisões em tecnologia da informação: o gerenciamento de dados está extremamente interligado à tecnologia da informação e ao gerenciamento da tecnologia da informação. O gerenciamento de dados requer uma abordagem que garanta que a tecnologia atenda e direcione as necessidades estratégicas de dados de uma organização. 3.3. Gerenciamento de dados é gerenciamento do ciclo de vida  Gerenciamento de dados é gerenciamento do ciclo de vida: os dados têm um ciclo de vida e o gerenciamento de dados requer a administração de seu ciclo de vida. Como os dados geram mais dados, o próprio ciclo de vida dos dados pode ser muito complexo. As práticas de gerenciamento de dados precisam levar em consideração o ciclo de vida em evolução dos dados.  Diferentes tipos de dados têm características diferentes de ciclo de vida: e por esse motivo, eles têm requisitos de gerenciamento diferentes. As práticas de gerenciamento de dados precisam reconhecer essas diferenças e ser flexíveis o suficiente para atender a diferentes tipos de requisitos do ciclo de vida dos dados.  O gerenciamento de dados inclui o controle dos riscos associado aos dados: além de ativos, os dados também representam riscos para a organização. Os dados podem ser perdidos, furtados ou mal utilizados. As organizações devem considerar as implicações éticas de seu uso. Os riscos relacionados aos dados devem ser gerenciados como parte do ciclo de vida dos dados. 3.4. O gerenciamento de dados depende de diversas habilidades  O gerenciamento de dados é multifuncional: uma única equipe não pode gerenciar todos os dados de uma organização. Fazer isso requer uma série de habilidades e conhecimentos. O gerenciamento de dados requer habilidades técnicas e não técnicas além da capacidade de colaborar.  O gerenciamento de dados requer uma perspectiva corporativa: o gerenciamento de dados possui aplicativos locais, mas deve ser aplicado em toda a instituição para ser o mais eficaz possível. Essa é uma das razões pelas quais o gerenciamento e o controle de dados estão interligados.  O gerenciamento de dados deve dar conta de várias perspectivas: os dados são fluidos e estão em mudança. O gerenciamento de dados deve evoluir constantemente para acompanhar não somente a maneira como os dados são criados e usados, mas também os consumidores que os usam. 3.5. Princípios e maturidade em gerenciamento de dados Reconhecer a importância, identificar os desafios e conhecer os princípios do gerenciamento de dados são relevantes para uma gestão eficiente. Sua organização está, sem dúvida, aplicando alguns desses princípios, pois segue, certamente, algumas das práticas descritas aqui. Mas, a menos que a
  • 33.
    organização aumente suaconsciência por meio de um nível de autoavaliação, é improvável que ela seja capaz de melhorar suas práticas. A Avaliação da Maturidade da Capacidade (CMA) é uma abordagem para a melhoria de processos com base em uma estrutura - um Modelo de Maturidade da Capacidade (CMM) - que descreve como as características de um processo evoluem de ad hoc para o ideal. O conceito de CMA surgiu dos esforços do Departamento de Defesa dos Estados Unidos para estabelecer critérios através dos quais avaliar fornecedores de software. Em meados da década de 1980, o Capability Maturity Model for Software foi publicado pelo Instituto de Engenharia de Software da Universidade Carnegie-Mellon. Embora aplicados pela primeira vez ao desenvolvimento de software, os CMMs foram desenvolvidos para uma variedade de outros campos, incluindo gerenciamento de dados. Modelos de maturidade são definidos em termos de uma progressão através de níveis que descrevem as características do processo. Quando uma organização obtém uma compreensão das características do processo, pode avaliar seu nível de maturidade e implementar um plano para melhorar suas capacidades. Há possibilidade de medir a melhoria e comparar-se aos concorrentes ou parceiros, guiados pelos níveis do modelo. A avaliação da maturidade da capacidade é um instrumento bastante eficiente para isso. Trata-se de uma abordagem para a melhoria do processo com base em uma estrutura - um Modelo de Maturidade da Capacidade - que descreve como as características de um processo evoluem de ad hoc para ideal. A cada novo nível, a execução do processo se torna mais consistente, previsível e confiável. Os processos melhoram à medida que assumem as características desses níveis. A progressão acontece em uma ordem definida que deve ser cumprida a cada fase conforme segue:  Nível 0 Ausência de capacidade  Nível 1 Inicial ou ad hoc: o sucesso depende da competência dos indivíduos  Nível 2 Repetível: a disciplina mínima do processo está em vigor  Nível 3 Definido: os padrões são definidos e usados  Nível 4 Gerenciável: os processos são quantificados e controlados  Nível 5 Otimizável: as metas de melhoria de processo são quantificadas Dentro de cada nível, os critérios são descritos nos recursos do processo. Por exemplo, um modelo de maturidade pode incluir critérios relacionados à forma como os processos são executados, incluindo o nível de automação desses processos. Pode se concentrar em políticas e controles, além de detalhes do processo. Essa avaliação ajuda a identificar o que está funcionando bem, o que não está funcionando bem e onde uma organização tem lacunas. A maturidade do uso dos princípios de gerenciamento de dados pode progredir conforme ilustrado na figura abaixo, onde uma organização passa do conhecimento limitado dos princípios de gerenciamento de dados para um estado em que os princípios se tornam motores da melhoria organizacional.
  • 34.
    Um DMMA (DataManagement Maturity Assessment) pode ser usado para avaliar o gerenciamento de dados em geral, ou para se concentrar em uma única área funcional ou de conhecimento, ou mesmo em um único processo ou ideia (como o grau em que uma organização segue os dados). Qualquer que seja o foco, um DMMA pode ajudar a preencher a lacuna entre as perspectivas de negócios e de TI sobre a saúde e a eficácia das práticas de gerenciamento de dados. Um DMMA fornece uma linguagem comum para descrever como é o progresso nas funções de gerenciamento de dados e oferece um caminho para melhorias baseado em etapas, que pode ser adaptado às prioridades estratégicas de uma organização. Assim, pode ser usado para definir e medir objetivos organizacionais, bem como comparar a organização com outras organizações ou referências do setor. Conheça um pouco mais sobre o DMMA 3.6. Reavaliar a maturidade As reavaliações devem ser realizadas em intervalos regulares, convergindo para um ciclo de melhoria contínua:  Estabelecer uma classificação de linha de base através da primeira avaliação.  Definir parâmetros de reavaliação, incluindo o escopo organizacional.  Repetir a avaliação do DMM conforme necessário em um planejamento o publicado.  Acompanhar tendências em relação à linha de base inicial.  Desenvolver recomendações com base nos resultados da reavaliação. A reavaliação também pode revigorar ou reorientar o esforço. O progresso mensurável ajuda a manter o compromisso e o entusiasmo em toda a organização. Alterações em estruturas regulatórias, políticas
  • 35.
    internas ou externasou inovações que possam mudar a abordagem de governança e estratégias são razões adicionais para reavaliar periodicamente. 3.7. Ferramentas de avaliação de maturidade  Estrutura de maturidade do gerenciamento de dados: A principal ferramenta usada em uma avaliação de maturidade é a própria estrutura do DMM.  Plano de comunicação: Um plano de comunicação inclui um modelo de envolvimento das partes interessadas, o tipo de informação a ser compartilhada e o cronograma para o compartilhamento de informações.  Ferramentas de colaboração: As ferramentas de colaboração permitem que os resultados da avaliação sejam compartilhados. Além disso, evidências de práticas de gerenciamento de dados podem ser encontradas nos e-mails, nos modelos concluídos e nos documentos de revisão criados por meio de processos padrão para design colaborativo, operações, rastreamento de incidentes, revisões e aprovações.  Repositórios de gerenciamento e de conhecimento em metadados: padrões de dados, políticas, métodos, agendas, atas de reuniões ou decisões e artefatos de negócio e técnicos que servem como prova de prática podem ser gerenciados nesses repositórios. Em alguns CMMs, a falta desses repositórios é um indicador de menor maturidade na organização. Os repositórios de metadados podem existir em várias construções, o que pode não ser óbvio para os participantes. Por exemplo, alguns aplicativos de Business Intelligence dependem completamente dos metadados para compilar suas visualizações e relatórios, sem se referir a ele como um repositório distinto separado. 3.8. Técnicas de avaliação de maturidade Diversas técnicas relacionadas à execução de um DMMA são definidas pela metodologia da estrutura de DMM escolhida. Técnicas mais gerais são descritas aqui. Os seguintes critérios devem ser considerados ao selecionar uma estrutura DMM. Acessibilidade As práticas são declaradas em termos não técnicos que transmitem a essência funcional da atividade. Abrangência A estrutura trata de um amplo escopo de atividades de gerenciamento de dados e inclui o envolvimento dos negócios, não apenas os processos de TI. Extensível e flexível o modelo está estruturado para permitir o aprimoramento de disciplinas específicas do setor ou adicionais e pode ser usado no todo ou em parte, dependendo das necessidades da organização. Caminho do progresso futuro incorporado embora as prioridades específicas sejam diferentes de organização para organização, a estrutura do DMM descreve um caminho lógico a seguir em cada uma das funções que descreve.
  • 36.
    Agnóstico e específicodo setor algumas organizações se beneficiarão de uma abordagem específica do setor, outras de uma estrutura mais genérica. Qualquer estrutura de DMM também deve aderir às melhores práticas de gerenciamento de dados que cruzam verticais. Nível de abstração ou detalhe as práticas e os critérios de avaliação são expressos em um nível de detalhe suficiente para garantir que eles possam estar relacionados à organização e ao trabalho que ela realiza. Não prescritivo A estrutura descreve o que precisa ser executado, não como deve ser executado. Organizado por tópico A estrutura coloca as atividades de gerenciamento de dados em seu contexto apropriado, permitindo que cada uma seja avaliada separadamente, enquanto reconhece as dependências. Repetível A estrutura pode ser interpretada de forma consistente, suportando resultados repetíveis para comparar uma organização com outras do setor e acompanhar o progresso ao longo do tempo. Suportado por uma organização independente e neutra O modelo deve ser neutro em relação ao fornecedor, a fim de evitar conflitos de interesse, e amplamente disponível para garantir uma ampla representação das melhores práticas. Tecnologia neutra O foco do modelo deve estar nas práticas, e não nas ferramentas. Suporte de treinamento incluído O modelo é suportado por um treinamento abrangente para permitir que os profissionais dominem a estrutura e otimizem seu uso. 3.9. Uso da estrutura DAMA-DMBOK O DAMA-DMBOK pode ser usado para preparar ou estabelecer critérios para um DMMA. Os responsáveis pela execução identificarão ligação direta entre funções segmentadas (as Áreas de Conhecimento) e as tarefas correspondentes (atividades). As áreas de conhecimento, atividades e produtos (produtos de trabalho) do DMBOK podem ser configuradas para uma estrutura específica do DMM com base nas áreas medidas, suas atividades de suporte, relevância e tempo disponível. Essa abordagem rápida, em conjunto com a lista de verificação, pode ser usada para determinar áreas que precisam de análise mais profunda, que representam lacunas ou que indicam pontos de acesso para correção. O DMBOK oferece vantagem adicional como ferramenta de planejamento de avaliação: Há uma grande comunidade de profissionais do conhecimento usando o DMBOK como um guia em vários setores, criando uma comunidade de prática em torno de seu uso.
  • 37.
    4. Ética naGestão de Dados Definida de maneira simples, a ética é um princípio de comportamento baseado em ideias de certo e errado. Os princípios éticos geralmente se concentram em ideias como justiça, respeito, responsabilidade, integridade, justiça, qualidade, confiabilidade, transparência e confiança. A ética de manipulação de dados preocupa-se em como adquirir, armazenar, gerenciar, usar e descartar dados de maneira alinhada aos princípios éticos. Em outras palavras, eles se preocupam em fazer as coisas certas com os dados e impedir que coisas erradas sejam feitas com os dados, mesmo quando ninguém está olhando. Manipular dados - não apenas gerenciá-los, mas usá-los e compartilhá-los com outras entidades - de maneira ética é necessário para o sucesso a longo prazo de qualquer organização que deseja obter valor de seus dados. O tratamento antiético de dados pode resultar em perda de reputação e clientes, pois coloca em risco as pessoas cujos dados estão expostos. Em alguns casos, práticas antiéticas também são ilegais. Dada a conexão entre o direito à privacidade e outros direitos humanos, a ética dos dados também é uma questão de responsabilidade social. O tratamento ético dos dados, abrangerá:  O porquê é importante gerenciar dados eticamente.  Os princípios subjacentes ao tratamento ético de dados.  Os benefícios de adotar uma abordagem ética para o gerenciamento de dados.  O como estabelecer uma abordagem ética para o gerenciamento de dados. 4.1. Ética e gerenciamento de dados A ética relacionada ao tema “manipulação de dados” apresenta alguns conceitos básicos. São eles:  Impacto nas pessoas: Os dados geralmente representam características de pessoas (Exemplos servidores, pacientes, fornecedores etc.) e são usados para tomar decisões que afetam a vida das pessoas. A ética exige que os dados sejam usados apenas de maneira a preservar a dignidade humana.  Potencial de uso indevido: O uso indevido de dados pode afetar negativamente pessoas e organizações. Isso leva a um imperativo ético para impedir o uso indevido de dados, principalmente por meio de ações que prejudicam o bem maior.  Valor econômico dos dados: os dados têm valor econômico. A ética da propriedade dos dados deve determinar como esse valor pode ser acessado e por quem. As organizações protegem os dados com base principalmente em normas legais e regulamentos. No entanto, como os dados afetam as pessoas, os profissionais de gerenciamento de dados devem reconhecer que existem razões éticas (e legais) para proteger os dados e garantir que não sejam mal utilizados. Mesmo dados que não representam diretamente indivíduos, como dados sobre acessibilidade ou distribuição de recursos, ainda podem ser usados para tomar decisões que afetam a vida das pessoas. Há um imperativo ético não apenas para proteger os dados, mas também para gerenciar sua qualidade. As pessoas que tomam decisões, bem como as que são impactadas por elas, esperam que os dados sejam completos e precisos para que eles tenham uma base sólida para as decisões.
  • 38.
    Do ponto devista comercial e técnico, os profissionais de gerenciamento de dados têm uma responsabilidade ética de gerenciar os dados de uma maneira que reduz o risco de que eles possam deturpar, ser mal utilizados ou ser mal interpretados. Essa responsabilidade se estende ao longo do ciclo de vida dos dados, da criação à destruição dos dados. Infelizmente, muitas organizações falham em reconhecer e responder às obrigações éticas inerentes ao gerenciamento de dados. Elas podem adotar uma perspectiva técnica tradicional e declarar não entender os dados. Ou elas assumem que, se seguirem a letra da lei, não terão riscos relacionados ao tratamento de dados. Esta é uma suposição perigosa. O ambiente de dados está evoluindo rapidamente. As organizações estão usando os dados de maneiras que elas nem imaginariam há alguns anos atrás. O Google Analytics pode aprender coisas com dados que diversas pessoas ainda não considerariam possíveis. Embora as leis codifiquem alguns princípios éticos, a legislação não pode acompanhar os riscos associados à evolução do ambiente de dados. As organizações devem reconhecer e responder à sua obrigação ética de proteger os dados a eles confiados, promovendo e sustentando uma cultura que valorize o manejo ético das informações. 4.2. Princípios éticos subjacentes à regulamentação da privacidade As políticas e normas legais tentam codificar o certo e o errado com base em princípios éticos, mas não é possível codificar todas as circunstâncias. Por exemplo, as leis de privacidade na União Europeia, Canadá e Estados Unidos mostram diferentes abordagens para codificar a ética dos dados. Esses princípios também podem fornecer uma estrutura para a política organizacional. Destaca-se os princípios subjacentes ao Regulamento Geral de Proteção de Dados (RGPD) da União Europeia incluem:  Justiça, legalidade, transparência: os dados pessoais devem ser processados de maneira legal, justa e transparente em relação ao titular dos dados.  Limitação de finalidade: Os dados pessoais devem ser coletados para finalidades especificadas, explícitas e legítimas, e não devem ser processados de maneira incompatível com essas finalidades.  Minimização de dados: os dados pessoais devem ser adequados, relevantes e limitados ao necessário em relação aos propósitos para os quais são processados.  Precisão: os dados pessoais devem ser precisos e, quando necessário, atualizados. Todas as medidas razoáveis devem ser tomadas para garantir que os dados pessoais imprecisos... sejam apagados ou retificados sem demora.  Limitação de armazenamento: Os dados devem ser mantidos de uma forma que permita a identificação dos titulares de dados [indivíduos] por não mais que o necessário para os fins para os quais os dados pessoais são processados.  Integridade e confidencialidade: Os dados devem ser processados de maneira a garantir a segurança adequada dos dados pessoais, incluindo proteção contra processamento não autorizado ou ilegal e contra perda, destruição ou dano acidental, usando medidas técnicas ou organizacionais apropriadas.  Responsabilidade: Os controladores de dados devem ser responsáveis por e ser capazes de demonstrar conformidade com esses princípios. Os princípios do RGPD são equilibrados e suportam certos direitos qualificados que os indivíduos têm de seus dados, incluindo os direitos de acesso, retificação de dados imprecisos, portabilidade, o direito de se opor ao processamento de dados pessoais que podem causar danos ou problemas e apagamento. Quando os dados pessoais são processados com base no consentimento, esse consentimento deve ser uma ação afirmativa fornecida livremente, específica, informada e inequívoca. O RGPD exige
  • 39.
    governança e documentaçãoeficazes para permitir e demonstrar conformidade e determina a Privacidade do Design. A Lei de Proteção de Dados Pessoais e Documentos Eletrônicos (PIPEDA) é a lei federal canadense de privacidade que combina um regime abrangente de proteção da privacidade com a autorregulação do setor. A PIPEDA (Lei de Proteção de Informações Pessoais e Documentos Eletrônicos) se aplica a toda organização que coleta, usa e divulga informações pessoais no decorrer de atividades comerciais. Ela estipula regras, com exceções, que as organizações devem seguir no uso das informações pessoais dos consumidores. Ressalta-se ainda que as obrigações estatutárias, baseadas na PIPEDA, consideram :  Prestação de contas: Uma organização é responsável pelas informações pessoais sob seu controle e deve designar um indivíduo para ser responsável pela conformidade da organização com o princípio.  Objetivos de identificação: Uma organização deve identificar os propósitos para os quais as informações pessoais são coletadas antes ou no momento em que as informações são coletadas.  Consentimento: Uma organização deve obter o conhecimento e o consentimento do indivíduo para a coleta, uso ou divulgação de informações pessoais, exceto quando inapropriado.  Limitando a coleta, o uso, a divulgação e a retenção: A coleta de informações pessoais deve ser limitada àquela necessária para os fins identificados pela organização. As informações devem ser coletadas por meios justos e legais. As informações pessoais não devem ser usadas ou divulgadas para outros fins que não aqueles para os quais foram coletadas, exceto com o consentimento do indivíduo ou conforme exigido por lei. As informações pessoais serão retidas apenas pelo tempo necessário para o cumprimento desses propósitos.  Precisão: as informações pessoais devem ser precisas, completas e atualizadas conforme o necessário para os fins para os quais devem ser usadas.  Salvaguardas: as informações pessoais devem ser protegidas por salvaguardas de segurança adequadas à sensibilidade das informações.  Abertura: Uma organização deve disponibilizar prontamente às pessoas informações específicas sobre suas políticas e práticas relacionadas ao gerenciamento de suas informações pessoais.  Acesso Individual: Mediante solicitação, um indivíduo deve ser informado da existência, uso e divulgação de suas informações pessoais e ter acesso a essas informações. Um indivíduo deve ser capaz de contestar a precisão e a integridade das informações e alterá-las conforme apropriado.  Desafios de conformidade: Um indivíduo deve ser capaz de enfrentar um desafio relativo à conformidade com os princípios acima ao indivíduo ou indivíduos designados responsáveis pela conformidade da organização. Saiba mais sobre proteção de dados HIPAA (Lei de Portabilidade e Responsabilidade do Seguro de Saúde) nos EUA, PIPEDA (Lei de Proteção de Informações Pessoais e Documentos Eletrônicos) no Canadá, o Regulamento Geral de Proteção de Dados da UE (RGPD) e outras leis de proteção de dados / privacidade das informações descrevem obrigações em relação ao manuseio de dados de identificação pessoal (por exemplo, nome, endereço, afiliação religiosa ou orientação sexual) e privacidade (acesso ou restrição a essas informações). Em março de 2012, a Federal Trade Commission (FTC) dos EUA emitiu relatório recomendando que as organizações projetassem e implementassem seus próprios programas de privacidade com base nas melhores práticas descritas no relatório (ou seja, Privacidade por Design).
  • 40.
    Evidencia-se que esserelatório reafirma o foco da FTC nos Princípios Justos de Processamento de Informações. São eles:  Aviso/conscientização: Os coletores de dados devem divulgar suas práticas de informações antes de coletar informações pessoais dos consumidores.  Escolha/Consentimento: Os consumidores devem ter opções em relação a como as informações pessoais coletadas por eles podem ser usadas para fins além daqueles para os quais as informações foram fornecidas.  Acesso/Participação: Os consumidores devem poder visualizar e contestar a precisão e a integridade dos dados coletados sobre eles.  Integridade/Segurança: Os coletores de dados devem tomar medidas razoáveis para garantir que as informações coletadas dos consumidores sejam precisas e seguras contra uso não autorizado.  Execução/reparação: O uso de um mecanismo confiável para impor sanções por não conformidade com essas práticas de informações justas. Existe uma tendência global no sentido de aumentar a proteção legislativa da privacidade das informações dos indivíduos, seguindo os padrões estabelecidos pela legislação da União Europeia. As leis em todo o mundo impõem diferentes tipos de restrições ao movimento de dados através das fronteiras internacionais. Mesmo dentro de uma organização multinacional, haverá limites legais para o compartilhamento de informações globalmente. Portanto, é importante que as organizações tenham políticas e diretrizes que permitam que a equipe cumpra os requisitos legais, além de usar dados dentro do apetite de risco da organização. Acesse o Saiba Mais para conhecer os normativos brasileiros que regulamentam o tema em estudo. Conforme estudado anteriormente, a Secretaria de Governo Digital da Secretaria Especial de Desburocratização, Gestão e Governo Digital do Ministério da Economia publicou no Diário Oficial da União (DOU) o Decreto nº 10.046, de 09 de outubro de 2019, que estabeleceu a Política de Compartilhamento de Dados no âmbito da Administração Pública Federal, instituiu o Cadastro Base do Cidadão (CBC) e o Comitê Central de Governança de Dados (CCGD). 4.3. Ética e vantagem competitiva As organizações estão cada vez mais reconhecendo que uma abordagem ética ao uso de dados é uma vantagem competitiva dos negócios. O tratamento ético dos dados pode aumentar a confiabilidade de uma organização e os resultados dos processos da organização. Isso pode criar melhores relacionamentos entre a organização e seus stakeholders. Criar uma cultura ética implica a introdução de uma governança adequada, incluindo a instituição de controles para garantir que os resultados pretendidos e resultantes do processamento de dados sejam éticos e não violem a confiança ou violem a dignidade humana. A manipulação de dados não acontece no vácuo. Enfatizamos as quatro fortes razões comerciais para lidar com os dados de forma ética: 1. Expectativas das partes interessadas: os clientes e outras partes interessadas esperam comportamentos e resultados éticos das empresas e de seus processos de dados. 2. Gerenciamento de risco: Reduzir o risco de que os dados pelos quais a organização é responsável sejam utilizados indevidamente por usuários, clientes ou parceiros é o principal motivo para cultivar princípios éticos para o tratamento de dados. 3. Prevenção de uso indevido: Também existe uma responsabilidade ética de proteger dados de criminosos (ou seja, proteger contra hackers e possíveis praias de dados). 4. Respeitando a propriedade: Diferentes modelos de propriedade de dados influenciam a ética do tratamento de dados. Por exemplo, a tecnologia melhorou a capacidade das organizações de compartilhar dados entre si. Essa capacidade significa que as organizações precisam tomar
  • 41.
    decisões éticas sobresua responsabilidade pelo compartilhamento de dados que não lhes pertencem. As funções emergentes de Chief Data Officer, Chief Risk Officer, Chief Privacy Officer e Chief Analytics Officer estão focadas no controle de riscos, estabelecendo práticas aceitáveis para o tratamento de dados. Mas a responsabilidade se estende além das pessoas nesses papéis. O tratamento de dados de forma ética requer o reconhecimento de toda a organização dos riscos associados ao uso indevido de dados e o compromisso organizacional de lidar com dados com base em princípios que protegem os indivíduos e respeitam os imperativos relacionados à propriedade dos dados. A governança de dados pode ajudar a garantir que os princípios éticos sejam seguidos para processos críticos, como decidir quem pode usar os dados e como eles podem usá-los. Os profissionais de governança de dados devem considerar os riscos éticos de certos usos de dados sobre as partes interessadas. Eles devem gerenciar esses riscos de maneira semelhante à maneira como gerenciam a qualidade dos dados. 4.4. Estabelecer uma cultura de manipulação ética de dados Estabelecer uma cultura de manipulação ética de dados requer entender as práticas existentes, definir comportamentos esperados, codificá-los nas políticas e um código de ética e fornecer treinamento e supervisão para aplicar os comportamentos esperados. Como em outras iniciativas relacionadas ao controle de dados e a mudança de cultura, esse processo exige uma liderança forte. O tratamento ético dos dados obviamente inclui seguir a lei. Também influencia como os dados são analisados, interpretados e aproveitados interna e externamente. Uma cultura organizacional que valorize o comportamento ético não apenas terá um código de conduta, mas também garantirá a existência de controles claros de comunicação e governança para apoiar os usuários que tomam conhecimento de práticas ou riscos antiéticos. Os usuários precisam poder relatar essas circunstâncias sem medo de retaliação. Melhorar o comportamento ético de uma organização em relação aos dados geralmente requer um processo formal de Gerenciamento de Mudanças Organizacionais (Organizational Change Management - OCM). Atenção, para o estabelecimento de uma cultura de manipulação ética de dados, é necessário cumprir as seguintes etapas. Acesse cada uma das abas abaixo para conhecê-las. Análise as práticas atuais de manipulação de dados do estado Examine até que ponto as práticas atuais estão direta e explicitamente conectadas aos fatores éticos e de conformidade; identificar até que ponto os usuários compreendem as implicações éticas das práticas existentes na construção e preservação da confiança de clientes, parceiros e outras partes interessadas. Identifique princípios, práticas e fatores de risco Considere o risco de que os dados sejam mal utilizados e causem danos a usuários, fornecedores, outras partes interessadas ou a organização como um todo. Além dos riscos relacionados ao setor, a maioria das organizações possui riscos específicos, que podem estar relacionados ao seu know-how tecnológico, à taxa de rotatividade de usuários, aos meios pelos quais eles coletam dados de usuários ou a outros fatores. Os princípios devem estar alinhados aos riscos (prejuízos que podem acontecer se os princípios não forem respeitados) e práticas (a forma correta realizar atividades para que os riscos sejam evitados). As práticas devem ser apoiadas por controles. Adote um modelo de risco ético socialmente responsável A execução de atividades de inteligência de negócios, análises e ciência de dados exige uma perspectiva ética que olhe além dos limites da organização e explique as implicações para a
  • 42.
    comunidade em geral.Uma perspectiva ética é necessária não apenas porque os dados podem ser facilmente mal utilizados, mas também porque as organizações têm uma responsabilidade social de não prejudicar seus dados. Um modelo de risco pode ser usado para determinar se um projeto deve ser executado, ele também influenciará como executar o projeto. Como os projetos de análise de dados são complexos, as pessoas podem não identificar os desafios éticos. As organizações precisam identificar ativamente riscos potenciais. Um modelo de risco pode ajudá-las a fazer o que a figura a seguir sugere. Crie uma estratégia e roteiro éticos para o tratamento de dados Após uma revisão do estado atual e o desenvolvimento de um conjunto de princípios, a organização pode formalizar uma estratégia para melhorar suas práticas de tratamento de dados. Essa estratégia deve refletir princípios éticos e o comportamento esperado relacionado aos dados, expresso em declarações de valores e código de comportamento ético. Lição módulo 3 1. Governança de Dados O termo gerenciamento de dados foi originalmente usado para descrever o trabalho que os Administradores de Banco de Dados (DBAs) e outras pessoas altamente técnicas fizeram para garantir que os dados em grandes bancos de dados estivessem disponíveis e acessíveis. Por esse infeliz acidente histórico ainda hoje ele está fortemente associado a essas atividades.
  • 43.
    A expressão governançade dados foi introduzida, em parte, para deixar claro que o gerenciamento de dados vai além do gerenciamento de bancos de dados. Mais importante, a governança de dados descreve os processos pelos quais as organizações tomam decisões sobre dados que precisam ser executadas por pessoas em toda a organização. Na maioria das organizações, o fluxo de dados ocorre horizontalmente, entre as verticais dos negócios. Se uma organização deve alavancar seus dados efetivamente entre funções, precisa estabelecer estruturas e políticas comuns para tomar decisões consistentes entre os diversos setores da organização. A governança de dados deve desempenhar um papel muito semelhante à governança financeira dentro de uma organização. A governança de dados (GD) é definida como o exercício de autoridade e de controle (por exemplo, planejamento, monitoramento e execução) sobre o gerenciamento de ativos de dados. As atividades de governança ajudam a controlar o desenvolvimento e o seu uso. Também promovem a redução dos riscos associados e permitem que uma organização aproveite os dados de forma estratégica. Todas as organizações tomam decisões sobre dados, independentemente de terem uma função formal de governança de dados. Aqueles que estabelecem um programa formal de governança de dados exercem autoridade e controle com maior intencionalidade e consistência. Tais organizações são mais propensas a alavancar estrategicamente o valor dos seus ativos de dados. Esse tópico abordará:  A definição da governança de dados e discutir sua importância.  Apresentar os diferentes modelos para organizar as funções de governança de dados.  Discutir como as atividades de gestão de dados contribuem para a governança e gerenciamento de dados. 1.1. Governança de dados como supervisão A função de controle de dados orienta todas as outras funções de gerenciamento de dados. O objetivo do controle de dados é garantir que os dados sejam gerenciados corretamente, de acordo com políticas e práticas recomendadas. Uma analogia comum é equiparar governança de dados a auditoria e contabilidade. Auditores e controladores definem as regras para o gerenciamento de ativos financeiros. Os profissionais de governança de dados definem regras para gerenciar ativos de dados. Outras áreas cumprem essas regras. Em ambos os casos, a governança de dados não é única; essa função de supervisão deve ser mantida depois de estabelecida. Os princípios para governança de dados precisam ser incorporados ao ciclo de vida de gerenciamento de dados e às atividades fundamentais. Em um programa contínuo, a governança de dados requer compromisso contínuo para garantir que uma organização obtenha valor de seus dados e reduz os riscos relacionados a dados. O principal foco do gerenciamento de dados é garantir que uma organização obtenha valor com seus dados. A governança de dados se concentra em como as decisões são tomadas sobre os dados e como as pessoas e os processos se comportam em relação aos dados.
  • 44.
    Atenção, o escopoe o objetivo de um programa de governança de dados dependerão das necessidades da organização que incluem:  Supervisão: garantindo que todas as áreas funcionais de governança de dados sigam os princípios orientadores em benefício da organização.  Estratégia: definindo, comunicando e direcionando a execução da estratégia e da governança de dados.  Política: definir e aplicando políticas relacionadas ao gerenciamento, acesso, uso, segurança e qualidade de dados e metadados.  Padrões e qualidade: definindo e aplicando padrões de qualidade e arquitetura de dados.  Administração: fornecendo observação prática, auditoria e correção nas principais áreas de qualidade, política e gerenciamento de dados.  Conformidade: garantindo que a organização possa atender aos requisitos de conformidade regulamentar relacionado a dados.  Gerenciamento de problemas: identificando, definindo, escalando e resolvendo problemas relacionados à segurança, acesso, qualidade, conformidade regulamentar, propriedade de dados, política, padrões, terminologia ou procedimentos de governança de dados.  Projetos de gerenciamento de dados: patrocinando esforços para melhorar as práticas de gerenciamento de dados.  Avaliação de ativos de dados: definindo padrões e processos para demarcar consistentemente o valor estratégico dos ativos de dados. Um programa de governança de dados articulará princípios, desenvolverá políticas e procedimentos, cultivará práticas de administração de dados, em vários níveis da organização, e se envolverá nos esforços de gerenciamento de mudanças organizacionais. Tais mudanças comunicam ativamente os benefícios de uma melhor governança de dados e os comportamentos necessários para gerenciar com êxito os dados como um ativo ao longo do ciclo de vida dos dados.
  • 45.
    Em parte, osprogramas de governança planejam seus roteiros com base em um modelo de maturidade de capacidade que lhes permite crescer e aprimorar suas práticas. Em boa parte das organizações, a adoção de governança formal de dados requer o apoio do gerenciamento de mudanças organizacionais, bem como o patrocínio de um executivo, como Chief Risk Officer e/ou Chief Data Officer. Ambos poderão atuar como Curador de Dados ou Data Steward - papel fundamental para as atividades operacionais de governança. São estas atividades práticas que levam a melhoria da qualidade de dados e informações e permitem a organização fazer a gestão dos seus ativos de dados de forma completa e aderente às necessidades de negócio. Saiba mais sobre o papel do Diretor de Riscos e sobre Diretor de Dados. 1.2. Direcionadores (Drivers) de negócios para governança de dados O que é mais comum para a governança de dados é a conformidade regulamentar, especialmente para setores fortemente regulamentados, como serviços financeiros, de saúde, de transportes, etc. Atender a uma legislação sempre em evolução requer processos aprimorados de governança de dados. A explosão das análises avançadas por meio da ciência de dados criou um motivo adicional para se implementar estruturas de governança de dados. Embora a conformidade e/ou análise de dados possam impulsionar a implementação de governança, muitas organizações avaliam a governança de dados apenas do ponto de vista de um programa de gerenciamento de informações direcionado por outras necessidades de negócios, como o Master Data Management (MDM) . Um cenário típico: uma organização precisa dos melhores dados cadastrais e escolhe desenvolver o MDM de diversas bases e percebe que o MDM bem-sucedido requer boa política proveniente de uma governança de dados atuante.
  • 46.
    A governança dedados não é um fim em si mesma. Ela precisa se alinhar diretamente à estratégia de negócio da organização. Quanto mais claramente ajudar a resolver problemas organizacionais, maior será a probabilidade de as pessoas mudarem comportamentos e adotarem práticas de governança. Os drivers para governança de dados geralmente se concentram em:  Reduzir riscos, como os relacionados à conformidade, à reputação geral da organização ou à segurança e privacidade dos dados.  Melhorar processos, como a capacidade de cumprir com a regulamentação, gerenciar serviços e operar com eficiência. Em termos de computação, Master Data Management (MDM) compreende um conjunto de processos e ferramentas que definem consistentemente e gerenciam os dados mestres (i.e. não transacionais) de uma organização (que pode conter dados referenciais). MDM tem o objetivo de prover processos para coletar, agregar, combinar, consolidar, garantir a qualidade, persistir e distribuir estes dados a toda a organização para garantir a consistência e o controle nas futuras manutenções e uso desta informação. O termo remete ao conceito de arquivo mestre de uma antiga era da computação. MDM seria o mesmo que virtual or federated database management. Aqui cabe sua atenção ao Cadastro Base do Cidadão - CBC, instituído pela art.16 do Decreto nº 10.046/2019. Como você sabe todo o cidadão, ao longo da vida cível, precisa realizar seu cadastro em diversos órgãos públicos para emitir documentos de identificação, como certidão de nascimento, RG, CPF, título de eleitor, carteira de habilitação, etc. Apesar de que cada desses documentos tem um propósito específico, todos eles tratam de dados biográficos do cidadão, tais como: nome, data de nascimento, sexo, etc. Apesar de termos alcançado grandes avanços tecnológicos na prestação desses serviços públicos, eles ocorreram de maneira individualizada. O resultado negativo disso é que, além do custo do cidadão de ter de se apresentar diversas vezes ao Estado, temos seu cadastro replicado em diversas bases de dados do governo. É difícil identificar o mesmo cidadão nestas diversas bases, o que inviabiliza a integração entre os sistemas governamentais e a composição de sua trajetória pelos diversos serviços estatais. Além disso, a replicação permite que os dados estejam diferentes entre as bases de dados e não se sabe qual é o registro mais atualizado ou correto, o que gera inconsistências e perda de confiabilidade nestes dados. O CBC será a base integradora dessas informações do cidadão e referência para as diversos órgãos e entidades da administração pública, estando disponível para a integração dos sistemas que precisem de dados cadastrais de pessoas. Benefícios:  Os usuários de serviços públicos terão acesso a processos e procedimentos de atendimento simplificados e confiáveis, além da eliminação de formalidades e exigências de comprovação de identidade.  O Estado será beneficiado pela aplicação de solução tecnológica que simplificará processos e procedimentos de atendimento aos usuários dos serviços públicos e proporcionará melhores condições para o compartilhamento das informações entre órgãos de governo, aumento da segurança da informação em função da garantia de sua autenticidade. Resultados pretendidos:  Desonerar o cidadão de manter atualizado todos os seus cadastros nos diversos órgãos do governo.
  • 47.
     Simplificação deserviços públicos, pois o cidadão precisará apenas se identificar com apenas um documento e, a partir dele, o governo poderá rastrear os cadastros nas demais bases de dados cadastrais.  Segurança na prestação de serviço público, pois os dados serão conferidos de forma eletrônica com garantia.  Qualificar os dados biográficos da população brasileira, para que, a partir das bases de dados existentes, se obtenha uma base de referência, para uso por toda a administração pública de forma que seja possível identificar a trajetória de pessoas pelos diversos serviços públicos. 1.3. Características do programa de controle de dados O objetivo da governança de dados é subsidiar as decisões estratégicas permitindo que uma organização gerencie os dados como ativos. A governança de dados fornece os princípios, políticas, processos, estrutura, métricas e supervisão para gerenciar dados como um ativo e orientar as atividades de gerenciamento de dados em todos os níveis. Para atingir esse objetivo geral, um programa de governança de dados deve ser:  Sustentável: a governança de dados é um processo contínuo que requer compromisso da organização. Exige mudanças na maneira como os dados são gerenciados e usados. Isso significa gerenciar as mudanças de maneira sustentável, além da implementação inicial de qualquer componente de controle de dados.  Incorporado: a governança de dados não é um processo complementar. As atividades de governança precisam ser incorporadas aos métodos de desenvolvimento de software, uso de dados para análise, gerenciamento de dados mestre e gerenciamento de riscos.  Medido: a governança de dados bem implementada gera impactos positivos, mas demonstrar esse impacto requer a compreensão do ponto de partida, do planejamento e definição de indicadores que represente o quanto a GD gera melhorias mensuráveis. Ressaltamos que a implementação de um programa de governança de dados requer compromisso com a mudança. Nesse sentido, desde o início dos anos 2000, princípios foram desenvolvidos para favorecer o estabelecimento de uma base sólida para essas situações de empreendimento do programa. São eles:  Liderança e estratégia: a governança de dados bem-sucedida começa com uma liderança visionária, comprometida e alinhada à estratégia de negócios da organização.  Orientado aos negócios: a governança de dados é um programa de negócios que deve governar as decisões de TIC relacionadas aos dados, assim como governa a interação dos negócios com os dados.  Responsabilidade compartilhada: a governança de dados é uma responsabilidade compartilhada entre gestores de negócios e profissionais de gerenciamento de dados.  Multicamada: a governança de dados atua nos níveis corporativo, local e nos níveis intermediários.  Baseado em estrutura: como as atividades de governança de dados exigem coordenação entre áreas funcionais, o programa de governança de dados deve estabelecer uma estrutura operacional que defina responsabilidades e interações.  Baseado em princípios: os princípios orientadores são a base das atividades de governança de dados e, principalmente, da política de governança de dados. A palavra central em governança é governar. A governança de dados pode ser entendida em termos de governança política, que abrange:  Funções legislativas (Legislative-like functions): definição de políticas, padrões e arquitetura de dados corporativos.  Funções judiciais (Judicial-like functions): gerenciamento e escalonamento de problemas.
  • 48.
     Funções executivas(Executive functions): proteger e servir, responsabilidades administrativas. Para gerenciar melhor os riscos, a maioria das organizações adota uma forma representativa de governança de dados, para que todas as partes interessadas possam ser ouvidas. 1.4. Modelos de Governança de Dados Cada organização deve adotar um modelo de governança que apoie sua estratégia de negócios em prol do sucesso dentro de seu próprio contexto. Os modelos diferem em relação à sua estrutura organizacional, nível de formalidade e abordagem à tomada de decisão. Alguns modelos são organizados de forma centralizada, enquanto outros são distribuídos. Todos os modelos precisam de certo grau de flexibilidade. As organizações também devem estar preparadas para desenvolver seu modelo para enfrentar novos desafios e se adaptar à medida que a cultura organizacional evoluir. As organizações de governança de dados também podem ter distintas formas de abordar preocupações em diferentes níveis dentro de uma organização. O trabalho de governança geralmente é dividido entre vários comitês, cada um com objetivo e nível de supervisão diferente dos outros. Esse trabalho precisa ser coordenado para que a organização se beneficie dessa sinergia. A imagem a seguir apresenta um modelo genérico de governança de dados. O modelo envolve atividades em váriados níveis da organização (conforme observado no eixo vertical), bem como a separação das responsabilidades de governança nas funções da organização e entre negócios (lado esquerdo) e TIC (lado direito).
  • 49.
    Parte do trabalhode governança de dados é realizado no nível “0” por gestores de dados integrantes de um escritório de governança de dados. Eles serão responsáveis por diferentes tipos de dados, dependendo da necessidade da organização. Frequentemente, lideram grupos de trabalho de áreas ou funções que se reportam por meio de um Conselho de Governança de Dados. No nível estratégico, diversas organizações têm um Comitê Gestor de Governança de Dados. Esse Comitê tem caráter diretivo/deliberativo e monitora a aplicação da política de GD e atua também como Fórum para discussão de controvérsias relacionadas à gestão de dados e atua na criação de subcomitês para analisar e avaliar soluções. No lado da TIC, o trabalho geralmente é dividido entre programas com alguns projetos, implementados por meio de equipes de projeto e responsabilidades operacionais executadas por serviços de gerenciamento de dados ou equipes de suporte/operações de produção. Implementar um nível de gestão também é necessário. A maioria das organizações precisará de estruturas de governança nas áreas de negócio e de TIC, além de uma função de supervisão. As diferentes partes da organização encarregadas das atividades de governança precisam colaborar e coordenar ativamente. A figura a seguir apresenta esse tipo de modelo que pode ser implementado de diferentes maneiras, dependendo das necessidades e das restrições da organização. As opções organizacionais para governança de dados dependem da estrutura existente na instituição, dos objetivos da governança de dados e da disposição cultural da organização para centralização e colaboração.  Em um modelo centralizado, uma organização de governança de dados supervisiona todas as atividades em todas as áreas de assunto.  Em um modelo replicado, o mesmo modelo operacional e padrões da GD são adotados por cada unidade de negócios.  Em um modelo federado, uma organização de governança de dados coordena-se com várias unidades de negócios para manter definições e padrões consistentes.
  • 50.
    Além de organizaras pessoas para governança de dados, também é útil estabelecer um modelo operacional que estabeleça a interação entre a organização de governança e as pessoas responsáveis por projetos ou iniciativas de gerenciamento de dados, o envolvimento de atividades de gerenciamento de mudanças para introduzir este novo programa e o modelo para caminhos de resolução de gerenciamento de problemas por meio da governança. A figura a seguir ilustra um exemplo que você pode adaptar para atender aos requisitos e corresponder à cultura da sua organização. Independentemente da sua situação, várias facetas permanecerão as mesmas. As funções executivas fornecem supervisão. O DGO (Data Governance Operations) trabalha em domínios. A política é rebaixada e os problemas são escalonados. Os administradores e as partes interessadas se envolvem em vários níveis. 1.5. Gerenciamento de dados Data Stewardship é um daqueles conceitos que as pessoas nem sempre entendem! O Data Stewards tem a função de gerenciar ativos de dados em nome de terceiros e no melhor interesse da organização. Esse conceito surgiu do reconhecimento de que, em qualquer organização, sempre houve pessoas que têm experiência nos dados e se preocupam genuinamente com a forma de uma organização manter os dados e disponibilizá-los para uso. À medida que a importância dos dados cresce, o mesmo ocorre com o reconhecimento formal dessa função. Os Data Stewards representam os interesses de todas as partes envolvidas e devem adotar uma perspectiva corporativa para garantir que os dados corporativos sejam de alta qualidade e possam ser usados com eficiência. Os Data Stewards eficazes são conscientes e responsáveis pelas atividades de governança de dados e dedicam parte de seu tempo a essas atividades.
  • 51.
    O foco dasatividades de Data Stewards diferirá de organização para organização, dependendo da estratégia de cada uma delas. No entanto, na maioria dos casos, as atividades de Data Stewards se concentram em algumas premissas, destacadas a seguir:  Criação e gerenciamento de metadados principais: padronização, definição e gerenciamento de terminologia de negócios, valores de dados válidos e outros metadados críticos.  Regras e padrões de documentação: definição/documentação de regras de negócios, padrões e regras de qualidade de dados. As expectativas usadas para definir dados de alta qualidade são frequentemente formuladas em termos de regras fundamentadas nos processos de negócios que criam ou consomem dados.  Gerenciamento de problemas de qualidade de dados: Os organizadores geralmente estão envolvidos na identificação, priorização e resolução de problemas relacionados a dados ou na facilitação do processo de resolução.  Execução de atividades operacionais de governança de dados: Os organizadores são responsáveis por garantir que as políticas e iniciativas de governança de dados sejam cumpridas diariamente. Influenciam as decisões para garantir que os dados sejam gerenciados de maneira a apoiar os objetivos gerais da organização. Saiba mais sobre as regulamentações globais em gerenciamento de dados. Neste contexto, pode-se destacar as principais normas e legislações que são afetas ao tema Governança e Gestão de Dados no âmbito da Administração Pública Federal, as quais é possível considerar como mecanismos de GD que visam promover o valor dos dados como ativos estratégicos e subsidiar o processo de transformação digital e de planejamento de Políticas Públicas. Acesse as abas a seguir para conhecer a finalidade de cada um desses instrumentos normativos. Lei nº 12.527, de 18 de novembro de 2011 Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal; Lei nº 13.460, de 26 de junho de 2017 Definiu que os cidadãos brasileiros não precisam mais apresentar a órgãos públicos documentos, atestados ou certidões que já estejam de posse da administração pública federal. São os órgãos que devem integrar as bases de dados e compartilhar essas informações. Esse compartilhamento pode ser feito de forma automatizada, sem intervenção humana, por meio de uma API. Lei nº 13.709, de 14 de agosto de 2018 Lei Geral de Proteção de Dados Pessoais (LGPD) Decreto nº 8.638, de 15 de janeiro de 2016 Institui a Política de Governança Digital no âmbito dos órgãos e das entidades da administração pública federal direta, autárquica e fundacional. Decreto nº 8.777, de 11 de maio de 2016 Institui a Política de Dados Abertos do Poder Executivo federal. Decreto nº 8.789, de 29 de junho de 2016 Dispõe sobre o compartilhamento de bases de dados na administração pública federal.
  • 52.
    Decreto nº 8.936,de 19 de dezembro de 2016 Institui a Plataforma de Cidadania Digital e dispõe sobre a oferta dos serviços públicos digitais, no âmbito dos órgãos e das entidades da administração pública federal direta, autárquica e fundacional. Decreto nº 9.094, de 17 de julho de 2017 Dispõe sobre a simplificação do atendimento prestado aos usuários dos serviços públicos, institui o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo para a apresentação de dados do cidadão no exercício de obrigações e direitos e na obtenção de benefícios, ratifica a dispensa do reconhecimento de firma e da autenticação em documentos produzidos no País e institui a Carta de Serviços ao Usuário. Decreto nº 9.203, de 22 de novembro de 2017 Dispõe sobre a política de governança da administração pública federal direta, autárquica e fundacional. Decreto nº 9.723, de 11 de março de 2019 Altera o Decreto nº 9.094, de 17 de julho de 2017, o Decreto nº 8.936, de 19 de dezembro de 2016, e o Decreto nº 9.492, de 5 setembro de 2018, para instituir o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo da apresentação de outros documentos do cidadão no exercício de obrigações e direitos ou na obtenção de benefícios e regulamentar dispositivos da Lei nº 13.460, de 26 de junho de 2017. Decreto nº 9.929, de 22 de julho de 2019 Dispõe sobre o Sistema Nacional de Informações de Registro Civil - Sirc e sobre o seu comitê gestor. Decreto nº 10.046, de 09 de outubro de 2019 Dispõe sobre a governança no compartilhamento de dados no âmbito da administração pública federal e institui o Cadastro Base do Cidadão e o Comitê Central de Governança de Dados. Portaria STI/MP nº 58, de 23 de dezembro de 2016 Dispõe sobre procedimentos complementares para o compartilhamento de bases de dados oficiais entre órgãos e entidades da administração pública federal direta e indireta e as demais entidades controladas direta ou indiretamente pela União. 1.6. Iniciando o controle de dados A governança de dados permite compartilhar responsabilidades relacionadas à gestão de dados e suas atividades são transversais aos setores da organização. Antes de um programa de GD ser configurado, a equipe precisará internalizar a estratégia e os desafios específicos no que tange a gestão dos dados da organização. Enfatizamos a seguir, os seguintes aspectos que deverão ser considerados nas avaliações iniciais:  Avaliação da maturidade do gerenciamento de dados: determine como a organização utiliza o potencial humano, processos e tecnologia para gerenciar e obter valor com seus dados. Essa avaliação pode ajudar a determinar os níveis de gestão, os padrões existentes e a identificar oportunidades de melhoria.
  • 53.
     Avaliação dacapacidade de mudar: determine a capacidade da organização para adotar comportamentos necessários para uma governança de dados bem-sucedida. Identifique possíveis obstáculos e ações de superação.  Prontidão colaborativa: caracterize a capacidade da organização de colaborar entre funções para administrar e tomar decisões holísticas e consistentes sobre dados.  Alinhamento: avalie o quão a organização alinha seus objetivos ao gerenciamento de dados com a estratégia de negócio. Identifique pontos críticos da governança de dados (por exemplo: conformidade regulatória e padrões SDLC).  Avaliação da qualidade dos dados: identifique dados críticos e pontos problemáticos existentes para fornecer informações sobre riscos existentes associados aos dados e processos de negócios.  Avaliação da conformidade regulatória: entenda a relação dos riscos de dados com os requisitos de conformidade e como eles são gerenciados atualmente. Identifique controles e monitoramento que possam melhorar a capacidade da organização de cumprir com os regulamentos. As avaliações iniciais contribuem para o caso de negócios da governança de dados. As avaliações de maturidade, qualidade dos dados e conformidade devem identificar pontos de partida concretos para melhoria, mas a abordagem geral deve ser orientada por uma estratégia que defina o escopo e a abordagem dos esforços de governança de dados em relação às metas de negócios. Sobre a estratégia, destacamos os aspectos que devem ser considerados para sua definição e após definida. Antes, para definição da estratégia Depois da estratégia definida  Instrumento formal que estabeleça metas e princípios.  Matriz de responsabilidades.  Plano de implementação estratégico e operacional que descreva: a. O objetivo das atividades de governança de dados e como elas serão incorporadas nos processos de TIC. b. O conjunto de iniciativas para melhorar os recursos de gerenciamento e da qualidade dos dados. c. Os benefícios esperados. d. A definição das métricas que demonstre os benefícios.  Definir políticas.  Subscrição dos projetos de melhoria de dados.  Gerenciar mudanças para impulsionar a adoção dos comportamentos desejados.  Gerenciar problemas e conflitos que podem surgir durante o processo de implementação. 1.7. Governança de dados sustentável A governança de dados orienta o gerenciamento de dados, estabelecendo políticas e práticas recomendadas para gerenciar ativos de dados e fornecendo supervisão contínua de sua implementação. Como essas práticas devem ser realizadas por outras áreas, os princípios devem ser incorporados ao ciclo de vida de gerenciamento de dados e às atividades fundamentais. Atenção, um programa de governança de dados bem-sucedido requer:
  • 54.
     Estabelecer umaestratégia que se alinhe e suporte a estratégia de negócios  Definir e aplicar políticas que definem comportamentos com base nos princípios de gerenciamento de dados  Definir padrões para a qualidade dos dados  Fornecer gerenciamento de dados críticos  Garantir que a organização esteja em conformidade com os regulamentos relacionados a dados.  Gerenciar problemas relacionados a aspectos de dados e governança. Um programa de GD bem-sucedido implicará na mudança da organização em relação à priorização de ações que incidam na curva de maturidade do gerenciamento de dados, com a finalidade de:  Patrocinar projetos de gerenciamento de dados.  Padronizar a avaliação de ativos de dados.  Envolver-se em comunicação contínua sobre os comportamentos necessários para obter valor dos dados. 1.8. Governança de dados e compromisso de liderança Mais do que qualquer outro aspecto do gerenciamento de dados, a governança de dados requer compromisso de liderança e patrocínio estratégico. Existem muitos obstáculos potenciais para o sucesso. A governança se concentra em fazer com que as pessoas se comportem de maneira diferente em relação aos dados. Mudar comportamentos é um desafio, especialmente para iniciativas em toda a organização porque a governança, de qualquer tipo, pode ser vista como uma imposição, e não como um meio de melhorar os processos e possibilitar o sucesso. No entanto, caso você se instrua sobre as maneiras pelas quais os dados suportam sua estratégia de negócios, rapidamente perceberá e endossará os benefícios da governança de dados. Destacam-se alguns benefícios:  Tomar decisões sobre dados no contexto da estratégia geral de negócios faz mais sentido do que tomar essas decisões projeto por projeto.  A codificação do comportamento esperado em relação aos dados nas políticas de governança estabelece diretrizes claras para os funcionários e outras partes interessadas.  Definir os dados uma vez e defini-los de forma consistente economiza tempo, esforço e rotatividade organizacional.  Estabelecer e aplicar padrões de dados são meios eficientes de definir e melhorar a qualidade dos dados mais críticos da organização.  Reduzir os riscos relacionados à privacidade dos dados ajuda a evitar violações de dados e é bom para a reputação e resultados da organização. 2. Planejamento e design no gerenciamento do ciclo de vida dos dados As atividades de gerenciamento do ciclo de vida dos dados se concentram no planejamento e design de dados, permitindo o uso, a manutenção para atender às metas organizacionais. Arquitetos de dados e modeladores de dados são os que planejam e projetam dados. Este tópico descreverá:  O papel da arquitetura corporativa no planejamento e design da organização  A função crítica da arquitetura de dados no gerenciamento de dados
  • 55.
     Os objetivose artefatos associados à modelagem de dados 2.1. Arquitetura de Negócio Arquitetura refere-se a um arranjo organizado de elementos destinados a otimizar a função, o desempenho, a viabilidade, o custo e a estética de uma estrutura ou sistema geral. O termo arquitetura foi adotado para descrever várias facetas do design de sistemas de informação. Mesmo em pequenas organizações, a tecnologia da informação é complicada. Artefatos arquitetônicos e documentação que descrevem sistemas e fluxos de dados mostram às pessoas como sistemas, processos e dados funcionam juntos. Uma abordagem estratégica da arquitetura permite que uma organização tome melhores decisões sobre seus sistemas e dados. Uma prática de arquitetura corporativa bem gerenciada pode ajudar uma organização a entender o estado atual de seus sistemas, promover mudanças desejáveis em relação ao estado futuro, habilitar a conformidade regulatória e melhorar a eficácia. O gerenciamento eficaz de dados e os sistemas em que os dados são armazenados e usados é um objetivo comum da amplitude das disciplinas de arquitetura. A prática de arquitetura é realizada em diferentes níveis dentro de uma organização (incluindo organização, domínio ou projeto) e com diferentes áreas de foco (por exemplo, infraestrutura, aplicações ou dados). A tabela abaixo descreve e compara os domínios de arquitetura. Arquitetos de diferentes domínios devem atender aos requisitos de desenvolvimento de forma colaborativa, pois cada domínio influencia os outros domínios. Tipo de Arquitetura Objetivo Elementos Dependências Papéis Arquitetura de Negócios Corporativos Identificar como uma corporação cria valor para clientes/usuários e outras partes interessadas. Modelos de negócio, processos, serviços de recursos, eventos, estratégias, vocabulário. Estabelece requisitos para os outros domínios. Arquitetos e analistas de negócio, Gestores de dados de negócios. Arquitetura de Dados Corporativos Descrever como os dados devem ser organizados e gerenciados. Modelos de dados, definições de dados, especificações de mapeamento de dados, fluxos de dados, APIs de dados estruturados. Gerencia dados criados e exigidos pela arquitetura de negócios. Arquitetos e modeladores de dados, Gestores de dados. Arquitetura de Aplicações Corporativas Descrever a estrutura e a funcionalidade das aplicações em uma organização. Sistemas de negócios, pacotes de software, bancos de dados. Atua nos dados especificados de acordo com os requisitos de negócios. Arquitetos de aplicações. Arquitetura de Tecnologia Corporativa Descrever a tecnologia física necessária para permitir que os sistemas funcionem e agreguem valor. Plataformas técnicas, redes, ferramentas de integração de segurança. Hospeda e executa a arquitetura de aplicações. Arquitetos de infraestrutura. Domínios da Arquitetura (DMBOK2)
  • 56.
    2.2. O QuadroZachman Uma estrutura de arquitetura é uma estrutura fundamental usada para desenvolver uma ampla variedade de arquiteturas relacionadas. Ela fornece uma maneira de pensar e entender a arquitetura e representa uma 'arquitetura para arquitetura' geral. As estruturas descritas na forma do diagrama permitem que profissionais sem a formação específica compreendam os relacionamentos (se não as diferenças detalhadas) entre esses conceitos. A estrutura de arquitetura corporativa mais conhecida, o Zachman Framework, foi desenvolvida por John A. Zachman na década de 1980. Continuou a evoluir. Zachman reconheceu que, ao criar edifícios, aviões, empresas, cadeias de valor, projetos ou sistemas, existem muitas partes interessadas e cada uma tem uma perspectiva diferente sobre arquitetura. Ele aplicou esse conceito aos requisitos para diferentes tipos e níveis de arquitetura em uma organização. O Zachman Framework é representado por uma matriz 6x6 que resume o conjunto completo de modelos necessários para descrever uma organização e os relacionamentos entre eles. O Framework não define como criar os modelos, mas demonstra quais modelos devem existir. Atenção à estrutura de Zachman! Ela resume as respostas a um conjunto simples de perguntas (ou seja, o que, como, onde, quem, quando, por que) que podem ser feitas pelas partes interessadas com diferentes perspectivas. São as seguintes perspectivas:  executiva (contexto de negócios): Lista os elementos de negócios que definem o escopo nos modelos de identificação.  de gerenciamento de negócios (conceitos de negócios): Esclarecimento das relações entre os conceitos de negócios definidos pelos líderes executivos como proprietários nos modelos de definição.
  • 57.
     do arquiteto(lógica de negócios): Modelos lógicos do sistema detalhando os requisitos do sistema e o design sem restrições representados pelos arquitetos como designers nos modelos de representação.  do engenheiro (física dos negócios): Modelos físicos otimizando o design para implementação para uso específico sob as restrições de tecnologia, pessoas, custos e prazos específicos especificados pelos engenheiros como construtores nos modelos de especificação.  do técnico (montagens de componentes): Uma visão fora de contexto, específica da tecnologia, de como os componentes são montados e operados, configurados pelos técnicos como implementadores nos modelos de configuração.  do usuário (classes de operações): Instâncias de funcionamento reais usadas por Trabalhadores como Participantes. Não há modelos nessa perspectiva. A estrutura então identifica quais tipos de artefatos de arquitetura são necessários para responder a essas perguntas fundamentais. 2.3. Arquitetura de Dados A arquitetura de dados é fundamental para o gerenciamento de dados. Como a maioria das organizações possui mais dados do que as pessoas podem compreender, é necessário representar dados organizacionais em diferentes níveis de abstração para que a alta Administração possa analisá- los e tomar decisões sobre eles. A disciplina especializada da arquitetura de dados pode ser entendida sob alguns pontos de vista, apresentados a seguir:  Resultados da arquitetura de dados, tais como modelos, definições e fluxos de dados em vários níveis (geralmente referidos como artefatos da arquitetura de dados).  Atividades de arquitetura de dados para formar, implantar e cumprir intenções de arquitetura de dados.  Comportamento da arquitetura de dados, assim como colaboração e habilidades entre as várias funções que afetam a arquitetura de dados da organização. A arquitetura de dados de uma organização é descrita por uma coleção integrada de documentos de projeto mestre em diferentes níveis de abstração, incluindo padrões que governam como os dados são coletados, armazenados, organizados, usados e removidos. Também é classificada por descrições de todos os contêineres e caminhos que os dados percorrem nos sistemas de uma organização. Os artefatos da arquitetura de dados incluem especificações usadas para descrever o estado existente, definir requisitos de dados, orientar a integração de dados e controlar ativos de dados, conforme apresentado em uma estratégia de dados. O documento de design da arquitetura de dados mais detalhado é um modelo formal de dados corporativos, contendo nomes de dados, definições abrangentes de dados e metadados, entidades e relacionamentos conceituais e lógicos e regras de negócios. Modelos de dados físicos estão incluídos, mas como um produto de modelagem e design de dados ao invés de uma arquitetura de dados. A arquitetura de dados agrega mais valor quando suporta as necessidades de gestão de dados de toda a organização. A arquitetura de dados corporativos define termos e designs padrão para os elementos importantes para toda a organização. O design de uma arquitetura de dados corporativos inclui a representação dos dados de negócio como tais, englobando a coleta, armazenamento, integração, movimentação e distribuição de dados. A arquitetura de dados corporativos permite padronização e integração consistentes de dados em toda a organização.
  • 58.
    A arquitetura dedados servirá como uma ponte entre a estratégia de negócios e a execução da tecnologia. Vale alertar que como parte da arquitetura corporativa os arquitetos de dados devem:  Preparar estrategicamente as organizações para evoluir rapidamente seus produtos, serviços e dados para aproveitar as oportunidades de negócios inerentes às tecnologias emergentes.  Traduzir necessidades de negócios em requisitos de dados e de sistema, para que os processos tenham consistentemente os dados necessários.  Gerenciar entrega complexa de dados e informações em toda a organização.  Facilitar o alinhamento entre negócios e TI.  Agir como agentes de mudança e transformação. Esses direcionadores de negócios devem influenciar as medidas do valor da arquitetura de dados. 2.4. Artefatos de arquitetura de dados À medida que os dados fluem dentro de uma organização, por meio de feeds ou interfaces, eles são protegidos, integrados, armazenados, registrados, catalogados, compartilhados, relatados, analisados e entregues às partes interessadas. Ao longo do caminho, os dados podem ser verificados, aprimorados, vinculados, certificados, agregados, anonimizados e usados para análises até serem arquivados ou eliminados. As descrições da arquitetura de dados corporativos devem, portanto, incluir modelos de dados corporativos (por exemplo, estruturas e especificações de dados), bem como projetos de fluxo de dados. Os arquitetos de dados criam e mantêm o conhecimento organizacional sobre os dados e os sistemas pelos quais eles se movem. Esse conhecimento permite que uma organização gerencie seus dados como um ativo e aumente o valor que obtém de seus dados, identificando oportunidades para uso de dados, redução de custos e mitigação de riscos. Os arquitetos buscam projetar de maneira a agregar valor à organização. Esse valor é obtido por meio de presença técnica ideal, eficiências operacionais e de projetos e maior capacidade da organização de usar seus dados. Para chegar lá, são necessários: bom design, planejamento e capacidade de garantir que os projetos e planos sejam executados de maneira eficaz. Nesse sentido, serão apresentados, a seguir, alguns artefatos da arquitetura de dados. a. Modelo de Dados Corporativos (Enterprise Data Model - EDM) O Enterprise Data Model - EDM é um modelo de dados conceitual ou lógico holístico, que independente da implementação, fornece uma visão comum e consistente dos dados da organização. Um EDM inclui as principais entidades de dados corporativos (ou seja, conceitos de negócios), seus relacionamentos, regras críticas de negócios orientadoras e alguns atributos críticos. Estabelece a base para todos os dados e projetos relacionados a dados. Qualquer modelo de dados no nível de projeto deve ser baseado no EDM. O EDM deve ser revisado pelas partes interessadas em concordância com a estratégia de negócio da organização. Uma organização que reconhece a necessidade de um modelo de dados corporativo deve decidir quanto tempo e esforço pode dedicar à sua construção. Os EDMs podem ser criados em diferentes níveis de detalhes, portanto, a disponibilidade de recursos influenciará o escopo inicial. Com o tempo, conforme as necessidades da organização exigem, o escopo e o nível de detalhes capturados em um modelo de dados corporativos geralmente se expandem. Os modelos de dados corporativos mais bem-sucedidos são criados de forma incremental e iterativa, usando camadas.
  • 59.
    A imagem aseguir apresenta os diferentes tipos de modelos e mostra como os modelos conceituais são vinculados aos modelos de dados de aplicações lógicas e físicas. Com relação à imagem acima, que apresenta o Modelo de Dados Corporativos, vale ressaltar que ela permite reconhecer:  a perspectiva conceitual sobre as áreas temáticas da organização.  as entidades e relacionamentos para cada área temática.  perspectiva lógica detalhada e parcialmente atribuída a cada uma dessas áreas temáticas.  os modelos lógicos e físicos específicos de uma aplicação ou projeto. Todos os níveis fazem parte desse modelo e as vinculações criam caminhos para rastrear uma entidade de cima para baixo e entre modelos no mesmo nível. b. Design de Fluxo de Dados O design do fluxo de dados define os requisitos e o plano mestre para armazenamento e processamento em bancos de dados, aplicações, plataformas e redes (os componentes). Esses fluxos de dados mapeiam a movimentação de dados para processos, locais, funções de negócios e componentes técnicos. Os fluxos de dados são um tipo de documentação de linhagem de dados que descreve como os dados transitam pelos processos e sistemas de negócios. Os fluxos de dados de ponta a ponta ilustram onde os dados se originaram, onde são armazenados e usados e como são transformados à medida que se movem dentro e entre diversos processos e sistemas.
  • 60.
    A análise delinhagem de dados pode ajudar a explicar o estado dos dados em um determinado ponto no fluxo. Ressalta-se que os fluxos de dados mapeiam e documentam os relacionamentos entre:  Aplicações em um processo de negócios.  Armazenamentos de dados ou bancos de dados em um ambiente.  Segmentos de rede (úteis para mapeamento de segurança).  Funções de negócio, representando quais funções são responsáveis por criar, atualizar, usar e excluir dados (CRUD – Acrônomo de Create, Read, Update e Delete, na língua inglesa).  Locais onde ocorrem as diferenças. Os fluxos de dados podem ser documentados em diferentes níveis de detalhe: área de assunto, entidade ou mesmo no nível do atributo. Os sistemas podem ser representados por segmentos de rede, plataformas, conjuntos de aplicações comuns ou servidores individuais. Os fluxos de dados podem ser representados por matrizes bidimensionais e diagrama de fluxo de dados.:  Matrizes Bidimensionais
  • 61.
    O Modelo deDados Corporativos e o Design do Fluxo de Dados precisam estar bem alinhados. Como mencionado, ambos precisam refletir o estado atual em relação à perspectiva da arquitetura de dados e também o estado de transição em relação à perspectiva do projeto. c. Arquitetura, Qualidade e Inovação de Gerenciamento de Dados Os dados e a arquitetura corporativa lidam com a complexidade de dois indicadores, que pedem abordagens distintas, conforme apresentado na tabela a seguir. Direcionadores/Drivers Foco Abordagem Orientação para a qualidade Concentre-se em melhorar a execução nos ciclos de negócios e desenvolvimento de TI. A menos que a arquitetura seja gerenciada, a arquitetura se deteriorará. Os sistemas gradualmente se tornarão mais complexos e inflexíveis, criando riscos para uma organização. Entrega descontrolada de dados, cópias de dados e relacionamentos de "espaguete" de interface tornam as organizações menos eficientes e reduzem a confiança nos dados. Alinha-se ao trabalho tradicional de arquitetura de dados, no qual as melhorias na qualidade da arquitetura são realizadas de forma incremental por meio da conexão do arquiteto com os projetos. Normalmente, o arquiteto mantém em mente toda a arquitetura e se concentra nos objetivos de longo prazo diretamente conectados à governança, padronização e desenvolvimento estruturado.
  • 62.
    Orientação para ainovação Concentre-se na transformação dos negócios e da TI para atender novas expectativas e oportunidades. Impulsionar a inovação com tecnologias disruptivas e uso de dados tornou-se um papel do arquiteto corporativo moderno. Pode ter uma perspectiva de curto prazo e usar lógica de negócios não comprovada e tecnologias de ponta. Essa orientação geralmente exige que os arquitetos entrem em contato com pessoas da organização com as quais os profissionais de TI geralmente não interagem; por exemplo, representantes de desenvolvimento de produtos e designers de negócios. Ao se trabalhar na arquitetura corporativa ou como uma equipe de arquitetura de dados, os arquitetos de dados são responsáveis por desenvolver um roteiro, gerenciar requisitos de dados corporativos nos projetos e integrar-se à arquitetura corporativa geral. O sucesso depende da definição e adesão aos padrões e da criação e manutenção de artefatos de arquitetura úteis e utilizáveis. Uma prática de arquitetura disciplinada pode melhorar a eficiência e a qualidade, criando soluções reutilizáveis e extensíveis. 2.5. Modelagem de dados Um modelo é uma representação de algo que existe ou um padrão para algo a ser feito. Mapas, organogramas e plantas de construção são exemplos de modelos em uso todos os dias. Os diagramas de modelos usam símbolos padrão que permitem entender seu conteúdo. A modelagem de dados é o processo de descoberta, análise e escopo de requisitos de dados e, em seguida, representação e comunicação desses requisitos de dados de uma forma precisa chamada modelo de dados. A modelagem de dados é um componente crítico do gerenciamento de dados. O processo de modelagem exige que as organizações descubram e documentem como seus dados se encaixam. Modelos de dados permitem que uma organização entenda seus ativos de dados. Os modelos de dados incluem e contêm metadados essenciais para os consumidores de dados. Boa parte desses metadados descobertos durante o processo de modelagem é essencial para outras funções de gerenciamento de dados, como, por exemplo, definições para controle de dados e linhagem para armazenamento e análise de dados. Um modelo de dados descreve os dados de uma organização como a organização os entende ou como a organização deseja que sejam. Um modelo de dados contém um conjunto de símbolos com rótulos de texto que tentam representar visualmente os requisitos de dados comunicados ao modelador de dados, para um conjunto específico de dados que pode variar em tamanho, de pequeno (para um projeto) a grande (para uma organização). O modelo é, portanto, uma forma de documentação para requisitos e definições de dados resultantes do processo de modelagem. Os modelos de dados são o principal meio usado para comunicar os requisitos de dados da organização para a TI e, dentro da TI, de analistas e arquitetos, para designers e desenvolvedores de bancos de dados. Atenção, os modelos de dados são críticos para o gerenciamento eficaz dos dados, pois:  Fornecem um vocabulário comum sobre dados.
  • 63.
     Capturam edocumentam o conhecimento explícito (metadados) sobre os dados e sistemas de uma organização.  Servem como principal ferramenta de comunicação durante os projetos.  Fornecem o ponto de partida para personalização, integração ou mesmo substituição de uma aplicação. Objetivos de modelagem de dados O objetivo da modelagem de dados é confirmar e documentar o entendimento de diferentes perspectivas sobre os dados. Esse entendimento leva a aplicações e dados que se alinham mais com os requisitos de negócios atuais e futuros. Esse entendimento também cria uma base para concluir com êxito iniciativas de escopo amplo, como Master Data Management e programas de governança de dados. A modelagem de dados adequada leva a custos de suporte mais baixos e aumenta as oportunidades de reutilização para iniciativas futuras, reduzindo assim os custos de construção de novas aplicações. Além disso, os próprios modelos de dados são uma forma importante de metadados. Alertamos que, confirmar e documentar a compreensão de diferentes perspectivas facilita à:  Formalização - Um modelo de dados documenta uma definição concisa de estruturas e relacionamentos de dados. Ele permite avaliar como os dados são afetados pelas regras de negócios implementadas, para os estados atuais (como estão) ou os estados de destino desejados. A definição formal impõe uma estrutura disciplinada aos dados que reduz a possibilidade de anomalias nos dados ao acessar e persistir dados. Ao ilustrar as estruturas e os relacionamentos nos dados, um modelo de dados facilita o consumo dos dados.  Definição do escopo - Um modelo de dados pode ajudar a explicar os limites do contexto de dados e implementação de pacotes de aplicativos, projetos, iniciativas ou sistemas existentes.  Retenção/documentação de conhecimento - Um modelo de dados pode preservar a memória corporativa em relação a um sistema ou projeto capturando conhecimento de forma explícita. Ele serve como documentação para futuros projetos a serem usados como estão. Os modelos de dados nos ajudam a entender uma organização ou área de negócios, um aplicativo existente ou o impacto da modificação de uma estrutura de dados existente. O modelo de dados se torna um mapa reutilizável para ajudar profissionais de negócios, gerentes de projeto, analistas, modeladores e desenvolvedores a entender a estrutura de dados no ambiente. Da mesma maneira que o cartógrafo aprendeu e documentou um cenário geográfico para outros usarem na navegação, o modelador permite que outros entendam um cenário de informações. Blocos de construção Existem diferentes variedades de modelos de dados, incluindo relacionais, dimensionais etc. Os profissionais de design utilizam tipos apropriados de modelos com base nas necessidades da organização, nos dados que estão sendo modelados e no sistema para o qual o modelo está sendo desenvolvido. Cada espécie de modelo utiliza convenções visuais diferentes para capturar informações. Os modelos também diferem com base no nível de abstração das informações que representam (conceitual com um alto nível de abstração; lógico com um nível médio de abstração; e físico que representa um sistema específico ou instanciação de dados). Entretanto, todos os modelos usam os mesmos blocos de construção: entidades, relacionamentos, atributos e domínios. Como líder em sua organização, não é necessário que você possa ler modelos de dados. No entanto, é útil você entender como eles descrevem dados. As definições aqui fornecem um panorama de como os modelos de dados funcionam.
  • 64.
    Entidade Fora da modelagemde dados, a definição de entidade é algo que existe separado de outras coisas. Na modelagem de dados, uma entidade é algo sobre o qual uma organização coleta informações. Às vezes, as entidades são chamadas de 'substantivos de uma organização. Nos modelos de dados relacionais, as entidades são as caixas que identificam o conceito que está sendo modelado. Uma entidade pode ser pensada como a resposta a esses questionamentos: Quem? O que? Quando? Onde? Por quê? Como? Pode também ser definida porra combinação dessas perguntas. Relação Um relacionamento é uma associação entre entidades. Ele captura as interações de alto nível entre entidades conceituais, as interações detalhadas entre entidades lógicas e as restrições entre entidades físicas. Os relacionamentos são mostrados como linhas no diagrama de modelagem de dados. Em uma relação entre duas entidades, a cardinalidade captura quantas de uma entidade (instâncias de entidade) participam do relacionamento com quantas da outra entidade. Por exemplo, uma organização pode ter um ou vários funcionários. Cardinalidade A cardinalidade é representada pelos símbolos que aparecem nas duas extremidades de uma linha de relacionamento. Para cardinalidade, as opções são simples: zero, um ou muitos ("muitos" referentes a qualquer número maior que um). Cada lado de um relacionamento pode ter qualquer combinação de zero, um ou muitos. O diagrama abaixo apresenta diferentes relações de cardinalidade. Uma organização emprega um ou mais funcionários. Um funcionário pode suportar zero, um ou muitos dependentes. Mas um Funcionário tem um e apenas um Trabalho durante um período de tempo. Os relacionamentos de cardinalidade são uma maneira de capturar regras e expectativas relacionadas aos dados. Se os dados mostrarem que um Funcionário mantém mais de um Trabalho durante um período de tempo definido, há um erro nos dados ou a organização está violando uma regra.
  • 65.
    Atributo Um atributo éuma propriedade que identifica, descreve ou mede uma entidade. O correspondente físico de um atributo em uma entidade é uma coluna, campo, tag ou nó em uma tabela, visualização, documento, gráfico ou arquivo. No exemplo abaixo, a entidade Organization possui os atributos de ID fiscal da organização, Número de telefone da organização e Nome da organização. O funcionário possui os atributos: Número do funcionário, Nome do funcionário, Sobrenome do funcionário e Data de nascimento do funcionário. Os detalhes Dependente e Trabalho têm atributos que descrevem suas características.
  • 66.
    Domínio Na modelagem dedados, um domínio é o conjunto completo de valores possíveis aos quais um atributo pode ser atribuído. Um domínio fornece um meio de padronizar as características dos atributos e restringe os dados que podem ser preenchidos no campo. Por exemplo, o domínio Data, que contém todas as datas válidas possíveis, pode ser atribuído a qualquer atributo de data em um modelo de dados lógico ou a colunas/campos de data em um modelo de dados físico, como:  EmployeeHireDate  OrderEntryDate  ClaimSubmitDate  CourseStartDate Os domínios são críticos para entender a qualidade dos dados. Todos os valores dentro do domínio são válidos. Aqueles fora do domínio são chamados de valores inválidos. Um atributo não deve conter valores fora do domínio atribuído. O domínio para EmployeeHireDate pode ser definido simplesmente como datas válidas. Sob essa regra, o domínio para EmployeeHireDate não inclui 30 de fevereiro de qualquer ano.
  • 67.
    Modelagem e gerenciamentode dados A Modelagem de Dados é um processo de descoberta e documentação de informações críticas para o entendimento de uma organização por meio de seus dados. Os modelos capturam e permitem o uso do conhecimento dentro de uma organização (ou seja, são uma forma crítica e uma fonte de metadados). Eles podem até ser usados para melhorar a qualidade dessas informações, por meio da aplicação de convenções de nomenclatura e outros padrões que tornam as informações mais consistentes e confiáveis. Os analistas e designers de dados atuam como intermediários entre os consumidores de informações (as pessoas com requisitos de negócios para dados) e os produtores de dados que capturam os dados de forma utilizável. Os profissionais de dados devem equilibrar os requisitos de dados dos consumidores de informações e os requisitos de aplicação dos produtores de dados. Os projetistas de dados também devem equilibrar os interesses de curto e de longo prazo. Os consumidores de informações precisam de dados em tempo hábil para atender demandas de curto prazo e avaliar oportunidades. As equipes de projeto de desenvolvimento do sistema devem atender às restrições de tempo e orçamento. No entanto, eles também devem atender aos interesses de longo prazo de todas as partes interessadas, garantindo que os dados de uma organização residam em estruturas de dados seguras, recuperáveis, compartilháveis e reutilizáveis, e que esses dados sejam os íntegros, oportunos, relevantes e utilizáveis. Portanto, modelos de dados e projetos de banco de dados devem fornecer um equilíbrio razoável entre as necessidades de curto e de longo prazo da organização. 3. Habilitando e Mantendo Dados O foco do trabalho de design, como arquitetura e modelagem de dados, é fornecer informações sobre a melhor forma de configurar as aplicações que disponibilizam dados utilizáveis, acessíveis e atuais para a organização. Depois que os dados são configurados em armazéns e aplicações é necessário um trabalho operacional significativo para que eles continuem a atender aos requisitos organizacionais. Este tópico visa descrever as funções de gerenciamento de dados que se concentram na ativação e manutenção de dados. São elas:  Armazenamento e Operações de Dados.  Integração e interoperabilidade de dados.  Armazenamento de dados.  Gerenciamento de dados de referência.  Gerenciamento de dados mestre.  Gerenciamento de Documentos e Conteúdo.  Armazenamento de Big Data. 3.1. Armazenamento e operações de dados A função de armazenamento e operações de dados é o que muitas pessoas entendem quando pensam no gerenciamento tradicional de dados. Esse é o trabalho, altamente técnico, realizado pelos administradores de banco de dados (Data Base Administrators - DBAs) e Administradores de Armazenamento em Rede (Network Storage Administrators - NSAs) para garantir que os sistemas de armazenamento de dados estejam acessíveis, com bom desempenho e que a integridade dos dados seja mantida.
  • 68.
    O trabalho dearmazenamento e operações de dados é essencial para as organizações que dependem de dados para realizar diversos tipos de transações. A administração do banco de dados é vista como uma função monolítica na qual os DBAs desempenham papéis diferentes. Podem suportar ambientes de produção, trabalho de desenvolvimento e procedimentos específicos. O trabalho do DBA é influenciado pela arquitetura de dados de uma organização (por exemplo, centralizada, distribuída, federada; fortemente ou fracamente acoplada), bem como pela maneira como os próprios bancos de dados são organizados (hierárquicos, relacional, etc.). Com o surgimento de novas tecnologias, os DBAs e NSAs são responsáveis por criar e gerenciar ambientes virtuais (computação em nuvem). Como os ambientes de armazenamento de dados são bastante complexos, os DBAs procuram maneiras de reduzir ou pelo menos gerenciar a complexidade por meio da automação, reutilização e aplicação de padrões e práticas recomendadas. Embora os DBAs possam parecer muito distantes da função de governança de dados, seu conhecimento do ambiente técnico é essencial para implementar diretivas de governança de dados relacionadas a itens como controle de acesso, privacidade e segurança de dados. DBAs experientes também são fundamentais para permitir que as organizações adotem e incrementem novas tecnologias. O armazenamento e as operações de dados são parte do gerenciamento de dados em todo o seu ciclo de vida, desde a obtenção até a eliminação. Atenção, os DBAs contribuem para esse processo:  Definindo requisitos de armazenamento.  Definindo requisitos de acesso.  Desenvolvendo instâncias.  Gerenciando o ambiente de armazenamento físico.  Carregando dados.  Replicando dados.  Rastreando padrões de uso.  Planejando a continuidade dos negócios.  Gerenciando backup e recuperação.  Gerenciando o desempenho e a disponibilidade do banco de dados.  Gerenciando ambientes alternativos (por exemplo, para desenvolvimento e teste).  Gerenciando a migração de dados.  Rastreando ativos de dados.  Habilitando auditorias e validação de dados. Em resumo, os DBAs garantem que os mecanismos estejam funcionando. Eles também são os primeiros em cena quando os bancos de dados se tornam indisponíveis. 3.2. Integração e interoperabilidade de dados Enquanto as atividades de armazenamento e operações de dados se concentram nos ambientes para armazenamento e manutenção de dados, as atividades de Integração e Interoperabilidade de Dados (DII) incluem processos para mover e consolidar dados dentro e entre repositórios de dados e aplicações. A integração consolida os dados em formas consistentes, físicas ou virtuais. Interoperabilidade de dados é a capacidade de vários sistemas se comunicarem. Os dados a serem integrados geralmente se originam de diferentes sistemas dentro de uma organização. Cada vez mais, as organizações também integram dados externos aos dados que produzem.
  • 69.
    As soluções DIIpermitem funções básicas de gerenciamento de dados das quais a maioria das organizações depende para:  Migração e conversão de dados.  Consolidação de dados em Hubs ou Marts.  Integração de pacotes de software de fornecedores ao portfólio de aplicações da organização  Compartilhamento de dados entre aplicações e organizações.  Distribuição dados entre repositórios de dados e datacenters.  Arquivamento de dados.  Gerenciamento de interfaces de dados.  Obtenção e ingestão de dados externos.  Integração de dados estruturados e não estruturados.  Fornecimento de inteligência operacional e suporte a decisões de gerenciamento A implementação de práticas e soluções de integração e interoperabilidade de dados visa:  Disponibilizar dados no formato e prazo necessários para os consumidores de dados, humanos e do sistema.  Consolidar dados fisicamente e virtualmente em hubs de dados.  Reduzir o custo e a complexidade do gerenciamento de soluções, desenvolvendo modelos e interfaces compartilhados.  Identificar eventos significativos (oportunidades e ameaças) e acionar alertas e ações automaticamente.  Apoiar os esforços de Business Intelligence, analytics, Master Data Management e eficiência operacional. O design das soluções DII precisa levar em consideração a:  Captura de dados alterados: como garantir que os dados sejam atualizados corretamente.  Latência: a quantidade de tempo entre quando os dados são criados ou capturados e quando são disponibilizados para consumo.  Replicação: como os dados são distribuídos para garantir o desempenho.  Orquestração: como diferentes processos são organizados e executados para preservar a consistência e a continuidade dos dados. O principal fator para o DII é garantir que os dados sejam interoperáveis eficientemente para diferentes meios de armazenamentos, tanto dentro da organização quanto entre organizações. É muito importante projetar com o objetivo de reduzir a complexidade. A maioria das organizações possuem centenas de bancos de dados. Se o DII não for gerenciado com eficiência, apenas o gerenciamento de interfaces poderá sobrecarregar uma organização de TI. Devido à sua complexidade, o DII depende de outras áreas do gerenciamento de dados, incluindo:  Governança de dados: para definir e governar as regras e políticas de transformação de dados e estruturas.  Arquitetura de dados: para projetar soluções.  Segurança de dados: para garantir que as soluções de segurança sejam eficientes nas diversas aplicações de transações de dados entre as organizações.  Metadados: para rastrear o inventário técnico de dados (persistente, virtual e em movimento), o significado estratégico dos dados, as regras para transformar os dados e o histórico operacional e a linhagem dos dados.  Armazenamento e operações de dados: para gerenciar as diversas instancias física das soluções.  Modelagem e Design de Dados: para projetar estruturas de dados, incluindo persistência física em bancos de dados, estruturas de dados virtuais e tráfego que transmitem informações entre aplicações.
  • 70.
    A integração ea interoperabilidade de dados são essenciais para o Data Warehousing & Business Intelligence, bem como para o gerenciamento de dados de referência e de dados mestre, porque tudo isso transforma e integra dados de sistemas de origem múltipla para hubs de dados consolidados e de hubs para os sistemas de destino onde eles podem ser entregues aos consumidores de dados, tanto do sistema quanto humanos. A integração e interoperabilidade de dados também é central para a área emergente do gerenciamento de Big Data. O Big Data procura integrar vários tipos de dados, incluindo dados estruturados e armazenados em bancos de dados, dados de texto não estruturados em documentos ou arquivos, outros tipos de dados não estruturados, como dados de áudio, vídeo e streaming. Esses dados integrados podem ser extraídos, usados para desenvolver modelos preditivos e implantados em atividades de inteligência operacional. Ao implementar o DII A organização deve seguir determinados princípios ao implementar o DII. São eles:  Adotar uma perspectiva corporativa no design para garantir a extensibilidade futura, mas implemente por meio de entrega iterativa e incremental.  Equilibrar as necessidades de dados locais com as necessidades de dados corporativos, incluindo suporte e manutenção.  Garantir a responsabilidade pelo design e atividade do DII. Os especialistas em negócios devem estar envolvidos no design e modificação das regras de transformação de dados, persistentes e virtuais. O processo de integração refere-se à possibilidade de dois ou mais sistemas ou aplicações de se comunicarem, compartilhando informações suficientes entre eles para que determinado processo ocorra. Geralmente, o uso da palavra integração refere-se à capacidade dos sistemas de enviarem informações e processá-las de modo que completem ou complementem um processo ou uma necessidade. Interoperar é a capacidade de um produto ou sistema trabalhar com outros produtos ou sistemas existentes, ou futuros produtos e sistemas sem restringir o acesso ou a implementação. Saiba Mais sobre interoperabilidade. Interoperabilidade Um dos pontos-chave das políticas de governo eletrônico é a interoperabilidade entre os entes que trabalham dentro e fora do governo (cidadãos, empresários, outras esferas de governo, etc.). Mas, o que é interoperabilidade? A interoperabilidade pode ser entendida como uma característica que se refere à capacidade de diversos sistemas e organizações trabalharem em conjunto (interoperar) de modo a garantir que pessoas, organizações e sistemas computacionais interajam para trocar informações de maneira eficaz e eficiente. Importância e Vantagens: “As principais questões de governança endereçadas pelas instituições abordam cinco itens inter- relacionados: os princípios de TIC; a arquitetura de TIC; a infraestrutura de TIC; as necessidades de aplicações para o negócio; e os investimentos e priorização de TI.” (Governança de Tecnologia da Informação, Peter Weil e Jeanne W. Ross). A Governança de TIC relacionada à questão da interoperabilidade aborda os “princípios de TIC” e “arquitetura de TI” com o objetivo de definir a abordagem conceitual e tecnológica para interoperar os
  • 71.
    sistemas de governo,do modo mais eficiente, efetivo e econômico, para o alcance das metas do Governo Federal no atendimento das necessidades da sociedade. Um importante desafio para o governo eletrônico é prestar serviços públicos com maior eficiência e eficácia para os cidadãos. A interoperabilidade gera instrumentos aos gestores para uma melhor tomada de decisão, uma melhor coordenação dos programas e serviços de governo e redução de custos, por meio da visão integrada dos processos do governo e do reuso de soluções tecnológicas. A interoperabilidade também auxilia no atendimento ao Decreto nº 9.723/2019, que dispõe sobre a simplificação do atendimento prestado aos usuários dos serviços públicos, institui o Cadastro de Pessoas Físicas - CPF como instrumento suficiente e substitutivo para a apresentação de dados do cidadão no exercício de obrigações e direitos e na obtenção de benefícios, ratifica a dispensa do reconhecimento de firma e da autenticação em documentos produzidos no País e institui a Carta de Serviços ao Usuário.” Os conceitos de interoperabilidade e integração são muitas vezes utilizados como sinônimos na área de TIC. Entretanto, esses conceitos são distintos, embora complementares. Integração refere-se ao processo de conectar dois ou mais sistemas gerando uma dependência tecnológica entre os mesmos. Interoperabilidade refere-se ao processo de comunicação de dois ou mais sistemas sem a geração de uma dependência tecnológica entre os mesmos. Em muitos casos, a integração entre sistemas é a melhor solução, mas não é o foco da e-PING, que trata principalmente da interoperabilidade entre órgãos. Dimensões da Interoperabilidade: A interoperabilidade pode ser organizada em três dimensões que se comunicam e se complementam: organizacional, semântica e técnica. A interoperabilidade organizacional diz respeito à colaboração entre organizações que desejam trocar informações mantendo diferentes estruturas internas e processos de negócios variados. Mesmo contando com a padronização de conceitos, as organizações possuem distintos modelos de operação, ou processos de trabalho. Isto quer dizer que elas realizam suas atividades em tempos diferentes e de maneiras diferentes. A interoperabilidade semântica é a capacidade de dois ou mais sistemas heterogêneos e distribuídos trabalharem em conjunto, compartilhando as informações entre eles com entendimento comum de seu significado (Buranarach, 2004). A interoperabilidade semântica garante que os dados trocados tenham seu efetivo significado corretamente interpretado dentro do contexto de uma dada transação ou busca de informação, dentro da cultura, convenções e terminologias adotadas por cada setor ou organização e, assim, compartilhados pelas partes envolvidas. A interoperabilidade técnica trata da ligação entre sistemas e serviços de computação pela utilização de padrões para apresentação, coleta, troca, processamento e transporte de dados. Esses padrões podem abranger hardware, software, protocolos e processos de negócio. Uma vez que foram identificados os motivos e os momentos adequados para interoperar, e que foram estabelecidos vocabulários comuns, é preciso haver também um padrão para fazer isso, ou seja, para tratar o “como fazer”. Fonte: Manual do Gestor de Interoperabilidade, 2012 - https://www.governodigital.gov.br/transformacao/compras/orientacoes/interoperabilidade/material-de- apoio
  • 72.
    A existência deuma infraestrutura de Tecnologia da Informação e Comunicação (TICs) estruturada e com fundamentos consolidados para a criação dos serviços de governo digital é o pré-requisito para o fornecimento de melhores serviços à sociedade com custo mais baixos. Um governo moderno e integrado exige sistemas igualmente modernos e integrados, interoperáveis, trabalhando de forma íntegra, segura e coerente em todo o setor público. Políticas e especificações claramente definidas para interoperabilidade e gerenciamento das informações são fundamentais para propiciar a conexão do governo, tanto no âmbito interno como na interação com a sociedade e, em maior nível de abrangência, com o resto do mundo, como outros governos e organizações atuantes no mercado mundial. A arquitetura ePING (Padrões de Interoperabilidade de Governo Eletrônico – Portaria nº 92, de 24 de dezembro de 2014) define um conjunto mínimo de premissas, políticas e especificações técnicas que regulamentam a utilização da Tecnologia de Informação e Comunicação no Governo Federal, estabelecendo as condições de interação com os demais Poderes e esferas de governo e com a sociedade em geral, com mais ênfase nos órgãos e entidades integrantes do Sistema de Administração dos Recursos de Tecnologia da Informação (SISP). Os recursos de informação do governo constituem valiosos ativos econômicos ao garantir que a informação governamental possa ser rapidamente localizada e transmitida entre os diversos órgãos públicos, mantidas as obrigações de privacidade e segurança. Esse processo é essencial para que o governo utilize da melhor forma esses ativos, melhorando a prestação de serviços públicos no país. Para mais informações: http://eping.governoeletronico.gov.br/ 3.3. Armazenamento de dados Os data warehouses – ou armazém de dados – permitem que as organizações integrem dados de sistemas diferentes em um modelo de dados comum, a fim de suportar funções operacionais, requisitos de conformidade e atividades de Business Intelligence (BI). A tecnologia de armazém surgiu nos anos 1980 e as organizações começaram a construir armazéns com viés corporativo a partir dos anos 1990. Os armazéns permitiram que as organizações usassem seus dados com mais eficiência, reduzindo a redundância de dados e proporcionando mais consistência. O termo armazém de dados implica que todos os dados estão em um único local, como em um armazém físico. No entanto, o conceito de data warehouses é mais complicado do que isso. Eles consistem em várias partes pelas quais os dados são movidos. Durante seu movimento, a estrutura e o formato dos dados podem ser alterados, para que possam ser reunidos em tabelas comuns, a partir das quais podem ser acessados. Pode ser usado diretamente para relatórios ou como entrada para aplicações downstream. A construção de um armazém requer habilidades de todo o espectro de gerenciamento de dados, desde as habilidades altamente técnicas necessárias para armazenamento, operações e integração de dados até as habilidades de tomada de decisão dos líderes de governança e estratégia de dados. Também significa gerenciar os processos fundamentais que permitem que os dados sejam seguros, utilizáveis (via metadados confiáveis) e de alta qualidade. Existem diferentes maneiras de construir um armazém. A abordagem adotada por uma organização dependerá de seus objetivos, estratégia e arquitetura. Qualquer que seja a abordagem, os armazéns compartilham as seguintes características comuns:  Armazenam dados de outros sistemas e os tornam acessíveis e utilizáveis para análise.
  • 73.
     O atode armazenamento inclui organizar os dados de maneira a agregar valor. Em muitos casos, isso significa que os armazéns efetivamente criam novos dados que não estão disponíveis em outros lugares.  As organizações constroem armazéns porque precisam disponibilizar dados confiáveis e integrados para as partes interessadas autorizadas.  Os dados do armazém servem a muitos propósitos, desde o suporte ao fluxo de trabalho até o gerenciamento operacional e a análise preditiva. As abordagens mais conhecidas para data warehousing foram conduzidas por dois líderes influentes, Bill Inmon e Ralph Kimball. Bill Inmon define um data warehouse como "uma coleta de dados orientada ao assunto, integrada, variável no tempo e não volátil, para apoiar o processo de tomada de decisão da gerência". Um modelo relacional normalizado é usado para armazenar e gerenciar dados. A figura abaixo ilustra a abordagem da Inmon, que é chamada de "Fábrica de informações corporativas". Ralph Kimball define um data warehouse como "uma cópia dos dados de transação estruturados especificamente para consulta e análise". A imagem a seguir ilustra a abordagem de Kimball, que exige um modelo dimensional.
  • 74.
    À medida quenos aproximamos da terceira década do milênio, muitas organizações estão construindo armazéns de segunda e terceira geração ou adotando lagos de dados para disponibilizar dados. Os lagos de dados (Data lake) disponibilizam mais dados a uma velocidade mais elevada, criando a oportunidade de passar da análise retrospectiva das tendências de negócios para a análise preditiva. O gerenciamento de dados requer conhecimento e planejamento, além de exigir a adoção dos seguintes princípios fundamentais: Foco nos objetivos de negócios Verifique se o data warehouse (DW) atende às prioridades organizacionais e resolve problemas de negócios. Fazer isso requer uma perspectiva estratégica, que, na maioria das vezes, é uma perspectiva da organização. Finalidade em mente O conteúdo do DW deve ser orientado pelas prioridades de negócios e pelo escopo da entrega de dados finais para Business Intelligence - BI. Pensamento global, construção local Permita que a visão final guie a arquitetura, mas construa e forneça de forma incremental, por meio de projetos ou sprints focados que permitem um retorno mais imediato do investimento. Resumo e otimização por último Observe que o resumo e otimização por último e não primeiro. Crie dados atômicos. Agregue e resuma para atender aos requisitos e garantir o desempenho, não para substituir os detalhes.
  • 75.
    Promoção da transparênciae do autoatendimento Quanto mais contexto (por exemplo, incluindo metadados de vários tipos) fornecido, maiores serão os consumidores de dados mais capazes de obter valor com os dados. Mantenha as partes interessadas informadas sobre os dados e os processos pelos quais eles são integrados. Criação de metadados É fundamental para o sucesso da DW a capacidade de explicar os dados. Por exemplo, ser capaz de responder a perguntas básicas como "Por que essa soma é X?" "Como isso foi calculado?" E "De onde vêm os dados?" Os metadados devem ser capturados como parte do ciclo de desenvolvimento e gerenciados como parte das operações em andamento. Colaboração Associar-se com outras iniciativas de dados, especialmente as de governança, qualidade e metadados. Um tamanho não serve para todos Use as ferramentas e produtos certos para cada grupo de consumidores de dados. 3.4. Gerenciamento de dados de referência (Reference Data Management - RDM) Diferentes tipos de dados desempenham diferentes funções dentro de uma organização e têm diferentes requisitos de gerenciamento de dados. Dados de referência (por exemplo, tabelas de código e descrição) são dados usados apenas para caracterizar outros dados em uma organização ou apenas para relacionar dados em um banco de dados a informações além dos limites da organização. Os Dados de referência fornecem um contexto crítico para a criação e uso de dados mestre e transacionais. Permite que outros dados sejam compreendidos de maneira significativa. Importante, é um recurso compartilhado que deve ser gerenciado no nível da organização. Ter várias instâncias dos mesmos Dados de Referência é ineficiente e inevitavelmente leva à inconsistência entre eles. A inconsistência leva à ambiguidade e a ambiguidade introduz riscos para uma organização. O RDM envolve controle sobre valores de domínio definidos e suas definições. O objetivo do RDM é garantir que a organização tenha acesso a um conjunto completo de valores precisos e atuais para cada conceito representado. Por ser um recurso compartilhado e ultrapassar os limites organizacionais internos, a propriedade e a responsabilidade pelos Dados de Referência são um desafio para algumas organizações. Alguns dados de referência se originam fora da organização, outros Dados de Referência podem ser criados e mantidos dentro de um departamento, mas têm um valor potencial em outra parte da organização. Determinar a responsabilidade de obter dados e aplicar atualizações faz parte do gerenciamento. A falta de responsabilização introduz riscos, pois as diferenças nos Dados de referência podem causar um mal-entendido no contexto dos dados (por exemplo, quando duas unidades de negócios têm valores diferentes para classificar o mesmo conceito). Os dados de referência geralmente parecem mais simples do que outros dados. Isso porque o conjunto de dados de referência geralmente são menores que outros tipos de dados. Os dados de referência também são geralmente menos voláteis do que outras formas de dados. Com algumas exceções notáveis (como dados da taxa de câmbio) os dados de referência são alterados com pouca frequência. O desafio com o RDM surge com o seu uso. Para que o Gerenciamento de dados de referência seja eficaz (valores atualizados e consistentes em várias aplicações e usos) ele precisa ser gerenciado por
  • 76.
    meio de tecnologiaque permita aos consumidores de dados humanos e de sistema acessá-lo de maneira oportuna e eficiente em várias plataformas. Assim como no gerenciamento de outras formas de dados, o RDM requer planejamento e design. A arquitetura e os modelos de dados de referência devem levar em conta como os dados de referência serão armazenados, mantidos e compartilhados. Por ser um recurso compartilhado, requer um alto grau de administração. Para obter o máximo valor de um sistema de dados de referência gerenciado centralmente, uma organização deve estabelecer políticas de governança que exijam o uso desse sistema e impedir que as pessoas mantenham suas próprias cópias dos conjuntos de dados de referência. Isso pode exigir um nível de atividade de gerenciamento de mudanças organizacionais, pois pode ser desafiador levar as pessoas a desistir de suas planilhas para o bem da organização. 3.5. Gerenciamento de dados mestre (Master Data Management - MDM) Como os Dados de referência, os Dados mestre são um recurso compartilhado. Dados mestre são dados sobre as entidades que fornecem contexto para transações e análises de negócios. Uma entidade é um objeto do mundo real (como uma pessoa, organização, local ou coisa). As entidades são representadas por instâncias de entidade, na forma de dados/registros. Os dados mestres devem representar os dados oficiais e mais precisos disponíveis sobre as principais entidades. Quando bem gerenciados, os valores dos Dados Mestres são confiáveis e podem ser usados com confiança. O MDM envolve controle sobre os valores e identificadores dos Dados mestre, que permitem o uso consistente, entre sistemas, dos dados mais precisos e oportunos sobre entidades comerciais essenciais. Os objetivos incluem garantir a disponibilidade de valores atuais precisos e reduzir o risco de identificadores ambíguos. Simplificando: quando as pessoas pensam em dados de alta qualidade, geralmente pensam em Dados Mestre bem gerenciados. Por exemplo, um registro de um cliente completo, preciso, atual e utilizável é considerado "bem gerenciado". A partir desse registro, eles devem ser capazes de reunir um entendimento histórico desse cliente. Se eles tiverem informações suficientes, poderão predizer ou influenciar as ações desse usuário. O MDM é um desafio. Isso ilustra um desafio fundamental com os dados: as pessoas escolhem maneiras diferentes de representar conceitos semelhantes e a reconciliação entre essas representações nem sempre é direta. É importante ressaltar que as informações são alteradas com o tempo e a contabilização sistemática dessas mudanças exige planejamento, conhecimento de dados e habilidades técnicas. Em resumo, é preciso trabalho, incluindo gerenciamento de dados e trabalho de governança, para gerenciar os Dados Mestre. Qualquer organização que tenha reconhecido a necessidade do MDM provavelmente já possui um cenário de sistema complexo, com várias maneiras de capturar e armazenar referências a entidades do mundo real. Como resultado do crescimento orgânico ao longo do tempo e de fusões e aquisições, os sistemas que forneceram informações para o processo MDM podem ter definições diferentes das próprias entidades e, muito provavelmente, padrões diferentes para a qualidade dos dados. Devido a essa complexidade, é melhor abordar o gerenciamento de dados mestre, um domínio de dados por vez. Comece pequeno, com alguns atributos, e desenvolva-se com o tempo. O planejamento para o MDM inclui várias etapas básicas dentro de um domínio, são elas:  Identificar fontes candidatas que fornecerão uma visão abrangente das entidades de dados mestre.  Desenvolver regras para corresponder e mesclar com precisão instâncias de entidade.
  • 77.
     Estabelecer umaabordagem para identificar e restaurar dados combinados e mesclados de maneira inadequada.  Definir uma abordagem para distribuir dados confiáveis para sistemas em toda a organização. A execução do processo, no entanto, não é tão simples quanto essas etapas fazem parecer. MDM é um processo de gerenciamento do ciclo de vida. Além disso, os dados mestre não devem ser gerenciados apenas dentro de um sistema MDM, mas também disponibilizados para uso por outros sistemas e processos. Isso requer tecnologia que permita compartilhamento e feedback. Também deve ser apoiada por políticas que exijam que os sistemas e processos de negócios usem os valores dos dados Principais e os impeçam de criar suas próprias "versões da verdade". Ainda assim, o MDM tem muitos benefícios. Os Dados Mestres bem gerenciados melhoram a eficiência organizacional e reduzem os riscos associados a diferenças na estrutura de dados entre sistemas e processos. 3.6. Gerenciamento de documentos, registros e conteúdo Documentos, registros e conteúdo (por exemplo, as informações armazenadas nos sites da Internet e da intranet) compreendem uma forma de dados com requisitos de gerenciamento distintos. O gerenciamento de documentos, registros e conteúdo envolve controlar a captura, armazenamento, acesso e uso de dados e informações armazenados fora dos bancos de dados relacionais. Como outros tipos de dados, espera-se que documentos, registros e conteúdo não estruturado sejam seguros e de alta qualidade. Garantir sua segurança e qualidade requer governança, arquitetura confiável e metadados bem gerenciados. O gerenciamento de documentos, registros e de conteúdo se concentra em manter a integridade e permitir o acesso a documentos e outras informações não estruturadas ou semiestruturadas; isso o torna aproximadamente equivalente ao gerenciamento de operações de dados para bancos de dados relacionais. No entanto, também possui direcionadores estratégicos. Os principais fatores de negócios para gerenciamento de documentos, registros e conteúdo incluem conformidade regulamentar, capacidade de responder a solicitações de litígio e descoberta eletrônica e requisitos de continuidade de negócios. Conheça a seguir a conceituação de cada um desses gerenciamentos: Gerenciamento de documentos Termo geral usado para descrever armazenamento, inventário e controle de documentos eletrônicos e em papel. Ele abrange as técnicas e tecnologias para controlar e organizar documentos ao longo de seu ciclo de vida. Gerenciamento de registros Forma especializada de gerenciamento de documentos que se concentra nos registros - documentos que fornecem evidências das atividades de uma organização. Essas atividades podem ser eventos, transações, contratos, correspondência, políticas, decisões, procedimentos, operações, arquivos de pessoal e demonstrações financeiras. Os registros podem ser documentos físicos, arquivos e mensagens eletrônicos ou conteúdo do banco de dados. Gerenciamento de conteúdo Refere-se aos processos, técnicas e tecnologias para organizar, categorizar e estruturar recursos de informações para que eles possam ser armazenados, publicados e reutilizados de várias maneiras. O conteúdo pode ser volátil ou estático (documentos e outros ativos digitais, como vídeos, fotografias, etc.). Pode ser gerenciado formalmente (estritamente armazenado, gerenciado, auditado, retido ou
  • 78.
    descartado) ou informalmentepor meio de atualizações ad hoc. O gerenciamento de conteúdo é particularmente importante em sites e portais, mas as técnicas de indexação com base em palavras- chave e organização com base em taxonomias podem ser aplicadas em plataformas tecnológicas. O gerenciamento bem-sucedido de documentos, registros e outras formas de conteúdo compartilhado requer:  Planejamento, incluindo a criação de políticas para diferentes tipos de acesso e manipulação.  Definição da arquitetura da informação e dos metadados necessários para suportar uma estratégia de conteúdo.  Permissão do gerenciamento de terminologia, incluindo ontologias e taxonomias, necessárias para organizar, armazenar e recuperar várias formas de conteúdo.  Adoção de tecnologias que permitem o gerenciamento do ciclo de vida do conteúdo, desde a criação ou captura de conteúdo até a versão e assegurando a segurança do conteúdo. Para os registros, as políticas de retenção e descarte são críticas. Os registros devem ser mantidos pelo período de tempo necessário e devem ser destruídos assim que os requisitos de retenção forem atendidos. Embora existam, os registros devem estar acessíveis às pessoas e processos apropriados e, como outros conteúdos, devem ser entregues por meio dos canais apropriados. Para atingir esses objetivos, as organizações exigem sistemas de gerenciamento de conteúdo (Content Management Systems - CMS), além de ferramentas para criar e gerenciar os metadados que suportam o uso do conteúdo. Eles também exigem que a governança supervisione as políticas e procedimentos que suportam o uso de conteúdo e evitam o uso indevido; essa governança permite que a organização responda ao litígio de maneira consistente e apropriada. 3.7. Armazenamento de Big Data O Big data e a ciência de dados estão conectados a mudanças tecnológicas significativas que permitiram às pessoas gerar, armazenar e analisar quantidades cada vez maiores de dados e usá-los para prever e influenciar comportamentos, além de obter informações sobre uma série assuntos como práticas de saúde, gestão de recursos naturais e desenvolvimento econômico. Os primeiros esforços para definir o significado de Big Data caracterizaram-no em termos dos Três V's: Volume, Velocidade, Variedade. À medida que mais organizações começaram a aproveitar o potencial do Big Data, a lista de V’s se expandiu. Hoje são seis os “v”, conforme especificado abaixo.  Volume: refere-se à quantidade de dados. O Big Data geralmente possui milhares de entidades ou elementos em bilhões de registros.  Velocidade: refere-se à velocidade na qual os dados são capturados, gerados ou compartilhados. O Big Data geralmente é gerado e também pode ser distribuído e até analisado em tempo real.  Variedade/variabilidade: refere-se às formas em que os dados são capturados ou entregues. O Big Data vem requer armazenamento de vários formatos. A estrutura de dados geralmente é inconsistente dentro ou entre conjuntos de dados.  Viscosidade: refere-se à dificuldade em usar ou integrar os dados.  Volatilidade: refere-se à frequência com que os dados são alterados e, portanto, quanto tempo os dados são úteis.  Veracidade: refere-se à confiabilidade dos dados. Tirar proveito do Big Data requer mudanças na tecnologia e nos processos de negócios e na maneira como os dados são gerenciados. A maioria dos data warehouses é baseada em modelos relacionais.
  • 79.
    O Big Datageralmente não é organizado em um modelo relacional. O data warehousing depende do conceito de ETL (loading and then transforming - extrair, transformar, carregar). As soluções de Big Data, como os lagos de dados, dependem do conceito de E L T - carregar e depois transformar (loading and then transforming). Isso significa que grande parte do trabalho inicial necessário para a integração não é feito para o Big Data, pois é para criar um data warehouse com base em um modelo de dados. Para algumas organizações e para alguns usos de dados, essa abordagem funciona, mas para outras, é necessário se concentrar na preparação de dados para uso. A velocidade e o volume dos dados apresentam desafios que exigem abordagens diferentes para aspectos críticos do gerenciamento de dados, não apenas a integração de dados, mas também o Gerenciamento de metadados, a avaliação da qualidade dos dados e o armazenamento de dados (por exemplo, no local, em um data center ou a nuvem). A promessa do Big Data - de que ele fornecerá um tipo diferente de insight - depende da capacidade de gerenciar o Big Data. De várias maneiras, devido à grande variação de fontes e formatos, o gerenciamento de Big Data requer mais disciplina do que o gerenciamento de dados relacionais. Cada um dos V's apresenta a oportunidade para o caos. Os princípios relacionados ao gerenciamento de Big Data ainda não foram totalmente formados, mas um é muito claro: as organizações devem gerenciar cuidadosamente os metadados relacionados às fontes de Big Data para ter um inventário preciso dos arquivos de dados, suas origens e seu valor. Algumas pessoas questionaram se há necessidade de gerenciar a qualidade do Big Data, mas a pergunta em si reflete uma falta de entendimento da definição de qualidade - adequação ao objetivo. A grandeza, por si só, não torna os dados adequados ao objetivo. O Big Data também representa novos riscos éticos e de segurança que precisam ser contabilizados pelas organizações de governança de dados. O Big Data pode ser usado para uma série de atividades, de mineração de dados a aprendizado de máquina e análise preditiva. Mas, para chegar lá, uma organização deve ter um ponto de partida e uma estratégia. A estratégia de Big Data de uma organização necessita estar alinhada e apoiar a estratégia geral de negócios da instituição. Sua atenção, para que isso ocorra, deve-se avaliar:  Quais são os problemas a organização está tentando resolver. Uma organização pode determinar que os dados devem ser usados para entender os negócios ou o ambiente de negócios; provar ideias sobre o valor de novos produtos; explorar uma hipótese; ou inventar uma nova maneira de fazer negócios. É importante estabelecer um processo de fechamento e verificação para avaliar o valor e a viabilidade das iniciativas.  Quais fontes de dados usar ou adquirir: As fontes internas podem ser fáceis de usar, mas também podem ter escopo limitado. Fontes externas podem ser úteis, mas estão fora do controle operacional (gerenciado por terceiros ou não controlado por ninguém, como no caso das mídias sociais). Muitos fornecedores estão competindo como intermediários de dados e geralmente existem várias fontes para os conjuntos de dados desejados. A aquisição de dados que se integra aos itens de ingestão existentes pode reduzir os custos gerais de investimento.  A pontualidade e o escopo dos dados a serem provisionados: Vários elementos podem ser fornecidos em feeds em tempo real, instantâneos em um determinado momento ou até integrados e resumidos. Dados de baixa latência são ideais, mas costumam custar recursos de aprendizado de máquina - há uma enorme diferença entre algoritmos computacionais direcionados para dados em repouso versus streaming. Não minimize o nível de integração necessário para o uso downstream.
  • 80.
     O impactoe a relação com outras estruturas de dados: Pode ser necessário fazer alterações na estrutura ou no conteúdo de outras estruturas de dados para torná-los adequados para integração com os conjuntos de Big Data.  Influências nos dados modelados existentes: Isso inclui a ampliação do conhecimento sobre clientes, produtos e abordagens de marketing. A estratégia orientará o escopo e o cronograma do roteiro de recursos de Big Data da organização. Muitas organizações estão integrando Big Data em seu ambiente geral de gerenciamento de dados. Os dados são transferidos dos sistemas de origem para uma área intermediária, onde podem ser limpos e enriquecidos. Em seguida, é integrado e armazenado no data warehouse (DW) e/ou em um armazenamento de dados operacional (Operational Data Store - ODS). A partir do DW, os usuários podem acessar dados por meio de marcadores ou cubos e utilizá-los para vários tipos de relatórios. O Big Data passa por um processo semelhante, mas com uma diferença significativa: enquanto a maioria dos armazéns integra dados antes de colocá-los em tabelas, as soluções de Big Data ingerem dados antes de integrá-los. O Big Data BI pode incluir análise preditiva e mineração de dados, além de formas mais tradicionais de geração de relatórios. 4. Usando e aprimorando dados Uma característica dos dados que os diferencia de outros ativos é que eles não são "consumidos" quando usados. Pessoas e processos diferentes utilizam dados ao mesmo tempo ou utilizam os mesmos dados várias vezes sem esgotá-los. Os dados não se esgotam como também o uso de dados cria mais dados. Por exemplo, agregações e cálculos de conjuntos de dados existentes criam novos conjuntos de dados, assim como modelos preditivos criados por cientistas de dados. Em muitos casos, esses novos conjuntos de dados continuaram sendo produzidos e atualizados. Eles exigem gerenciamento. Eles precisam ser definidos e suportados por meio de metadados. Expectativas relacionadas à sua qualidade também devem ser definidas. Seu acesso e uso devem ser regidos.
  • 81.
    Este tópico examinaráas atividades do ciclo de vida em que os dados são utilizados e aprimorados, incluindo:  Uso de dados mestre.  Business Intelligence.  Ciência de Dados.  Ferramenta Google Analytics.  Visualização de dados.  Monetização de dados. 4.1. Uso de dados mestre O uso de dados mestre fornece uma boa ilustração de como o uso de dados está diretamente conectado à melhoria de dados. Os dados mestre bem gerenciados permitem que uma organização tenha um bom entendimento das entidades (usuários, fornecedores, serviços etc.) com as quais interage e transaciona os negócios. No processo transacional de dados, uma organização aprende mais sobre essas entidades. O que se aprende pode ser armazenado no nível da transação, mas as organizações coletam dados necessários para manter seus dados mestre (por exemplo, alterações de endereço, atualizações nas informações de contato etc.). Os dados transacionais também permitem que eles obtenham dados adicionais (por exemplo: quais benefícios assistenciais determinado usuário tem acesso, etc.) que podem aprimorar seus dados mestre. Embora a interação dinâmica entre diferentes usos de dados deva ser considerada no planejamento do gerenciamento de dados, esse é o foco particular do gerenciamento de dados mestre. 4.2. Inteligência do Negócio O desenvolvimento de relatórios de Business Intelligence é outra atividade em que o uso de dados resulta na criação de novos dados que exigem um nível de gerenciamento contínuo. Vale ressaltar que o termo Business Intelligence (BI) apresenta dois significados: 1. Tipo de análise de dados que visa entender as atividades e oportunidades organizacionais. Quando as pessoas dizem que os dados possuem a chave da vantagem competitiva, estão articulando a promessa inerente à atividade de Business Intelligence: que se uma organização fizer as perguntas certas de seus próprios dados, poderá obter insights sobre seus usuários, produtos e serviços que permitem tomar as melhores decisões sobre como cumprir seus objetivos estratégicos. 2. Conjunto de tecnologias que suportam esse tipo de análise de dados. As ferramentas de BI permitem consultas, mineração de dados, análise estatística, geração de relatórios, modelagem de cenários, visualização de dados e painel de controle, desde orçamento, relatórios operacionais e métricas de desempenho de negócios até análises avançadas. O BI é o principal direcionador (driver) do armazenamento de dados, pois as atividades tradicionais de BI exigem fontes de dados confiáveis e integradas para uso. As ferramentas de BI devem suportar a exploração de dados, bem como os relatórios. O BI pode evoluir rapidamente à medida que os analistas utilizam os dados. Sua atenção, pois um programa de análise de dados utilizando BI deve se orientar por processos confiáveis, tais como:
  • 82.
     Manter eaprimorar os dados estratégicos utilizados nos relatórios de BI e permitir a incorporação de novos dados.  Manter e aprimorar o conjunto de ferramentas de BI.  Gerenciar metadados relacionados aos relatórios de BI, para que as partes interessadas entendam os próprios relatórios.  Documentar a linhagem de dados para as partes interessadas.  Fornecer um ciclo de feedback da qualidade dos dados para que permaneçam confiáveis e sejam identificadas oportunidades para aprimorá-los. Em resumo, o gerenciamento dos dados criados por um programa de BI segue as etapas de gerenciamento do ciclo de vida que fazem parte do gerenciamento de dados. 4.3. Ciência de dados A ciência de dados existe há muito tempo. Costumava ser chamado de estatística aplicada. Mas a capacidade de explorar padrões de dados evoluiu rapidamente no século XXI com o advento das tecnologias de coleta e armazenamento de Big Data. A ciência de dados mescla mineração de dados, análise estatística e aprendizado de máquina com recursos de integração e modelagem de dados para se criar modelos preditivos que exploram padrões de conteúdo de dados. O termo ciência de dados refere-se ao processo de desenvolvimento de modelos preditivos. O analista de dados (ou cientista de dados) usa o método científico (observação, hipótese, experimentação, análise e conclusão) para desenvolver e avaliar um modelo analítico ou preditivo. O cientista de dados desenvolve uma hipótese sobre o comportamento que pode ser observado nos dados antes de uma ação específica. Por exemplo, a compra de um tipo de item geralmente é seguida pela compra de outro tipo de item (a compra de uma casa geralmente é seguida pela compra de móveis). Em seguida, o cientista de dados analisa grandes quantidades de dados históricos para determinar com que frequência a hipótese foi verdadeira no passado e para verificar estatisticamente a precisão provável do modelo. Se uma hipótese é válida com frequência suficiente e se o comportamento previsto é útil, o modelo pode se tornar a base de um processo de inteligência operacional para prever o comportamento futuro, possivelmente até mesmo em tempo real. De certa forma, a ciência de dados pode ser entendida como uma extensão do BI. De outras formas, no entanto, leva a análise de dados e o uso a um nível muito diferente. O Business Intelligence tradicional fornece relatórios do 'espelho retrovisor' - análise de dados estruturados para descrever tendências passadas. Em alguns casos, os padrões de BI são utilizados para prever o comportamento futuro, mas com ausência de precisão confiável. 4.4. Análise preditiva e prescritiva Grande parte da ciência de dados está focada no desejo de criar modelos preditivos, embora nem todos que criam e utilizam esses modelos sejam cientistas de dados. A forma mais simples de modelo preditivo é a previsão. O Predictive Analytics é o subcampo do aprendizado de máquina supervisionado, enraizado nas estatísticas em que os usuários tentam modelar elementos de dados e prever resultados futuros por meio da avaliação de estimativas de probabilidade.
  • 83.
    O Predictive Analyticsutiliza modelos de probabilidade com base em variáveis (incluindo dados históricos) relacionadas a possíveis eventos. Quando recebe outras informações, o modelo desencadeia uma reação da organização. O fator desencadeante pode ser um evento como um feed de notícias ou dados de sensores de utilidade ou um aumento no volume de solicitações de serviço. O fator de disparo pode ser um evento externo. As notícias relatadas sobre uma organização podem servir como um preditor de uma mudança no preço das ações. A previsão do movimento das ações deve incluir o monitoramento de notícias e determinar se as notícias sobre uma organização provavelmente serão boas ou ruins para o preço das ações. Frequentemente, o fator desencadeante é o acúmulo de um grande volume de dados em tempo real como um número extremamente alto de negociações ou solicitações de serviço ou volatilidade do ambiente. O monitoramento de um fluxo de eventos de dados inclui a criação incremental dos modelos preenchidos até que seja atingido um limite que ativa o acionador. A quantidade de tempo que um modelo preditivo fornece entre a previsão e o evento previsto é frequentemente muito pequena (em segundos ou menos). O investimento em soluções de tecnologia de latência muito baixa como bancos de dados em memória, redes de alta velocidade e até proximidade física da fonte dos dados, otimiza a capacidade da organização de reagir à previsão. A análise prescritiva leva a análise preditiva um passo adiante para definir ações que afetarão os resultados, em vez de apenas prever os resultados das ações que ocorreram. A análise prescritiva antecipa o que acontecerá, quando acontecerá e implica por que isso acontecerá. Como a análise prescritiva pode mostrar as implicações de várias decisões, pode sugerir como aproveitar uma oportunidade ou evitar um risco. A análise prescritiva pode captar continuamente novos dados para re-prever e re-prescrever. Esse processo pode melhorar a precisão da previsão e resultar em melhores prescrições. A tabela a seguir resume a relação entre BI tradicional e ciência de dados. A tabela abaixo, revela a Progressão analítica. Data Werehouse / BI Tradicional Ciência de Dados / Análise Preditiva Ciência de Dados / Análise Prescritiva Retrospectiva Percepção Predição Baseado no histórico: O que aconteceu? Por que isso aconteceu? Com base em modelos preditivos: O que é provável que aconteça? Com base em cenários: O que devemos fazer para que as coisas aconteçam? Descritivo Preditivo Prescritivo Até recentemente, a análise aprofundada de enormes conjuntos de dados era limitada pela tecnologia. As análises basearam-se em amostragem ou outros meios de abstração para aproximar padrões. À medida que cresce a capacidade de coletar e analisar grandes conjuntos de dados, os cientistas de dados estão integrando métodos de matemática, estatística, ciência da computação, processamento de sinais, modelagem de probabilidade, reconhecimento de padrões, aprendizado de máquina, modelagem de incertezas e visualização de dados para obter insights e prever comportamentos com base em conjuntos de Big Data.
  • 84.
    Em suma, aciência de dados encontrou novas maneiras de analisar e extrair conhecimento dos dados. Em muitos casos, esse conhecimento pode ser traduzido em valor econômico. Como o Big Data foi introduzido nos ambientes de data warehouse e BI, as técnicas de ciência de dados podem fornecer uma visão prospectiva ('para-brisa') da organização. Recursos preditivos, em tempo real e baseados em modelo, usando diferentes tipos de fontes de dados, oferecem às organizações uma melhor visão para onde estão caminhando. Os modelos de ciência de dados se tornam fontes de dados. Eles precisam ser monitorados e explorados para obter informações. Como outras formas de ciência, a ciência de dados cria novos conhecimentos e também novas hipóteses. Testar hipóteses resulta em novos modelos e novos dados. Todas essas peças requerem gerenciamento para criar valor ao longo do tempo. Os modelos precisam ser 'treinados' e avaliados. Novas fontes de dados podem ser incorporadas aos modelos existentes. O ciclo de vida dos dados deve compor os esforços de ciência de dados que precisa ser contabilizado como parte do planejamento e da estratégia. Os modelos de ciência de dados que contêm lógica (algoritmos) para processar dados e fazer previsões a partir deles, não são a mesma coisa que os modelos de dados descritos no tópico “Habilitando e Mantendo Dados” que documentam a estrutura dos dados e os relacionamentos entre entidades e atributos de dados. 4.5. Visualização de dados Visualização é o processo de interpretação de conceitos, ideias e fatos usando figuras ou representações gráficas. A visualização de dados facilita a compreensão dos dados subjacentes, resumindo-os em uma forma visual, como um gráfico. As visualizações de dados condensam e encapsulam dados de características, facilitando sua visualização. Dessa forma podem revelar oportunidades, identificar riscos ou destacar novas análises. A visualização tem sido fundamental para a análise de dados. As ferramentas tradicionais de BI incluem opções de visualização, como tabelas, gráficos de diversos modelos, histogramas, dentre outras formas. Os princípios nesses exemplos simples são estendidos significativamente em aplicações de ciência de dados. A visualização de dados é fundamental para a ciência de dados porque, sem ela, a interpretação dos dados é quase impossível. Padrões em um grande conjunto de dados podem ser difíceis, se não impossíveis, de reconhecer em uma exibição de números. Um padrão pode ser capturado rapidamente, quando milhares de pontos de dados são apresentados em uma exibição visual. As visualizações de dados podem ser entregues em um formato estático, como um relatório publicado ou em um formato online mais interativo. Algumas tecnologias de visualização permitem que os analistas se movam entre as camadas de dados, por meio de filtros ou a capacidade de 'aprofundar' os dados. Outros permitem que a visualização seja alterada pelo usuário sob demanda por meio de displays inovadores, como mapas de dados e paisagens em movimento de dados ao longo do tempo. Para atender à crescente necessidade de entender dados, o número de ferramentas de visualização aumentou e as técnicas melhoraram. À medida que a análise de dados amadurece, a visualização apresenta novas maneiras de exibição oferecendo vantagens estratégicas. Ver novos padrões nos dados pode resultar em novas oportunidades de negócios. À medida que a visualização de dados continua a evoluir, as organizações terão que aumentar suas equipes de Business Intelligence para competir em um mundo cada vez mais orientado a dados. Os departamentos de análise de negócios buscarão especialistas em dados com habilidades de
  • 85.
    visualização (incluindo cientistasde dados, artistas de dados e especialistas em visão de dados), além de arquitetos e modeladores de informações tradicionais, especialmente devido aos riscos associados à visualização enganosa. Um fator crítico de sucesso na implementação de uma abordagem de ciência de dados é o alinhamento das ferramentas de visualização apropriadas à comunidade de usuários. Dependendo do tamanho e da natureza da organização, é provável que muitas ferramentas de visualização diferentes sejam aplicadas em uma variedade de processos. Certifique-se de que os usuários entendam a complexidade relativa das ferramentas de visualização. Usuários sofisticados terão demandas cada vez mais complexas. A coordenação entre as equipes de arquitetura corporativa, gerenciamento de portfólio e manutenção será necessária para controlar os canais de visualização dentro e por meio do portfólio. Esteja ciente de que a mudança de provedores de dados ou critérios de seleção provavelmente terá impactos a jusante nos elementos disponíveis para visualização que podem afetar a eficácia das ferramentas. É uma prática recomendada estabelecer uma comunidade que defina e publique padrões e diretrizes de visualização e revise artefatos dentro de um método de entrega especificado; isso é particularmente vital para o conteúdo voltado para clientes e regulamentações. Assim como outros usos dos dados, a visualização de dados cria novos conjuntos de dados, na forma das próprias visualizações e nos métodos pelos quais os dados são combinados para que possam ser apresentados em um formato gráfico. Você adivinhou!!! Esses dados também devem ser gerenciados. A visualização de dados é um campo em evolução, mas os princípios que o guiam se baseiam nos princípios de design. Ver Tufte (2001) e McCandless (2012). Existem vários recursos baseados na Web com exemplos e exemplos contrários. Consulte a Tabela Periódica de Métodos de Visualização em Visual Literacy.Org https://bit.ly/IX1bvI. 4.6. Monetização de dados É provável que qualquer organização envolvida na Data Science ou outras formas de análise obtenha informações valiosas sobre seus próprios clientes, produtos, serviços e processos. A análise avançada também pode gerar informações sobre entidades externas. É possível que essa organização desenvolva técnicas que possam ser valiosas para outras pessoas. Se essas ideias e técnicas puderem ser empacotadas e vendidas, uma organização estaria aproveitando seus dados não apenas como um ativo, mas como um produto. Em alguns círculos, a monetização direta de dados é percebida como o santo graal do gerenciamento de dados. Algumas organizações (Dun & Bradstreet, Google, Amazon) fizeram um negócio de monetizar seus dados. Mas vender dados e informações não é a única maneira de obter valor dos ativos de dados. Em Monetizing Data Management, Peter Aiken e Juanita Billings apontam que poucas organizações exploram a vantagem estratégica que podem obter com os dados, “o único ativo estratégico não esgotável, não degradante, durável e duradouro da organização”. Eles argumentam que melhorar as práticas de gerenciamento de dados é o primeiro meio de obter mais valor dos dados. Uma organização que coloca um valor monetário em práticas eficazes de gerenciamento de dados produzirá dados de maior qualidade e poderá fazer mais com eles. Aiken e Billings afirmam que boas práticas de gerenciamento de dados também são a base para a inovação bem-sucedida do uso de dados. As práticas precárias de gerenciamento de dados, por outro lado, custam dinheiro e introduzem riscos em novas iniciativas e processos existentes. Esses autores apresentam estudos de caso que documentam que más práticas de gerenciamento de dados podem resultar em desperdício direto por meio de trabalho redundante e, com ele, a criação de dados redundantes, metadados ruins ou ausentes, processos confusos e informações incorretas.
  • 86.
    Eles também fornecemexemplos dos benefícios de práticas disciplinadas de gerenciamento de dados. Por exemplo, práticas claras e executáveis de gerenciamento de metadados aumentam o conhecimento organizacional e tornam esse conhecimento transferível. Infonomics, de Douglas Laney, um estudo completo sobre gerenciamento de informações como um ativo, apresenta uma ampla variedade de estudos de caso que demonstram como as organizações aproveitaram seus ativos de informações para criar valor. Enquanto as indústrias, atividades e produtos diferem, o valor econômico derivado dos dados se resume a dois métodos básicos:  Troca de informações por bens, serviços ou dinheiro.  Usando informações para aumentar a receita, reduzir despesas e gerenciar riscos. Laney apresenta 12 (doze) drivers (direcionadores) de negócio para monetizar dados. Uma das primeiras maneiras de obter valor é usar os dados organizacionais com mais eficiência para reter clientes existentes, entrar em novos mercados e criar novos produtos. Mas Laney vai além do óbvio. Por exemplo, dados melhores podem melhorar a eficiência organizacional, permitindo que uma organização reduza os custos de manutenção, negocie melhores termos e condições, detecte fraudes e desperdícios ou pague os custos de gerenciamento de dados. Para alguns, como mostram os estudos de caso de Aiken e Billings e Laney e outras pesquisas confirmam, dados de baixa qualidade são um passivo significativo. Outros, no entanto, conseguiram avançar, com melhorias operacionais e monetização direta. Os estudos de caso mostram que o uso inovador de dados requer gerenciamento confiável de dados. Embora nem toda organização almeje vender seus dados, todas as organizações vislumbram ter confiança nas decisões com base em seus dados. O primeiro passo nessa direção é gerenciar bem os dados. Lição módulo 4 1. Gerenciamento de metadados Como princípio, os metadados são essenciais para o gerenciamento de dados. Em outras palavras, você precisa de dados para gerenciar dados. Os metadados descrevem quais dados você possui e, se não souber isso, não poderá gerenciá-los. O gerenciamento de metadados é uma atividade fundamental que precisa ser realizada durante todo o ciclo de vida dos dados. O ciclo de vida dos metadados também precisa ser gerenciado. A definição mais comum de metadados – "dados sobre dados" – é aparentemente simples. Para alguns, infelizmente, é uma fonte de confusão e não de esclarecimento, porque muitos tipos de informações podem ser classificados como metadados e não existe uma linha clara entre "dados" e "metadados". Em vez de tentar traçar essa linha, descreveremos como os metadados são usados e por que são tão importantes. Para entender o papel vital dos metadados no gerenciamento de dados, imagine uma grande biblioteca, com centenas de milhares de livros e revistas, mas sem catálogo. Sem um catálogo, os leitores podem nem saber como começar a procurar um livro específico ou mesmo um tópico específico. O catálogo não apenas fornece as informações necessárias (quais livros e materiais a biblioteca possui e onde estão guardadas), mas também permite que os clientes encontrem materiais usando diferentes pontos de partida (área de assunto, autor ou título). Sem o catálogo, encontrar um livro específico seria difícil, se não impossível. Uma organização sem metadados é como uma biblioteca sem um catálogo.
  • 87.
    Como outros dados,os metadados requerem gerenciamento. À medida que a capacidade das organizações de coletar e armazenar dados aumenta, o papel dos metadados no gerenciamento de dados cresce em importância. O gerenciamento de metadados, no entanto, não é um fim em si; é um meio pelo qual uma organização pode obter mais valor com seus dados. Para ser guiada por dados, uma organização deve ser guiada por metadados. 1.1 Metadados e seus benefícios No gerenciamento de dados, os metadados incluem informações sobre processos técnicos e de negócio, regras e restrições de dados e estruturas de dados lógicas e físicas. Ele descreve os próprios dados (por exemplo, bancos de dados, elementos de dados, modelos de dados), os conceitos que os dados representam (por exemplo, processos de negócios, sistemas de aplicativos, código de software, infraestrutura de tecnologia) e as conexões (relacionamentos) entre os dados e os conceitos. Os metadados auxiliam uma organização a entender seus dados, sistemas e fluxos de trabalho. Ele permite a avaliação da qualidade dos dados e faz parte do gerenciamento de bancos de dados e outros aplicativos. Contribui para a capacidade de processar, manter, integrar, proteger, auditar e governar outros dados. Os dados não podem ser gerenciados sem os metadados. Além disso, os próprios metadados devem ser gerenciados. Atenção, metadados confiáveis e bem gerenciados ajudam a:  Aumentar a confiança nos dados, fornecendo contexto, permitindo a representação consistente dos mesmos conceitos e a medição da qualidade dos dados.  Ampliar o valor das informações estratégicas (por exemplo, dados mestre), possibilitando vários usos.  Identificar dados e processos redundantes e assim melhorar a eficiência operacional.  Impedir o uso de dados desatualizados ou incorretos.  Proteger informações confidenciais.  Reduzir o tempo de pesquisa orientada a dados.  Aperfeiçoar a comunicação entre consumidores de dados e profissionais de TI.  Criar análise de impacto precisa, reduzindo assim o risco de falha do projeto.  Melhorar o tempo de implementação, reduzindo o tempo do ciclo de vida do desenvolvimento do sistema.  Reduzir os custos de treinamento e diminuir o impacto da rotatividade de pessoal por meio de documentação completa do contexto, histórico e origem dos dados.  Dar suporte à conformidade regulamentar. As organizações obtêm mais valor de seus ativos de dados se os dados forem de alta qualidade. Os dados de qualidade dependem da governança. Como explicam os dados e processos que permitem que as organizações funcionem, os metadados são críticos para a governança de dados. Se os metadados são um guia para os dados em uma organização, eles devem ser bem gerenciados. Convém atenção também ao fato que Metadados mal gerenciados levam a:  Dados redundantes e processos de gerenciamento de dados.  Dicionários, repositórios e outros armazenamentos de metadados replicados e redundantes.  Definições inconsistentes de elementos de dados e riscos associados ao uso indevido de dados.  Origens e versões concorrentes e conflitantes dos metadados que reduzem a confiança dos consumidores de dados.  Dúvida sobre a confiabilidade de metadados e dados.
  • 88.
    O gerenciamento bemexecutado de metadados permite um entendimento consistente dos recursos de dados e um desenvolvimento Interorganizacional mais eficiente. 1.2 Tipos de metadados Os metadados são geralmente classificados em três tipos: estratégico, técnico ou operacional. Os metadados de negócio se concentram amplamente no conteúdo e na condição dos dados e também incluem detalhes relacionados à governança de dados. Os metadados incluem nomes e definições não técnicos de conceitos, áreas de assunto, entidades e atributos; tipos de dados de atributo e outras propriedades de atributo; descrições de faixa; cálculos; algoritmos e regras de negócios; valores de domínio válidos e suas definições. Seguem exemplos de metadados de negócios:  Modelos de dados, definições e descrições de conjuntos de dados, tabelas e colunas.  Regras de negócios, regras de qualidade de dados e regras de transformação, cálculos e derivações.  Origem e linhagem dos dados.  Padrões e restrições de dados.  Nível de segurança / privacidade dos dados.  Problemas conhecidos com dados.  Notas de uso de dados. Os metadados técnicos fornecem informações sobre os detalhes técnicos dos dados, os sistemas que armazenam dados e os processos que os movem dentro e entre sistemas. São exemplos de metadados técnicos:  Nomes e propriedades da tabela e da coluna do banco de dados físico.  Direitos de acesso a dados, grupos, funções.  Regras de CRUD de dados (Criar, Substituir, Atualizar e Excluir).  Detalhes do trabalho ETL de dados (Extração, Transformação e Carregamento).  Documentação da linhagem de dados, incluindo informações de impacto de alterações a montante e a jusante.  Agendas e dependências do ciclo de atualização de conteúdo. Atenção, metadados operacionais descrevem detalhes do processamento e acesso aos dados, como:  Logs de execução de tarefas para programas em lote.  Resultados de auditoria, balanceamento, medidas de controle e registros de erros.  Relatórios e padrões de acesso à consulta, frequência e tempo de execução.  Patches e plano e execução de manutenção de versão, nível de patch atual.  Provisões de backup, retenção, data de criação, recuperação de desastres. Essas categorias auxiliam as pessoas a entender o conjunto de informações que se enquadram nos metadados, bem como as funções que produzem metadados. No entanto, as categorias também podem levar a confusão. As pessoas podem ser envolvidas em perguntas sobre a qual categoria um conjunto de metadados pertence ou quem deve usá-lo. É melhor pensar nessas categorias em relação à origem dos metadados, e não como eles são usados. Em relação ao uso, as distinções entre os tipos de metadados não são rigorosas. Determinada equipe pode utilizar metadados técnicos e/ou operacionais, conforme o tipo de demanda a ser atendida.
  • 89.
    1.3 Metadados sãodados Embora os metadados possam ser entendidos por meio de seus usos e categorias, é importante destacar que os metadados são dados. Como outros dados, ele tem um ciclo de vida. Devemos gerenciá-lo em relação ao seu ciclo de vida. Uma organização deve planejar os metadados de que precisa, projetar processos para que os metadados de alta qualidade possam ser criados e mantidos e aumentar seus metadados à medida que aprende com seus dados. 1.4 Metadados e gerenciamento de dados Os metadados são essenciais para o gerenciamento de dados e o uso de dados. Todas as grandes organizações produzem e utilizam muitos dados. Em uma organização, indivíduos diferentes terão níveis diferentes de conhecimento de dados, mas nenhum indivíduo saberá tudo sobre os dados. Essas informações devem ser documentadas ou a organização corre o risco de perder um conhecimento valioso sobre si mesma. Os metadados fornecem o principal meio de capturar e gerenciar o conhecimento organizacional sobre dados. O gerenciamento de metadados, entretanto, não é apenas um desafio de gerenciamento de conhecimento, é também uma necessidade de gerenciamento de riscos. Os metadados são necessários para garantir que uma organização possa identificar dados particulares ou confidenciais e que possa gerenciar o ciclo de vida dos dados para seu próprio benefício e para atender aos requisitos de conformidade e minimizar a exposição ao risco. Sem metadados confiáveis, uma organização não sabe quais dados possui, o que representa, onde se origina, como transita pelos sistemas, quem tem acesso a eles ou o que significa, quais dados são de alta qualidade. Sem os metadados, uma organização não pode gerenciar seus dados como um ativo. De fato, sem os metadados, uma organização pode não ser capaz de gerenciar seus dados. Na imagem a seguir, conheça o ciclo de vida dos metadados: Planejar – definir requisitos de metadados Projetar e habilitar – identificar oportunidades para criar e gerenciar metadados como parte de gerenciamento de dados em andamento.
  • 90.
    Criar e obter– verificar como os metadados são criados e quais os requisitos de qualidade. Armazenar e manter – verificar se os metadados permanecem e continuam a atender aos requisitos. Utilizar – utilizar os metadados para obter valor dos dados. Habilitar um loop de feedback para melhorar a qualidade dos metadados. Aprimorar – evolua os metadados com os novos conhecimentos. Implemente novos requisitos de metadados. Descartar – limpar ou excluir os metadados obsoletos. 1.5 Metadados e interoperabilidade À medida que a tecnologia evoluiu, a velocidade na qual os dados são gerados também aumentou. Os metadados técnicos tornaram-se absolutamente essenciais para a maneira como os dados são movidos e integrados. O Padrão de Registro de Metadados da ISO, ISO/IEC 11179, visa permitir a troca de dados orientada por metadados em um ambiente heterogêneo, com base em definições exatas de dados. Os metadados presentes no XML e em outros formatos permitem o uso dos dados. Outros tipos de marcação de metadados permitem que os dados sejam trocados, mantendo os significantes de propriedade, requisitos de segurança, etc. Saiba Mais sobre o Padrão de Registro de Metadados da ISO/IEC 11179: Padrão de Registro de Metadados ISO/IEC 11179 O Padrão de Registro de Metadados da ISO, ISO/IEC 11179 fornece uma estrutura para definir um registro de Metadados. Este padrão foi projetado para permitir a troca de dados orientada por metadados, com base em definições exatas de dados, começando com elementos de dados. O padrão está estruturado em seis partes: Parte 1: Estrutura para geração e padronização de elementos de dados. Parte 2: Fornece um modelo conceitual para gerenciar esquemas de classificação. Parte 3: Atributos básicos dos elementos de dados. Parte 4: Regras e diretrizes para a formulação de definições de dados. Parte 5: Princípios de nomeação e identificação para elementos de dados. Parte 6: Registro de elementos de dados. Mais informações: http://metadata-standards.org/11179/.
  • 91.
    1.6 Estratégia demetadados Conforme você já percebeu, os tipos de informações que podem ser usados como metadados são amplos. Os metadados são criados em vários setores da organização. Os desafios vêm com a união de metadados para que pessoas e processos possam utilizá-los. Uma estratégia de metadados descreve como uma organização pretende gerenciá-los e como ela passará do estado atual para as práticas avançadas e inovadoras (estado futuro). Uma estratégia de metadados deve fornecer uma estrutura para as equipes de desenvolvimento melhorarem o gerenciamento de metadados. O desenvolvimento de requisitos de metadados ajudará a esclarecer os direcionadores da estratégia e a identificar possíveis obstáculos à sua implementação. A estratégia inclui definir o conteúdo e a arquitetura de metadados da situação atual e a ser alcançada pela organização, bem como as fases de implementação necessárias para atender aos objetivos estratégicos. Os passos para a estratégia de metadados incluem: Iniciar o planejamento da estratégia de metadados O objetivo do início e do planejamento é permitir que a equipe de estratégia de metadados defina suas metas de curto e longo prazo. O planejamento inclui a elaboração de uma carta, escopo e objetivos alinhados aos esforços gerais de governança e o estabelecimento de um plano de comunicação para apoiar o esforço. As principais partes interessadas devem estar envolvidas no planejamento. Realizar entrevistas com as principais partes interessadas As entrevistas com as partes interessadas técnicas e de negócios fornecem uma base de conhecimento para a estratégia de Metadados. Avaliar fontes de metadados existentes e arquitetura da informação A avaliação determina o grau relativo de dificuldade na solução dos problemas de metadados e sistemas identificados nas entrevistas e na revisão da documentação. Durante esse estágio, realize entrevistas detalhadas da equipe principal de TI e revise a documentação das arquiteturas do sistema, modelos de dados, etc. Desenvolver a arquitetura futura de metadados Refine e confirme a visão futura e desenvolva a arquitetura de destino de longo prazo para o ambiente de metadados gerenciados neste estágio. Essa fase deve levar em consideração componentes estratégicos, como estrutura organizacional, alinhamento com administração e administração de dados, arquitetura de metadados gerenciados, arquitetura de entrega de metadados, arquitetura técnica e arquitetura de segurança. Desenvolver plano de implementação em fases Valide, integre e priorize os resultados das entrevistas e análises de dados. Documente a estratégia de metadados e defina uma abordagem de implementação em fases para passar do ambiente de metadados gerenciado existente para o futuro. A estratégia evoluirá com o tempo, à medida que os requisitos de metadados, a arquitetura e o ciclo de vida dos metadados forem mais bem compreendidos.
  • 92.
    1.7 Entender osrequisitos de metadados Os requisitos de metadados começam com o conteúdo: quais metadados são necessários e em que nível. Por exemplo, nomes físicos e lógicos precisam ser capturados para colunas e tabelas. O conteúdo de metadados é amplo e os requisitos virão dos consumidores de dados estratégicos a técnicos. Existem ainda diversos requisitos focados na funcionalidade associados a uma solução abrangente de metadados. São eles:  Frequência com a qual os atributos e conjuntos de metadados serão atualizados.  Tempo das atualizações em relação às alterações de origem.  Se as versões históricas dos metadados precisam ser mantidas.  Quem pode acessar os metadados.  Como os usuários acessam (funcionalidade específica da interface do usuário para acessar).  Como os metadados serão modelados para armazenamento.  O grau de integração de metadados de diferentes fontes; regras para integração.  Processos e regras para atualização de metadados (registro e referência para aprovação).  Funções e responsabilidades para gerenciar metadados.  Requisitos de qualidade de metadados.  Segurança para metadados - alguns metadados não podem ser expostos porque revelam a existência de dados altamente protegidos). 1.8 Arquitetura de Metadados Como outras formas de dados, os metadados têm um ciclo de vida. Embora existam maneiras diferentes de arquitetar uma solução de metadados, conceitualmente todas as soluções de gerenciamento de metadados incluem camadas de arquiteturas que correspondem a pontos no ciclo de vida dos metadados. São elas:  Criação e fornecimento de metadados.  Armazenamento de metadados em um ou mais repositórios.  Integração de metadados.  Entrega de metadados.  Acesso e uso de metadados.  Controle e gerenciamento de metadados. Um sistema de gerenciamento de metadados deve ser capaz de reunir metadados de várias fontes diferentes. Os sistemas diferem dependendo do grau de integração e do papel do sistema de integração na manutenção dos metadados. Um ambiente de metadados gerenciados deve isolar o usuário final das várias e diferentes fontes de metadados. A arquitetura deve fornecer um único ponto de acesso para os metadados necessários. O design da arquitetura depende dos requisitos específicos da organização. Conheça a seguir, as três abordagens arquiteturais técnicas para a construção de um repositório comum de metadados refletem as abordagens para projetar data warehouses:
  • 93.
     Centralizada Uma arquiteturacentralizada consiste em um único repositório de metadados que contém cópias dos metadados das várias fontes. As organizações com recursos limitados de TI, ou aquelas que procuram automatizar o máximo possível, podem optar por evitar essa opção de arquitetura. As organizações que buscam um alto grau de consistência no repositório comum de metadados podem se beneficiar de uma arquitetura centralizada.  Distribuída Uma arquitetura completamente distribuída mantém um único ponto de acesso. O mecanismo de recuperação de metadados responde às solicitações do usuário, recuperando dados dos sistemas de origem em tempo real; não há repositório persistente. Nessa arquitetura, o ambiente de gerenciamento de metadados mantém os catálogos do sistema de origem e as informações de pesquisa necessárias para processar efetivamente as consultas e pesquisas do usuário. Um broker de solicitação de objeto comum ou protocolo de middleware semelhante acessa esses sistemas de origem.  Híbrida Uma arquitetura híbrida combina características de arquiteturas centralizadas e distribuídas. Os metadados ainda transitam diretamente dos sistemas de origem para um repositório centralizado. No entanto, o design do repositório considera apenas os metadados adicionados pelo usuário, os itens padronizados críticos e as adições de fontes manuais. Implementar um ambiente de metadados gerenciados de forma incremental visa minimizar riscos e facilitar a aceitação. O conteúdo do repositório deve ser genérico no design. Não deve meramente refletir os projetos de banco de dados do sistema de origem. Os especialistas da área empresarial devem ajudar a criar um modelo abrangente de metadados para o conteúdo. O planejamento deve considerar a integração de metadados para que os consumidores de dados possam ver em diferentes fontes de dados. A capacidade de fazer isso será um dos principais recursos estratégicos do repositório. Ele deve abrigar versões atuais, planejadas e históricas dos metadados. Frequentemente, a primeira implementação é um piloto para provar conceitos e aprender sobre o gerenciamento do ambiente de metadados. 1.9 Qualidade de metadados Ao gerenciar a qualidade dos metadados é importante reconhecer que diversos metadados se originam por meio dos processos existentes. Por exemplo, o processo de modelagem de dados produz definições de tabela e coluna e outros metadados essenciais para a criação de modelos de dados. Para obter metadados de alta qualidade, os metadados devem ser vistos como um produto desses processos e não como um subproduto deles. Novamente, os metadados seguem o ciclo de vida dos dados. Os metadados confiáveis começam com um plano e aumentam o valor à medida que são usados, mantidos e aprimorados. As fontes de metadados, como o modelo de dados, a documentação de mapeamento de origem para o destino, os logs de ETL e similares devem ser tratadas como fontes de dados. Eles devem implementar processos e controles para garantir que produzam um produto de dados confiável e utilizável. Todos os processos, sistemas e dados precisam de algum nível de meta-informação; isto é, uma descrição de suas partes componentes e como elas funcionam. Além disso, à medida que o processo,
  • 94.
    sistema ou dadossão usados, as meta-informações crescem e mudam. Com isso, o sistema precisa ser mantido e aprimorado. O uso de metadados geralmente resulta no reconhecimento de requisitos para metadados adicionais. Por exemplo, os consumidores que utilizam dados de usuários de dois sistemas diferentes podem precisar saber de onde os dados foram originados para entender melhor o perfil dos usuários. Alguns princípios gerais do gerenciamento de metadados descrevem os meios para gerenciar sua qualidade, são eles:  Responsabilidade: Reconhecer que os metadados geralmente são produzidos por meio de processos existentes (modelagem de dados, SDLC (systems development life cycle), definição de processos de negócios) e responsabilizar os proprietários dos processos pela qualidade dos metadados (tanto na criação inicial quanto na manutenção).  Padrões: Definir, impor e auditar os padrões dos metadados para simplificar a integração e permitir o uso.  Melhorar: Criar um mecanismo de feedback para que os consumidores possam informar a equipe de Gerenciamento de Metadados de que estão incorretos ou desatualizados. Como outros dados, os metadados podem ser perfilados e inspecionados quanto à qualidade. Sua manutenção deve ser agendada ou concluída como uma parte auditável do trabalho do projeto. 1.10 Governança de Metadados Mudar de um ambiente de metadados não gerenciado para um gerenciado exige trabalho e disciplina. Não é fácil, mesmo que a maioria das pessoas reconheça o valor de metadados confiáveis. A prontidão organizacional é uma grande preocupação, assim como os métodos de governança e controle. Uma abordagem abrangente de metadados exige que a equipe de negócios e a de tecnologia possam trabalhar em conjunto de maneira multifuncional. O gerenciamento de metadados é de baixa prioridade em muitas organizações. Um conjunto essencial de metadados precisa de coordenação e compromisso. Do ponto de vista do gerenciamento de dados, os metadados essenciais dos negócios incluem definições, modelos e arquitetura de dados. Os metadados técnicos essenciais incluem descrições técnicas de arquivos e conjuntos de dados, nomes de tarefas, agendas de processamento etc. As organizações devem determinar seus requisitos específicos para o gerenciamento do ciclo de vida de metadados críticos e estabelecer processos de governança para permitir esses requisitos. Recomenda-se atribuir funções e responsabilidades formais a recursos dedicados, especialmente em áreas grandes ou críticas aos negócios. A governança de metadados requer metadados e controles, para que a equipe encarregada de gerenciar os metadados possa testar os princípios nos metadados criados e utilizados. 2. Gerenciamento de qualidade de dados O gerenciamento eficaz de dados envolve um conjunto de processos inter-relacionados que permitem a organização utilizar seus dados para atingir objetivos estratégicos. O gerenciamento de dados inclui a capacidade de projetar dados para desenvolver aplicações, armazená-los e acessá-los com segurança, compartilhá-los adequadamente e aprender com eles para atender aos objetivos estratégicos e operacionais.
  • 95.
    Atenção, as organizaçõesque almejam obter valor com seus dados precisam saber se eles são confiáveis. Em outras palavras, se os dados são de alta qualidade. Entretanto, vários fatores podem prejudicar a qualidade dos dados, tais como:  Falta de entendimento sobre os efeitos de dados de baixa qualidade no sucesso organizacional.  Planejamento ruim ou insuficiente.  Projeto isolado de processos e sistemas (silos).  Processos de desenvolvimento técnico inconsistentes.  Documentação incompleta e metadados.  Falta de padrões e governança. Uma parcela das organizações não prioriza definir o que torna os dados adequados ao objetivo estratégico e, consequentemente, não têm compromisso com a qualidade dos dados. Todas as disciplinas de gerenciamento de dados contribuem para a qualidade dos dados. Como as decisões ou ações desinformadas de qualquer pessoa que interaja com dados podem resultar em dados de baixa qualidade, a produção de dados de alta qualidade requer comprometimento e coordenação multifuncionais. As organizações e as equipes devem estar cientes disso e planejar dados de alta qualidade, executando processos e projetos de maneira a responder pelos riscos relacionados a condições inesperadas ou inaceitáveis nos dados. Como nenhuma organização possui processos técnicos perfeitos ou práticas perfeitas de gerenciamento de dados, todas as organizações enfrentam problemas relacionados à qualidade de seus dados. Esses problemas podem gerar prejuízos elevados. As organizações que gerenciam formalmente a qualidade dos dados têm menos problemas em relação aquelas que não priorizam a qualidade dos dados. A qualidade dos dados está se tornando uma necessidade estratégica. A capacidade de demonstrar que os dados são de alta qualidade, como a capacidade de demonstrar que os dados foram protegidos adequadamente, é exigida por alguns regulamentos. Os parceiros de negócios e os usuários (consumidores de dados) esperam que os dados sejam confiáveis. Uma organização que pode mostrar que gerencia bem seus dados obtém uma vantagem competitiva. O objetivo deste tópico é definir os principais conceitos relacionados à qualidade dos dados e discutir o gerenciamento da qualidade em relação a governança de dados. 2.1 Qualidade dos dados O termo qualidade dos dados é usado para se referir às características associada aos dados de alta qualidade e aos processos utilizados para medir ou melhorar essa qualidade. Nesse sentido, começaremos a observar o significado de dados de alta qualidade e, logo após, será examinada a definição de gerenciamento da qualidade dos dados. Os dados são de alta qualidade, na medida em que atendem às expectativas e necessidades dos consumidores de dados. Quando este proposito não for atendido ou parcialmente atendido, podemos avaliar como dados de baixa qualidade. A qualidade dos dados depende, portanto, do contexto e das necessidades dos consumidores de dados. Um dos desafios no gerenciamento da qualidade dos dados é que as expectativas relacionadas à qualidade nem sempre são conhecidas ou mensuradas. Os profissionais que gerenciam dados nem sempre fazem levantamento sobre esses requisitos e, tampouco, inexiste uma avaliação consolidada de informações dos consumidores finais sobre a confiabilidade dos dados.
  • 96.
    O processo deavaliação da qualidade e das expectativas das partes interessadas precisa ser contínuo, visto que os requisitos sofrem mudanças com o tempo, à medida que as necessidades dos negócios e a influência das forças externas evoluem. 2.2 Dimensões da qualidade dos dados Uma dimensão da qualidade de dados é um recurso ou característica mensurável dos dados. O termo dimensão é usado para fazer a conexão com as dimensões na medição de objetos físicos (por exemplo, comprimento, largura, altura). As dimensões da qualidade dos dados fornecem um vocabulário para definir os requisitos de qualidade dos dados. A partir daí, eles podem ser utilizados para definir os resultados da avaliação inicial da qualidade dos dados, bem como das medições em andamento. Para medir a qualidade dos dados, uma organização precisa estabelecer características que não são apenas importantes para os processos de negócios, mas também mensuráveis e factíveis. As dimensões fornecem uma base para regras mensuráveis, as quais devem estar diretamente vinculadas aos riscos potenciais em processos críticos. Atenção ao exemplo a seguir:  Risco: Se os dados no campo de endereço de e-mail do usuário estiverem incompletos, haverá prejuízo no processo de comunicação.  Um meio de mitigar o risco: Deve ser medida a porcentagem de usuários para os quais se tem endereços de e-mail utilizáveis para aprimorar os processos até se obter um endereço de e-mail utilizável para pelo menos 98% de usuários. Diversos pensadores importantes escreveram sobre as dimensões da qualidade dos dados. Embora não haja um único conjunto de dimensões de qualidade de dados acordadas, todos os conjuntos contêm ideias comuns. As dimensões incluem algumas características que podem ser medidas objetivamente (integridade, validade, conformidade do formato) e outras que dependem muito do contexto ou da interpretação subjetiva (usabilidade, confiabilidade, reputação). Quaisquer que sejam os nomes usados, as dimensões focam se há dados suficientes (integridade), se estão corretos (precisão, validade), quão bem eles se encaixam (consistência, integridade, exclusividade), se estão atualizados (pontualidade), acessível, utilizável e seguro. Em 2013, o DAMA (The Data Management Association) do Reino Unido produziu um documento técnico propondo seis dimensões principais da qualidade dos dados. O conjunto inclui:  Completude: a proporção de dados armazenados contra o potencial de 100%.  Exclusividade: nenhuma instância de entidade será registrada mais de uma vez após identificada.  Oportunidade: o grau em que os dados representam a realidade a partir do momento requerido.  Validade: os dados são válidos se estiverem em conformidade com a sintaxe (formato, tipo, intervalo) de sua definição.  Precisão: o grau em que os dados descrevem corretamente o objeto ou evento do 'mundo real' sendo descrito.  Consistência: A ausência de diferença ao comparar duas ou mais representações de uma instancia com uma definição. Além dessas dimensões, o documento oficial da DAMA UK descreve outras características que têm impacto na qualidade.
  • 97.
     Usabilidade: osdados são compreensíveis, relevantes, acessíveis, mantidos e no nível certo de precisão?  Problemas de tempo (além da própria tempestividade): é estável, mas responde a solicitações de mudança legítimas?  Flexibilidade: os dados são comparáveis e compatíveis com outros dados? Possui agrupamentos e classificações úteis? Pode ser reaproveitado? É fácil de manipular?  Confiança: a governança, a proteção e a segurança dos dados estão vigentes? Qual é a credibilidade dos dados? É verificável?  Valor: existe um levantamento de custo/benefício para os dados? É ou serão utilizados da melhor maneira possível? Põe em risco a segurança ou a privacidade das pessoas ou as responsabilidades legais da organização? Apoia ou contradiz a imagem corporativa ou a visão estratégica corporativa? Qualquer organização que almeja melhorar a qualidade de seus dados deve adotar ou desenvolver um conjunto de dimensões por meio das quais possa mensurar a qualidade e alcançar um consenso sobre as dimensões que podem fornecer um ponto de partida para a construção de um vocabulário comum sobre o tema. 2.3 Gerenciamento da qualidade dos dados Conforme observado anteriormente, às vezes o termo qualidade dos dados é usado para se referir aos processos usados para medir ou melhorar a qualidade dos dados. Esses processos constituem o gerenciamento da qualidade dos dados. Embora todas as funções de gerenciamento de dados tenham potencial para afetar a qualidade. Atenção, o gerenciamento formal da qualidade dos dados concentra-se em ajudar a organização a:  Definir dados de alta qualidade: por meio de padrões, regras e requisitos de qualidade de dados.  Avaliar os dados: em relação a esses padrões e comunicar resultados às partes interessadas.  Monitorar e relatar: a qualidade dos dados em aplicações e armazenamentos de dados.  Identificar problemas: e avaliar e defender oportunidades de melhoria. O gerenciamento formal da qualidade dos dados é semelhante ao gerenciamento contínuo da qualidade de outros serviços. Ele inclui o gerenciamento de dados durante o seu ciclo de vida, definindo padrões, incorporando qualidade aos processos que criam, transformam e armazenam dados e medindo dados em relação aos padrões. Gerenciar dados para esse nível geralmente requer uma equipe de programa de qualidade de dados. A equipe do programa de qualidade de dados é responsável por envolver os profissionais de gerenciamento de dados técnicos e de negócios e conduzir o trabalho de aplicação de técnicas de gerenciamento de qualidade aos dados, para garantir que os dados sejam adequados ao consumo para uma variedade de propósitos. A equipe provavelmente estará envolvida em uma série de projetos por meio dos quais eles podem estabelecer processos e práticas recomendadas enquanto abordam problemas de dados de alta prioridade. Como o gerenciamento da qualidade dos dados envolve o gerenciamento do ciclo de vida dos dados, um programa de qualidade dos dados também terá responsabilidades operacionais relacionadas ao uso dos dados. Por exemplo, relatórios sobre os níveis de qualidade dos dados e participação na análise, quantificação e priorização de problemas de dados. A equipe ainda é responsável por trabalhar com aqueles que precisam de dados para realizar suas tarefas, para garantir que os dados atendam às suas necessidades e por trabalhar com aqueles que criam, atualizam ou excluem dados no decorrer de suas tarefas para garantir que eles estejam
  • 98.
    manipulando os dadoscorretamente. A qualidade dos dados depende de todos que interagem com os dados, não apenas dos profissionais de gerenciamento de dados. Como é o caso da governança de dados e do gerenciamento de dados como um todo, o gerenciamento da qualidade dos dados é um programa, não um projeto. Incluirá o trabalho de projeto e manutenção, juntamente com o compromisso com as comunicações e o treinamento. Mais importante, o sucesso a longo prazo do programa de melhoria da qualidade dos dados depende de uma organização mudar sua cultura e adotar uma mentalidade de qualidade. Conforme declarado no Manifesto de dados do líder: mudanças fundamentais e duradouras exigem liderança e envolvimento comprometidos de pessoas em todos os níveis de uma organização. As pessoas que utilizam dados para realizar seu trabalho – o que significa um percentual elevado - precisam promover mudanças. E uma das mudanças mais críticas a serem focadas é como as organizações gerenciam e melhoram a qualidade de seus dados. PLANEJAR: Definir características de dados de alta qualidade. PROJETAR e HABILITAR: Definir controle de sistema e de processo para evitar erros que prejudiquem o suporte a qualidade contínua dos dados. CRIAR / OBTER: Medir ou inspecionar os dados para garantir que atendam aos requisitos de qualidade. ARMAZENAR / MANTER: Monitorar a qualidade dos dados nos sistemas e dos processos para garantir que continuem a atender às expectativas.
  • 99.
    UTILIZAR: Habilitar umloop de feedback que identifique maneiras de melhorar a qualidade dos dados. APRIMORAR: Atuar nas oportunidades de melhoria da qualidade dos dados. DESCARTAR: Identificar e limpar corretamente os dados com base nos requisitos. Os princípios de gerenciamento de dados da DAMA afirmam que o gerenciamento de dados é o gerenciamento do ciclo de vida dos dados e que gerenciar dados significa gerenciar a qualidade dos dados. Durante o ciclo de vida dos dados, as atividades de gerenciamento da qualidade dos dados ajudam uma organização a definir e medir as expectativas relacionadas aos seus dados. Essas expectativas podem mudar ao longo do tempo à medida que os usos organizacionais dos dados evoluem. 2.4 Qualidade dos dados e outras funções de gerenciamento de dados Conforme citado anteriormente, todas as áreas do gerenciamento de dados têm o potencial de afetar a qualidade dos dados. Governança e administração de dados, modelagem de dados e gerenciamento de metadados têm efeitos diretos na definição dados de alta qualidade. Se estes não forem bem executados, é muito difícil ter dados confiáveis. Os três estão relacionados na medida em que estabelecem padrões, definições e regras relacionadas aos dados. A qualidade de dados visa atender às expectativas de forma coletiva descrevendo um conjunto de expectativas comuns. A qualidade dos dados é baseada na premissa de que atende aos requisitos dos consumidores de dados. Ter um processo robusto pelo qual os dados são definidos suporta a capacidade de uma organização formalizar e documentar os padrões e requisitos pelos quais a qualidade dos dados pode ser medida. Os metadados definem o que os dados representam. A administração de dados e os processos de modelagem de dados são fontes de metadados críticos. Metadados bem gerenciados também podem apoiar o esforço para melhorar a qualidade dos dados. Um repositório de metadados pode abrigar resultados de medições de qualidade de dados que podem ser compartilhados por toda a organização, de forma que a equipe de qualidade de dados possa ter insumos para produzir consenso sobre as prioridades e fatores de melhoria do Programa de Qualidade de Dados. Um programa de qualidade de dados é mais eficaz quando faz parte de um programa de governança de dados, uma vez que isto que esse alinhamento visa identificar problemas de qualidade de dados e propor soluções a serem discutidas e avaliadas para como a política de governança de dados na organização. A incorporação dos esforços de qualidade dos dados no escopo da governança de dados permite que a equipe do programa de qualidade dos dados trabalhe com uma variedade de partes interessadas e facilitadores, tais como:  Equipe de risco e segurança que pode ajudar a identificar vulnerabilidades organizacionais relacionadas a dados.  Equipe de engenharia e treinamento de processos de negócios que pode ajudar as equipes a implementar melhorias de processos que aumentam a eficiência e resultam em dados mais adequados para usos posteriores.  Gestores de dados de negócio, operacionais e proprietários de dados que podem identificar dados críticos, definir padrões e expectativas de qualidade e priorizar a correção de problemas de dados.
  • 100.
    Atenção, uma organizaçãode governança pode acelerar o trabalho de um programa de qualidade de dados, por meio das seguintes ações:  Definindo as prioridades.  Desenvolvendo e agindo na manutenção de padrões e políticas para a qualidade dos dados.  Estabelecendo mecanismos de comunicação e compartilhamento de conhecimento.  Monitoramento e geração de relatórios sobre desempenho e medições de qualidade de dados.  Compartilhando resultados da inspeção da qualidade dos dados para conscientizar e identificar oportunidades de melhoria. Os programas de governança também costumam ser responsáveis pelo gerenciamento de dados mestre e gerenciamento de dados de referência. Vale ressaltar que o gerenciamento de dados mestre e o gerenciamento de dados de referência são exemplos de processos focados na curadoria de tipos específicos de dados com o objetivo de garantir sua qualidade. Simplesmente rotular um conjunto de dados de "Dados Mestre" implica certas expectativas sobre seu conteúdo e confiabilidade. 2.5 Qualidade e regulação de dados A qualidade como a segurança dos dados proporciona uma vantagem estratégica. Usuários e parceiros de negócios esperam e estão começando a exigir dados completos e precisos. A qualidade dos dados também é um requisito regulatório em alguns casos. As práticas de gerenciamento de dados podem ser auditadas. Os regulamentos diretamente conectados às práticas de qualidade dos dados consideram os seguintes exemplos:  Sarbanes-Oxley (EUA), que se concentra na precisão e validade das transações financeiras.  Solvência II (UE), que se concentra na linhagem de dados e na qualidade dos dados subjacentes aos modelos de risco.  O Regulamento Geral de Proteção de Dados (GDPR, União Européia) afirma que os dados pessoais devem ser precisos e, quando necessário, mantidos atualizados. Devem ser tomadas medidas razoáveis para apagar ou corrigir dados pessoais imprecisos.  A Lei de Proteção de Informações Pessoais e Documentos Eletrônicos (PIPEDA, Canadá) afirma que os dados pessoais devem ser tão precisos, completos e atualizados para seus fins. Vale ressaltar que, mesmo quando os requisitos de qualidade dos dados não são especificamente mencionados, a capacidade de proteger dados pessoais depende, em parte, da alta qualidade desses dados. 2.6 Ciclo de melhoria da qualidade dos dados A maioria das abordagens para melhoria da qualidade dos dados baseia-se nas técnicas de melhoria da qualidade na fabricação de produtos físicos. Nesse paradigma, os dados são entendidos como o produto de um conjunto de processos. Em sua forma mais simples, um processo é definido como uma série de etapas que transforma entradas em saídas. Um processo que cria dados pode consistir em uma etapa (coleta de dados) ou várias etapas: coleta de dados, integração em um data warehouse, agregação em um data mart, etc. Em qualquer etapa, os dados podem ser afetados negativamente, por ter sido coletado incorretamente, eliminado ou duplicado entre sistemas, alinhado ou agregado incorretamente, etc.
  • 101.
    Melhorar a qualidadedos dados requer a capacidade de avaliar o relacionamento entre entradas e saídas para garantir que as entradas atendam aos requisitos do processo e as saídas estejam em conformidade com as expectativas. Como as saídas de um processo se tornam entradas para outros processos, os requisitos devem ser definidos ao longo de toda a cadeia de dados. Uma abordagem geral para a melhoria da qualidade dos dados é uma versão do ciclo Shewhart/Deming. Com base em método científico, o ciclo de Shewhart/Deming é um modelo de solução de problemas conhecido como 'planejar-fazer-verificar-agir'. A melhoria ocorre por meio de um conjunto definido de etapas. A condição dos dados deve ser medida em relação aos padrões e, se não atender aos padrões, a(s) causa(s) raiz(es) da discrepância em relação aos padrões deve(m) ser identificada(s) e remediada(s). As causas-raízes podem ser encontradas em qualquer uma das etapas do processo, técnicas ou não técnicas. Uma vez remediados, os dados devem ser monitorados para garantir que continuem a atender aos requisitos. Conheça a seguir o ciclo de Shewhart/Deming Para um determinado conjunto de dados, um ciclo de melhoria da qualidade começa identificando os dados que não atendem aos requisitos dos consumidores, que são problemas e geram obstáculos à consecução dos objetivos de negócios.
  • 102.
    Os dados precisamser avaliados em relação às principais dimensões da qualidade e aos requisitos de negócio conhecidos. As causas principais dos problemas precisarão ser identificadas para que as partes interessadas possam entender os custos da correção e os riscos de não remediá-los. Esse trabalho geralmente é realizado em conjunto com o Data Stewards e outras partes interessadas. Acesse as abas a seguir para conhecer mais sobre as etapas do ciclo. Clique no(s) item(s) abaixo para navegar pelo infográfico  Planejar No estágio Planejar (Plan), a equipe de qualidade dos dados (QD) avalia o escopo, o impacto e a prioridade dos problemas conhecidos e avalia alternativas para resolvê-los. Esse plano deve ser baseado em uma base sólida de análise das causas dos problemas. A partir do conhecimento das causas e do impacto dos problemas, é possível entender o custo / benefício, determinar a prioridade e formular um plano básico para resolvê-los.  Fazer No estágio Fazer (Do), a equipe de qualidade de dados lidera os esforços para abordar as causas principais dos problemas e planejar o monitoramento contínuo dos dados. Para causas raízes baseadas em processos não técnicos, a equipe de QD pode trabalhar com os responsáveis pelos processos para implementar mudanças. Para causas raiz que exigem alterações técnicas, a equipe de QD deve trabalhar com equipes técnicas e garantir que os requisitos sejam implementados corretamente e que nenhum erro não intencional seja introduzido por alterações técnicas.  Verificar O estágio de Verificar (Check) envolve o monitoramento ativo da qualidade dos dados, conforme medido em relação aos requisitos. Desde que os dados atendam aos limites definidos para a qualidade, ações adicionais não são necessárias. Os processos serão considerados sob controle e atendendo aos requisitos de negócios. No entanto, se os dados estiverem abaixo dos limites de qualidade aceitáveis, ações adicionais deverão ser tomadas para elevá-lo a níveis aceitáveis.  Agir O estágio Agir (Act) é para atividades que abordam e resolvem problemas emergentes de qualidade de dados. O ciclo é reiniciado, à medida que as causas dos problemas são avaliadas e as soluções propostas. A melhoria contínua é alcançada iniciando um novo ciclo. Novos ciclos começam como: As medidas existentes caem abaixo dos limites. Novos conjuntos de dados estão sob investigação. Novos requisitos de qualidade de dados emergem para conjuntos de dados existentes. Regras, padrões ou expectativas de negócios mudam. Estabelecer critérios para a qualidade dos dados no início de um processo ou construção do sistema é um sinal de uma organização com maturidade no gerenciamento de dados. Fazer isso exige governança e disciplina, além de colaboração multifuncional. Integrar a qualidade nos processos de gerenciamento de dados desde o início custa menos do que modernizá-la. Manter dados de alta qualidade em todo o ciclo de vida dos dados é menos arriscado do que tentar melhorar a qualidade em um processo existente. Isso também cria um impacto muito menor na organização. É melhor fazer as coisas corretamente da primeira vez, embora poucas organizações tenham o cuidado de fazê-lo. Mesmo se o fizerem, gerenciar a qualidade é um processo contínuo. As demandas em mudança e o crescimento orgânico ao longo do tempo podem causar problemas de qualidade dos dados que podem ser onerosos se desmarcados, mas podem ser cortados pela raiz se uma organização estiver atenta aos riscos potenciais.
  • 103.
    2.7 Qualidade dosdados e comprometimento da liderança Os problemas de qualidade dos dados podem surgir em qualquer ponto do ciclo de vida dos dados, desde a criação até o descarte. Ao investigar as causas principais, os analistas devem procurar possíveis culpados, como problemas com entrada de dados, processamento de dados, design de sistema e intervenção manual em processos automatizados. Muitos problemas terão múltiplas causas e fatores contribuintes (especialmente se as pessoas tiverem criado maneiras de contorná-los). Essas causas de problemas também implicam que problemas de qualidade de dados podem ser evitados por meio de:  Melhoria no design de interface.  Teste de regras de qualidade de dados como parte do processamento.  Foco na qualidade dos dados no design do sistema.  Controles rigorosos da intervenção manual em processos automatizados. Obviamente, táticas preventivas devem ser usadas. No entanto, o senso comum diz e pesquisas indicam que muitos problemas de qualidade dos dados são causados pela falta de comprometimento organizacional, que por sua vez resultam da falta de liderança de governança e de gerenciamento. Toda organização possui ativos de informação e dados que são estratégicos para suas operações. De fato, as operações dependem da capacidade de compartilhar informações. Apesar disso, poucas organizações gerenciam esses ativos com rigor. Vários programas de controle e ativos de informações são orientados apenas pela conformidade e não pelo valor potencial dos dados como um ativo. A falta de reconhecimento por parte da liderança significa falta de compromisso dentro de uma organização para gerenciar dados como um ativo, incluindo o gerenciamento de sua qualidade. Sua atenção, às barreiras para o gerenciamento eficaz da qualidade dos dados englobam:  Falta de conscientização por parte da liderança e da equipe.  Falta de governança de negócios.  Falta de liderança e gestão.  Dificuldade em justificar melhorias.  Instrumentos inadequados ou ineficazes para medir o valor. Essas barreiras têm efeitos negativos na experiência do cliente, produtividade, moral, eficácia organizacional, receita e vantagem competitiva. Eles aumentam os custos de administração da organização e também introduzem riscos. Assim como no entendimento da causa raiz de qualquer problema, o reconhecimento dessas barreiras - as causas principais dos dados de baixa qualidade - fornece à organização uma visão de como melhorar sua qualidade. Se a organização perceber que não possui governança, propriedade e responsabilidade corporativa fortes, poderá resolver o problema estabelecendo governança, propriedade e responsabilidade empresarial. Se a liderança perceber que a organização não sabe como colocar as informações em funcionamento, a liderança poderá implementar processos para que a organização possa aprender a fazê-lo. O reconhecimento de um problema é o primeiro passo para resolvê-lo!
  • 104.
    Realmente, resolver problemasexige trabalho. A maioria das barreiras ao gerenciamento de informações como um ativo é cultural. Para resolvê-los, é necessário um processo formal de gerenciamento de mudanças organizacionais. A imagem a seguir apresenta as barreiras ao gerenciamento de dados como um ativo estratégico, apresentadas na DMBOK2. 2.8 Organização e mudança cultural A qualidade dos dados não será aprimorada por meio de uma coleção de ferramentas e conceitos, mas por mentalidade que ajuda os consumidores e as partes interessadas a priorizarem a qualidade dos dados necessários para atender sua organização e seus usuários. Conseguir que a organização seja consciente da qualidade dos dados geralmente requer mudança cultural significativa. Essa mudança requer visão e liderança! O primeiro passo é promover a conscientização sobre o papel e a importância dos dados para a organização e definir as características dos dados de alta qualidade. Todos os consumidores de dados devem agir com responsabilidade e levantar problemas de qualidade dos dados; solicitar dados de boa qualidade como consumidores e fornecer informações de qualidade a terceiros. Toda pessoa que toca nos dados pode afetar a qualidade desses dados. A qualidade dos dados não é apenas responsabilidade de uma equipe de QD, de uma equipe de governança de dados ou de um grupo de TI. Os consumidores de dados precisam pensar e agir de maneira diferente para produzir e gerenciar dados de melhor qualidade. Isso requer não apenas treinamento, mas também comprometimento da liderança.
  • 105.
    3 Maturidade emGerenciamento de dados Dados confiáveis não são produzidos por acidente. Tentamos mostrar que dados bem gerenciados dependem do planejamento, governança e comprometimento com a qualidade e segurança, bem como da execução disciplinada dos processos contínuos de gerenciamento de dados. Este tópico abordará as etapas críticas para iniciar melhorias na maturidade organizacional em torno do gerenciamento de dados. Esses incluem:  Avaliar o estado atual  Compreender as opções de melhoria para desenvolver um roteiro para gerenciamento de dados  Iniciar um programa de Gerenciamento de Mudanças na Organização para apoiar a execução do modelo 3.1 Avaliar o estado atual Antes de definir qualquer nova organização ou tentar melhorar uma já existente, é importante avaliar o estado atual da gestão dos dados, especialmente porque elas se relacionam à cultura, ao modelo operacional existente e às pessoas. Embora as especificidades da mudança cultural sejam diferentes de organização para organização. A avaliação do estado atual foca na melhoria do gerenciamento de dados e precisará considerar:  O papel dos dados na organização: Quais processos principais são orientados por dados? Como os requisitos de dados são definidos e entendidos? Quão bem reconhecido é o papel que os dados desempenham na estratégia organizacional? De que maneira a organização está ciente dos custos de dados de baixa qualidade?  Normas culturais sobre dados: Existem possíveis obstáculos culturais para implementar ou melhorar as estruturas de gerenciamento e governança de dados? Os proprietários de processos de negócios upstream estão cientes dos usos downstream de seus dados?  Práticas de gerenciamento e governança de dados: Quem e como é executado as atividades relacionadas à gestão de dados? Como e quem toma as decisões sobre o gerenciamento de dados?  Como o trabalho é organizado e executado: A execução das atividades é baseada em projetos? Quais estruturas de comitê existem para apoiar o esforço de gerenciamento de dados? Qual é o modelo operacional para interações de TI/Negócios? Como os projetos são patrocinados?  Relacionamentos de relatórios: A organização é centralizada ou descentralizada, hierárquica ou plana? Quão colaborativas são as equipes?  Níveis de habilidade: Qual é o nível de conhecimento de dados e de gerenciamento de dados das partes interessadas? Existem especialistas no assunto? A avaliação do estado atual também deve incluir o nível de satisfação, isso fornecerá informações sobre as necessidades e prioridades de gerenciamento de dados da organização. Atenção aos exemplos:  Tomada de decisão: A organização possui as informações necessárias para tomar decisões estratégicas, oportunas e sólidas?  Relatórios: A organização confia em seus relatórios?  Principais indicadores de desempenho (Key Performance Indicator - KPI): Com que eficácia a organização rastreia seus KPIs?  Conformidade: A organização está em conformidade com todas as normas legais relacionadas à governança de dados?
  • 106.
    O meio maiseficaz para conduzir essa avaliação é usar um modelo confiável de maturidade em gerenciamento de dados que forneça informações sobre como a organização se compara a outras organizações e orientações sobre os próximos passos. Os modelos de maturidade definem cinco ou seis níveis de maturidade, cada um com suas próprias características, que variam de inexistentes (nível 0), ad hoc (nível 1) a otimizados ou de alto desempenho (nível 5). Uma avaliação detalhada incluiria critérios para categorias amplas, como pessoas, processos e tecnologia; e para subcategorias como estratégia, política, padrões, definição de função, tecnologia/automação etc. dentro de cada função de gerenciamento de dados ou área de conhecimento. Acesse as abas para obter um resumo dos níveis macro da maturidade do gerenciamento de dados. Nível 0 - Ausência de Capacidade Não existem práticas organizadas ou processos corporativos formais para gerenciamento de dados. Há uma parcela considerável de organizações no nível 0. Esse nível é reconhecido apenas para fins de conceito. Nível 1 - Inicial/Ad Hoc Gerenciamento de dados utilizando um conjunto de ferramentas limitado, com pouca ou nenhuma governança. O tratamento de dados é altamente dependente de alguns especialistas. Papéis e responsabilidades são definidos em silos. Cada gestor de dados recebe, gera e envia dados de forma autônoma. Os controles, se existirem, são aplicados de forma inconsistente. As soluções para gerenciamento de dados são limitadas. Os problemas de qualidade dos dados são difundidos e não são abordados. Os suportes de infraestrutura estão no nível da unidade de negócios. Os critérios de avaliação podem incluir a presença de qualquer controle de processo, como registro de problemas de qualidade de dados. Nível 2 - Repetível Surgimento de ferramentas consistentes e definição de função para apoiar a execução do processo. No nível 2, a organização começa a usar ferramentas centralizadas e a fornecer mais supervisão para o gerenciamento de dados. As funções são definidas e os processos não dependem apenas de um especialista. Existe conscientização organizacional sobre questões e conceitos de qualidade de dados. Os conceitos de gerenciamento de dados mestre e de referência começam a ser reconhecidos.
  • 107.
    Os critérios deavaliação podem incluir a definição formal de função em artefatos, como descrições de tarefas, a existência de documentação do processo e a capacidade de alavancar conjuntos de ferramentas. Nível 3 - Definido Capacidade emergente de gerenciamento de dados. O Nível 3 vê a introdução e a institucionalização de processos escaláveis e uma visão do gerenciamento de dados como um facilitador organizacional. As características incluem a replicação de dados em uma organização com alguns controles em vigor e um aumento na qualidade dos dados, juntamente com definição e gerenciamento coordenados de políticas. Uma definição de processo mais formal leva a uma redução significativa na intervenção manual. Isso, junto com um processo de design centralizado, significa que os resultados do processo são mais previsíveis. Os critérios de avaliação podem incluir a existência de políticas de gerenciamento de dados, o uso de processos escalonáveis e a consistência de modelos de dados e controles do sistema. Nível 4 - Gerenciado O conhecimento institucional adquirido com o crescimento nos níveis 1 a 3 permite que a organização preveja resultados ao abordar novos projetos e tarefas e comece a gerenciar os riscos relacionados aos dados. O gerenciamento de dados inclui métricas de desempenho. As características do nível 4 incluem ferramentas padronizadas para gerenciamento de dados, das estações de trabalho à infraestrutura, juntamente com uma função centralizada de planejamento e governança. As expressões desse nível são um aumento mensurável na qualidade dos dados e nos recursos de toda a organização, como auditorias de dados de ponta a ponta. Os critérios de avaliação podem incluir métricas relacionadas ao sucesso do projeto, métricas operacionais para sistemas e métricas de qualidade dos dados. Nível 5 - Otimizado Quando as práticas de gerenciamento de dados são otimizadas, elas são altamente previsíveis, devido à automação de processos e gerenciamento de mudanças tecnológicas. As organizações nesse nível de maturidade se concentram na melhoria contínua. No nível 5, as ferramentas permitem uma visualização dos dados entre os processos. A proliferação de dados é controlada para evitar duplicação desnecessária.
  • 108.
    Métricas bem entendidassão usadas para gerenciar e medir a qualidade e os processos dos dados. Os critérios de avaliação podem incluir artefatos e métricas de gerenciamento de mudanças na melhoria do processo. Na sequência, conheça o Modelo de Níveis de Maturidade em Gerenciamento de Dados. O gráfico espiral a seguir apresenta um exemplo de demonstração de resultado das descobertas após a aplicação da metodologia de Avaliação de Maturidade de Gerenciamento de Dados (Data Management Maturity Assessment - DMMA).
  • 109.
    Para cada umdos recursos (Governança, Arquitetura, etc.), o anel externo da tela mostra o nível de capacidade que a organização determinou que precisa para competir com sucesso. O anel interno exibe o nível de capacidade conforme determinado pela avaliação. As áreas em que a distância entre os dois anéis é maior representam os maiores riscos para a organização. Esse relatório pode ajudar a definir prioridades, como também, ser utilizado para medir o progresso ao longo do tempo. O objetivo de uma avaliação do estado atual é compreender o ponto de partida da organização para planejar a melhoria. Uma avaliação precisa é mais importante que uma pontuação alta. Uma avaliação formal da maturidade do gerenciamento de dados coloca a organização na escala de maturidade, esclarecendo os pontos fortes e fracos de atividades críticas de gerenciamento de dados. Ajuda a organização a identificar, priorizar e implementar oportunidades de melhoria. Ao atingir seu objetivo principal, um DMMA pode ter um impacto positivo na cultura. Isso auxilia a:  Conscientizar as partes interessadas sobre os conceitos, princípios e práticas de gerenciamento de dados.  Esclarecer as funções e responsabilidades das partes interessadas em relação aos dados organizacionais.  Destacar a necessidade de gerenciar dados como um ativo crítico.  Ampliar o reconhecimento das atividades de gerenciamento de dados em toda a organização.  Contribuir para melhorar a efetividade da governança de dados. Com base nos resultados da avaliação, uma organização pode aprimorar seu programa de gerenciamento de dados, de forma a apoiar as atividades estratégicas da organização. Normalmente, os programas de gerenciamento de dados são desenvolvidos em silos organizacionais. Raramente começam com uma visão corporativa dos dados.
  • 110.
    Um estudo deDMMA pode prover à organização meios para desenvolver uma visão coesa e estratégica; além de permitir uma avaliação clara e criteriosa de suas prioridades, redefinição de objetivos e desenvolvimento de um plano integrado de melhoria. 3.2 Uso dos resultados para planejar melhorias Uma avaliação do estado atual ajuda a determinar o que está funcionando bem, o que não está funcionando e onde uma organização apresenta lacunas. As conclusões fornecem a base para os objetivos do programa de mapeamento de trilhas que auxiliam a determinar por onde começar e com qual velocidade avançar. Atenção, os objetivos devem se concentrar em:  Oportunidades de melhoria de alto valor relacionadas a processos, métodos, recursos e automação.  Recursos alinhados à estratégia de negócios.  Processos de governança para avaliação periódica do progresso organizacional com base nas características do modelo. As especificidades dos planos de ação dependerão dos resultados da avaliação. A tabela abaixo apresenta um modelo simplificadíssimo que considera apenas a adoção de uma metodologia padrão e o grau de automação do processo. Nível de Maturidade Qualidade de Dados (QD) – Características de Medição Grau de Automação Nível 5 – Otimizado: As metas de melhoria e de processo são quantificadas Os relatórios de QD são amplamente compartilhados entre os acionistas da gerência. Os resultados da medição da qualidade dos dados são usados para identificar oportunidades de melhorias no sistema e nos processos de negócios e o impacto dessas melhorias é relatado. Relatórios e Painéis otimizados e automatizados, incluindo alertas. Nível 4 – Gerenciado: Processos são quantificados e controlados Os gestores de sistemas e de negócios são obrigados a medir a qualidade de seus dados e a reportar resultados, para que os consumidores tenham um conhecimento consistente da qualidade dos dados. O processo de medição é totalmente automatizado. Nível 3 – Definido: Os padrões são definidos e usados Os padrões são definidos para estabelecimento das métricas de qualidade dos dados e se estão sendo aplicados nas equipes. Uma abordagem padrão foi adotada para iniciar o processo de automação. Nível 2 – Repetível: Existe uma prática mínima repetível no processo As partes envolvidas aprenderam práticas para medir a qualidade dos dados e estão desenvolvendo habilidades para replicar essas práticas. Os processos ainda são amplamente manuais, mas algumas equipes testaram a automação. Nível 1 - Inicial (Ad Hoc): O sucesso depende da competência dos indivíduos Há um esforço dos indivíduos em medir a qualidade dos dados, mas isso não faz parte diretamente da rotina de atividades e não existe uma metodologia definida. Nenhum. Os processos de acompanhamento dos indicadores são realizados de forma manual. Nível 0 - Ausência de capacidade Não existe definição de métricas e acompanhamento da qualidade dos dados. Não aplicável. Níveis de maturidade para medição da qualidade dos dados
  • 111.
    Digamos que umaorganização reconheça a necessidade de melhorar a qualidade de seus dados. No entanto, sua avaliação atual do estado mostra que encontra-se no Nível 1. Ainda não estabeleceu práticas repetíveis em torno da medição da qualidade dos dados, mas há indivíduos que testaram as águas e descobriram algumas coisas. Com base em sua estratégia geral, estabelece uma meta de passar do Nível 1 para o Nível 3 dentro de 18 meses. Atingir esse objetivo requer um plano de ação que explique vários fluxos de trabalho:  Pesquisa de abordagens para medir a qualidade dos dados e adoção de uma abordagem alinhada com os pontos problemáticos da organização, as metas de medição e o setor.  Treinamento de equipe sobre a metodologia.  Identificação e adoção de ferramentas para apoiar a execução da metodologia. Além de executar planos para atingir essas metas, os líderes também devem levar em consideração o desenvolvimento futuro (ou seja, ao passar para o Nível 3, a organização também deverá se preparar para passar para o Nível 4). Esse exemplo simples mostra o processo de pensamento em torno do planejamento para a melhoria de um componente do gerenciamento de dados. As avaliações de maturidade do gerenciamento de dados podem ter diferentes áreas de foco. Se sua organização avaliar de forma abrangente suas práticas de gerenciamento de dados, a saída identificará diversas oportunidades de melhoria. Eles precisarão ser priorizados para apoiar a estratégia de negócios. Um modelo de maturidade de gerenciamento de dados inclui orientações internas, descrevendo como é o progresso dentro e entre as áreas funcionais de gerenciamento de dados. O caminho para a melhoria baseado em etapas pode ser adaptado às necessidades e prioridades de uma organização. 3.3 Gerenciamento de mudanças organizacionais A maioria das organizações que busca melhorar suas práticas de gerenciamento ou governança de dados está no meio da escala de maturidade de capacidade (ou seja, não são 0 ou 5). O que significa que quase todas precisam melhorar suas práticas. Para a maior parte das organizações, melhorar as práticas de gerenciamento de dados requer alterar a maneira como as pessoas trabalham juntas e como elas entendem o papel dos dados em suas organizações, bem como a maneira como utilizam os dados e implementam a tecnologia para dar suporte aos processos organizacionais. Atenção às práticas bem-sucedidas de gerenciamento de dados, pois elas exigem, entre outros fatores:  Aprender a gerenciar horizontalmente, alinhando responsabilidades ao longo da cadeia de valor das informações.  Mudar o foco da responsabilidade vertical (silo) para a gestão compartilhada de informações.  Evoluir a qualidade da informação de uma expectativa do negócio de nicho ou trabalho do departamento de TI para um valor central da organização.  Mudar o pensamento sobre a qualidade das informações de 'limpeza de dados e scorecards' para uma capacidade organizacional mais fundamentada em transformar a qualidade em processos.  Implementar processos para mensurar o custo do gerenciamento de dados informal e o valor do gerenciamento de dados formalizado. Esse nível de mudança não é alcançado por meio da tecnologia (mesmo que o uso apropriado de ferramentas de software possa dar suporte à entrega). Em vez disso, é realizado por meio de uma
  • 112.
    abordagem cuidadosa eestruturada para o gerenciamento de mudanças na organização. A mudança será necessária em todos os níveis. É fundamental que seja gerenciado e coordenado a fim de evitar iniciativas sem saída, perda de confiança e danos à credibilidade da função de gerenciamento de informações e de sua liderança. A mudança na cultura da organização requer planejamento, treinamento e persistência. Consciência e responsabilidade são essenciais para motivar e envolver as pessoas em iniciativas, políticas e processos de gerenciamento de dados. Os fatores críticos de sucesso para o gerenciamento de mudanças organizacionais são bem conhecidos. Demonstrou-se consistentemente que dez fatores desempenham um papel fundamental no sucesso de organizações eficazes de gerenciamento de dados, independentemente de sua estrutura. São eles: Patrocínio da alta administração A alta administração deve internalizar e acreditar na iniciativa. Deve ser capaz de se envolver efetivamente e mobilizar outros líderes no apoio às mudanças. Visão clara Os líderes devem garantir que todas as partes interessadas afetadas pelo gerenciamento de dados - tanto internas quanto externas - entendam e internalizem o que é gerenciamento de dados, por que é importante e como o trabalho deles afetará e será afetado por eles. Gerenciamento proativo de mudanças A aplicação do gerenciamento organizacional de mudanças para o estabelecimento de uma prática de gerenciamento de dados aborda os desafios das pessoas e aumenta a probabilidade de práticas e estruturas organizacionais serem sustentáveis ao longo do tempo. Alinhamento da liderança O alinhamento da liderança garante que haja acordo - e suporte unificado para - a necessidade de um programa de gerenciamento de dados e que haja acordo sobre como o sucesso será definido. O alinhamento da liderança inclui o alinhamento entre as metas dos líderes e os resultados do gerenciamento de dados, além de valor e alinhamento de propósito entre os líderes. Comunicação A organização deve garantir que as partes interessadas tenham um entendimento claro do que é o gerenciamento de dados e a sua importância. O que sofrerá transformações e quais mudanças no comportamento são necessárias. Engajamento das partes interessadas Indivíduos e grupos afetados por uma iniciativa de gerenciamento de dados reagirão de maneiras diferentes ao novo programa e sua função. O modo como a organização envolve essas partes interessadas - como elas se comunicam, respondem e envolvem - terá um impacto significativo no sucesso da iniciativa. Orientação e treinamento A capacitação é essencial para que o gerenciamento de dados aconteça. Diferentes grupos de pessoas (líderes, gestores de dados, equipes técnicas) exigirão diferentes tipos e níveis de educação para que possam desempenhar suas funções de maneira eficiente. Diversas pessoas precisarão de treinamento em novas políticas, processos, técnicas, procedimentos e até ferramentas.
  • 113.
    Avaliação da adoção Criemétricas em torno do progresso e da adoção das diretrizes de gerenciamento de dados visando manter a continuidade da execução do programa de gerenciamento de dados. O aspecto facilitador do gerenciamento de dados pode se concentrar na melhoria dos processos centrados em dados, como identificação de risco e eficiência da execução do projeto. O aspecto de inovação do gerenciamento de dados pode se concentrar na melhoria na tomada de decisão e na análise por meio de dados aprimorados e confiáveis. Adesão aos princípios orientadores Princípios de gerenciamento de dados do DAMA servem como pontos de referência a partir dos quais todas as decisões serão tomadas. Estabelecê-los é um primeiro passo para a criação de um programa de gerenciamento de dados que efetivamente conduz mudanças no comportamento. Evolução, não revolução Em todos os aspectos do gerenciamento de dados, a filosofia de 'evolução não revolução' ajuda a minimizar grandes mudanças ou projetos de alto risco e em larga escala. O estabelecimento de uma organização que evolua e amadureça ao longo do tempo, melhorando de forma incremental a maneira como os dados são gerenciados e priorizados pelos objetivos de negócios, garantirá que novas políticas e processos sejam adotados e que as mudanças comportamentais sejam sustentadas. 3.4. Governança da Gestão da Maturidade Um DMMA faz parte de um conjunto de atividades de governança de dados. O ciclo de vida de um DMMA consiste no planejamento e na avaliação inicial, seguido de recomendações, um plano de ação e reavaliação periódica. Supervisão do Processo DMMA A supervisão do processo DMMA é exercido pela equipe de Governança de Dados. Se a Governança de Dados formal não possuir know-how, os padrões de supervisão serão adotados pelo Comitê Diretor ou pela camada de gerenciamento que iniciou o DMMA. O processo deve ter um patrocinador da alta Administração para garantir que as melhorias nas atividades de gerenciamento de dados sejam mapeadas conforme os objetivos de negócios. A amplitude e profundidade da supervisão dependem do escopo da DMMA. Cada função envolvida no processo tem sua responsabilidade na execução, método, resultados e roteiros provenientes da avaliação. Cada área de gerenciamento de dados estará envolvida de forma interdependente, mas também utilizaram uma linguagem comum por meio da estrutura do DMMA. Métricas Além de ser um componente central de qualquer estratégia de melhoria, as métricas são uma ferramenta de comunicação essencial. As métricas iniciais do DMMA são as classificações que representam o estado atual do gerenciamento de dados. As métricas podem ser reavaliadas periodicamente para demonstrar tendências de melhoria. Cada organização deve desenvolver métricas adaptadas à sua situação. Métricas podem incluir:
  • 114.
    Classificações DMMA As classificaçõesDMMA apresentam, por meio de níveis, a capacidade da organização. As classificações podem ser acompanhadas de uma descrição, talvez uma ponderação personalizada para a classificação em uma avaliação ou área temática específica e um resultado esperado. Taxas de utilização de recursos Utilizar exemplos de métricas que ajudam a expressar o custo do gerenciamento de dados com base em cálculos percentuais como: "Todo recurso da organização gasta 10% do tempo agregando dados manualmente". A exposição ao risco: Exposição ao risco Exposição ao risco ou a capacidade de responder a cenários de risco expressa os recursos de uma organização em relação às classificações de DMMA. Por exemplo, se uma organização quisesse iniciar um novo negócio que exigisse um alto nível de automação, mas seu modelo operacional atual se baseia no gerenciamento manual de dados (Nível 1), incorreria no risco de não entregar. O gerenciamento de gastos Expressa como o custo do gerenciamento de dados é alocado em uma organização e identifica os impactos desse custo na sustentabilidade e no valor. Essas métricas se sobrepõem às métricas de governança de dados.  Sustentabilidade no gerenciamento de dados  Realização das metas e objetivos  Eficácia da comunicação  Eficácia da capacitação de pessoal  Velocidade de adoção das mudanças  Valor agregado com práticas de gerenciamento de dados  Contribuições para os objetivos de negócios  Reduções de riscos As entradas para o DMMA São importantes para gerenciar, pois falam sobre a abrangência da cobertura, nível de investigação e detalhes do escopo relevante para a interpretação dos resultados da pontuação. As entradas principais podem incluir o seguinte: contagem, cobertura, disponibilidade, número de sistemas, volumes de dados, equipes envolvidas etc. Taxa de mudança A taxa na qual uma organização está melhorando sua capacidade. Uma linha de base é estabelecida por meio do DMMA. A reavaliação periódica é usada para melhorar a tendência. 3.5. Elementos do modelo de maturidade Temos acesso a mais dados do que nunca, mas isso se tornou confuso e contraditório, a ponto de a qualidade dos dados ser considerada uma disciplina por si só. Em que ponto paramos de confiar nos dados? Não é apenas o volume de dados que os torna confusos, é como os usamos.
  • 115.
    Podemos usar osdados para obter muitos resultados diferentes, dependendo do que fazemos com eles. Se não pararmos para verificar se estamos de acordo em que manipulamos ou extrapolamos, estamos caminhando em direções muito diferentes e concorrentes. O primeiro passo será proceder uma avaliação da maturidade dos dados para ajudá-lo a entender com qual cenário está inserido - forneça uma imagem de como organização encontra-se em seu ponto de partida no mapa. A avaliação da maturidade dos dados é uma ferramenta útil não só para compreender a situação atual da organização, antes de iniciar (ou a partir de quando o processo será iniciado), mas também para demonstrar o progresso das iniciativas de melhoria. Visto que essas informações serão utilizadas como insumos da linha de base. Diversas mudanças falham porque não houve tempo para compreender a real posição da organização. Uma lagarta pode ser uma lagarta perfeitamente boa, mas para atingir seu verdadeiro potencial, ela precisa se transformar em uma borboleta. Embora não estamos sugerindo que é possível saber tudo com antecedência, é possível em pouco tempo compreender a posição da sua organização sobre os fatores importantes em relação à forma como trata os dados. A linha de base pode demonstrar o que a organização tem realizado e onde fez a diferença. Com isso é possível determinar se existe retorno relevante para a organização e com isso decidir se mantém ou não esse processo. Uma das coisas que é difícil quando se algum tipo de mudança é demonstrar os benefícios - sem isso é realmente fácil para qualquer organização se preocupar que não está no caminho certo. As partes interessadas e os usuários podem consumir uma grande quantidade de energia para gerenciar e também podem inviabilizar completamente os programas, se houver medidas preventivas. Uma maneira simples de ajudá-los a entender se estão na direção certa é demonstrar o progresso em relação à sua linha de base - que é a primeira avaliação de maturidade. Conheça alguns pontos relevantes ao se conduzir um modelo de maturidade:  Toda interação é importante. O trabalho de preparação foi realizado para que haja alinhamento das motivações e expectativas.  Nem todo mundo será um defensor ou até um pouco positivo sobre o que propõe a fazer. É necessário avaliar e decidir se o esforço para mudar a posição de alguns é factível.  Se forem positivos, não presumam que permanecerão assim, continue se engajado para garantir um bom nível de aceitação.  Aproveite todas as oportunidades para mudar a atitude das pessoas em relação aos dados! Atenção aos principais elementos do modelo de maturidade são: Estratégia Organizações com níveis de maturidade altas comunicam a visão. Ou seja, o caminho da liderança a seguir com uma estratégia de negócios e fornecer os princípios para estratégias detalhadas relacionadas às principais áreas de negócios, das quais a estratégia de dados deve se alinhar. Governança corporativa Os elementos principais da boa governança corporativa estão vigentes e estão bem implantados? Operam isoladamente um do outro ou garantem uma abordagem sincronizada? As atividades relevantes e adaptáveis são realizadas regularmente e de forma eficiente? A governança deve alinhar- se conformidade. Liderança e patrocínio Existem pessoas chaves nos níveis estratégicos da organização que compreendem a importância e o valor do que está sendo feito? Apoiarão para garantir que se obtenha o tempo necessário para demonstrar o verdadeiro valor advindo desse processo.
  • 116.
    Estrutura, processo eferramentas Sua organização possui estrutura coerente para fazer com que os demais setores se mantenham alinhados? Como as políticas são atualizadas? As ferramentas disponíveis ajudam ou atrapalham? Quantos sistemas relacionados a dados estão em operação no momento? As pessoas utilizam esses sistemas de dados de forma correta? Compreende o ciclo de vida das informações na sua organização? Políticas Existem políticas, padrões, procedimentos para garantir que as pessoas da organização tenham um instrumento de alinhamento estratégico? Essas políticas, procedimentos e padrões são claras, consistentes e fáceis de utilizar? Existe uma estrutura para demonstrar a inter-relação entre essas políticas? Risco de informação O risco das informações está bem definido e em que nível, tendo em vista a importância do negócio? As ferramentas vigentes para auxiliar o gerenciamento de dados e adequada para mitigar os riscos adequadamente? Arquitetura Como as informações de toda a organização são estruturadas e como transitam entre os silos? As arquiteturas estão mapeadas? Quais são os responsáveis? Organização, funções e responsabilidade As funções são claras e acordadas em toda a organização? Existe uma equipe dedicada pela gestão dos dados da organização? Foram definidas funções para abordar elementos de gerenciamento e garantia de informações em seus diferentes domínios? Existe um conselho diretor com poderes para tomar decisões relacionadas a dados e informações? Habilidades Quais habilidades são necessárias para alcançar os objetivos de gerenciamento de dados definidos pela organização? A organização dispõe de programas de treinamento para os profissionais de dados e de informações? Métricas As funções de gerenciamento de dados são mensuradas do ponto de vista de desempenho e demonstrada por meio de relatórios que apontam os benefícios alcançados? O resultado do processo de mensuração é direcionado para as mudanças comportamentais pretendidos pela cultura de valorização de dados? Comportamento da tutela da informação Valoriza-se os dados e o que pode ser realizado pelo seu uso? Os investimentos no gerenciamento de dados foram positivos resultado em resultados mensuráveis? Tecnologia A tecnologia disponível é facilmente escalável e adequada para atender os processos de gerenciamento de dados
  • 117.
    Referências Bibliográficas The Data-CentricRevolution: Restoring Sanity to Enterprise Information Systems by Dave McComb Publisher: Technics Publications, Release Date: September 2019. Non-Invasive Data Governance by Robert S. Seiner, Publisher: Technics Publications, Release Date: July 2014. Gestão e Governança de Dados – Promovendo dados como ativo de valor nas empresas. Rêgo, Bergson Lopes. Editora Brasport, 2013. Navigating the Labyrinth: An Executive Guide to Data Management by Laura Sebastian-Coleman for DAMA International Publisher: Technics Publications Release Date: June 2018. DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition) by DAMA International Publisher: Technics Publications, Release Date: July 2017. Data Driven Business Transformation by Caroline Carruthers, Peter Jackson, Publisher: Wiley, Release Date: May 2019.
  • 118.
    Outra fontes. http://www.datagovernance.com/goals-and-principles-for-data-governance/ Aqui estãoos Princípios Orientadores de Governança de Dados do Data Governance Institute, juntamente com os comentários. 1. Princípio - Integridade Os participantes da Governança de Dados praticarão integridade com suas relações entre si; eles serão sinceros e imediatos ao discutir drivers, restrições, opções e impactos para decisões relacionadas a dados. Isto é essencial. Seu programa está fadado a problemas, a menos que sua equipe do DGO atue como "intermediários confiáveis" de informações ao transmitir mensagens entre diferentes partes interessadas e participantes. 2. Princípio - Transparência Os processos de administração e administração de dados exibirão transparência; deve ficar claro para todos os participantes e auditores como e quando as decisões e controles relacionados aos dados foram introduzidos nos processos. Nem tudo pode ser transparente, é claro. Para ser eficaz, às vezes as medidas de segurança não podem ser óbvias. Porém, para qualquer atividade relacionada a dados, as pessoas da DIREITA devem descobrir o que está acontecendo. 3. Princípio - Auditabilidade As decisões, processos e controles relacionados a dados sujeitos ao Data Governace serão auditáveis; eles serão acompanhados de documentação para suportar os requisitos de auditoria operacional e baseada em conformidade. Se o foco do seu programa for algo diferente da conformidade, é fácil esquecer que outras pessoas podem precisar revisar seu trabalho e suas decisões. Esse princípio exige equilíbrio; você precisa deixar rastros quando apropriado, mas não quer gastar horas criando documentação que ninguém precisa. 4. Princípio - Responsabilização O Data Governance definirá responsabilidades para decisões, processos e controles multifuncionais relacionados a dados. Freqüentemente, o Data Governance pode fornecer um ótimo serviço, abordando “lacunas e sobreposições” nas responsabilidades relacionadas aos dados. Procure situações em que NINGUÉM é responsável ou MUITOS grupos estão listados como responsáveis e é provável que ninguém realmente seja. 5. Princípio - Administração O Data Governance definirá responsabilidades por atividades de administração que são de responsabilidade de colaboradores individuais, bem como responsabilidades por grupos de Data Stewards. Não negligencie situações em que alguém não recebeu a designação formal de Data Steward. Eles ainda podem ter responsabilidades de mordomia que devem ser incorporadas às suas responsabilidades formais. 6. Princípio – Verificações e contrapesos O Data Governance definirá responsabilidades de maneira a introduzir verificações e ponderações equilibradas entre as equipes de negócios e tecnologia, bem como entre aqueles que criam / coletam
  • 119.
    informações, quem osgerencia, quem os utiliza e quem introduz padrões e requisitos de conformidade. O estabelecimento de verificações e balanços apropriados que possam orientar os esforços de gerenciamento é provavelmente o papel mais importante de Governança de Dados. 7. Princípio - Padronização O Data Governance apresentará e dará suporte à padronização de dados corporativos. Nem tudo pode ser padronizado - nem deveria ser. Mas alcançar a padronização de dados é um pré- requisito para muitos projetos de negócios e TI de alto valor. E NUNCA é alcançado de maneira sustentável sem Governança e Administração de Dados. 8. Princípio - Gerenciamento de Mudanças O Data Governance oferecerá suporte a atividades proativas e reativas de gerenciamento de mudanças para valores de dados de referência e a estrutura / uso de dados mestre e metadados. Se você deseja sucesso sustentável para projetos que envolvem dados, você precisa controlar como esses dados são alterados. Sim, alguns dados devem mudar com frequência. Outros dados - como uma lista de valores válidos para o campo "Estado ou província" em um endereço - devem mudar raramente, e apenas com ótimas deliberações e análises de impacto. A maioria dos programas de Governança de Dados se envolve em atividades de gerenciamento de alterações relacionadas a dados, mesmo que apenas incorporando atividades de notificação de alterações nas responsabilidades do Data Stewardship. Esses princípios estão imbuídos em todos os programas, processos e projetos bem-sucedidos de Governança e Administração de Dados. São os princípios que ajudam as partes interessadas a se unirem para resolver os tipos de conflitos relacionados a dados que são inerentes a todas as organizações.