O documento discute o potencial e desafios dos dados governamentais na perspectiva da Ciência Aberta para a saúde pública, apresentando um estudo de caso do Centro de Integração de Dados e Conhecimentos para Saúde da Fiocruz. O centro enfrenta desafios como receber, tratar e analisar grandes volumes de dados administrativos de saúde de forma ética e segura para pesquisa, respeitando a privacidade dos indivíduos.
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desafios para saúde pública a partir de um estudo de caso
1. Dados governamentais na perspectiva da Ciência
Aberta: potencialidades e desafios para saúde
pública a partir de um estudo de caso
Bethânia Almeida
9a Conferência Luso Brasileira de Acesso Aberto
Lisboa, 02-04 de Outubro de 2018
2. Agenda
• Ciência Aberta: aspirações e foco atual
• Gestão e Abertura de Dados
• Dados de Pesquisa e Dados Governamentais
• Dados Administrativos e Saúde Pública
• Estudo de Caso
3. Ciência Aberta: aspirações e foco atual
(...) Ciência Aberta é mais do que a disponibilização em
acesso aberto de dados e publicações, é a abertura do
processo científico enquanto um todo, reforçando o
conceito de responsabilidade social científica.
É concebida como uma nova forma de produzir e partilhar o
conhecimento entre a comunidade científica e a sociedade em
geral, possibilitando ampliar o reconhecimento e o impacto social
e econômico da ciência.
Fonte: MCTES. Portugal, 2016. Disponível em:
http://www.ciencia-aberta.pt/sobre-ciencia-aberta
4. Ciência Aberta: aspirações e foco atual
• Devido à complexidade da Ciência Aberta, nota-se que atualmente as
suas práticas se concentraram principalmente em dois aspectos: acesso
aberto a publicações científicas e, mais recentemente, abertura de
dados.
5. Ciência Aberta: aspirações e foco atual
- Nos últimos anos, o acesso a dados de pesquisa financiadas com
recursos públicos tornou-se uma das principais propostas da Ciência
Aberta.
- Dados sempre foram ativos importantes para produção de
conhecimento, cuja aquisição e tratamento para análise demandam a
maior parte do tempo e dos recursos financeiros destinados às
pesquisas.
6. Gestão e Abertura de Dados
- A solicitação de planos de gestão de dados (PGD) por agências de
financiamento tem sido instrumental para sensibilizar pesquisadores,
pois passaram a apresentar propostas/compromissos sobre a coleta,
tratamento, análise, acesso e preservação dos dados que embasam as
suas pesquisas.
- Verifica-se certo consenso acerca dos requisitos para gestão, acesso,
compartilhamento e reutilização de dados gerados por projetos de
pesquisa nos PGD.
7. Dados de Pesquisa e Dados Governamentais - Administrativos
- Dados coletados ou armazenados pelo governo diferem de dados
gerados por projetos de pesquisa.
- Especificamente no caso de dados administrativos, registros de
informações individuais obtidos por departamento ou agência do
governo em seus serviços rotineiros a exemplo de registros escolares e
informações sobre saúde, são fontes de dados importantes para
pesquisas e geração de evidências para políticas públicas.
8. Dados de Pesquisa e Dados Governamentais - Administrativos
- O acesso a dados administrativos com finalidade de pesquisa é restrito
em muitos países para manter a confidencialidade, proteger a
privacidade individual, respeitar os termos de consentimento e
gerenciar a segurança da informação dos cidadãos. Tendo, portanto,
desafios de ordem ética e legal para aderir aos princípios da Ciência
Aberta.
9. Dados Administrativos e Saúde Pública
• Ressalta-se que o uso de dados administrativos, principalmente quando
integrados com dados de outras fontes, torna possível elucidar efeitos
de fatores combinados que afetam a saúde de populações.Nesses casos,
dados individualizados são necessários.
11. Dados Administrativos e Saúde Pública
• Os potenciais benefícios de ampliar conhecimentos e gerar evidências
que subsidiem decisões regulatórias e de políticas públicas na área da
saúde são reconhecidos para o acesso e uso de dados pessoais para a
pesquisa em algumas legislações, desde que empregadas medidas
técnicas e administrativas de segurança para evitar a violação da
privacidade dos indivíduos. Exemplos recentes:
- Regulamento Geral de Proteção de Dados Pessoais da União Europeia
(GDPR);
- Lei Geral de Proteção de Dados Pessoais do Brasil.
12. Dados Administrativos e Saúde Pública
- A vinculação de dados com finalidade de pesquisa suscita muitos
desafios para equilibrar direitos individuais e benefício público (saúde
pública entendida como direito coletivo).
13. Estudo de Caso
Criado em Dezembro de 2016, o Centro de Integração de Dados e
Conhecimentos para Saúde da Fiocruz (Cidacs) enfrenta desafios para
desenvolver uma plataforma de dados integrados para pesquisa com segurança
da informação, ética e privacidade. Desafios que implicam na concepção e
implementação de métodos, técnicas e protocolos para:
• Receber, tratar e processar grande volume de dados, aspectos que incluem
vinculação, estimativa de acurácia, extração e anonimização;
• Armazenar, catalogar e preservar datasets;
• Acessar os dados vinculados e anonimizados;
• Desenvolver métodos para análise.
15. Estudo de Caso
• A Plataforma de Dados foi projetada para preservar a confidencialidade por
meio de uma combinação de configurações físicas e virtuais que restringem
a possibilidade de reidentificação de indivíduos de acordo com
considerações para ambientes seguros de vinculação de dados, incluindo a
separação de processos de vinculação e análise.
• Após receber autorização para usar os bancos de dados administrativos
necessários para os projetos de pesquisa propostos, conforme aprovação
prévia por um comitê de ética, os dados são recebidos com protocolos de
segurança da informação e ingeridos na Plataforma.
16. Estudo de Caso
• A preparação e processamento dos dados envolvem áreas de ciência de dados, curadoria digital e
estatística visando garantir a qualidade e acurácia dos dados vinculados e anonimizados. Processos
descritos detalhadamente em metadados, incluindo informações estatísticas.
• Os pesquisadores têm permissão apenas para acessar, de forma controlada, variáveis de dados
codificados e não identificados relevantes para suas respectivas pesquisas presencialmente ou via
Rede Virtual Privativa com provimento de ferramentas de visualização e análise, mediante
assinatura de termos de responsabilidade com condições de uso. No momento, somente os
projetos de pesquisa de membros internos e colaboradores são considerados qualificados para usar
os bancos de dados vinculados e anonimizados.
• Ainda em 2018 serão publicados metadados com identificadores persistentes acompanhados de
termos e condições para acesso aos dados em si. Desse modo, a existência e descrição dos dados
tornam-se públicas e, quando viável, será fornecido acesso controlado aos dados em questão.
Aspectos convergentes com os princípios FAIR, adotados como padrão internacional para gestão de
dados na perspectiva da Ciência Aberta.
17. Considerações
• A gestão de dados no Cidacs leva em consideração bases legais e
éticas no recebimento e tratamento de dados bem como nos termos
e condições de acesso e uso dos dados vinculados e anonimizados.
• Adicionalmente, passou a empreender esforços para viabilizar o
acesso e reutilização dos dados produzidos em formatos aderentes
aos princípios da Ciência Aberta, que reconhece a distinção entre a
abertura de metadados e dados para apoiar uma ampla gama de
circunstâncias especiais.
18. BETHÂNIA DE ARAÚJO ALMEIDA
bethania.almeida@fiocruz.br
baraujo2010@gmail.com