PRESERVAÇÃO E CURADORIA
DE DADOS CIENTÍFICOS
http://cariniana.ibict.br Miguel Angel Márdero Arellano – Coordenador da rede Cariniana
Miguel Angel Márdero Arellano – Coordenador da rede Cariniana
GESTÃO
POLÍTICAS
PRESERVAÇÃO
CURADORIA
INFRAESTRUTURA
CAPACITAÇÃO
FINANCIAMENTO
http://cariniana.ibict.br
O papel do pesquisador e o papel da instituição de pesquisa
Gestão dos dados científicos
Que são Dados científicos
"...qualquer informação que possa ser
armazenada em formato digital,
incluindo texto, números, imagens,
vídeos ou filmes, áudio, software,
algoritmos, equações, animações,
modelos, simulações, etc.“
(National Science Board, Long-lived
digital data collections, 2005)
Dados FAIR
Facilmente encontráveis – Acessíveis – Interoperáveis – Reusáveis
Para serem facilmente encontráveis, os dados devem ser descritos
adequadamente, usando taxonomias e ontologias padrão sempre que
possível. Para serem acessíveis, os dados de pesquisas idealmente devem
ser abertos, disponíveis para compartilhamento e reutilização.
Nem todos os dados de pesquisas podem ser abertos, mas a boa prática
indica que esses dados devem ser “tão abertos quanto possível, e tão
protegidos quanto necessário”.
Dados FAIR
Facilmente encontráveis – Acessíveis – Interoperáveis – Reusáveis
Os dados de pesquisas também devem ser interoperáveis, capazes de
serem processados por máquinas usando vocabulários que seguem os
princípios FAIR. Para serem reusáveis, os metadados que descrevem os
dados devem cumprir padrões das comunidades relevantes ao domínio.
https://www.force11.org/group/fairgroup/fairprinciples
Responsáveis pelos dados científicos
 Criador de dados - em primeiro lugar!
 Especialistas em Curadoria
 Bibliotecários
 Arquivistas
 Bibliotecários de metadados
 Especialistas da área
Responsáveis pelos dados científicos
Pesquisadores
Indiretamente - eles têm o contato mais direto com a fase de
criação e entendem como os dados podem ser usados
Diretamente - às vezes responsável pela manutenção da
coleta de dados da comunidade
Profissionais da informação
Às vezes, mas depende do contexto
Profissionais de TI
Principalmente informáticos que trabalham com cientistas
Responsáveis pelos dados científicos
Os pesquisadores devem planejar a
coleta, curadoria, descrição e
disseminação dos dados no início da
pesquisa. A melhor maneira de
captar essa informação é mediante
um plano de gestão dos dados de
pesquisas, que proporciona um
quadro para a administração dos
dados de pesquisa.
Plano de gestão de dados científicos
Plano de gestão de dados científicos
http://vimeo.com/82408192
Instituições de pesquisa
Existe uma grave lacuna no nível de
preparação entre organizações de
pesquisa ao lidar com grandes volumes
de dados. Essa lacuna é proeminente em
áreas como formulação de políticas,
conscientização acerca das questões
atuais, desenvolvimento de habilidades,
capacitação, custos, construção de
comunidades, governança, diferenças
disciplinares, jurídicas, terminológicas e
geográficas.
Repositórios de dados científicos
A existência de várias centenas de
repositórios institucionais em estágio
de produção, não assegura, contudo,
a sua capacidade de abrigar,
preservar e dar acesso a conjuntos
de dados científicos.
Repositórios de dados científicos
A existência de várias centenas
de repositórios institucionais em
estágio de produção, não
assegura, contudo, a sua
capacidade de abrigar,
preservar e dar acesso a
conjuntos de dados científicos.
Estado da Arte
Repositórios de dados de pesquisa
Elaboração de políticas de gestão
Políticas de repositórios de dados de pesquisa
Política de dados científicos
Toda organização de pesquisa deve ter
uma política de dados de pesquisas,
que inclua um esquema de gestão dos
dados de pesquisas. Os financiadores
das pesquisas também devem ter uma
política de dados de pesquisas,
estipulando as obrigações que um
pesquisador deve cumprir como
condição do financiamento.
Um serviço inovador
Preservação de dados científicos
Serviço de preservação de dados
 Migração de dados para o
melhor formato
 Migração dados para um meio
adequado
 Backup e armazenamento de
dados
 Criação de metadados e
documentação
 Arquivo confiável de dados
Serviço de preservação de dados
Ações de preservação (preservation actions) são tomadas para garantir a
viabilidade e disponibilidade da informação digital em longo prazo,
atestando autoridade sobre a natureza do dado. Ações de preservação
devem garantir que o material permaneça autêntico, confiável e utilizável
enquanto sua integridade é mantida.
Serviço de preservação de dados
Tais ações incluem a validação, a atribuição de metadados de preservação,
atribuindo representação à informação e garantindo estruturas de dados e
formatos de arquivo aceitáveis. Autenticação (authentication) por sua vez
são medidas de segurança projetadas para estabelecer a veracidade da
informação desde a origem ou meio de transmissão, bem como, da
autoridade de um indivíduo para fornecer informações.
Política de preservação digital de dados
 Para resumir a abordagem institucional com relação ao arquivamento seguro
das suas coleções digitais.
 Para explicar como a sua aplicação servirá para atender às necessidades de
confiabilidade, autenticidade e acessibilidade a esses documentos.
 Para orientar o uso e os direitos de salvaguarda dos acervos digitais.
 Para explicar como uma comunidade se encaixa na estratégia global de
preservação digital.
Metadados
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositório de Dados Científicos
A prática da gestão de dados e seu impacto
Curadoria de dados científicos
Curadoria em repositórios digitais
A necessidade de conjugar a dimensão institucional (muito
ampla e multidisciplinar no caso das universidades) com a
dimensão disciplinar (requisitos específicos) constitui um dos
principais desafios à utilização dos repositórios institucionais
como componente fundamental na infraestrutura global de
curadoria dos dados científicos
Curadoria de dados científicos
 Trata das atividades de gestão requeridas para manter dados de
pesquisa a longo prazo de modo que esteja disponível para o reuso
e para a preservação.
 Em termos amplos, curadoria significa uma gama de atividades e
processos feitos para criar, gerir, manter e validar um componente
científico;
 A curadoria de dados trata da preservação da informação
científica.
Curadoria em repositórios digitais
A gestão de dados está relacionada
aos cuidados de dados de pesquisa
e comunicação científica apoiada
por uma infraestrutura que coordena
as atividades de curadoria.
A curadoria de dados é definida
como um conjunto de atividades
repetidas com foco em tratamento
dos dados e criação de produtos
dos dados dentro de uma área
particular.
Curadoria em repositórios digitais
A curadoria de dados designa o conjunto de ações que
garante que um conjunto de dados é genuíno, permitindo o
seu uso por outros que não os seus produtores.
A curadoria pode envolver ações de descrição dos dados,
de ligação destes a outros dados que os tornem inteligíveis,
de registro dos usos e resultados.
Auditoria de repositórios de dados
Auditoria de Dados fornece às organizações os meios para
identificar, localizar problemas e avaliar a gestão atual de seus
ativos de dados de pesquisa. Dentro da estrutura da auditoria,
com informações adequadas, podem encontrar meios para
melhorar a gestão de dados em curso.
Auditoria e certificação de repositórios de dados
Auditoria e certificação de repositórios de dados
As imagens também podem ser apresentadas de modo mais enfático em tela larga.
Infraestrutura de repositórios de dados científicos
Ecossistemas digitais
As plataformas de gestão de dados científicos devem oferecer
os seguintes serviços:
 armazenamento, para pesquisadores que coletam dados;
 plataforma de publicação, onde os dados de pesquisas e respectivos softwares
podem ser disponibilizados para compartilhamento e reutilização;
 serviços de arquivo, para permitir a curadoria dos dados de pesquisas no longo
prazo, em geral como resposta às exigências dos financiadores da pesquisa;
 um serviço de descoberta, que permite que os pesquisadores e cidadãos busquem
depósitos de dados de pesquisas localmente e em toda a Internet.
Repositórios de dados científicos
As imagens também podem ser apresentadas de modo mais enfático em tela larga.
Capacitação de curadores de dados científicos
Competências em ambientes de dados científicos
A prevalência de dados de pesquisas requer que todos os
pesquisadores, novos e estabelecidos, se equipem com
habilidades e ferramentas para serem confiantes num
ambiente baseado em dados. A liderança deve ser
assumida por organizações de pesquisa e, em muitos casos,
por suas bibliotecas institucionais.
Competências em ambientes de dados científicos
Novos papéis para as Bibliotecas e novos perfis profissionais
são demandados para garantir a autenticidade do registro e
tratamento adequado dos dados, considerando que os
pesquisadores, por si só, não são as pessoas adequadas para
assegurar a preservação e o acesso continuado aos dados
que produzem e disponiblizam.
Competências em ambientes de dados científicos
As suas competências concentram-se essencialmente no domínio
da pesquisa e “novos” profissionais estão surgindo com
conhecimentos no domínio científico dos dados (cientista de
dados) e formação específica sobre tratamento do dado na
área da informação (bibliotecário de dados) incluindo
curadoria de dados.
As imagens também podem ser apresentadas de modo mais enfático em tela larga.
Financiamento de repositórios de dados científicos
Cálculo de custos
A gestão dos dados de pesquisas
tem múltiplos custos. Não há um
método único para avaliar esses
custos, mas existem vários modelos
de cálculo de custos que podem
ajudar, por exemplo, o projeto 4C.
IBICT
Serviço de preservação de dados de pesquisa da rede Cariniana
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositórios de Dados Científicos
Os Serviços do Repositório de Dados Científicos
Os Serviços do Repositório de Dados Científicos
http://repositoriopesquisas.ibict.br
Os Serviços do Repositório de Dados Científicos
3ª Reunião Técnica dos Usuários do Repositório
Dataverse, Ibict, Brasília, DF. 25 de agosto de 2017.
Os Serviços do Repositório de Dados Científicos
http://demodataverse.ibict.br
Bibliografia básica
http://learn-rdm.eu/wp-content/uploads/RDMToolkit.pdf
PRESERVAÇÃO E CURADORIA
DE DADOS CIENTÍFICOS
http://cariniana.ibict.br Miguel Angel Márdero Arellano – Coordenador da rede Cariniana

Preservação e Curadoria de Dados Científicos

  • 1.
    PRESERVAÇÃO E CURADORIA DEDADOS CIENTÍFICOS http://cariniana.ibict.br Miguel Angel Márdero Arellano – Coordenador da rede Cariniana
  • 2.
    Miguel Angel MárderoArellano – Coordenador da rede Cariniana GESTÃO POLÍTICAS PRESERVAÇÃO CURADORIA INFRAESTRUTURA CAPACITAÇÃO FINANCIAMENTO http://cariniana.ibict.br
  • 3.
    O papel dopesquisador e o papel da instituição de pesquisa Gestão dos dados científicos
  • 4.
    Que são Dadoscientíficos "...qualquer informação que possa ser armazenada em formato digital, incluindo texto, números, imagens, vídeos ou filmes, áudio, software, algoritmos, equações, animações, modelos, simulações, etc.“ (National Science Board, Long-lived digital data collections, 2005)
  • 5.
    Dados FAIR Facilmente encontráveis– Acessíveis – Interoperáveis – Reusáveis Para serem facilmente encontráveis, os dados devem ser descritos adequadamente, usando taxonomias e ontologias padrão sempre que possível. Para serem acessíveis, os dados de pesquisas idealmente devem ser abertos, disponíveis para compartilhamento e reutilização. Nem todos os dados de pesquisas podem ser abertos, mas a boa prática indica que esses dados devem ser “tão abertos quanto possível, e tão protegidos quanto necessário”.
  • 6.
    Dados FAIR Facilmente encontráveis– Acessíveis – Interoperáveis – Reusáveis Os dados de pesquisas também devem ser interoperáveis, capazes de serem processados por máquinas usando vocabulários que seguem os princípios FAIR. Para serem reusáveis, os metadados que descrevem os dados devem cumprir padrões das comunidades relevantes ao domínio. https://www.force11.org/group/fairgroup/fairprinciples
  • 7.
    Responsáveis pelos dadoscientíficos  Criador de dados - em primeiro lugar!  Especialistas em Curadoria  Bibliotecários  Arquivistas  Bibliotecários de metadados  Especialistas da área
  • 8.
    Responsáveis pelos dadoscientíficos Pesquisadores Indiretamente - eles têm o contato mais direto com a fase de criação e entendem como os dados podem ser usados Diretamente - às vezes responsável pela manutenção da coleta de dados da comunidade Profissionais da informação Às vezes, mas depende do contexto Profissionais de TI Principalmente informáticos que trabalham com cientistas
  • 9.
    Responsáveis pelos dadoscientíficos Os pesquisadores devem planejar a coleta, curadoria, descrição e disseminação dos dados no início da pesquisa. A melhor maneira de captar essa informação é mediante um plano de gestão dos dados de pesquisas, que proporciona um quadro para a administração dos dados de pesquisa.
  • 10.
    Plano de gestãode dados científicos
  • 11.
    Plano de gestãode dados científicos http://vimeo.com/82408192
  • 12.
    Instituições de pesquisa Existeuma grave lacuna no nível de preparação entre organizações de pesquisa ao lidar com grandes volumes de dados. Essa lacuna é proeminente em áreas como formulação de políticas, conscientização acerca das questões atuais, desenvolvimento de habilidades, capacitação, custos, construção de comunidades, governança, diferenças disciplinares, jurídicas, terminológicas e geográficas.
  • 13.
    Repositórios de dadoscientíficos A existência de várias centenas de repositórios institucionais em estágio de produção, não assegura, contudo, a sua capacidade de abrigar, preservar e dar acesso a conjuntos de dados científicos.
  • 14.
    Repositórios de dadoscientíficos A existência de várias centenas de repositórios institucionais em estágio de produção, não assegura, contudo, a sua capacidade de abrigar, preservar e dar acesso a conjuntos de dados científicos.
  • 15.
    Estado da Arte Repositóriosde dados de pesquisa
  • 16.
    Elaboração de políticasde gestão Políticas de repositórios de dados de pesquisa
  • 17.
    Política de dadoscientíficos Toda organização de pesquisa deve ter uma política de dados de pesquisas, que inclua um esquema de gestão dos dados de pesquisas. Os financiadores das pesquisas também devem ter uma política de dados de pesquisas, estipulando as obrigações que um pesquisador deve cumprir como condição do financiamento.
  • 18.
  • 19.
    Serviço de preservaçãode dados  Migração de dados para o melhor formato  Migração dados para um meio adequado  Backup e armazenamento de dados  Criação de metadados e documentação  Arquivo confiável de dados
  • 20.
    Serviço de preservaçãode dados Ações de preservação (preservation actions) são tomadas para garantir a viabilidade e disponibilidade da informação digital em longo prazo, atestando autoridade sobre a natureza do dado. Ações de preservação devem garantir que o material permaneça autêntico, confiável e utilizável enquanto sua integridade é mantida.
  • 21.
    Serviço de preservaçãode dados Tais ações incluem a validação, a atribuição de metadados de preservação, atribuindo representação à informação e garantindo estruturas de dados e formatos de arquivo aceitáveis. Autenticação (authentication) por sua vez são medidas de segurança projetadas para estabelecer a veracidade da informação desde a origem ou meio de transmissão, bem como, da autoridade de um indivíduo para fornecer informações.
  • 22.
    Política de preservaçãodigital de dados  Para resumir a abordagem institucional com relação ao arquivamento seguro das suas coleções digitais.  Para explicar como a sua aplicação servirá para atender às necessidades de confiabilidade, autenticidade e acessibilidade a esses documentos.  Para orientar o uso e os direitos de salvaguarda dos acervos digitais.  Para explicar como uma comunidade se encaixa na estratégia global de preservação digital.
  • 23.
  • 24.
    Os Serviços doRepositório de Dados Científicos
  • 25.
    Os Serviços doRepositório de Dados Científicos
  • 26.
    Os Serviços doRepositório de Dados Científicos
  • 27.
    A prática dagestão de dados e seu impacto Curadoria de dados científicos
  • 28.
    Curadoria em repositóriosdigitais A necessidade de conjugar a dimensão institucional (muito ampla e multidisciplinar no caso das universidades) com a dimensão disciplinar (requisitos específicos) constitui um dos principais desafios à utilização dos repositórios institucionais como componente fundamental na infraestrutura global de curadoria dos dados científicos
  • 29.
    Curadoria de dadoscientíficos  Trata das atividades de gestão requeridas para manter dados de pesquisa a longo prazo de modo que esteja disponível para o reuso e para a preservação.  Em termos amplos, curadoria significa uma gama de atividades e processos feitos para criar, gerir, manter e validar um componente científico;  A curadoria de dados trata da preservação da informação científica.
  • 30.
    Curadoria em repositóriosdigitais A gestão de dados está relacionada aos cuidados de dados de pesquisa e comunicação científica apoiada por uma infraestrutura que coordena as atividades de curadoria. A curadoria de dados é definida como um conjunto de atividades repetidas com foco em tratamento dos dados e criação de produtos dos dados dentro de uma área particular.
  • 31.
    Curadoria em repositóriosdigitais A curadoria de dados designa o conjunto de ações que garante que um conjunto de dados é genuíno, permitindo o seu uso por outros que não os seus produtores. A curadoria pode envolver ações de descrição dos dados, de ligação destes a outros dados que os tornem inteligíveis, de registro dos usos e resultados.
  • 32.
    Auditoria de repositóriosde dados Auditoria de Dados fornece às organizações os meios para identificar, localizar problemas e avaliar a gestão atual de seus ativos de dados de pesquisa. Dentro da estrutura da auditoria, com informações adequadas, podem encontrar meios para melhorar a gestão de dados em curso.
  • 33.
    Auditoria e certificaçãode repositórios de dados
  • 34.
    Auditoria e certificaçãode repositórios de dados
  • 35.
    As imagens tambémpodem ser apresentadas de modo mais enfático em tela larga. Infraestrutura de repositórios de dados científicos
  • 36.
    Ecossistemas digitais As plataformasde gestão de dados científicos devem oferecer os seguintes serviços:  armazenamento, para pesquisadores que coletam dados;  plataforma de publicação, onde os dados de pesquisas e respectivos softwares podem ser disponibilizados para compartilhamento e reutilização;  serviços de arquivo, para permitir a curadoria dos dados de pesquisas no longo prazo, em geral como resposta às exigências dos financiadores da pesquisa;  um serviço de descoberta, que permite que os pesquisadores e cidadãos busquem depósitos de dados de pesquisas localmente e em toda a Internet.
  • 37.
  • 38.
    As imagens tambémpodem ser apresentadas de modo mais enfático em tela larga. Capacitação de curadores de dados científicos
  • 39.
    Competências em ambientesde dados científicos A prevalência de dados de pesquisas requer que todos os pesquisadores, novos e estabelecidos, se equipem com habilidades e ferramentas para serem confiantes num ambiente baseado em dados. A liderança deve ser assumida por organizações de pesquisa e, em muitos casos, por suas bibliotecas institucionais.
  • 40.
    Competências em ambientesde dados científicos Novos papéis para as Bibliotecas e novos perfis profissionais são demandados para garantir a autenticidade do registro e tratamento adequado dos dados, considerando que os pesquisadores, por si só, não são as pessoas adequadas para assegurar a preservação e o acesso continuado aos dados que produzem e disponiblizam.
  • 41.
    Competências em ambientesde dados científicos As suas competências concentram-se essencialmente no domínio da pesquisa e “novos” profissionais estão surgindo com conhecimentos no domínio científico dos dados (cientista de dados) e formação específica sobre tratamento do dado na área da informação (bibliotecário de dados) incluindo curadoria de dados.
  • 42.
    As imagens tambémpodem ser apresentadas de modo mais enfático em tela larga. Financiamento de repositórios de dados científicos
  • 43.
    Cálculo de custos Agestão dos dados de pesquisas tem múltiplos custos. Não há um método único para avaliar esses custos, mas existem vários modelos de cálculo de custos que podem ajudar, por exemplo, o projeto 4C.
  • 44.
    IBICT Serviço de preservaçãode dados de pesquisa da rede Cariniana
  • 46.
    Os Serviços doRepositório de Dados Científicos
  • 47.
    Os Serviços doRepositório de Dados Científicos
  • 48.
    Os Serviços doRepositório de Dados Científicos
  • 49.
    Os Serviços doRepositórios de Dados Científicos
  • 50.
    Os Serviços doRepositório de Dados Científicos
  • 51.
    Os Serviços doRepositório de Dados Científicos http://repositoriopesquisas.ibict.br
  • 52.
    Os Serviços doRepositório de Dados Científicos 3ª Reunião Técnica dos Usuários do Repositório Dataverse, Ibict, Brasília, DF. 25 de agosto de 2017.
  • 53.
    Os Serviços doRepositório de Dados Científicos http://demodataverse.ibict.br
  • 54.
  • 55.
    PRESERVAÇÃO E CURADORIA DEDADOS CIENTÍFICOS http://cariniana.ibict.br Miguel Angel Márdero Arellano – Coordenador da rede Cariniana