Apresentação sobre orientações de uso do repositório Dataverse da Rede Cariniana. IV Reunião Técnica da Rede de Brasileira de Repositórios Dataverse, Ibict, Braília, DF. 25 de agosto de 2017
3. Repositórios Digitais
Os repositórios digitais são bases de dados que reúnem
de maneira organizada a produção científica de uma
instituição ou área temática. Armazenam arquivos de
diversos formatos e proporcionam maior visibilidade
aos resultados de pesquisas e possibilitam a
preservação da memória científica de sua instituição.
4. Repositórios de dados científicos
A existência de várias centenas
de repositórios institucionais
em estágio de produção, não
assegura, contudo, a sua
capacidade de abrigar,
preservar e dar acesso a
conjuntos de dados científicos.
5. Que são Dados científicos
"...qualquer informação que possa ser armazenada em
formato digital, incluindo texto, números, imagens,
vídeos ou filmes, áudio, software, algoritmos, equações,
animações, modelos, simulações, etc.“
(National Science Board, Long-lived digital data collections,
2005)
6. Segundo Dudziak (2016) são os materiais comumente
registrados e aceitos na comunidade científica como
necessários para validar os resultados de pesquisa.
Exemplo: fatos e estatísticas recolhidas para posterior
referência ou análise, documentos, questionários,
transcrições, áudios, vídeos, fotografias, coleção de objetos
digitais adquiridos e gerados durante o processo de
pesquisa, modelos, algoritmos, scripts, arquivos de log etc.
DUDZIAK, Elisabeth. Dados de Pesquisa agora devem ser armazenados e citados. 2016.
Disponível em: <http://www.sibi.usp.br/?p=6189> Acesso em: 18 ago. 2017.
Que são Dados científicos
7. Dados FAIR
Facilmente encontráveis – Acessíveis – Interoperáveis – Reusáveis
Para serem facilmente encontráveis, os dados devem ser descritos
adequadamente, usando taxonomias e ontologias padrão sempre
que possível. Para serem acessíveis, os dados de pesquisas
idealmente devem ser abertos, disponíveis para compartilhamento
e reutilização.
Nem todos os dados de pesquisas podem ser abertos, mas a boa
prática indica que esses dados devem ser “tão abertos quanto
possível, e tão protegidos quanto necessário”.
8. Dados FAIR
Facilmente encontráveis – Acessíveis – Interoperáveis –
Reusáveis
Os dados de pesquisas também devem ser interoperáveis,
capazes de serem processados por máquinas usando vocabulários
que seguem os princípios FAIR. Para serem reusáveis, os
metadados que descrevem os dados devem cumprir padrões das
comunidades relevantes ao domínio.
https://www.force11.org/group/fairgroup/fairprinciples
9. O papel do pesquisador e o papel da instituição de pesquisa
Gestão dos dados científicos
10. Responsabilidade do pesquisador
Os pesquisadores devem planejar a coleta, curadoria,
descrição e disseminação dos dados no início da pesquisa.
A melhor maneira de captar essa informação é mediante
um plano de gestão dos dados de pesquisas, que
proporciona um quadro para a administração dos dados de
pesquisa.
12. Plano de gestão de dados científicos
http://vimeo.com/82408192
13. Responsabilidade das Instituições de pesquisa
Existe uma grave lacuna no nível de preparação entre
organizações de pesquisa ao lidar com grandes volumes de
dados. Essa lacuna é proeminente em áreas como formulação de
políticas, conscientização acerca das questões atuais,
desenvolvimento de habilidades, capacitação, custos, construção
de comunidades, governança, diferenças disciplinares, jurídicas,
terminológicas e geográficas.
15. Política gestão de dados científicos
Toda organização de pesquisa deve ter uma política de
dados de pesquisas, que inclua um esquema de gestão
dos dados de pesquisas. Os financiadores das pesquisas
também devem ter uma política de dados de pesquisas,
estipulando as obrigações que um pesquisador deve
cumprir como condição do financiamento.
16. Política de preservação digital de dados
– Para resumir a abordagem institucional com relação ao
arquivamento seguro das suas coleções digitais.
– Para explicar como a sua aplicação servirá para atender às
necessidades de confiabilidade, autenticidade e
acessibilidade a esses documentos.
– Para orientar o uso e os direitos de salvaguarda dos
acervos digitais.
– Para explicar como uma comunidade se encaixa na
estratégia global de preservação digital.
19. Serviços das plataformas de gestão de dados científicos
– armazenamento, para pesquisadores que coletam dados;
– plataforma de publicação, onde os dados de pesquisas e
respectivos softwares podem ser disponibilizados para
compartilhamento e reutilização;
– serviços de arquivo, para permitir a curadoria dos dados de
pesquisas no longo prazo, em geral como resposta às
exigências dos financiadores da pesquisa;
– um serviço de descoberta, que permite que os
pesquisadores e cidadãos busquem depósitos de dados de
pesquisas localmente e em toda a Internet.
23. Curadoria em repositórios digitais
A necessidade de conjugar a dimensão
institucional (muito ampla e multidisciplinar no
caso das universidades) com a dimensão
disciplinar (requisitos específicos) constitui um
dos principais desafios à utilização dos
repositórios institucionais como componente
fundamental na infraestrutura global de
curadoria dos dados científicos
24. Curadoria de dados científicos
Trata das atividades de gestão requeridas para manter
dados de pesquisa a longo prazo de modo que esteja
disponível para o reuso e para a preservação.
Em termos amplos, curadoria significa uma gama de
atividades e processos feitos para criar, gerir, manter e
validar um componente científico;
A curadoria de dados trata da preservação da
informação científica.
25. Curadoria em repositórios digitais
A gestão de dados está relacionada
aos cuidados de dados de pesquisa
e comunicação científica apoiada
por uma infraestrutura que
coordena as atividades de
curadoria.
A curadoria de dados é definida
como um conjunto de atividades
repetidas com foco em tratamento
dos dados e criação de produtos dos
dados dentro de uma área
particular.
26. Curadoria em repositórios digitais
A curadoria de dados designa o conjunto de
ações que garante que um conjunto de dados
é genuíno, permitindo o seu uso por outros
que não os seus produtores.
A curadoria pode envolver ações de descrição
dos dados, de ligação destes a outros dados
que os tornem inteligíveis, de registro dos usos
e resultados.
38. Serviço de preservação de dados
– Migração de dados para o
melhor formato
– Migração dados para um
meio adequado
– Backup e armazenamento
de dados
– Criação de metadados e
documentação
– Arquivo confiável de dados
39. Serviço de preservação de dados
Ações de preservação (preservation actions) são tomadas
para garantir a viabilidade e disponibilidade da informação
digital em longo prazo, atestando autoridade sobre a
natureza do dado. Ações de preservação devem garantir
que o material permaneça autêntico, confiável e utilizável
enquanto sua integridade é mantida.
40. Serviço de preservação de dados
Tais ações incluem a validação, a atribuição de metadados de
preservação, atribuindo representação à informação e
garantindo estruturas de dados e formatos de arquivo
aceitáveis. Autenticação (authentication) por sua vez são
medidas de segurança projetadas para estabelecer a
veracidade da informação desde a origem ou meio de
transmissão, bem como, da autoridade de um indivíduo para
fornecer informações.
53. Para entrar no Dataverse acesse
repositoriopesquisas.ibict.br ou
pelo portal da Cariniana
(http://cariniana.ibict.br) no
menu serviços, conforme
imagem.
54.
55.
56. Ao clicar no menu
“dataverses” o usuário terá
acesso aos dataverses ,
dentro do dataverse
selecionado os conjuntos de
dados e dentro deles os
arquivos.
Navegação
57. Para realizar as buscas é possível
realizá-la na busca direta (simples)
ou restringindo a pesquisa em
“busca avançada”.
Ao selecionar a “busca avançada”, é
possível restringir sua pesquisa por
dados do dataverse, conjunto de
dados, arquivos. Conforme
ilustração abaixo:
Opções de busca
65. Requisitos
Para utilizar o Dataverse como pesquisador, o usuário deverá:
• Ter um projeto de pesquisa
• Informar seu projeto à coordenação da Rede e solicitar um
login como pesquisador
O Dataverse da Cariniana é direcionado aos:
• pesquisadores do IBICT;
• pesquisadores de Instituições Parceiras da Rede Cariniana;
• pesquisadores da rede de pesquisa Dríade;
• periódicos na plataforma OJS/SEER
66. Submissão de arquivos
Após inserir o login e senha, o pesquisador responsável deverá
criar um dataverse para seu dados de pesquisa, para tanto basta
selecionar:
Adicionar dados > Novo Dataverse ( ) e inserir as
informações solicitadas.
67. Submissão de arquivos
Após criar o dataverse, você poderá adicionar conteúdo nele ou
criar outro dataverse dentro deste. Para adicionar conteúdo ao
dataverse selecione:
Adicionar dados > Novo conjunto de dados ( ),
preencha as informações solicitadas e, por fim, selecione
arquivos para adicionar.
Durante sua criação, é possível preencher apenas as informações
básicas solicitadas e depois voltar para completá-las ou para
inserir arquivos.
68. Publicação
Após criados, é possível publicar o seu dataverse e seus conjuntos
de dados. Para tanto, basta abrir a página de seu dataverse e
selecionar Publicar ( ).
• É necessário publicar cada dataverse criado e cada conjunto de
dados individualmente, não sendo possível publicar todos
simultaneamente.
69. Permissões
A qualquer momento é possível restringir o acesso ao conteúdo
dos dados, bem como definir níveis de permissões para
determinados usuários. Para tanto selecione Editar > Permissões
e selecione suas preferências: