O documento resume os resultados de um projeto sobre acesso aberto a dados de pesquisa no Brasil. Ele identificou repositórios brasileiros, levantou práticas de pesquisadores, desenvolveu uma comunidade online e analisou soluções tecnológicas. O projeto mostrou que iniciativas de compartilhamento de dados abertos no Brasil ainda são poucas e requerem mais apoio público para se consolidarem.
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Acesso aberto a dados de pesquisa no Brasil
1. Rene Faustino Gabriel Junior(1), Rafael Port da Rocha(1), Sônia Elisa Caregnato(1),
Caterina Groposo Pavão(1), Paula Caroline Schifino Jardim Passos(1), Eduardo
Nunes Borges(1), Samile Andréa de Souza Vanz(1), Luís Alberto Barbosa
Azambuja(1))
(1)UFRGS; (2)FURG; - dadosabertos@rnp.br; cedap@ufrgs.br
Acesso Aberto a
Dados de Pesquisa no
Brasil
2. • Foi selecionado pela Rede Nacional de Ensino e Pesquisa (RNP), via
carta-convite RNP/IBICT, de 01/2017, entre outros 7 propostas;
• Hoje é um Grupo de Trabalho (GT) da RNP em parceria com IBICT;
• Atuou na identificação de práticas de Acesso Aberto a Dados de
Pesquisa (AADP) no Brasil e no desenvolvimento de experimentos
tecnológicos visando o planejamento de infraestrutura e futuros
serviços para dados de pesquisa.
2
Introdução: projeto RDP-Brasil
3. • A primeira parte do projeto foi desenvolvida por pesquisadores do
Centro de Documentação e Acervo Digital da Pesquisa (CEDAP) da
UFRGS e ao Centro de Ciências Computacionais (C3) da FURG.
• O CEDAP/UFRGS foi concebido em 2010 para apoiar “a gestão,
curadoria e disponibilização em rede de ativos de pesquisa da
UFRGS”, tendo sido financiado pelo Edital CT-INFRA 2010, da FINEP.
• Teve como objetivo geral realizar um levantamento de informações
que subsidiassem as primeiras ações no âmbito do AADP no país.
3
Introdução: CEDAP/UFRGS e C3/FURG
4. Objetivos
1) Identificar os repositórios brasileiros de AADP;
2) levantar as práticas e percepções dos
pesquisadores brasileiros sobre AADP;
3) desenvolver um portal website para reunir a
comunidade brasileira;
4) analisar as soluções tecnológicas mais utilizadas
no mundo;
5) desenvolver um protótipo para atender a um
conjunto de usuários selecionados.
4
5. Objetivo 1 – Resultados
(15 repositórios)
a) Quatro repositórios de abrangência internacional;
b) Onze nacionais, sendo cinco multi-institucionais;
c) predominam as áreas de geociências e ciências
biológicas e agrárias;
d) cinco divulgam políticas;
e) quadro informam os padrões de
metadados usados e
f) dois utilizam o DSpace e um o Dataverse.
I Workshop institucional sobre Ciência Aberta
5
6. Objetivo 1 - Identificação das atuais práticas de AADP em
instituições brasileiras
Repositórios Abrangência Instituição área
GLOBE - Global Collaboration Engine Intern. +INPE Solo, Bio, Geo, Oce
IODP - International Ocean Discovery Program Intern. +CAPES Oceano, Solo, Geo,Eco
PPBio Data Repository Intern. +CENBAM CV,Bio,Eco
WorldClim - Global Climate Data Intern. +CRIA Clima,Oce,Geo
BDC/UFPR - BD Científicos da UFPR Nasc. UFPR CCH,Bio,CN,Eng
Sistema Maxwell Nasc. PUC-Rio Enf, Fis
IBICT Nasc. IBICT CSH,CV,CN
CIS - Consórcio de Informações Sociais Nasc. USP,ANPOCS CS
IPAgriDados Nasc. Embrapa Ciências Agrárias
INMET - Instituto Nacional de Meteorologia Nasc. MAPA Dados Meteorológicos
IBGE - Instituto Brasileiro de Geografia e Estatística Nasc. IBGE Geo
BDEP - BD de Exploração e Produção Nasc. ANP,SGB Petroleo,Geo
Base Tuiuiu Nasc. Embrapa,IFMS Ar,Solo,Bio, Sensores
Repositório de dados PELD Nasc. Âmbito SiBBr Eco
Projeto speciesLink Nasc. CRIA,GBIF, .... CB,Coleções Científicas
15 Repositórios Analisados
7. Objetivo 2 – Resultados do
Survey
7
Questionário foi organizado no software Survey Monkey contendo:
• 8 questões demográficas
• 13 questões sobre as práticas dos pesquisadores
• 6 questões acerca das percepções em relação ao compartilhamento
e uso de dados de pesquisa.
Convite para participação foi enviado, em março de 2018, a um
Universo de 71.712 e-mails válidos:
• 48.335 líderes e 27.869 vice-líderes dos grupos de pesquisa
cadastrados no Diretório de Grupos de Pesquisa CNPq;
• 4.677 e-mails institucionais e de coordenadores dos PPGs
cadastrados na CAPES;
• 249 e-mails de coordenadores de INCT.
8. Objetivo 2 – Resultados
(4.735 respostas / 4.703 válidas)
68%
compartilharam dados
de alguma maneira
utilizaram dados abertos
compartilhados por
outros grupos
39,5%
utilizaram algum repositório
para acessar dados
31,7%
31,9% apontam a falta de infraestrutura como dificuldade para
compartilhamento e 21,4% a falta de padronização dos dados
47,7% apontam que a instituição do pesquisador deve oferecer serviços de
apoio à gestão dos dados de pesquisa
25,0% já elaboraram um plano de gestão de dados
8
9. Objetivo 3 – Resultados da
comunidade
https://dadosdepesquisa.rnp.br/
Migrou-se
https://www.rd-alliance.org
https://twitter.com/dadosdepesquisa
https://www.facebook.com/dados.depesquisa
11. Objetivo 4 - Levantamento comparativo dos serviços e
soluções tecnológicas para compartilhamento de dados
• Análise
• Qualitativa, Uso de Exemplos
• Softwares Analisados
• Software Livre, de “Prateleira”,
completa
• Em vários Repositórios de Dados
• Em Repositório Confiável
• Usado no Brasil
Solução
Tecnológica
Uso em
Repositório
de Dados
Repositórios
Confiáveis
TCS,DSA
Dataverse 69 3
DSpace 62 11
CKAN 52 0
Fedora 31 14
Eprints 31 0
Fonte: Diretório Re3Data, em 15/11/2018 - https://www.re3data.org
Dspace
Datashare
Dryad
HKU
Drum
Dataverse
Texas DR
Dataverse NL
Harvard DV
ODUM
CKAN
(front end)
DataBris
(+Zenodo)
12. Objetivo 4 - Critérios
Para analisar as soluções tecnológicas, elaboramos 56 critérios:
• Representação do Ambiente do Repositório (6);
• Representação dos Conjuntos de Dados (6);
• Descrição e Documentação dos Conjuntos de Dados (11);
• Produção dos Conjuntos de Dados (7);
• Armazenamento de Longo Prazo e Preservação (5);
• Acesso e Uso dos Conjuntos de Dados (15);
• Uso, Desenvolvimento e Manutenção do Software (6).
Os critérios foram estruturados com base no modelo OAIS e nos
critérios relativos ao desenvolvimento e uso de software.
12
13. Objetivo 4 - Resultados
Principais atributos
Ferramentas estudadas
DSpace Dataverse CKAN
Código aberto
Ambiente web
Desenvolvimento Java
Interface multilíngue
Princípios OAIS
Desenvolvimento específico para dados de pesquisa
Inclusão de qualquer tipo de material digital
Hierarquização de conteúdos
Organização dos dados em datasets
Registro e autenticação de usuários
Políticas específicas por comunidade, usuários, submissão e acesso
Data Research and Information Management (DRIM)
Busca e a interoperabilidade semântica
Protocolo OAI-PMH
Princípios FAIR
Metadados de citação
Versionamento de dados de pesquisa
Identificador persistente (DOI, Handle)
Esquemas de metadados específicos (Perfil de Aplicação)
Application programming interface (API) para facilitar: pesquisa,
depósito, acesso e visualização dos dados armazenados
Comunidade no Re3data (no. de repositórios) 61 69 51
15. Os princípios FAIR indicam que os dados devem:
Localizáveis (Findable)
Acessíveis (Accessible)
Interoperáveis (Interoperable)
Reusáveis (Reusable)
Possuir identificadores únicos, persistentes
e globais.
Ser descritos por metadados indexáveis e
ricos.
Ser recuperáveis pelo seu identificador, por
meio de protocolo de comunicação
padronizado, aberto e gratuito.
Ser representados em linguagens formais.
Usar vocabulários controlados que sigam
princípios FAIR.
Ligar (meta)dados.
Ser aceitos pela comunidade.
Conter atributos relevantes, precisos e úteis,
Incluir metadados de proveniência.
Conter licenças claras e acessíveis.
15
16. 16
Relatórios disponíveis em acesso aberto no Repositório Lume /UFRGS
http://hdl.handle.net/10183/185195
http://hdl.handle.net/10183/185138
http://hdl.handle.net/10183/185126
práticas e
percepções dos
pesquisadores
repositórios
brasileiros de dados
de pesquisa
soluções
tecnológicas para
compartilhamento de
dados no Brasil
17. Relatórios do projeto:
• Instalação do Dataverse (Ubuntu e Debian9)
• Biblioteca de tradução do Dataverse v.5.15.1
(Português)
• Indicadores persistentes no Dataverse
• Grupos Nacionais do Portal RDA
17
Dados abertos do questionário:
https://dadosabertos.rnp.br/dataset.xhtml?
persistentId=hdl:20.500.12401/4
Acesso aberto a dados de pesquisa no
Brasil : práticas e percepções dos
pesquisadores
18. 18
Considerações Finais
O estudo foi pioneiro na investigação do AADP no Brasil;
Contribuiu para iniciativas governamentais, como o compromisso de
“Estabelecer mecanismos de governança de dados científicos para o
avanço da ciência aberta no Brasil”, assumido pelo Brasil na Parceria de
Governo Aberto (OGP), através do seu Quarto Plano de Ação.
O estudo sobre o AADP no Brasil demonstrou não somente que
iniciativas institucionais de compartilhamento de dados abertos de
pesquisa no Brasil ainda são poucas, mas também que esforços públicos
são necessários para concretizar e consolidar tais iniciativas.
A ciência aberta não depende só de soluções tecnológicas, mas
também de uma mudança cultural.
19. “Os dados são preciosos e
durarão mais que os próprios
sistemas”
Obrigado
Tim Berners-Lee (2006). Disponível em : https://www.bcs.org/content/ConWebDoc/3337. Acesso
em: 09/04/2019. 19