[1] O documento discute o projeto piloto de dados abertos no programa Horizonte 2020 da Comissão Europeia, apresentando detalhes sobre o escopo e requisitos do piloto.
[2] É explicado que os beneficiários dos projetos devem desenvolver Planos de Gestão de Dados para especificar quais dados serão abertos e como serão arquivados e preservados.
[3] Ferramentas como o DMPonline podem ajudar na criação desses planos, que devem ser atualizados periodicamente para refletir a evolução dos projet
Webinar OpenAIRE sobre Dados abertos no H2020 - projeto piloto de dados abertos de investigação no Horizonte 2020
1. DADOS ABERTOS NO H2020
projeto piloto dos dados de investigação abertos
WEBINAR – 5 DE ABRIL
Pedro Príncipe
pedroprincipe@sdum.uminho.pt
2. Tópicos
1.Do piloto Open Access no 7ºPQ ao
piloto dos Dados Abertos no H2020
2.Detalhes do projeto piloto dos dados
de investigação abertos no H2020
3.Planos de Gestão de Dados no piloto
de dados abertos do H2020
4.Repositórios de dados e o Zenodo
5. Dados científicos e os serviços de
apoio da infraestrutura OpenAIRE
2
4. Evolução do mandato OA da CE
Piloto OA do 7ºPQ (2008)
• Acordos com Claúsula Especial 39
• 20% das áreas do programa
• Depósito em repositórios
• Orientações OA do ERC: Depósito em
repositórios e periodo de embargo.
Horizonte 2020 (2014)
• Todos os acordos
• 100% das áreas do programa
• Depósito em Repositórios
• Projeto-piloto de Dados Abertos
4
5. OPEN ACCESS NO HORIZONTE 2020
CADA BENEFICIÁRIO DEVERÁ
ASSEGURAR O
ACESSO ABERTO
A TODAS AS PUBLICAÇÕES
CIENTÍFICAS COM REVISÃO
POR PARES RELATIVAS A
RESULTADOS DE PROJETOS.
Acesso Aberto definido como princípio geral no novo programa-quadro da CE
6. Open Access no Horizonte 2020
OPEN ACCESS DEFINIDO COMO
PRINCÍPIO GERAL NO HORIZONTE 2020
Multi-beneficiary General Model Grant Agreement
nas disposições aplicáveis no acordo de subvenção:
• artigo 29: ”Dissemination of results -
Open Access - Visibility of EU funding”
• 29.2 Open access to scientific publications;
• 29.3 Open access to research data
http://http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf
7. Excerto do “Model
Grant Agreement”
29.3 Acesso aberto aos
dados de investigação
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
8. EC Guidelines on Open
Access and Research Data
in Horizon 2020
Documento com orientações
para os benificiários dos
projetos financiados que
integram o piloto de dados
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
www.openaire.eu/opendatapilot
11. Piloto de dados abertos no H2020
• Quais as áreas científicas abrangidas pelo piloto?
• Qual o objetivo e âmbito do piloto?
• Que dados são abrangido?
• Quais são os requisitos?
• O que precisamos saber sobre gestão de dados?
Questões chave:
12. Projeto-piloto de Dados Científicos Abertos
12
• Áreas científicas abrangidas pelo projeto-piloto 2014-2015:
Future and Emerging Technologies
Research infrastructures – part e-Infrastructures
Leadership in enabling and industrial technologies – Information and Communication
Technologies
Societal Challenge: Secure, Clean and Efficient Energy – part Smart cities and communities
Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials –
except raw materials
Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies
Science with and for Society
(Projetos de outras áreas podem aderir voluntariamente).
13. Piloto de dados abertos no H2020
13
• Future and Emerging Technologies
• Research infrastructures – (new: coverage of the whole area)
• Leadership in enabling and industrial technologies – Information and Communication Technologies
• Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and
‘modelling’ topics (new)
• Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research
and the bioeconomy - selected topics as specified in the work programme (new)
• Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials
• Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies
• Science with and for Society
• Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP)
Áreas científicas abrangidas pelo projeto-piloto 2016-2017:
14. Piloto de dados abertos no H2020
14
• Future and Emerging Technologies
• Research infrastructures – (new: coverage of the whole area)
• Leadership in enabling and industrial technologies – Information and Communication Technologies
• Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and
‘modelling’ topics (new)
• Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research
and the bioeconomy - selected topics as specified in the work programme (new)
• Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials
• Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies
• Science with and for Society
• Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP)
Áreas científicas abrangidas pelo projeto-piloto 2016-2017:
PROJETOS DE OUTRAS ÁREAS SÃO ENCORAJADOS A ADERIR VOLUNTARIAMENTE.
15. Piloto de dados abertos no H2020
Projeto-piloto que visa melhorar e maximizar o acesso e a
reutilização dos dados de investigação gerados por projetos CE.
Objetivo:
15
EC: information already paid for by the public should not be paid for again.
Open data is data that is free to access and reuse
16. Piloto de dados abertos no H2020
• Dados, incluindo metadados associados, necessários para validar
os resultados apresentados em publicações científicas, logo que
possível;
• Outros dados, incluindo metadados associados, conforme
especificado e dentro dos prazos estabelecidos no plano de gestão
de dados.
Âmbito – aos beneficiários é requerido o depósito:
16
17. Piloto de dados abertos no H2020
Principios:
17
• Discoverable
• Accessible
• Assessable and intelligible
• Useable beyond the original
purpose for which it was collected
• Interoperable to specific quality
standards
18. Piloto de dados abertos no H2020
1. Desenvolver (e atualizar) um Plano de Gestão de Dados.
2. Depositar num repositório de dados adequado.
3. Tornar possível a terceiros o acesso, a prospeção, a exploração,
a reprodução e a disseminação dos dados – de forma gratuita.
4. Fornecer informações sobre as ferramentas e os instrumentos
necessários para validar os resultados (ou fornecer as
ferramentas).
Requisitos que os beneficiários devem cumprir:
18
19. Piloto de dados abertos no H2020
• Dados, incluindo metadados associados, necessários para validar os
resultados apresentados em publicações científicas, logo que possível;
• Outros dados, incluindo metadados associados, conforme especificado e
dentro dos prazos estabelecidos no plano de gestão de dados.
Aos beneficiários é requerido o depósito:
19
Não se aplica a todos os dados (os investigadores definem em função do seu projeto), havendo ainda exceções.
20. AS OPEN AS POSSIBLE,
AS CLOSED AS NEEDED
Abordagem da Comissão Europeia:
20
21. Piloto de dados abertos no H2020
• Se o projeto não gerar / recolher dados.
• Em caso de conflito com a obrigação de proteção dos resultados (se é esperado que
os resultados sejam comercialmente ou industrialmente explorados).
• Em caso de conflito com as obrigações de confidencialidade.
• Em caso de conflito com as obrigações nacionais de segurança.
• Em caso de conflito com as regras em matéria de proteção de dados pessoais.
• Se a realização do objetivo principal do projeto (ação) ficar comprometido com a
disponibilização aberta dos dados.
Os projetos (as ações) podem optar por sair do piloto, na fase de proposta ou durante o
projeto (devidamente justificado no plano de projeto), com base em:
21
23. Opt in / Opt out (alguns números)
Basis : 3,699 Horizon 2020 signed grant agreements
• Calls in core-areas: opt out 34,6% (149/431 proposals)
• Other areas: voluntary opt in 12,5% (409/3268 proposals)
Conclusion:
• These numbers in the proposals for the first calls of Horizon 2020
are encouraging.
• Comprehensive follow up needed
Numbers by Daniel Spichtinger, European Commission, at OpenCon 14-11-15
23
24. Razões do opting out
Numbers by Daniel Spichtinger, European Commission, at OpenCon 14-11-15
24
17.85
35.37
5.32
24.96
7.79
8.71
No data generated
IPR protec on
Confiden ality
Privacy
Jeopardize main objec ve
other
25. Recapitulando, em jeito de guia…
Quem deve depositar?
Projetos integrados nas áreas:
Future and Emerging Technologies
Research infrastructures – (new: coverage of the whole area)
Leadership in enabling and industrial technologies – Information and
Communication Technologies
Nanotechnologies, Advanced Materials, Advanced Manufacturing
and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’
topics (new)
Societal Challenge: Food security, sustainable agriculture and forestry,
marine and maritime and inland water research and the bioeconomy -
selected topics as specified in the work programme (new)
Societal Challenge: Climate Action, Environment, Resource Efficiency
and Raw materials – except raw materials
Societal Challenge: Europe in a changing world – inclusive, innovative
and reflective Societies
Science with and for Society
Cross-cutting activities - focus areas – part Smart and Sustainable
Cities (moved from Energy WP)
O que depositar?
• Dados, incluindo metadados associados,
necessários para validar os resultados
apresentados em publicações científicas,
logo que possível;
• Outros dados, incluindo metadados
associados, conforme especificado e dentro
dos prazos estabelecidos no plano de
gestão de dados.
26. Recapitulando, em jeito de guia…
Onde depositar?
• Depositar num repositório de dados adequado (ver
diretório de repositórios de dados re3data);
• A infraestrutura europeia OpenAIRE disponibiliza o
repositório Zenodo que poderá ser usado para
cumprir com os requisitos do piloto.
Quando depositar?
• Os dados, incluindo os metadados associados,
necessários para validar os resultados apresentados
numa publicações científica devem ser
depositados o mais cedo possível.
• Outros dados, incluindo os metadados associados,
devem ser depositado de acordo com o
especificado no plano de gestão de dados.
27. Projetos H2020 no piloto de dados
com coordenação de organizações PT
27
28. Projetos H2020 no piloto de dados
com participação de organizações PT
28
29. REQUISITOS NA PRÁTICA (simplificados)
Projeto-piloto de Dados Científicos Abertos
Criar um plano de gestão dos dados
Assegurar o depósito num repositório
Associar licenças CC
Providenciar ferramentas
O foco deve ser o planeamento >> para a disponibilização dos dados,
facilitando o depósito e a licença para permitir a reutilização.
30. Planos de Gestão de
Dados no piloto de
dados abertos do
H2020
3
30
31. Propósito do Plano de Gestão de dados:
• Define o plano para a criação e gestão dos dados (ex. que normas vão
ser usadas), e especifica que dados vão ser abertos. Planos para partilha
e preservação deverão ser referidos também.
• Disponibilizar uma análise dos principais elementos da política de
gestão de dados que será usada pelos beneficiários relativamente a
todos os conjuntos de dados (datasets) que serão gerados pelo projeto.
• A CE vê os planos como documentos “vivos” – deverão ser regularmente
atualizados.
32. Tópicos do Plano de Gestão de Dados:
Data set reference and name
• Identificação do conjunto de dados..
Data set description
• Descrição com origem, natureza, tamanho, público. Informação de eventuais dados
similares, possibilidades de integração e reutilização.
Standards and metadata
• Referencia às normas de metadados disciplinares a usar para descrição, ou como é que vão
ser descritos ou criados os metadados.
Data sharing
• Descrição de como os dados vão ser partilhados, incluindo procedimentos de acesso,
períodos de embargo, indicando eventuais ferramentas necessárias para reutilização dos
dados. Incluir informação das limitações de acesso.
Archiving and preservation (including storage and backup)
• Descrição de procedimento de armazenamento e preservação, indicando quando tempo os
dados devem ser preservados.
33. Devenvolvimento do
Plano de Gestão de Dados
Do ponto de vista da CE não é um documento
fechado – deverá evoluir e ir ganhando precisão.
• Deverá ser apresentado nos primeiros seis
meses do projeto.
• Deverá ser atualizado e apresentado com
novas versão sempre que as mudanças o
justifiquem, mas num mínimo de duas vezes
(mid-term & final review).
A CE nas orientações para a Gestão de Dados no
Horizonte 2020 disponibilizam dois templates
(anexo 1 e 2).
A CE não solicita plano no momento entrega da
proposta – portanto, o plano não é parte do
processo de avaliação da candidatura).
No entanto, todas as propostas apresentadas no âmbito das
ações "Research and Innovation actions“ e "Innovation
actions“ incluem uma secção “research data” nos critérios de
avaliação do impacto.
Initial plan Mid-term Final review
34. DMPonline
https://dmponline.dcc.ac.uk
• Ferramenta web para ajudar os investigadores a elaborar o seu plano de
gestão de dados.
• Disponibilizada de forma gratuita pelo DCC
• Incluiu já um template para o Horizonte 2020
35. How to write a DMP - DEMO
• Template available from https://dmponline.dcc.ac.uk/
35
1
39. 39
Briefly specify
• how data will be captured/created
• how it will be documented
• according to what standards
• who will be able to access it
• where it will be stored
• how it will be backed up, and
• where and how it will be shared and
preserved long-term
43. Templates Horizon 2020
The DMP should address the points
below on a dataset by dataset
basis:
• Data set reference and name
• Data set description
• Standards and metadata
• Data sharing
• Archiving and preservation
(including storage and backup)
Annex 2
(mid-term & final review)
Scientific research data should be easily:
1. Discoverable
2. Accessible
3. Assessable and intelligible
4. Useable beyond the original purpose for
which it was collected
5. Interoperable to specific quality
standards
Annex 1
(by month 6)
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
45. Onde encontrar um repositório?
1. Num arquivo de dados ou repositório externo e de âmbito temático ou
disciplinar
2. Num repositório de dados institucional, ou de unidade de investigação
devidamente estabelecido e com facilidades de gestão de dados.
1. Zenodo.org
2. Pesquisar no diretório de repositórios: re3data.org
45
48. ZENODO, a destacar:
• Permitir que todos possam partilhar e citar os dados.
• Receber dados multidisciplinares de comunidade científica, investigador
e instituição.
• Proporcionar um interface para ligar dados à informação do projeto de
financiamento.
• Possibilitar agregação via OAI-PMH de qualquer dado ou coleção
armazenada.
• Ligar com outros sistemas de informação e armazenamento (Dropbox,
github).
Fácil de usar!
61. Open Research Data Pilot
• Open Research Data Pilot: https://www.openaire.eu/opendatapilot
• Create a Data Management Plan: https://www.openaire.eu/opendatapilot-dmp
• Select a Data Repository: https://www.openaire.eu/opendatapilot-repository
• Factsheet: https://www.openaire.eu/or-data-pilot-factsheet
Informação útil disponibilizada pelo OpenAIRE
61
66. “Open Innovation, Open
Science, Open to the World”
Carlos Moedas
Comissário Europeu para a Investigação, Ciência e Inovação, 2015
67. Open Science is a key priority of the Dutch Presidency. The
Netherlands is committed to open access to scientific publications and
the best possible re-use of research data, and it would like to
accelerate the transition this requires.
68. Gravações e apresentações: http://openaccess.sdum.uminho.pt
TAXAS DE PUBLICAÇÃO – apoios para financiar taxas de
publicação em Acesso Aberto nos projetos do 7º PQ.
ACESSO ABERTO NO H2020 – requisitos da política de
Acesso Aberto da CE no Horizonte 2020.
REPOSITÓRIOS – como associar a informação dos
projetos às publicações depositadas no RCAAP.
POLÍTICAS INSTITUCIONAIS DE ACESSO ABERTO – da
definição à monitorização.
DADOS ABERTOS NO H2020 – projeto piloto dos dados
abertos no Horizonte 2020.
8 FEVEREIRO
1 MARÇO
15 MARÇO
22 MARÇO
2016
5 ABRIL
relates to controversial or security issues that might have undesired societal consequences if research results became known prematurely
Second, you can select your organisation, but no problem if it’s not on the list. Note that ou may also find projects here, such as ELIXIR for life sciences.
You may want to include the guidance provided by the DCC. This is a good addition to the guidance that the EC provides on the questions of the template.
Next, click CREATE.
You’re asked to provide some basic information. Please note that the ID here is one that you enter yourself, for your convenience. I’ll show you in a second where I did this.
This page summarises that the DMP is a deliverable to be submitted within 6 months into the project. Below the orange bar it lists the topics of the initial DMP.
You’re asked to provide some basic information. Please note that the ID here is one that you enter yourself, for your convenience and that of your collaborators.
In this way the researcher proceeds to write the plan – more details follow in a second, but let’s first look ahead:
And make sure that you know what will be asked of you for the mid-term and the final review: the focus here is on enabling reuse of your data – by your future self and others.
In a couple of minutes I’ll tell you why this is a bit underspecified.
Okay, this is the easy part: there is a template. What’s really at stake of course is: what to write in the plan, and who should be involved?
…and select an export format; for the EC PDF is fine.
Use an external data archive or repository already established for your research domain to preserve the data according to recognised standards in your discipline.
If available, use an institutional research data repository, or your research group’s established data management facilities.
Use a well-known data repository in your own country.
Use a cost-free (data) repository such as Zenodo.
Search for other data repositories here: re3data.org
Zenodo is developed by CERN under the EU FP7 project OpenAIREplus