Contributo di Paola Gargiulo al workshop GIDIF-RBM "Open Data e Open Access: quali differenze, quali convergenze?"
Bibliostar 2015 - Palazzo Stelline, Milano
13.03.2015
Paola Gargiulo "Open Access and Open Data in practice: l'esperienza e le iniziative di CINECA
1. Open Access and Open Data in practice:
l’esperienza e le iniziative di Cineca
Paola Gargiulo,
Cineca &
OpenAire -
NOAD
13 marzo 2015
GIDIF-RBM
OPEN DATA E OPEN ACCESS:
QUALI DIFFERENZE E QUALI CONVERGENZE?
2. Sommario
• Introduzione a Cineca e alle sue attività
• Breve storia delle attività Cineca in ambito
OA dal 2003-2013
• Le attività odierne : Dspace-CRIS, IRIS,
Scholary Publishing
- Progetti europei su Open Access e Open
Data
2
3. ⁄ Staff: > 900
⁄ Sedi: Bologna, Milan & Rome
⁄ Turnover: >100M
⁄ Consorzio Interuniversitario
⁄ Not for Profit
⁄ Fondato nel 1969
⁄ Headquarter in Bologna
⁄ 75 Membri
⁄ 70 Università
⁄ 4 Istituti di Ricerca
⁄ MIUR
L’Organizzazione
4. Higher Education
• Solutions & Services for the University Administration
• Services for the Ministry of Education, University and
Research (MIUR)
Scientific Research
• High Performance Computing
• FERMI: in the TOP500 List
• EURORA: in the TOPGREEN500 List
• Scientific Visualization & Interactive Virtual Environments
Technological Innovation
• Data Center
• Information and Knowledge Management Services
• Health Care Systems
Le attività
5. EUNIS
Board Member | Interoperability TF
| Business Intelligence TF |
BencHEIT TF
euroCRIS
Board Member | DRIS/Best
Practice TG | Architecture TG |
CERIF TG
CHEITA
Leading Member | Benchmarking
IT Group | Research Group
Attività a livello internazionale
DSpace
Steering Committee | 2 Committers
| Registered Service Provider |
DSpace-CRIS
OpenAIRE
National Open Access Desk
Pentaho
Member of the Advisory Board
Institutional Technological
6. L‘impegno decennale sull‘OA 2003-2013
•Membri dei consorzi
•Finalità istituzionale
Da dove
siamo partiti
•Supporto tecnologico
•Roadmap & definizione di
politiche
•Advocacy, promozione, helpdesk
Cosa abbiamo
fatto
A
multifaceted
approach
(since 2003)
7. Supporto tecnologico – 2003-2013
A livello nazionale
/ AePIC: advanced electronic publishing solutions (Cilea- 2003-
2012);
/ Open Access@CASPUR: soluzioni tecnologiche e servizi
(2005-2012)
/ PLEIADI: piattaforma nazionale per l’accesso alle pubblicazioni
depositate negli archivi OA italiani e nelle riviste OA italiane (dal
2004 – oggi >1M record
A livello istituzionale
/ Consulenza
/ Hosting e installazioni di archivi OA
/ gestione della piattaforma OJS per le riviste
OA
/ Surplus- from a repository to a CRIS
8. Portale per la letteratura scientifica elettronica
Italiana su Archivi aperti e Depositi Istituzionali
8
11. Promozione, Policy, Advocacy
A livello nazionale
/ Iniziative Nazionali e Gruppi di lavoro
• Dichiarazione di Messina (2004) a supporto della Dichiarazione di Berlino (olttre 70 università italiane +
alcuni enti di ricerca
• CRUI GdL sulll’accesso aperto (2006-2013)
• Organizzazione e Promozione di manifestazioni durante la settimana internazionale dell’Open Access
• Membro del gruppo di esperti nazionali a supporto del National Point of Reference (dal 2013)
/ Ospita OA-wiki (il portale informativo sull’accesso aperto in italiano)
/ National Open Access Desk – OpenAIRE
A livello istituzionale
/ Supporto tecnologico nelle implementazioni delle
linee guida CRUI sui repository OA, metadati, tesi di
dottorato, policy istituzionali
/ Sostenere i coordinatori dei progetti finanziati
dall’EU e gli uffici di ricerca nell’ottemperanza dei
requisiti OA previsti nel progetto pilota sull’accesso
aperto (OA Pilot FP7 2008-2013)
12. La partecipazione di Cineca nelle comunità
internazionali dell’OA dal 2007 -
Technologico
/ DSpace Community
Registered Service Provider | 2 DSpace Committers ! (Steering Group | DSpace-CRIS
/ euroCRIS Community
Board Member | CERIF TG | Architecture TG
/ OpenAIRE
Italian partner for implementing OpenAIRE guidelines | NOAD (dal 2009-)
Policy & Promotion
/ EUA Open Access Working Group (2008)
/ SPARC Europe - Board Member (2009-2012)
/ SCOAP3 – Governing Board (2014-)
/ EU funded project:
OpenAIRE | MedOANet
/ Partecipation in international conferences
13. Una breve cronologia
D-Space Community
•2003: started to install, setup and support
DSpace repositories for Italian institutions
(Cilea-Aepic)
•2004: collaboration with the DSpace
community(forum, support)
•2007: one staff in Committer Group
•2009: support for foreign institutions
(DSpace and Fedora Commons)
•2010: Certified Service Provider for
DuraSpace
•2013: second staff in Committer Group
EuroCRIS Community
•2011: membership
•2013: members of CERIF and
DRIS/IR task groups
•2013: release of dspace-cris (CERIF-
compliant CRIS) -
http://cineca.github.io/dspace-cris
OPEN AIRE (2009-2011)
Italian partner for implementing
OpenAIRE guidelines (OA
repositories and Oa Journals
compliance)
OPENAIREPLUS (2011-2014)
OPENAIRE 2020 (2015-)
International conferences
2007: DSpace User Group meeting (Rome)
2009: ELPUB on innovation in communication paradigms (Milan)
2011: euroCRIS Membership meeting (Bologna)
2014: CRIS 2014 (Rome, with CNR)
14. Le attività Cineca in ambito Open Source
e Open Access: DSPACE CRIS
Open
SourceDspace extended to the CERIF entities
To better support:
(People | Units | Projects | etc.)
Interactions
Reputation
Dissemination
www.cineca.it |
Institutional
Repository
15. La presenza di Dspace –CRIS e di altre soluzioni tecnologiche
sviluppate da Cineca per il mondo della ricerca e della didattica
15
Students & Learning:
>50 Installations (Turkey, Romania, Albania, Haiti, Central Asian Republics)
Research (DSpace + DSpace-CRIS + IRIS):
>20 Installations (the 5 Continents and the World Health Organisation)
16. Archivia, permette di
accedere a
informazioni su
• Ricercatori
• Pubblicazioni
• Brevetti
• Tesi di dottorato
• Progetti
Progettato dall’ Hong Kong University insieme con CINECA, rilasciato come open source,
Modulo Dspace- CRIS
http:// hub.hku.hk/
Il portale dei ricercatori di HKU
17. Il portale dei ricercatori di HKU
17
http:// hub.hku.hk/
19. HKU: The Researcher
www.cineca.it | DSpace-CRIS: An Open Source Solution | Use Science | November 2013
L’Università, sistema aperto? Come diffonde i suoi risultati? Verona, 23 ottobre 2014
20. HKU: La pubblicazione
www.cineca.it | DSpace-CRIS: An Open Source Solution | Use Science | November 2013L’Università, sistema aperto? Come diffonde i suoi risultati? Verona, 23 ottobre 2014
21. Workflows mapping
business processes
System Integration
(legacy, national, …)
Reports &
Analytics
WHAT IRIS ADDS
Da Dspace- CRIS a IRIS- Institutional
Research Information System
Open Source
Dspace extended to the CERIF entities
To better support:
(People | Units | Projects | etc.)
Interactions
Reputation
Dissemination
www.cineca.it | IRIS: Institutional Research Information System
Institutional
Repository
23. Raccogliere l’output scientifico dell’istituzione per finalità legate alla valutazione
Misurare i risultati ai fini del benchmarking
Disseminare
pubblicazioni, dati,
ecc per aumentare
l’impatto e la
visibilità
Far tesoro degli
investimenti in ICT e
massimizzare ROI
Finalità di IRIS
23
24. RICERCA
46 Università (U-GOV RI)
> 1.5 Milione e mezzo di
pubblicazioni
9 Università (SURplus)
10 Nuove istallazioni (IRIS)
18 Università all’estero che
utilizzano
(IRIS & DSpace-CRIS)
IRIS è stato lanciato lo scorso anno ad aprile, entro l’estate del 2015
sarà installato e funzionante in 62 atenei italiani
25. Scholarly Publishing: soluzione per
la pubblicazione di riviste OA
• Basato sul sw Open Source
(OJS- Open Journal System)
sviluppato da PKP (Canada)-
Cineca unico partner italiano
per lo sviluppo di OJS
• Soluzione per la gestione del
flusso editoriale
• Indicizzazione da parte di
PLEIADI e dei motori di ricerca
e di banche dati specializzati
• conforme ad OpenAire
26. Commissione Europea e l‘OA
Grant agreement SC39
20% programme areas
Deposit in Repositories
OA after embargo (6-12
months)
Gold payments during
project
Budget: €50 Billion
All grant agreements
100% programme areas
Deposit in Repositories
Gold payments after
project end
Open Data Pilot on
specific areas
Budget: €71 Billion
FP7 OA Pilot (2009) Horizon 2020 (2014)
27. Horizon 2020 e Accesso aperto
• Ciascun beneficiaro
dovra’ assicurare
l’accesso aperto a
– tutte le pubblicazioni
relative ai risultati dei
progetti e “soggette alla
revisione dei pari”
– dati della ricerca
(Progetto Pilota in alcuni
settori)
27
29. Horizon 2020 -Progetto Pilota sui Dati della ricerca (1)
• Cosa dovranno fare i
beneficiari del progetto
– depositare i dati, inclusi i
metadati nel repository dei
dati prescelto
– fare il possibile affinchè sia
possibile accedere, fare il
data mining, sfruttare,
riprodurre e disseminare
liberamente questi dati (per
es. esempio usando Licenze
Creative Commons)
– fornire informazioni sui tools e
gli strumenti utilizzati dal
beneficiario e necessari per
validare i risultati (quando
possibile fornirli)
29
www.openaire.eu/open-access/open-access-in-h202/h2020-oa-
data
30. Progetto Pilota sui Dati della ricerca (2)
• Quali dati?
– Dati della ricerca (inclusi i metadati associati)
necessari per validare i risultati della ricerca
presentati nelle pubblicazioni (underlying data)
– Altri dati (inclusi i metadati associati) specificati
nel data management plan
30
31. Horizon 2020 -Progetto Pilota sui
Dati della ricerca- Quali aree
• Le seguenti aree partecipano al
progetto pilota sui dati aperti nella
ricerca nel programma di lavoro 2014-
2015
• Future and Emerging Technologies
• Research infrastructures – parte e-
Infrastructures
• Leadership in enabling and
industrial techonologies- Information
and Communication Technologies
• Societal Challenge: Secure, Clean
and Efficient Energy – part Smart
cities and communities
• Societal Challenge: Climate Action,
Environment, Resource Efficiency
and Raw materials – except raw
materials
• Societal Challenge: Europe in
changing world – inclusive,
innovative and reflective Societies
• Science with and for Society
31
32. Progetto Pilota sui Dati della
ricerca
• E’ possibile l’opt-out dal progetto
pilota in una serie di casi.
Deroghe pertanto sono
ammesse:
– se il progetto non genera/nè
raccoglie dati
– in caso di conflitto con gli obblighi di
protezione dei dati
– in caso di conflitto con gli obblighi
di confidenzialità
– in caso di conflitto con obblighi di
sicurezza
– in caso di conflitto con i regolamenti
di protezione dei dati personali
• Inoltre nel caso in cui rendere
aperti alcune parti dei dati della
ricerca rappresenti un rischio
per il raggiungimento
dell’obiettivo principale del
progetto
32
33. Data Management Plan in H2020 (1)
• Il Data Management Plan
(DMPs) è obbligatorio per
tutti i progetti che
partecipano al progetto
pilota (va consegnato
entro i primi 6 mesi del
progetto)
• Altri progetti sono invitati
a fornire un DMP se
quest’ultimo è rilevante
per il piano della ricerca
• Un modello di DMP è
disponibile nel portale dei
Partecipanti
33
34. Data Management Plan
I progetti finanziati che partecipano nel progetto pilota
dovranno sviluppare un Data Management plan (DMP), nel
quale specificano quali dati saranno aperti
la Commissione NON richiede ai benificiari di sottoporre un
DMP nella proposta
IL DMP NON fa parte della valutazione
DMPs sono uno dei deliverable del progetto
35. Al momento della
proposta Nel progetto
Quando rilevante*, le proposte in
Horizon 2020 possono includere una
sezione sulla gestione dei dati che
sarà valutata nei criteri di ‘Impact’.
Pertanto in questo caso vanno
fornite informazioni su
quali dati verranno raccolti o
generati
quali standard saranno utilizzati e
come saranno generati i metadati
quali dati saranno riutilizzati
quali saranno condivisi/liberamente
accessibili
come saranno conservati i dati
* For “Research and Innovation actions” and
“Innovation Actions”
• DMP sono dei “deliverable” per
coloro che partecipano ad un
progetto che rientra nell’aree
comprese nel progetto pilota sui
dati
• E’ un documento in evoluzione–
La prima versione va presen
tata entro i primi 6 mesi
del progetto
Versioni più elaborate
potranno essere redatte
qualora ci siano importanti
cambiamenti. Ci sarà una
versione intermedia ed una
finale
Il DMP va presentato
36. DMP : cosa deve contenere
Data set reference and name
• Identificatore per i data sets che vengono prodotti
Data set description
• Descrizione, origine, grandezza dei dati che saranno generati o raccolti e a chi potrebbero essere utili.
• Informazioni sull’esistenza o meno di simili dati e possibilità per l’integrazione e il riuso
• Standards and metadata
• Far riferimento agli standard esistenti nel settore disciplinare. Se non ci fossero definire come e quali
metadati verrano creati
Data sharing
• Come i dati verrrano condivisi, quanto saranno liberamente accessibili o limitati nell’accesso a gruppi
specifiici e le ragioni per cui non possono essere condivisi
• Procedure relative all’accesso, eventuali periodi di embargo e sistemi per la disseminazione
• Software e altri strumenti necessari per il riuso
• Repository in cui i dati saranno depositati
Archiving and preservation ( inclusi storage e backup)
• Procedure per la long-term preservation
• Quanto a lungo i dati saranno conservati
• Qual è l’entita finale dei dati (in termini di volume)
• Quali sono i costi connessi alla gestione
37. DMP: altre informazioni aggiuntive da fornire
Scientific research data should be easily:
1. Discoverable
Come i dati e il software possono essere ricercabili e identificabili , con quali strumenti, per es. Il
DOI?
2. Accessible
Sono i dati accessibili e sulla base di quali condizioni, per es. Licenze, embargo, ecc.?
3. Assessable and intelligible
I dati e i software sono valutabili e intellegibili da terze parti per il peer review?
4. Useable beyond the original purpose for which it was collected
I dati sono conservati insieme con almeno un minimo di software e di documentazione che possa
essere utilizzato da terze parti nel lungo periodo
5. Interoperable to specific quality standards
I dati e i software sono interoperabili e pertanto permettono lo scambio dei dati? Per es.sono stati
usati formati e metadati standard?
38. Documentazione
EC Open Access Factsheet:
• https://ec.europa.eu/programmes/horizon2020/sites/horizon202
0/files/FactSheet_Open_Access.pdf
Guidelines on Open Access to Scientific
Publications and Research Data in Horizon 2020
• http://ec.europa.eu/research/participants/data/ref/h2020/grants_
manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
38
39. Che cosa è OpenAIRE (2009-2011)
– E’ l’infrastruttura finanziata dall’EU realizzata per rendere accessibili le
pubblicazioni risultanti da progetti finanziati come previsto nel progetto Pilota
sull’OA del 7PQ (2007-2013)
– aggrega risultati accademici e scientifici, inclusi dati e letteratura depositati
negli archivi istituzionali o tematici, e dati su progetti, persone, enti, ecc.,
mantenuti in sistemi informativi per la ricerca.
– offre servizi integrati diretti ai ricercatori, ai gestori di archivi delle pubblicazioni
e i dei dati, ai coordinatori di progetto e ai finanziatori della ai finanziatori della
ricerca, per trovare, accedere, analizzare, correlare questa informazione
– OpenAire continua le sue attività nei progetti successivamente finanziati
– OpenAirePlus (2011-2014) e OpenAire2020 (2015-2018)
39
40. OpenAIRE : a chi si rivolge
40
http://www.openaire.it
41. Visualize - Manage
Enhanced Publications
Get support
(NOADs)
Linked Content
Statistics
+++
Search & Browse
Curate & collaborate
Deposit
Publications
& data
Research impact
Citations, usage statistics
+++
APIs
Data repositories
Data Journals
Metadata
on data
Publication
repositories
Institutional &
Thematic
Usage data
Metadata
And pdfs
8,700,000 OA publications
460 validated repositories
National funding
EC funding
Guidelines for use services
Institutional
CRIS
Systems
CERN/OpenAIRE “catch-all”
Guidelines for data interoperability
Services for
Project Coordinators, Project Funders, Funders, Researchers,… Systems
Infrastructure
coordination
Infrastructure: data sources
Deposits in institutional or thematic repository
Publishes in OA journal
Publishes data
Fully
compliant?
Mine for project
Mine for other info De-duplicateLinkEnrich
OrganizationsProjects
AuthorsDatasets
Publications
Data
Providers
42. OpenAIRE2020 : punti salienti
• Aumentare l’interoperabilità di tutte le risorse connesse con il ciclo della
ricerca
• Dare supporto per ottemperare agli obblighi OA previsti in Horizon2020
– 100% delle pubblicazioni scientifiche dovranno essere OA
– Progetto Pilota sui dati aperti della ricerca
• Implementare il progetto pilota Gold OA pilot FP7 post grant
• Sperimentare nuove forme di scholarly communication (open peer
reviewing, nuove metriche sulla base di dati forniti da OpenAire)
• Rafforzare collaborazione internazionali
• Diventare un’ entità giuridica
42
43. Per saperne di più: guarda le
slide
http://www.slideshare.net/OpenAIRE_eu
43
44. Per tenersi aggiornati: segui
la Newsletter
https://www.openaire.eu/newsletter/view
OpenAIRE2020 - Overview 44
46. Informazioni, domande ecc..
FAQ, Factsheets material
https://www.openaire.eu/support/faq
Helpdesk
https://www.openaire.eu/support/helpdesk
Horizon2020 factsheets
https://www.openaire.eu/h2020-fachtsheets/static-content/openaire-
h2020-fachtsheets
E se non trovaste la risposta che cercate, scrivete a
openaire-it@cineca.it
46
47. Documentazione
Le linee guida sull'accesso aperto e ai dati in
Horizon 2020
Guidelines on Open Access to Scientific Publications and
Research Data in Horizon 2020:
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi
/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
Le linee guida sulla gestione dei dati della ricerca
Guidelines on Data Management in Horizon 2020:
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi
/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
Il modello del Grant Agreement di Horizon 2020
http://ec.europa.eu/research/participants/data/ref/h2020/mga/gga/h2020-
mga-gga-multi_en.pdf