Gestion des données scientifiques en imagerie in vivo – Journée scientifique organisée par PIV le 7 décembre 2017 au PARCC-HEGP
Marie-Christine Jacquemot
OPIDOR
Démarche et logiciel de gestion des connaissances pour le cycle de vie des pr...
Mc jacquemot piv2017_c
1. OPIDoR, des services pour
faciliter l’adoption des
bonnes pratiques de gestion
des données de la recherche
Marie-Christine Jacquemot-Perbal, Inist-CNRS
marie-christine.jacquemot@inist.fr
2. 1
« Open science for innovation and discovery »
7/12/2017MC Jacquemot-Perbal - PIV2017
Open Access
Open Data
Open
Reproducible
Science
Open Science
Tools
By G.emmerich (Own work) CC BY-SA 3.0
3. 2
Principes pour une gestion bénéfique des
données
« FAIR Data principles »
« Findable » : facile à trouver par l’utilisation e , des
métadonnées riches et le signalement dans un catalogue
« Accessible »: grâce aux identifiants par des
. aux métadonnées
« Interoperable »: par l’application de
l’utilisation de vocabulaires et des références
vers autres données/métadonnées
« Reusable » : réutilisable grâce à une , accompagnée si nécessaire
d’informations sur la , avec l’utilisation de standards communautaires et de
Wilkinson et al. (2016) https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4792175/
7/12/2017MC Jacquemot-Perbal - PIV2017
Approuvés par la Commission
européenne, G20, RDA, NIH, ELIXIR,
Organization for Human Brain Mapping
4. 3
« Linked research objects »
pour améliorer la réutilisation et la découverte
7/12/2017MC Jacquemot-Perbal - PIV2017
Research object
Research object
Methods/
protocols
Data
Data
Softwares
PID
PID
PID
PID
PID
Workflows
PID
PID Persistent identifiers
Methods/
protocols
Data
Provenance
Softwares
PID
PID
PID
PID
PID
workflow
PID
PID PID
Provenance
Metadata Metadata
Publication
PID
5. Construire un écosystème propice
au partage et à la réutilisation
Engagement des
acteurs et
Harmonisation
des pratiques
Agences de
financement
Instances
gouvernantes
Organismes de recherche
Universités
Chercheurs
Professionnels IST
Archivistes
Informaticiens
Data librarians
Data scientists
Editeurs
Fournisseurs
d’infrastructure
Cadre éthique
et juridique
Data & metadata
peer-reviewing
Environnement
pédagogique
Métriques
6. 5
Développement d’outils : un petit aperçu
7/12/2017MC Jacquemot-Perbal - PIV2017
RDA Metadata Standards
Directory
Linked Open Vocabulary
7. Data management plan
« Data management plan as a key element of good data
management »
a DMP should include information on:
• the handling of research data during and after the end of
the project
• what data will be collected, processed and/or generated
• which methodology and standards will be applied
• whether data will be shared/made open access and
• how data will be curated and preserved (including after the
end of the project).
Source: Guidelines on FAIR Data Management in Horizon 2020 (European Commission, 2016, v3.0)
Document dynamique : initié en amont du projet (de préférence dès le montage du projet) et
continuellement mis à jour tout au long du projet
Incitation voire obligation par : agences de financement de la recherche, organismes de recherche
Pas seulement un formulaire administratif mais aussi un inventaire des données du projet de recherche
Une représentation du cycle de vie
Source : Université de Sydney
7/12/20176 MC Jacquemot-Perbal - PIV2017
8. 7
Modèle(s) de DMP
Structuration selon cycle de vie des données ou principes FAIR
Adaptation en fonction :
Financeur, organisation de recherche
Discipline/domaine, infrastructure, entrepôt
Actuellement, pas de modèle standard mais des éléments communs
Thèmes révisés DCC et UC3
7/12/2017MC Jacquemot-Perbal - PIV2017
Data description
Data format
Data volume
Data collection
Metadata documentation
Ethics & privacy
Intellectual property rights
Storage & security
Data sharing
Data repositories
Preservation
Roles & responsabilities
Budget
Related policies
9. Acteurs impliqués dans la gestion des données
DMP = opportunité pour établir un dialogue nécessaire pour la bonne
conduite du projet
Rencontre entre scientifiques, informaticiens, professionnels de
l’information/data librarians (documentalistes, bibliothécaires,
archivistes) => répartition des rôles et responsabilités
Anticiper => identification et échange avec les services intervenant à
différents stades du cycle de vie des données
Scientifiques
Informaticiens
Data librarians
7/12/20178 MC Jacquemot-Perbal - PIV2017
10. 9
DMP OPIDoR
7/12/2017
DMP pour une Optimisation du Partage
et de l’Interopérabilité des Données de la Recherche
MC Jacquemot-Perbal - PIV2017
11. 10
Un service ouvert pour l’ESR
7/12/2017MC Jacquemot-Perbal - PIV2017
Hébergé à l’Inist-CNRS, sur un serveur sécurisé (pas une archive)
Confidentialité : pas d’accès aux DMPs
Réutilisation du code open source de DMPonline développé par le Digital Curation
Center
Maintenance corrective et évolutive de l’application : adaptation aux besoins de la
communauté
Mise à disposition d’une instance de production et d’une instance « bac à sable »
Assistance conseil pour l’élaboration de DMPs et de modèles de DMPs
info-opidor@inist.fr Assistance, conseils
https://dmp.opidor.fr/ Instance de production
12. 11
Un outil collaboratif
7/12/2017MC Jacquemot-Perbal - PIV2017
Partage de DMPs avec des
collaborateurs, personnels d’appui
Echange de commentaires, questions
17. Evolutions techniques DMPRoadmap Amélioration des fonctionnalités
• Internationalisation
• API, …
Standardisation de la
structure du DMP
Harmonisation par
discipline
DMP Common group Standards WG (RDA)
• Développer un modèle informationnel commun qui
rendra le DMP exploitable par les machines et
interopérables
“Domain Protocols for Research Data Management”
• Modèle de DMP pour un domaine particulier
Autres produits de la
recherche à gérer
Logiciels/codes et autres matériels
• Software management plan
• Outputs management plan : données, logiciels,
matériels (anticorps, lignées cellulaires, réactifs)
16
Perspectives
7/12/2017MC Jacquemot-Perbal - PIV2017
18. 17
Intégration dans le workflow de recherche : une
illustration
7/12/2017MC Jacquemot-Perbal - PIV2017
Système d’informations
administratives
Plateforme
d’acquisitionPlateforme de calcul
Archivage
Financeurs
Entrepôts
Annuaire de données
Plateforme de gestion
de projet
Service stockage,
sécurité des données
Services d’appui
(juridique, valorisation,
accompagnement)
Coordination, alimentation semi-automatique, réutilisation des informations
=> Qualité des données, inventaire dynamique
19. Catalogue pour une Optimisation
du Partage et de l’Interopérabilité
des Données de Recherche
https://cat.opidor.inist.fr/
infocatopidor@inist.fr
18
20. 19
Cat OPIDoR
Un catalogue référençant les services français dédiés aux données de la recherche
7/12/2017MC Jacquemot-Perbal - PIV2017
21. 20
Identifier des services
7/12/2017MC Jacquemot-Perbal - PIV2017
Contribuer et
ajouter vos services
Type de services
Stade du
cycle de vie
Domaine/discipline Localisation