Research data management : [part of] PROOF course Finding and controlling sci...
( Dutch ) Dataverse Network : Workshop (Dutch) Dataverse Network voor 3TU.Datacentrum en anderen / Leon Osinski
1. (Dutch) Dataverse Network
Workshop (Dutch) Dataverse Network voor
3TU.Datacentrum en anderen
TU Delft, 25-11-2014
l.osinski@tue.nl, TU/e IEC/Library
Available under CC BY-SA license, which permits copying
and redistributing the material in any medium or format &
adapting the material for any purpose, provided the original
author and source are credited & you distribute the
adapted material under the same license as the original
2. RDM tijdens je onderzoek
beschermen en delen van je data
Bescherming tegen fysiek verlies en vernietiging
opslag, backup
Bescherming tegen intellectueel verlies en onvindbaarheid –
gebruik van de juiste data
metadata (voor discovery en voor hergebruik), documentatie
file-naamgeving, organiseren van data in folders, versie-beheer
Bescherming tegen niet-geautoriseerd gebruik
toeganscontrole
Source: Research Data Netherlands /
Marina Noordegraaf
3. RDM tijdens je onderzoek
datalabs voor actieve research data
Data labs ondersteunen en faciliteren het:
Opslaan van je data op een georganiseerde en veilige manier
Duidelijk beschrijven van je data
Regelen van toegang tot je data
Krijgen van erkenning voor je data
Samenwerken aan je data
Datalab ‘surrogaten’: Google Drive, Dropbox,
SURFdrive, Beehub…
Source: Research Data Netherlands /
Marina Noordegraaf
4. (Dutch) Dataverse Network #1
opslag en backup van data
Opslag en backup van data via technisch beheer [DANS]
Data transfer: maximaal 2 Gb per dataset
Dataverse 3TU.Datacentrum: tot 50 Gb gratis
5. (Dutch) Dataverse Network #2
organisatie en beschrijving van je data
Organisatie van data in Dataverse Study (Data)file
Collection
Metadateren gaat vooraf aan het uploaden van data
+ Discovery-metadata van studie of onderzoek
+ Formele gegevens (voor citatie)
+ Inhoudelijke gegevens (voor discovery)
+ Gegevens over data-collectie en methodologie
Versiebeheer van Studies, niet van datafiles
6. (Dutch) Dataverse Network #3
toegangscontrole #1
Lees-, edit- en toegangsrechten: rollen toekennen aan geregistreerde
gebruikers
Access restricted site: alleen leesrechten (downloaden datafiles)
Contributor: plus creëren en editen eigen Studies
Contributor +: plus creëren eigen Studies en editen alle Studies in een Dataverse
Curator: plus publiceren (‘releasen’) Studies + toegangsrechten toekennen aan Studies
Admin: plus creëren van en toegangsrechten toekennen aan Dataverse
Toegangsrechten voor gespecificeerde groepen of personen op Dataverse-,
Study- en datafile-niveau
‘Unreleashed’ Study; alleen zichtbaar voor personen die rechten hebben gekregen
‘Released’ Study: default Public ; vervolgens kan toegang beperkt worden (‘restricted access’)
Toegangsrechten = lezen/downloaden datafiles en/of editrechten: metadata wijzigen, (data)files
toevoegen aan of verwijderen van Study
7. (Dutch) Dataverse Network #3
toegangscontrole #2
Studies (in
Dataverse)
inzien/downloade
n datafiles
Studies (in
Dataverse) maken
Eigen Studies
inzien, editen en
downloaden
datafiles
Studies van
anderen (in
Dataverse) inzien,
editen en
downloaden
datafiles
Eigen Studies
releasen
Studies van
anderen (in een
Dataverse)
releasen
Toekennen
toegangs- en
leesrechten aan
Study (in
Dataverse)
Maken Dataverse
+ toekennen
toegangs- en
leesrechten aan
Dataverse
Access restricted
site + - - - - - - -
Contributor + + + - - - - -
Contributor + + + + + - - - -
Curator + + + + + + + -
Admin + + + + + + + +
8. (Dutch) Dataverse Network #4
erkenning voor en samenwerken aan je data
Persistent identifier (Handle)
Gezamenlijke / online analyse van data (Stata, SPSS, GraphML)
Source: Research Data
Netherlands / Marina Noordegraaf
9. (Dutch) Dataverse Network #5
praktische zaken
Account maken via SURFconext
+ Je hebt dan alleen nog maar een username (emailadres zonder . en @)
vervolgens kent Admin of Curator een rol (met bijhorende rechten) toe
+ ‘Externen’ kunnen DDN gebruiken maar niet zelf een account maken is aan de
Admin van dataverse
Een dataverse of study die niet released is, is alleen zichtbaar voor
personen die rechten hebben op de dataverse of study
Niet-releaste studies hebben geen versie-beheer
Contributor kan niet eigen Studies releasen / toegangsrechten instellen
aanbieden voor Review (‘releasen’) bij Admin of Curator; daarna bellen om
toegangsrechten af te stemmen
10. URL’s of mentioned webpages
in order of appearance #1
1. Website IEC/Library [TU/e]: http://w3.tue.nl/en/services/library/
2. Storage, back up of data: http://www.data-archive.ac.uk/create-manage/storage
3. Metadata, documentation of data: http://www.data-archive.ac.uk/create-manage/document
4. File naming: http://www.ncdcr.gov/portals/26/pdf/guidelines/filenaming.pdf
5. Organizing data: http://www.data-archive.ac.uk/create-manage/format/organising-data
6. Version control: http://www.data-archive.ac.uk/create-manage/format/versions
7. Data in a relational database: http://www.datacarpentry.org
8. Google Drive: https://www.google.com/drive/
9. Dropbox: http://www.dropbox.com
10. SURFdrive: https://surfdrive.surf.nl
11. Beehub: https://beehub.nl/system/
12. Dutch Dataverse Network: http://www.dataverse.nl
Notas do Editor
Introducing myself and IEC/Library
Integriteit van de data: 1/ beschermen van het fysieke bestaan; 2/ handhaven van de kwaliteit van de data; 3/ zorgen dat data alleen toegankelijk zijn voor degenen die dat mogen
Ruim opgevat - bescherming tegen intellectueel verlies en onvindbaarheid van je data - staat bescherming gelijk aan het delen van data
RDM consists of these parts.
minimize the risk of data loss or deletion ;
protect your data from unauthorized use ;
use the correct data. Especially when you edit your data often or collect data through various experiments or tests, identifying the correct data may pose a problem ;
RDM enhances the efficiency of your research.
Geen aandacht voor de userinterface van DDN. Dat wordt behandeld in de workshop.
In de handleiding staat dat de toegangsrechten DDN ingewikkeld maken. Dat klopt. Maar het is ook de user interface die niet vriendelijk is.
Containers: om data op te slaan, moet men eerst een Dataverse [is al gebeurd met bijvoorbeeld Dataverse van 3TU.datacentrum] en dan een Study creeren.
Een Dataverse kan meerdere Studies bevatten, een Study kan meerdere datafiles bevatten
‘n Study = metadata (‘cataloguing information’) plus een of meerdere datafiles. Datafiles kunnen elk format of type zijn. Studies kunnen door jezelf in verschillende Collecties geplaatst worden. Een Collection is een verzameling van gereleaste Studies.
Eerst metadata toekennen, dan datafiles uploaden. Slechts een metadataveld (Titelveld) is verplicht.
Unreleashed Dataverse: indien publiek: de datafiles van een Study kunnen door iedereen gedownload worden die toegang heeft tot de Study. Ook bij unreleashed Dataverses kunnen toegangsrechten ingesteld worden!
Het gaat steeds om Studies in een bepaalde Dataverse
Editen (schrijfrechten) = metadata van een Study wijzigen ; datafiles toevoegen of verwijderen
DDN ook als archief! UvT maar zie ook bijvoorbeeld tijdschrift Data in Brief
Tabular and Network data files of recognized formats (Stata, SPSS, Graphml) can be further manipulated through downloading subsets of variables and by performing various statistical analyses.