CSC:n ja Avoin tiede ja tutkimus -hankkeen pääsihteeri Pirjo-Leena Forsström kertoo tutkijan tiedonhallinnan ja -tallentamisen käytännöistä. Hän valottaa, miten tutkija huolehtii VN TEAS -hankkeessa käytettävän ja syntyvän aineiston omistus-, hallinta- ja tekijänoikeuskysymyksistä, säilytyksestä ja saatavuudesta. Esitys pidettiin Valtioneuvoston kanslian vuorovaikutuskoulutuksessa 20.9.2017.
Pirjo-Leena Forsström: Tutkijan tiedonhallinnan parhaat käytännöt
1. Tutkijan hyvä tiedonhallinta
- olemmeko samalla planeetalla?
Pirjo-Leena Forsström
First image of an exoplanet
By ESO - http://www.eso.org/public/images/26a_big-vlt/,
CC BY 4.0,
https://commons.wikimedia.org/w/index.php?curid=1124
8936
2. Sisältö
Hyvä tieteellinen käytäntö ja suositukset
Hyvä tiedonhallinta käytännössä
If we knew what it was we were doing, it
would not be called research, would it?
Albert Einstein
3. Mielekkään merkityksen, ajattelun ja kommunikaation horisontti, jossa:
Tiedon käytännöt: menetelmät, dokumentaatio, huolellisuus, tarkkuus, kriittisyys, objektiivisuus,
eettisyys, aineistot ja dokumentaatio
Tietämisen tapahtumat: aiemman tutkimuksen tuntemus, harhojen tunnistaminen ja hallinta,
johtopäätöksien tekeminen
Tulevien tietämisen mahdollisuuksien jäsentely, toistettavuus ja todennettavuus
Tietäminen ja tieto
Uudistuva tutkimustieto
Mahdolli-
suuksien
jäsentely
Tapahtu
mat
Käytän-
nöt
Hyvä
tieteellinen
käytäntö,
toistettavuus
Viittaaminen,
ontologiat,
tunnisteet
Tietomallit,
saatavuus,
pysyvyys
Laadukas tutkimus kantaa ns.
”episteemistä taakkaa” joka
mahdollistaa merkityksen ja rajaa ja
ehdollistaa mahdollisuuksia toimia. Hyvä
tutkimusdatainfrastuktuuri helpottaa tätä
taakkaa.
4. Laadukasta tutkimusta tukee esimerkiksi:
• Tutkimusdatat, tutkimusjulkaisut ja tutkimusmenetelmät ovat avoimesti ja helposti
löydettävissä ja saatavilla. Vastuut näiden elinkaaren eri vaiheisiin liittyvistä tehtävistä
on sovittu ja kaikkien tiedossa, ja tehtävät on resursoitu riittävästi.
• Avoin tietoarkkitehtuuri mahdollistaa yhteentoimivan tutkimustietoinfrastruktuurin
kehittämisen. Pitkäaikaissaatavuuteen liittyvä standardointityö on edistänyt
tutkimusinfrastruktuurien ja korkeakoulujen parempaa tutkimustiedon hallintaa.
Arkistot, kirjastot ja museot ovat luonteva osa tätä kokonaisuutta.
• Perusta on kunnossa suuriin haasteisiin vastaamiseksi, ja tutkimustieto ja kehitetyt
tutkimusmenetelmät ovat aktiivisessa käytössä.
•Yhteentoimivuus kansallisesti ja kansainvälisesti on hallittua, selkeästi kuvattua ja
helppoa.
• Pitkäaikaissaatavuuden turvaaminen on tutkijoille helppo ja kannustava tapa toimia,
ja aineistojen elinkaaresta huolehtiminen on luonteva osa tutkimuksen käytäntöjä.
5. TENK: Hyvä tieteellinen käytäntö
Tutkimuksessa noudatetaan tiedeyhteisön tunnustamia toimintatapoja eli rehellisyyttä,
yleistä huolellisuutta ja tarkkuutta tutkimustyössä, tulosten tallentamisessa ja
esittämisessä sekä tutkimusten ja niiden tulosten arvioinnissa.
Tutkimukseen sovelletaan tieteellisen tutkimuksen kriteerien mukaisia ja eettisesti
kestäviä tiedonhankinta-, tutkimus- ja arviointimenetelmiä. Tutkimuksessa toteutetaan
tieteellisen tiedon luonteeseen kuuluvaa avoimuutta ja vastuullista tiedeviestintää
tutkimuksen tuloksia julkaistaessa.
Tutkijat ottavat muiden tutkijoiden työn ja saavutukset asianmukaisella tavalla
huomioon niin, että he kunnioittavat muiden tutkijoiden tekemää työtä ja viittaavat
heidän julkaisuihinsa asianmukaisella tavalla ja antavat heidän saavutuksilleen niille
kuuluvan arvon ja merkityksen omassa tutkimuksessaan ja sen tuloksia
julkaistessaan.
Tutkimus suunnitellaan ja toteutetaan ja siitä raportoidaan sekä siinä syntyneet
tietoaineistot tallennetaan tieteelliselle tiedolle asetettujen vaatimusten edellyttämällä
tavalla.
Tarvittavat tutkimusluvat on hankittu ja tietyillä aloilla vaadittava eettinen
ennakkoarviointi on tehty.
6. Tutkimusdata on saatavilla 1) tutkimuskäyttöön, 2) yhteiskunnallisen
päätöksenteon tueksi ja 3) kaikille kiinnostuneille
1) Tutkijoille: tutkimuksen resurssit (paikalliset, kansalliset,
kansainväliset), tieteenalakohtaiset säilytyspaikat ja jakeluportaalit,
vertaisverkosto
Jatkokäyttö, vertaisarviointi
2) Yhteiskunnallinen päätöksenteko: koottuja datasettejä, koskien
esim. Suomea tai suomalaisia
Esim. ilmastotutkimuksen havaintoaineistot
3) Kiinnostuneet: avointa dataa hyvin kuvailtuna
joukkoistetut datan kuvailut ja keruut
Osaamisen kasvattaminen
Tavoite tutkimusaineistojen saatavuudelle
7. FAIR principles
Included in EU Council Conclusions on Open Science
To be Findable:
F1. (meta)data are assigned a globally unique and persistent identifier
F2. data are described with rich metadata (defined by R1 below)
F3. metadata clearly and explicitly include the identifier of the data it describes
F4. (meta)data are registered or indexed in a searchable resource
To be Accessible:
A1. (meta)data are retrievable by their identifier using a standardized communications protocol
A1.1 the protocol is open, free, and universally implementable
A1.2 the protocol allows for an authentication and authorization procedure, where necessary
A2. metadata are accessible, even when the data are no longer available
To be Interoperable:
I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
I2. (meta)data use vocabularies that follow FAIR principles
I3. (meta)data include qualified references to other (meta)data
To be Reusable:
R1. meta(data) are richly described with a plurality of accurate and relevant attributes
R1.1. (meta)data are released with a clear and accessible data usage license
R1.2. (meta)data are associated with detailed provenance
R1.3. (meta)data meet domain-relevant community standards
8. Esimerkki: Imperial College London
11. It is important that primary results are recorded accurately during research and they can be
retrieved or reproduced if necessary. For data which requires statistical analysis, the same
methodology should be used in the design of the research as in its evaluation. The existence of
verifiable data will allow research results to be tested by a third party if an allegation of scientific
misconduct is made.
12. Guidelines.
a. If some aspects of a study are outside the expertise of the investigator, he or she should consult
other specialists before conducting the research.
b. Primary data should be recorded promptly, accurately and permanently by an appropriate
method. Entries should be signed and dated by the investigator where possible. This is consistent
with the requirements of US Patent Law, and will provide protection from allegations of misconduct
as well as having positive benefits for the individual researcher.
c. Where computer and/ or instrument printouts are the main record of results, these should be
kept in numerical order and affixed to any relevant laboratory notebooks.
d. Any changes made to primary data during the conduct of a study should be identified separately
and the reason for the change should be indicated. Under no circumstances should data be
modified in an improper manner.
e. Primary data are the property of Imperial College and should remain in the laboratory where it
was generated for as long as reference needs to be made to it and for no less than ten years.
9. Toistettavuuden ja todennettavuuden esteet
Series1
Series2
Series3
Series4
Series5
0
2
4
6
8
10
12
14
16
Merkittävyya
Mainintoja
Este
Toistettavuuden ja todennettavuuden esteet
10. Suurimmat juridiset esteet avoimelle tieteelle ja
tutkimukselle Suomessa
Selvitys kuvaa keskeiset ongelmat, muutostarpeen sekä
ehdotukset ongelman ratkaisuun.
https://avointiede.fi/documents/10864/12232/Suurimmat+juridis
et+esteet+avoimelle+tieteelle+ja+tutkimukselle+Suomessa/45e6
ded5-192b-4c16-8ac6-f0828e146a19
Tiedonlouhinta ja tekijänoikeuslaki
Julkaisujen rinnakkaistallentaminen ja
tekijänoikeuslaki
Henkilötietojen käyttäminen
By Miriam Ramos Moreno - http://blog.illustraciencia.cat/2015/04/panorama-de-ciudad-de-vascos-miriam.html, CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=45526765
11. Avoimuuteen vaikuttavat
Löydettävyys/näkyvyys
Saatavuus
Lisenssit ja käyttöoikeuden
rajoitukset
Ymmärrettävyys
Kieli
Abstraktiotaso
Kontekstin selkeys
Käytettävyys
Tekninen avoimuus (koneluettavuus, dynaamisuus)
Linkitettävyys ja pysyvyys
By Theodor de Bry - This image is available from the United States
Library of Congress's Prints and Photographs division under the digital
ID cph.3b07443.This tag does not indicate the copyright status of the
attached work. A normal copyright tag is still required.
Public Domain https://commons.wikimedia.org/w/index.php?curid=632870
13. Aineistojen käyttöön vaikuttaa
Tekijänoikeus ja IPR
tekijänoikeus
tekijänoikeuden lähioikeudet
(luettelot, tietokannat, teoskynnystä
ylittämättömät valokuvat)
patentit
tavaramerkit
Kansallista turvallisuutta koskevat
lait
Uhanalaisten lajien ja
luontotyyppien suojelu
Kulttuuriperinnön suojelu
Alkuperäiskansojen suojelu
Biopankkilait
Tietosuojalait
Tieteelliset embargosopimukset
Luottamuksellisuus
Yksityisyyden suoja
Muut sopimukset
Muut eettiset syyt
Lähde:Oikeuksien hallintaan liittyvät metatiedot -selvitys
http://urn.fi/URN:NBN:fi-fe201702101528
14. Hyvä tiedonhallinta
Vaatii suunnittelua:
Mitä rahoittaja vaatii?
Mitä osallistuvat organisaatiot vaativat?
Mitä sopimuksia on tai täytyy tehdä?
Miten ja mistä viestitään?
Mitä tuloksia ja tuotoksia tuotetaan ja käytetään? =>
aineistonhallinta
Missä vaiheessa voi julkistaa?
Luvat ja lisenssit
Missä julkaistaan: kanavat ja alustat
Versionhallinta
Saatavuus ja säilytys By Strekeisen - Own work, CC BY-SA 4.0,
https://commons.wikimedia.org/w/index.php?curid=44914830
15. Aineisto voi olla rajoitettua
Miten toimia?
Rajoituksen peruste tulee tuntea, suojatoimet
riippuvat
Rekisterinpitäjä ohjeistaa TAI sopimuksessa
sovitaan käsittelytavat TAI suojaustaso
määrittää VAHTI-ohjeiden mukaisen
säilytystavan.
Rekisterinpitäjä, tietosuojavastaava
16. Aineistonhallinta
Mitä aineistoja syntyy?
Millaisia aineistoja syntyy
(standardit, kuvailutiedot jne.)
Versionhallinta ja jakaminen
Missä vaiheessa voi julkaista
mitäkin?
Millä lisenssillä?
Mitä sopimuksia vaaditaan?
Tietoturva By Alicia Tomico García
http://blog.illustraciencia.cat/2015/05/ciclo-de-vida-de-parnassius-apollo.html
CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=45416328
17. Aineistonhallinnan haasteita
Pitkän elinkaaren hallinta
Tutkijan prioriteetit
Kuvailutietojen keruu
Heterogeenisuus
Juridiset kysymykset
Kehitys
19. Science is organized
knowledge. Wisdom
is organized life.
Immanuel Kant
KIITOS!
By Marcelo Canevari y Marcelo José Canevari
http://blog.illustraciencia.cat/2015/04/ibera-marcelo-canevari-y-marcelo-jose.html,
CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=45564805