7. Toegankelijkheid van Data
Deze onderzoekers zijn begonnen vóór
internet
ze hebben een fantastische datacreatie
workflow ontwikkeld op hun instituut
de ETCBC heeft een behoorlijk dikke
celwand gekregen
9. research data cycle ?religious
communities
theol.
scholars
theol.
scholars
enlightened lay
people
10. research data cycle ?religious
communities
theol.
scholars
theol.
scholars
Research Data
Archiving
DANS
CLARIN
SHEBANQ
LAF-Fabric
comp. hum
linguists
enlightened lay
people
13. stap 4: project (2013)
SHEBANQ
System for Hebrew Text:
ANnotations for Queries
project: CLARIN-NL
data curation: LAF
demonstrator: query saver
infrastructuur
data formaat
instrument
14. LAF? Yes, ISO Linguistic Annotation Framework
ISO 24612:2012
Nancy Ide, Laurent Romary
25. transformeren Hoe kan ik de computer zo snel mogelijk voor mij aan het werk zetten?
scripten
shell, python
scientific programming
software als instrument
uur cyclus
door onderzoeker voor
onderzoeker
programmeren
C, C++, Java
software engineering
applicaties als product
wekelijkse cyclus
door ICTer voor
onderzoeker
26. waar vallen wetenschappers voor?
het zijn geen software ontwikkelaars
maar ze programmeren wel
ze exploreren data, kneden, masseren
hun product is geen programma
maar analyse, visualisatie, publicatie
27. cultuur
fragmenten uit een video van Fernando Perez
4:19 onderzoekers en computing - 7:37
17:00 tools en de data life cycle - 20:26
42:09 data en publiceren - 44:20 / 49:22
28. data science at the command line
http://datascienceatthecommandline.com
http://datasciencetoolbox.org
The Data Science Toolbox is a virtual
environment based on Ubuntu Linux that
is specifically suited for doing data
science. Its purpose is to get you started
in a matter of minutes. You can run the
Data Science Toolbox either locally
(using VirtualBox and Vagrant) or in the
cloud (using Amazon Web Services).
31. stap 7: meer (toekomst)
meer projecten
meer disciplines
meer databronnen
meer wetenschappelijke output
betere positie in de competitie
32. research environment
function medium infra
data LAF in dataset DANS EASY
web site web2py DANS=>KNAW,
Leaseweb, Cloud
tools LAF-Fabric,
Shebanq, Emdros
Github,
Sourceforge
publishing IPython notebooks,
Restructured Text
Github,
Readthedocs
products apps, notebooks,
articles
Github, Science
Clouds, Journals
33. is dit een succes verhaal?
dat staat nog te bezien ...
pas na 6 jaar tekenen van versnelling
vaak de gelegenheid grijpen
overmatig overtuigen
technische diepgang
affiniteit met de bronnen en het onderzoek
investeringen vooraf
34. waarom gaat het niet sneller?
de groep heeft zich efficiënt georganiseerd
veel is onder controle
nieuwe methoden zijn nog niet bewezen
technische support is schaars en moeilijk te
betalen voor alfa-groepen
35. welke factoren dragen bij?
personele veranderingen in de vakgroep
nieuwe projecten
nieuwe eisen van NWO (open access)
competitie en samenwerking over disciplines
door de al maar doorgaande dynamiek van meer-beter-sneller-
werkbaarder:
komt de digitale wereld steeds dichter bij steeds meer mensen
36. Helpt data management de
onderzoeker?
ja, als zij inziet waar archivering en hergebruik
goed voor zijn
ja, als hij de weg naar het archief weet te vinden
ja, als het archief relevant voor haar weet te zijn
ja, als het archief alert omgaat met de
ontwikkelingen in ICT
dirk.roorda@dans.knaw.nl
37. Helpt data management de
onderzoeker?
Niets hiervan is
vanzelfsprekend
ja, als zij inziet waar archivering en hergebruik
goed voor zijn
ja, als hij de weg naar het archief weet te vinden
ja, als het archief relevant voor haar weet te zijn
ja, als het archief alert omgaat met de
ontwikkelingen in ICT
dirk.roorda@dans.knaw.nl