De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
5. Ter ilustratie sequencing ‘old style’ vs ‘new style’ Nu: 240 GB / dag 100.000 ACTG per experiment 50.000.000.000 3 uur Tijd per experiment 7 uur 2 jaar Tijd voor humaan genoom 2 weken € 300.000.000 Kosten voor humaan genoom € 3.000
6.
7.
8. Integratie zorg & onderzoek bij dataverzameling Gewenste situatie Geïntegreerde zorg- en onderzoeksinformatie Zorg- / research pad Intake, anamnese en IC Self reporting MyUMC
9.
10.
11. ICT Infrastructuur Gewenste situatie Waardevolle gegevens in een goed beheerd RC Goede/snelle verbindingen binnen UMCU Hoge bandbreedte naar buiten Open access & identity management Storage als basisvoorziening Schaalbare, flexibele storage tegen lage kosten Gedeeltelijk eigen beheer Metadatering om data op langere termijn te beheersen Toegankelijk Rekencapaciteit als basisvoorziening Voldoende voor onderzoek op bijv. beeldmateriaal Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen Met energie / koeling / beveiliging goed geregeld Hogere eisen aan security / privacy Netwerk Storage Rekenkracht Rekencentrum
12. Situatie landelijk V eel partijen, veel lijntjes, veel steigers Lifelines SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC LSH NFU ZonMW KNAW CTMM BMM PSI BBMRI Industrie RIVM e.a. Programma’s & projecten project project project project project project TI Pharma project … ESFRI IMI OPS PROTECT … FP7 BioShare BioImaging …
13.
14. Issues / bottlenecks / vragen Not invented here! Flexibiliteit & kosten Snelle toegang Beveiliging eigen data Samenwerking?
15.
Notas do Editor
Alleen voor Genetica UMC Utrecht nu 5 petabyte per jaar;dat groeit nog, dan zijn we nog niet eens echt aan het sequencen begonnen
Life sciences is top sector voor EZ: Nederland als kennisland
Situatie in Utrecht Strategiestudie 2010-2011 Onderzoekers bewegen van ‘zelf doen’ naar gebruik centrale dienstverlening Groei tot over de eigen grenzen Verder: kwaliteit / monitoring wordt van groter belang Pro biotica affaire, maar ook management Geen automatische steun vanuit de onderzoekers Spitsen: Research dataware house Kennis Storage / rekencapaciteit / netwerk
Het resultaat van dit work package zou moeten zijn dat een geïntegreerde verzameling van data voor zorg en onderzoek wordt gerealiseerd. Met de invoering van het nieuwe ziekenhuissysteem in 2011 wordt een begin gemaakt met de invoering van zgn. ‘zorgpaden’: op de unieke patiënt afgestemde trajecten, waarin meerdere hulpverleners ieder hun eigen taak hebben en informatie met elkaar delen. Het idee is dat binnen deze zorgpaden ook research activiteiten worden geïntegreerd, zodat de patiënt via één pad zowel door de zorgverleners als door de onderzoekers worden benaderd. Eventuele dubbelingen worden vermeden, bloedbepalingen en scans worden in principe zo uitgevoerd dat deze zowel voor de zorg als het onderzoek gebruikt kunnen worden.
Huidige situatie Vele soorten en vormen van onderzoeksdatabases Veel suboptimale, lokale oplossingen. Niet altijd conform wet- en regelgeving Borging van de data is vaak matig (bijv. backups) Goede datamanagement ondersteuning niet overal beschikbaar Vindbaarheid van onderzoeksdata beperkt / geen catalogus
Administratieve ondersteuning Toegang tot expertise op het gebied van datamanagement, medische informatiekunde en bio-informatica Beveiligde toegang tot relevante resources, waaronder de eigen datasets Gedeelde omgeving met collega’s, ook buiten het ziekenhuis Centraal volgen van onderzoek maakt kwaliteitscontroles mogelijk
Infrastructuur = storage, high performance computing, netwerk Centraal vs decentraal beheer Financiering / doorberekening Opvangen piekbelasting door samenwerking? Cloud computing Basis IT-voorzieningen als commodity
Er wordt op allerlei manieren gewerkt aan de realisatie van een nationale en internationale ICT infrastructuur voor onderzoek. Wat bedoel ik daarmee? U moet hierbij denken aan zaken die je instituutsoverstijgend moet organiseren om samenwerking en uitwisseling van data zo goed mogelijk te faciliteren, maar ook om zo effectief mogelijk van dure voorzieningen gebruik te maken. Concreet gaat het met name om: Een centrale pseudonimisatiedienst, waardoor het mogelijk wordt om data over dezelfde patiënt uit meerdere ziekenhuizen te koppelen Standaarden voor de wijze waarop data wordt verzameld en vastgelegd. Dan gaat het om SOP’s, om de semantiek en syntax van de data die je verzamelt en de metadata, dus de data die belangrijke kenmerken van de verzamelde data beschrijven. Zonder dit soort standaarden is uitwisseling eigenlijk niet mogelijk. In het kader van parelsnoer is een begin gemaakt met dit soort standaarden. En we hebben mogelijk allemaal ook wel over SNOMED gehoord. Dan weet u ook dat er nogal wat bij komt kijken. Voorzieningen waarmee data kunnen worden teruggevonden. We zijn een enorme oceaan aan data aan het opbouwen, en het is absoluut niet vanzelfsprekend dat we straks nog iets kunnen terugvinden. Maar eventueel ook het gezamenlijk gebruik van grote rekenclusters zodat niet iedereen de eigen serverparken hoeft af te stemmen op de piekbelastingen En tenslotte kan het gaan om de ontwikkeling van dure en specifieke technologieën die voor iedereen van belang zijn. Hierbij speelt bijv. het NBIC een rol. De situatie nu is dat er vanuit allerlei grote projecten zoals CTMM, Parelsnoer, TI Pharma en BBMRI wordt gewerkt aan allerlei belangrijke voorzieningen. Voor een deel wordt er daarbij samengewerkt, voor een deel ook niet. Er staat van alles in de steigers, maar de programma’s lopen de komende jaren af en het is onzeker wat er daarna gebeurt.
Op verschillende niveaus is inmiddels het besef scherp aanwezig dat het nodig is om alle initiatieven beter op elkaar af te stemmen, zodat een samenhangende ICT infrastructuur ontstaat op nationaal en zo mogelijk ook op internationaal niveau, die ook op de langere termijn in stand kan worden gehouden. Hierbij zal naar verwachting de rol van de instituten groter gaan worden dan nu het geval is, zij zijn de eigenlijke klant van deze infrastructuur.
‘ Not invented here’ syndroom: moeite met oplossingen die men niet zelf heeft bedacht Argwaan tegen ‘centrale’ voorzieningen Flexibiliteit & kosten De concurrent is de Mediamarkt Onderscheid soorten data: archivering vs werk Direct opvraagbaarheid is van belang, ook van de ruwe data Wantrouwen t.a.v. andere partijen Big brother Ook: de eigen data zijn heilig