Marc Rietveld (UMC Utrecht) - Big Data en Research IT

•Transferir como PPT, PDF•

1 gostou•1,394 visualizações

De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.

Seminar Dutch Health Hub 23 november 2011 Marc Rietveld

Kans Dutch Health Hub in onderzoek ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Werken aan vertrouwen

Inhoud ,[object Object],[object Object],[object Object],[object Object],[object Object]

Trends in medisch / farmaceutisch onderzoek ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ter ilustratie sequencing ‘old style’ vs ‘new style’ Nu: 240 GB / dag 100.000 ACTG per experiment 50.000.000.000 3 uur Tijd per experiment 7 uur 2 jaar Tijd voor humaan genoom 2 weken € 300.000.000 Kosten voor humaan genoom € 3.000

Trends medisch / farmaceutisch onderzoek ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Situatie UMC Utrecht ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Integratie zorg & onderzoek bij dataverzameling Gewenste situatie Geïntegreerde zorg- en onderzoeksinformatie Zorg- / research pad Intake, anamnese en IC Self reporting MyUMC

Research Data Platform Gewenste situatie : RDP als onderdeel UMC-breed datawarehouse OLAP Bronsystemen Data store ETL EZIS SAP BW Lab / medicatie Uitvoer BI portal Rapport xyz Rapport xyz Dataset Samples Beeld Vragenlijsten META DATA Dataset Dataset ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],Onderzoeksportaal Gewenste situatie

ICT Infrastructuur Gewenste situatie Waardevolle gegevens in een goed beheerd RC Goede/snelle verbindingen binnen UMCU Hoge bandbreedte naar buiten Open access & identity management Storage als basisvoorziening Schaalbare, flexibele storage tegen lage kosten Gedeeltelijk eigen beheer Metadatering om data op langere termijn te beheersen Toegankelijk Rekencapaciteit als basisvoorziening Voldoende voor onderzoek op bijv. beeldmateriaal Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen Met energie / koeling / beveiliging goed geregeld Hogere eisen aan security / privacy Netwerk Storage Rekenkracht Rekencentrum

Situatie landelijk V eel partijen, veel lijntjes, veel steigers Lifelines SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC LSH NFU ZonMW KNAW CTMM BMM PSI BBMRI Industrie RIVM e.a. Programma’s & projecten project project project project project project TI Pharma project … ESFRI IMI OPS PROTECT … FP7 BioShare BioImaging …

Gewenste situatie: samen werken aan toekomstvaste voorzieningen ,[object Object],SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC NFU ZonMW KNAW Industrie RIVM e.a. Nationale ICT infrastructuur ,[object Object],DHH?

Issues / bottlenecks / vragen Not invented here! Flexibiliteit & kosten Snelle toegang Beveiliging eigen data Samenwerking?

Mogelijke bijdrage Dutch Health Hub ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Mais conteúdo relacionado

Mais de AlmereDataCapital

Roland Haeve (Atos): 'Using the Cloud for Big Data Analytics'AlmereDataCapital

Dr. Piet Daas (CBS) - Statistiek en grote data bestandenAlmereDataCapital

Maurice Bouwhuis (SARA/Vancis) - Hoe big data te begrijpen door ze te visuali...AlmereDataCapital

Gerard Jansen (CEO Alan Turing Institute) - Alan Turing Institute: brengt dat...AlmereDataCapital

Bert Reijmerink (Genalice) - Hoe technologie bijdraagt aan een betere behande...AlmereDataCapital

Carlijn Nouwen (McKinsey) - Keynote: Big Data in de ZorgAlmereDataCapital

Sjaak van der Pouw (Siemens Healthcare) - Beeldexplosie: de mogelijkheden van...AlmereDataCapital

Nicky Hekster (IBM) - Watson for HealthAlmereDataCapital

Freek Bomhof (TNO) - Big Data en kansen in de zorgAlmereDataCapital

Harro Stokman (Euvision) - Big Brother Watches Big DataAlmereDataCapital

Arjan Hassing (Ernst & Young) - Kosten besparen op big data storageAlmereDataCapital

Prof. Ard den Heeten (LRCB) - Brondata: kennis uit ruwe dataAlmereDataCapital

Peter Walgemoed (Carelliance) - Businessmodels for Big DataAlmereDataCapital

Mais de AlmereDataCapital (13)

Roland Haeve (Atos): 'Using the Cloud for Big Data Analytics'

Dr. Piet Daas (CBS) - Statistiek en grote data bestanden

Maurice Bouwhuis (SARA/Vancis) - Hoe big data te begrijpen door ze te visuali...

Gerard Jansen (CEO Alan Turing Institute) - Alan Turing Institute: brengt dat...

Bert Reijmerink (Genalice) - Hoe technologie bijdraagt aan een betere behande...

Carlijn Nouwen (McKinsey) - Keynote: Big Data in de Zorg

Sjaak van der Pouw (Siemens Healthcare) - Beeldexplosie: de mogelijkheden van...

Nicky Hekster (IBM) - Watson for Health

Freek Bomhof (TNO) - Big Data en kansen in de zorg

Harro Stokman (Euvision) - Big Brother Watches Big Data

Arjan Hassing (Ernst & Young) - Kosten besparen op big data storage

Prof. Ard den Heeten (LRCB) - Brondata: kennis uit ruwe data

Peter Walgemoed (Carelliance) - Businessmodels for Big Data

Marc Rietveld (UMC Utrecht) - Big Data en Research IT

1. Seminar Dutch Health Hub 23 november 2011 Marc Rietveld

5. Ter ilustratie sequencing ‘old style’ vs ‘new style’ Nu: 240 GB / dag 100.000 ACTG per experiment 50.000.000.000 3 uur Tijd per experiment 7 uur 2 jaar Tijd voor humaan genoom 2 weken € 300.000.000 Kosten voor humaan genoom € 3.000

8. Integratie zorg & onderzoek bij dataverzameling Gewenste situatie Geïntegreerde zorg- en onderzoeksinformatie Zorg- / research pad Intake, anamnese en IC Self reporting MyUMC

10.

11. ICT Infrastructuur Gewenste situatie Waardevolle gegevens in een goed beheerd RC Goede/snelle verbindingen binnen UMCU Hoge bandbreedte naar buiten Open access & identity management Storage als basisvoorziening Schaalbare, flexibele storage tegen lage kosten Gedeeltelijk eigen beheer Metadatering om data op langere termijn te beheersen Toegankelijk Rekencapaciteit als basisvoorziening Voldoende voor onderzoek op bijv. beeldmateriaal Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen Met energie / koeling / beveiliging goed geregeld Hogere eisen aan security / privacy Netwerk Storage Rekenkracht Rekencentrum

12. Situatie landelijk V eel partijen, veel lijntjes, veel steigers Lifelines SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC LSH NFU ZonMW KNAW CTMM BMM PSI BBMRI Industrie RIVM e.a. Programma’s & projecten project project project project project project TI Pharma project … ESFRI IMI OPS PROTECT … FP7 BioShare BioImaging …

13.

14. Issues / bottlenecks / vragen Not invented here! Flexibiliteit & kosten Snelle toegang Beveiliging eigen data Samenwerking?

15.

Notas do Editor

Alleen voor Genetica UMC Utrecht nu 5 petabyte per jaar;dat groeit nog, dan zijn we nog niet eens echt aan het sequencen begonnen
Life sciences is top sector voor EZ: Nederland als kennisland
Situatie in Utrecht Strategiestudie 2010-2011 Onderzoekers bewegen van ‘zelf doen’ naar gebruik centrale dienstverlening Groei tot over de eigen grenzen Verder: kwaliteit / monitoring wordt van groter belang Pro biotica affaire, maar ook management Geen automatische steun vanuit de onderzoekers Spitsen: Research dataware house Kennis Storage / rekencapaciteit / netwerk
Het resultaat van dit work package zou moeten zijn dat een geïntegreerde verzameling van data voor zorg en onderzoek wordt gerealiseerd. Met de invoering van het nieuwe ziekenhuissysteem in 2011 wordt een begin gemaakt met de invoering van zgn. ‘zorgpaden’: op de unieke patiënt afgestemde trajecten, waarin meerdere hulpverleners ieder hun eigen taak hebben en informatie met elkaar delen. Het idee is dat binnen deze zorgpaden ook research activiteiten worden geïntegreerd, zodat de patiënt via één pad zowel door de zorgverleners als door de onderzoekers worden benaderd. Eventuele dubbelingen worden vermeden, bloedbepalingen en scans worden in principe zo uitgevoerd dat deze zowel voor de zorg als het onderzoek gebruikt kunnen worden.
Huidige situatie Vele soorten en vormen van onderzoeksdatabases Veel suboptimale, lokale oplossingen. Niet altijd conform wet- en regelgeving Borging van de data is vaak matig (bijv. backups) Goede datamanagement ondersteuning niet overal beschikbaar Vindbaarheid van onderzoeksdata beperkt / geen catalogus
Administratieve ondersteuning Toegang tot expertise op het gebied van datamanagement, medische informatiekunde en bio-informatica Beveiligde toegang tot relevante resources, waaronder de eigen datasets Gedeelde omgeving met collega’s, ook buiten het ziekenhuis Centraal volgen van onderzoek maakt kwaliteitscontroles mogelijk
Infrastructuur = storage, high performance computing, netwerk Centraal vs decentraal beheer Financiering / doorberekening Opvangen piekbelasting door samenwerking? Cloud computing Basis IT-voorzieningen als commodity
Er wordt op allerlei manieren gewerkt aan de realisatie van een nationale en internationale ICT infrastructuur voor onderzoek. Wat bedoel ik daarmee? U moet hierbij denken aan zaken die je instituutsoverstijgend moet organiseren om samenwerking en uitwisseling van data zo goed mogelijk te faciliteren, maar ook om zo effectief mogelijk van dure voorzieningen gebruik te maken. Concreet gaat het met name om: Een centrale pseudonimisatiedienst, waardoor het mogelijk wordt om data over dezelfde patiënt uit meerdere ziekenhuizen te koppelen Standaarden voor de wijze waarop data wordt verzameld en vastgelegd. Dan gaat het om SOP’s, om de semantiek en syntax van de data die je verzamelt en de metadata, dus de data die belangrijke kenmerken van de verzamelde data beschrijven. Zonder dit soort standaarden is uitwisseling eigenlijk niet mogelijk. In het kader van parelsnoer is een begin gemaakt met dit soort standaarden. En we hebben mogelijk allemaal ook wel over SNOMED gehoord. Dan weet u ook dat er nogal wat bij komt kijken. Voorzieningen waarmee data kunnen worden teruggevonden. We zijn een enorme oceaan aan data aan het opbouwen, en het is absoluut niet vanzelfsprekend dat we straks nog iets kunnen terugvinden. Maar eventueel ook het gezamenlijk gebruik van grote rekenclusters zodat niet iedereen de eigen serverparken hoeft af te stemmen op de piekbelastingen En tenslotte kan het gaan om de ontwikkeling van dure en specifieke technologieën die voor iedereen van belang zijn. Hierbij speelt bijv. het NBIC een rol. De situatie nu is dat er vanuit allerlei grote projecten zoals CTMM, Parelsnoer, TI Pharma en BBMRI wordt gewerkt aan allerlei belangrijke voorzieningen. Voor een deel wordt er daarbij samengewerkt, voor een deel ook niet. Er staat van alles in de steigers, maar de programma’s lopen de komende jaren af en het is onzeker wat er daarna gebeurt.
Op verschillende niveaus is inmiddels het besef scherp aanwezig dat het nodig is om alle initiatieven beter op elkaar af te stemmen, zodat een samenhangende ICT infrastructuur ontstaat op nationaal en zo mogelijk ook op internationaal niveau, die ook op de langere termijn in stand kan worden gehouden. Hierbij zal naar verwachting de rol van de instituten groter gaan worden dan nu het geval is, zij zijn de eigenlijke klant van deze infrastructuur.
‘ Not invented here’ syndroom: moeite met oplossingen die men niet zelf heeft bedacht Argwaan tegen ‘centrale’ voorzieningen Flexibiliteit & kosten De concurrent is de Mediamarkt Onderscheid soorten data: archivering vs werk Direct opvraagbaarheid is van belang, ook van de ruwe data Wantrouwen t.a.v. andere partijen Big brother Ook: de eigen data zijn heilig

Marc Rietveld (UMC Utrecht) - Big Data en Research IT

Recomendados

Recomendados

Mais conteúdo relacionado

Mais de AlmereDataCapital

Mais de AlmereDataCapital (13)

Marc Rietveld (UMC Utrecht) - Big Data en Research IT

Notas do Editor