O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Machine learning og perspektiver for sundhedssektoren - Enversion A/S

1.444 visualizações

Publicada em

Teknologiens udvikling gør det i dag muligt at bygge systemer, der kan assistere f.eks. læger i at træffe den bedst mulige beslutning i en given situation. Systemer baseret på machine learning (et skridt på vejen mod kunstig intelligens) - kan overskue, bearbejde og finde mønstre i langt flere data end mennesket er i stand til. Se hele foredraget på YouTube: https://www.youtube.com/watch?v=hWdzCHOxJbM

Publicada em: Saúde
  • Seja o primeiro a comentar

Machine learning og perspektiver for sundhedssektoren - Enversion A/S

  1. 1. Kunstig intelligens Perspektiver for sundhedssektoren
  2. 2. Dagens program • 14:00 Velkommen og et par ord om kunstig intelligens • 14:20 Introduktion til maskinlæring • 15:00 LEGO-demonstration – ”Will it break”? • 15:30 Forfriskning og pause • 16:00 Maskinlæring i sundhedssektoren • 16:45 Afrunding og opsummering • 17:00 Spørgsmål og svar 2
  3. 3. 3 Velkommen
  4. 4. 4 Det er ønsket om at gøre danskerne til det sundeste folk i verden, der er drivkraften bag Enversion. Læs mere på enversion.dk eller følg os på Facebook, LinkedIn, Twitter
  5. 5. 5 FOKUS
  6. 6. 6
  7. 7. 7 Data mining Prædiktiv modellering Maskinlæring Data science Big data Kunstig intelligens Maskinintelligens Ekspertsystem
  8. 8. 8
  9. 9. 9 http://www.knightscope.com/
  10. 10. 10 https://www.youtube.com/watch?v=WFR3lOm_xhE
  11. 11. 11 Enorme datamængder Begrænset baggrundsviden Genial til specialopgaver Multikunstner Intet ”hvorfor” Holdninger, fantasi, etik, moral Sandsynligheder Intuition Ingen dårlige dage Performance afhænger af dagsform
  12. 12. 12 http://content.time.com/time/magazine/article/0,9171,2048299,00.html 2015
  13. 13. 13
  14. 14. 14 http://aiimpacts.org/trends-in-the-cost-of-computing/
  15. 15. 15 Introduktion til maskinlæring
  16. 16. 16
  17. 17. 17
  18. 18. 18 RESULTAT Kendte data Blodprøvesvar Køn, alder, herkomst … Kendte svar Haft tarmkræft? Træning Anvendelse Kendte data Blodprøvesvar Køn, alder, herkomst … Ønsket svar Tarmkræft?
  19. 19. 19 Attributter: Eksisterende data, der beskriver objektets forskellige egenskaber. (features) Objektet: Et eller andet, man gerne vil kunne udtale sig om, f.eks.: En borger Et modermærke Nogle symptomer En spillefilm En LEGO-klods En kunde Et journalopslag En fakturalinje … RESULTAT Gruppering: Tilhørsforhold til andre objekter. Anormalitetsdetektion: Afvigere (fra andre normale objekter). Klassifikation: Ønsket viden Kan ”puttes i kasser”. Regression: Ønsket viden Kan tælles.
  20. 20. 20 Attributter: Blodprøvesvar Symptomer Journalnotater Mobiltelefonbrug Google-søgninger Rejsevaner Netflix-præferencer Kreditkortbrug Hvilepuls og BMI Diagnoser Køn, alder, civilstand Lønindkomst KOMPLEKSEATTRIBUTTER RESULTAT Gruppering: Hvem minder han om? Anormalitetsdetektion: Er han et menneske? Klassifikation: Social bedrager? Kræftsyg? Dårlig betaler? Vinelsker? Regression: Forventet levealder? Livsløn? Risiko% for diabetes?
  21. 21. 21 Attributter: Vægt Dimensioner Massefylde Antal bøjelige led Farve(r) Antal enkeltdele Produktionsår Serienavn Antal fikspunkter Pigment(er) Hårdhed #solgte enheder SIMPLEATTRIBUTTER RESULTAT Gruppering: Klodstype? Anormalitetsdetektion: Er det en LEGO-klods? Klassifikation: Er den populær? Er den skrøbelig? Vil den flyde på vand? Er den farlig for børn? Regression: Brugtpris? Reklamationsrate? Maksimal stablingshøjde?
  22. 22. 22
  23. 23. 23 Attributter: Blodprøvesvar Symptomer Journalnotater Mobiltelefonbrug Google-søgninger Rejsevaner Netflix-præferencer Hvilepuls og BMI Diagnoser Køn, alder, civilstand Kreditkortbrug Lønindkomst RESULTAT Gruppering: Hvem minder han om? Anormalitetsdetektion: Er han et menneske? Klassifikation: Social bedrager? Kræftsyg? Dårlig betaler? Vinelsker? Regression: Forventet levealder? Livsløn? Body Mass Index? Risiko% for diabetes?
  24. 24. Find den ”funktion”, der bedst muligt… 24 1. Beskriver sammenhængen mellem attributter og kendte resultater for en række objekter. 2. Forudsiger (prædikterer) svaret for et ukendt objekt baseret på objektets attributter. Bedst muligt? • Hurtigst, billigst • Flest “sandt positive” og “sandt negative” • Færrest “falsk negative” og “falsk positive” Diagnose 1Diagnose 2 Diagnose 3
  25. 25. Artsbestemmelse af iris 25 Iris setosa Iris versicolor + Iris virginica Attribut 1: Bredde af bægerblad Attribut2:Breddeafkronblad Iris setosa 0 5 2 0 Iris versicolor
  26. 26. Regelstyring et hyppigt alternativ 26 IF ( (Blodprøvesvar1>0,5) AND (Blodprøvesvar2<1,0 OR Blodprøvesvar3<0,5) ) {Diagnose1} ELSE {Diagnose2} ;
  27. 27. 27
  28. 28. To do-liste 1. Problemformulering 2. Løsningsmuligheder 3. Indsamling af relevante data 4. Klargøring af data 5. Teknisk metodevalg 6. Træning af model 7. Implementering  Aktiv læring 28
  29. 29. 1. Problemformulering 29 Der er problemer med et stigende antal reklamationer på vores LEGO-klodser. Dette har betydelige konsekvenser for serviceomkostninger og kundeloyalitet.
  30. 30. 2. Løsningsmuligheder 30 Løsning: Byg algoritme, der kan ”teste” en ny LEGO-klods, før den går i produktion.
  31. 31. 3. Indsamling af relevante data 31
  32. 32. 4. Klargøring af data 32 +
  33. 33. 4. Klargøring af data 33
  34. 34. 5. Teknisk metodevalg • Ønsket resultat: Klassifikation [JA/NEJ] • Endeligt attributvalg: • Modeltype: • Optimeringskriterier: • Straf for modelkompleksitet: • Matematisk optimeringsmetode:
  35. 35. 6. Evaluering af modeller 35 1 2 3 4 5 Model 1 Model 2 Model 3 Model 4 Model 5 1 2 3 4 5 Performance model 1 Performance model 2 Performance model 3 Performance model 4 Performance model 5
  36. 36. 36 7. Implementering / aktiv læring HUND! KAT! ?
  37. 37. Will it break?
  38. 38. 38 Forfriskning og pause
  39. 39. 39 Maskinlæring i sundhedssektoren
  40. 40. • Alle kontaktpunkter: – Privatpraktiserende læge og vagtlæger – Speciallæger – Private og offentlige sygehuse – Apoteker – Kommunal hjemmepleje – Kommunale sagsbehandlere 40 Den offentlige sektors viden om Thomas
  41. 41. Maskinlæringsnirvana… 41 Radiologisvar Årligt: 700.000 Siden 2000: 11 millioner Sundhedsfaglige registreringer (SFI) Årligt: 100 millioner Siden 2011: 400 millioner Laboratoriesvar Årligt: 40 millioner Siden 2008: 225 millioner Medicinadministrationer Årligt: 13 millioner Siden 2004: 100 millioner Vævsprøveanalyser, mikrobiologi, registreringer af utilsigtede hændelser, logistikdata, indkøbsdata, økonomidata, personaledata, borger-stamdata, gendata, … §
  42. 42. • Alle kontaktpunkter: – Badevægt – Apple Watch – Endomondo – Blodtryksapparat – Toilet – Min DNA-profil 42 Egen viden om Thomas
  43. 43. Eller hvad med… 43 http://www.nature.com/nature/journal/v529/n7587/full/nature16521.html
  44. 44. 44 Attributter: Symptomer Kliniske fund Prøvesvar Medicinprofil Diagnoser Genetikdata Sygdom i familien Vægt, højde, BMI Køn, alder Civilstand KRAM-faktorer RESULTAT Gruppering: Borgersegment? Anormalitetsdetektion: Akutindsats påkrævet? Klassifikation: Medicinprofil OK? Bud på diagnose? Overlever indgreb? Bedste behandling? Regression: Livskvalitetsscore? Antal leveår? Omkostning/gevinst?
  45. 45. Ustruktureret tekst 45
  46. 46. Tekstanalyse 46 Emnemærkning, konstruktion af attributter Stemningsklassifikation
  47. 47. Watson for Oncology 47
  48. 48. Watson for Oncology 48
  49. 49. Google 49 http://googleresearch.blogspot.dk/2015/03/large-scale-machine-learning-for-drug.html
  50. 50. TeleSkin (skinScan) 50
  51. 51. Modernizing Medicine 51 https://www.modmed.com/ophthalmology/improve-outcomes/
  52. 52. Your.md 52
  53. 53. 23andMe 53
  54. 54. 23andMe 54
  55. 55. 55
  56. 56. 56
  57. 57. 57 Krav: Signifikant ”bedre” resultat end ingen screening. ”Bedre” målt som livskvalitet, økonomi, leveår, …
  58. 58. Evidensbaseret beslutningsstøtte • Skal vi operere eller medicinere? • Er der en bedre medicinprofil? • Hvilken type pacemaker er bedst? • Møder John til behandlingen? • Hvilke målinger bør jeg foretage? • Hvornår bør vi indkalde John? 58MASKINLÆRING PÅ KORT SIGT
  59. 59. 59 Case: Prædiktion af genindlæggelser
  60. 60. Lidt om mig selv • 24 år, lige flyttet til Aarhus • Kandidatstuderende i Sundhedsteknologi på AAU, mangler lige mit speciale • Forrige semester: Udlandsophold i Australien • Arbejde med genindlæggelsesmodeller 60
  61. 61. Baggrund for projektet Genindlæggelsesrater er en kvalitetsparameter • USA: Offentligt økonomisk tilskud til hospitaler på baggrund af genindlæggelsesrater [1] • DK: Kvalitetsparametre testes som supplement til afregningsgrundlaget [2] 61 Genindlæggelser er skidt for sundheden og samfundsøkonomien • Definition: Akut hospitalsindlæggelse 4 timer – 30 dage efter udskrivning • Reducér genindlæggelser?  Identificér højrisikopatienter • Intensiveret overgangspleje kan reducere risikoen for genindlæggelse [1] • DK: Bedre overgang fra regional til kommunal behandling i Danmark [1]: D. Kansagara et al: “Risk prediction models for hospital readmission: a systematic review,” Jama, vol. 306, no. 15, pp. 1688–1698, 2011. [2]: K.M. Pedersen: ”Økonomistyring i den offentlige sektor: Kvantitet, kvalitet og sammenhæng i opgaveløsningen”, no.2:2015
  62. 62. Hvorfor maskinlæring? • Maskinlæring giver store fordele • Viser de vigtigste attributter i forhold til genindlæggelser • Sandsynlighedsvurderer hver patient i forhold til risiko for genindlæggelse 62 • Nødvendighed: Uoverskueligt stort datasæt • 6,6 millioner unikke patienter • 25 millioner forløb • Administrative informationer om hvert forløb fra en 10-årig periode • Alder, køn, indlæggelse- og udskrivningstidspunkt, diagnosekoder m.m.
  63. 63. Resultater 63 • Endeligt datasæt: 5,8 millioner forløb • Opdeling af data til træning og test af model • Præcision: Model gætter rigtigt i 92,5% af tilfældene Vigtighed (1 = vigtigst) Attribut Uddybning 1. Overordnet diagnosekategori F.eks. ”kredsløbsforstyrrelse”, eller ”forstyrrelse i fordøjelsessystem” 2. Komorbiditets-indeks Score, som beskriver patientens sundhedstilstand på tværs af alle patientens nuværende sygdomme 3. Hospitalskode Unik kode for hvert hospital, f.eks. ”Hospital 1”, ”Hospital 2”.. 4. Alder i år 5. Henvist fra ”Praktiserende læge”, ”Akut”… 6. Henvist til ”Praktiserende læge”, ”Plejehjem”... 7. Køn ”Mand”, ”Kvinde”, ”Uvis”… 8. Indlæggelsestid i timer Under patientens nuværende forløb 9. Totalt antal af forløb Fra hele patientens sygehistorik 10. Afdelingstype F.eks. Onkologi, Dialyse eller Akutafsnit … … … 18 Udskrivningsmåde ”Udskrevet af hospital”, ”Død”..
  64. 64. Diskussion og læring • ”For grov” præprocessering – Fjerner bestemte patientgrupper – ej den ”rigtige verden” – Viden om dine data (populationen) er alfa og omega! • Model er ikke endeligt valideret på patienter i realtid • Sandsynlighed for genindlæggelse er ingen redning – Vi kan identificere patienter med høj risiko for genindlæggelse – Hvordan kan/skal denne information bedst udnyttes? 64
  65. 65. 65
  66. 66. 66 Afrunding og opsummering
  67. 67. Gode data 67 https://data.digitaliser.dk/alle
  68. 68. Gode værktøjer 68 Tilgængeligt i skyen, ingen installation Brugervenligt / Amazon-kvalitet Billigt (4 kr./time) Uendeligt skalérbart Gratis Open source Vi stiller LEGO-WEKA-filerne til rådighed Moderate datamængder Gratis Open source Omfattende men veldokumenteret Skalerer fornuftigt http://www.infoworld.com/article/2853707/machine-learning/11-open-source-tools-machine-learning.html
  69. 69. God læsning 69 ”…it is close to being the perfect guide for the intelligent reader who, regardless of whether s/he has a tech background, has a sincere desire to learn how the tools and principles of data science can be used to extract meaningful information from huge datasets.”
  70. 70. God lytning 70 http://www.thetalkingmachines.com/ ”… your window into the world of ML … conversations with experts in the field … discussions of industry news, and useful answers to your questions. ML is changing the questions we can ask of the world around us, here we explore how to ask the best questions and what to do with the answers.”
  71. 71. God læring 71
  72. 72. Krav til gode samarbejdspartnere 72 VS
  73. 73. Krav til gode samarbejdspartnere 73 VS
  74. 74. Gode idéer? 74 Jacob Høy Berthelsen jhb@enversion.dk Thomas Schultz tms@enversion.dk Bo Thiesson thiesson@enversion.dk
  75. 75. VI SES Opfølgning • Gense dagen på YouTube (Enversion-kanalen) • Gense slides på SlideShare • Hent LEGO-datasættet og WEKA-filer på enversion.dk • Se billeder fra dagen på Facebook • Følg os på LinkedIn, Twitter og Facebook • Connect med os på LinkedIn • Giv os feedback på tms@enversion.dk 75
  76. 76. Inge Lehmanns Gade 10 8000 Aarhus C E-mail: info@enversion.dk Telefon: +45 70 23 26 20 Tak (næsten) for i dag
  77. 77. 77 Spørgsmål og svar

×