Data hyötykäyttöön – avoin data kaupungin työntekijän arjessa
Datapohjaiset visualisoinnit datan tulkinnan ja ymmärtämisen tukena
1. Datapohjaiset visualisoinnit datan tulkinnan ja
ymmärtämisen tukena
Executive MBA in Policing 6.10.2016 Tampere
Anne Tervakari, anne.tervakari@tut.fi
Matematiikan laitos, Tampereen teknillinen yliopisto
2. Visualisointi
Tarkoitetaan yleensä prosessia, jossa data (tai informaatio)
muunnetaan visuaaliseksi esitykseksi, joka voidaan havaita
näköaistin avulla.
(Gershon, Eick & Card 1998)
TTY-IISLab
P. Raumonen. 2015
3. Informaation prosessointi
Havainto
Havaintoympäristö
Sensorinen muisti
näkö, kuulo, jne.
Suuntautuminen
(automaattinen rinnakkaisprosessointi
vs. sarjallinen prosessointi)
huomio > valinta > tulkinta > hahmon
tunnistaminen
Pitkäkestoinen
muisti
Säilyttäminen
Muokkaaminen
Lyhytkestoinen muisti
(visuaalinen – sanallinen)
- mieleen painaminen
- säilyttäminen
- mieleen palauttaminen
Freepik from Flaticon CC-BY-3.0
Ajattelu
Muistaminen
Toiminta
(Utriainen 2004, 32 - 35)
5. Huhtamäki, J. et al. (2013). Process for Measuring and
Visualizing an Open Innovation Platform: Case Demola.
http://dx.doi.org/10.1145/2523429.2523478 .
DATAPOHJAISIA
VISUALISOINTEJA
7. Datavisualisoinnit
• Tieteellinen visualisointi (scientific
visualization).
• Olemassa olevan jatkuvan datan (esim.
mittaustulokset) muuntaminen
visuaalisiksi elementeiksi.
• Usein kuvallisia (pictoral) esityksiä,
joista ei voida erotella erillisiä
(esitys)muotoja, glyyfejä (esim. flow
ja volume visualisoinnit).
• Staattisia tai dynaamisia
visualisointeja.
Marcel Ritter, Jian Tao, Haihong Zhao, Louisiana State
University Center for Computation and Technology.
Hurricane Gustave Oil Spill. 2012
http://www.nsf.gov/news/news_images.jsp?
cntn_id=125855&org=NSF Ks. myös:
http://sciviz.cct.lsu.edu/wordpress/?page_id=62
(Ziemkiewicz & Kosara 2009)
8. • Visuaalinen esitys
havaintoyksiköistä (nodes) ja
niiden välisistä yhteyksistä
(edges/arcs).
• Mm. sosiaaliset verkostot,
kommunikaatioverkostot,
organisaatioverkostot,
päätöksentekoverkostot jne.
• Yksiulotteiset ja kaksiulotteiset
verkostot sekä egokeskeiset
verkostot.
Verkostovisualisoinnit
(Silius et al. 2012. Developing
online publication.
http://dx.doi.org/
10.1007/978-3-642-28314-7_49
Esimerkki: Jaakko Salonen ja Helsingin Sanomat.
Hoitosuositukset ja lääketehtaat.
http://dynamic.hs.fi/2012/kaypahoito/index.html
Lisätietoa tietojen keräämisestä
http://blogit.hs.fi/hsnext/hs-julkaisee-kaypa-hoito-suosituksen-
laatijoiden-sidonnaisuudet
9. Informaation visualisointi (InfoVis)
• Perustuu olemassa olevaan
datalähteeseen (data-driven).
• Jokaista yksittäistä informaatio
”palasta” vastaa yksi visuaalinen
elementti ja päinvastoin (bijective
mapping).
• Vuorovaikutteinen: Käyttäjä voi
kontrolloida näkymäänsä.
• Visualisointi muodostuu
symboleista (voidaan eritellä
esitysmuotoja, glyyfejä)
(notationality)
(Esim. Card, MacKinlay & Shneiderman 1999;
Ziemkiewicz & Kosara, 2009)
An Interactive Data Visualization Dashboard
of San Francisco Police Reports in 2013. Open Data Bits.
http://opendatabits.com/an-interactive-data-visualization-
dashboard-of-san-francisco-police-reports-in-2013/
10. Infografiikka (Information Graphics,
Infographic)
• Datan graafinen esitys, jota käytetty
erityisesti sanomalehdissä yms. tarinan
kertomiseen (viestinnällinen funktio).
• Käyttögrafiikka, uutisgrafiikka.
• Eroaa informaation visualisoinneista
• ei vuorovaikutusmahdollisuutta
(käyttäjä ei voi ”tutkia” dataa)
• kontrolli on visualisoinnin
suunnittelijalla.
• sisältävät usein myös
ylimääräistä, informaation
välittämisen kannalta
epäolennaisia elementtejä (Chart
Junk) (vrt. Tufte 2001).
Florence Nightingale (1857). Krimin sodan
kuolinsyyt.
https://www.sciencenews.org/article/florence-
nightingale-passionate-statistician
11. • Visualisointia hyödynnetään
tietämyksen luomisessa ja siirtämisessä
yksilöiden ja ryhmien välillä
(collaborative context).
• Tietokoneavusteisen ohella myös muun
tyyppisiä visuaalisia esityksiä
• Visualisoinnin tyyppejä: Luonnokset,
erilaiset diagrammit, osaamis- ja
käsitekartat, kuvat ja visuaaliset
metaforat, objektit ja 3d-mallit,
vuorovaikutteiset visualisoinnit, tarinat
ja visiot
Tietämyksen visualisointi
(Knowledge Visualization)
(Eppler & Burkhard 2004; Masud ym. 2010; Meyer, 2009) Osaamispassi. Futurex - Future Experts 2010-2014.
13. Narra$iviset visualisoinnit
• Tarinankerronta ihmisille luontainen tapa välittää informaatiota
• Tukee datan ”lukemista”, tunnistamista, ymmärtämistä ja muistamista sekä
informaation jakamista à kommunikointiväline.
• Olennaisinta informaation esitystapa, ei niinkään vuorovaikutus (vrt. Kosara &
Mackinlay, 2013).
• Gapminder https://www.gapminder.org/tools/
• Stories Through Data http://www.dataviz.myvirtualplayground.co.uk/
• IISLab, TTY. https://iislab.ee.tut.fi/piiri/node/4729/stats/story
Lisätietoa (tutkimusartikkeleja, esityksiä, blogeja jne.) narratiivisista visualisoinneista
esim. Data Storytelling: The Ultimate Collection of Resources
http://www.juiceanalytics.com/writing/the-ultimate-collection-of-data-storytelling-resources
14. Informaation esteettinen visualisointi
(Information Aesthetics Visualization)
• Periaatteessa kuten informaation
visualisointi, mutta hyödyntää visuaalisen
taiteen keinoja
• Pyrkii tukemaan käyttäjiä datan
• lukemisessa ja tunnistamista
• perusmerkityksen tai -viestin
ymmärtämisessä.
• Ambient Visualization, Informative Art:
lähellä visuaalista taidetta.
• Hyödyntävät visuaalisesti mielenkiintoisia
esittämistapoja pyrkiessään tukemaan
datan ”lukemista” ja tunnistamista.
(Lau & Moere 2007; Pousman, Stasko & Mateas 2007) Personal visualization based on Facebook
data. (Wang, Tanahashi, Leaf & Ma, 2015)
Personas. http://personas.media.mit.edu/
15. Taiteelliset visualisoinnit
(Artistic Visualization)
• Tavoitteena viestittää/välittää merkityksiä → katsoja ymmärtää
perusmerkityksen
• Dataa hyödynnetään kuitenkin raakamateriaalina (→ tosiasiallinen tausta).
• Data muunnetaan kiinnostavaksi, inspiroivaksi, tunteisiin vaikuttavaksi tai
ajatuksia herättäväksi visuaaliseksi esitykseksi, joka mahdollistaa merkityksen
ymmärtämisen.
Rodgers, J. & Lyn Bartram, L. (2011) Exploring ambient and artistic visualization for residential energy use feedback.
Visualization and Computer Graphics, IEEE Transactions on, 17 (12 )
https://svn.labri.fr/visu/InfoVis_2011/VisWeek2011_proceedings/infovis/papers/rodgers.pdf
(Kosara 2007)
16. Visualization art (Data art)
• Hyödyntää usein moniselitteisiä ja
tulkinnanvaraisia visualisointitapoja
sekä uusimpia visualisointitekniikoita.
• Kysymyksessä visualisointitekniikoiden
soveltaminen taiteeseen.
• Tavoitteena välittää vaikutelmia tai
alleviivata datan ”sisältämä” viesti,
herättää katsojassa ajatuksia sekä
haastaa katsoja (voi johtaa jopa
turhautumiseen).
• Ei niinkään tue datan ymmärtämistä tai
tutkimista.
http://
www.wefeelfine.org/
(Lau & Moere 2007; Pousman, Stasko & Mateas 2007)
FRICKbits. Your life, your data.” Data-selfie”.
http://www.frickbits.com/
17. R. Lengler and M. J. Eppler. 2007. Towards a periodic table of visualization methods
for management. In GVE 2007: Graphics and Visualization in Engineering. Acta
Press. http://www.visual-literacy.org/periodic_table/periodic_table.pdf
18. Visualisointiprosessi
(Kuosa et al., (2016). Interactive Visualization Tools to Improve Learning and Teaching in Online Learning Environments.
International Journal of Distance Education Technologies (IJDET). http://dx.doi.org/10.4018/IJDET.2016010101
Data
prerpocessing,
integration,
cleansing
Filtering and
grouping
Visual mapping
Interactive visualization
Raw
data
Focus data
Transformation
Selections
by user
Prepared data
Suunnittelijan tavoitteet
Käyttäjän tavoitteet
19. Suunnittelussa huomioitavaa
• Mitä? Mitä informaatiota (lähtö)data sisältää? Miltä alalta? Mikä
osa datasta tulisi visualisoida? Millä tarkkuudella?
• Kenelle? Kenelle visualisointi on tarkoitettu? Millaisissa tilanteissa
visualisointia on tarkoitus käyttää (käyttökonteksti)?
• Miksi? Mikä on visualisoinnin tarkoitus: välittää informaatiota,
vaikuttaa tai suostutella, herättää ajatuksia tai tunteita, auttaa
datan ymmärtämisessä, tukea datan tutkimista?
• Miten? Minkä tyyppinen visualisointi? Millainen visuaalinen
koodaus (encoding)? Vuorovaikutteiset toiminnot? Algoritmin
tehokkuus?
06/10/16 19
(Munzner 2009)
20. Visualisointien laatukriteeristö
Osa-alue Kriteeri (heuris/nen sääntö)
Havainnoin$ 1. Visuaalisen vihjeen tehokkuus on suhteessa kuva6avan asian
tärkeyteen
2. Värien merkitys ja keskinäinen suhde
3. Kogni$ivisen kuorman vähentäminen
Ymmärtämisen
tukeminen
4. Visualisoinnin ja konteks$n yhteys
5. Käy6äjän itseohjautuvuuden tukeminen
6. Sisäinen ja ulkoinen yhtenäisyys ja johdonmukaisuus
Analyysiprosessin
tukeminen
7. Analyysin osatavoi6eita tukeva vuorovaikutus
8. Tulkinnan oikeellisuuden todenne6avuus
9. Vuorovaiku6eisuuden tehokkuus
10. Eritasoisten käy6äjien huomioiminen
11. Sosiaalinen ulo6uvuus ja datan uudelleen käy6ö
Saavute6avuus 12. Saavute6avan teknologian käy6ö
13. Esteetön $edon esi6äminen
Muokattu alkuperäisen lähteen pohjalta.
Paukkeri, J. 2014. Informaation visualisoinnin laadukkuuskriteerit.
Hypermedian DI-työ.Tampere: Tampereen teknillinen yliopisto.
21. VISUAALINEN
ANALYTIIKKA
Industrial scale QSM for all trees in aforest stand of
several ha. Raumonen, P. et al. 2015.
Massive-scale tree modelling from TLS data. ISPRS.
Vol-II-3/W4
22. Visualisoinneista visuaaliseen analy$ikkaan
• Visuaalisessa analytiikassa on kysymys iteratiivisesta,
vuorovaikutteisesta prosessista (näkymän luominen,
tutkiminen ja informaation jalostaminen), joka
– tuottaa (uutta) tietoa datan sisältämistä merkityksistä ja niiden
välisistä yhteyksistä sekä
– auttaa tulkitsemaan informaatiota kontekstissaan sekä
havaitsemaan syysuhteita.
(Gershon, Eick & Card 1998;
Heer & Shneiderman 2012)
Lähde: VisMaster 2015
http://www.visual-analytics.eu/faq/
23. Visuaalista analyysia tukevat toiminnallisuudet
Heerin ja Shneidermanin (2012) mukaan
A. Datan ja näkymän
määrittely
1. Tarkoituksenmukaisen visuaalisen koodauksen (encoding) valinta
datan visualisointiin.
2. Datan suodattaminen, mikä mahdollistaa tarkentamisen
mielenkiintoisiin kohtiin.
3. Tekijöiden järjesteleminen kaavan tai rakenteen (pattern)
paljastamiseksi
4. Lähtödatan jalostaminen (arvojen ja mallien johtaminen).
B. Näkymien käsittely 5. Korostettavien, suodatettavien tai käsiteltävien kohteiden valinta.
6. Navigointi ylemmän tason kaavojen (pattern) ja alemman tason
yksityiskohtien tutkimiseksi.
7. Näkymien koordinointi moniulotteisen tutkimuksen tukemiseksi.
8. Ikkunoiden ja työtilojen järjestäminen.
C. Analysointiprosessin
tukeminen
9. Analyysin vaiheiden ”nauhoitus” tarkistamista, arviointia ja
jakamista varten.
10. Analysoinnin tulosten, kaavojen (pattern) kommentointi
löydöksien dokumentoimiseksi.
11. Näkymien ja kommenttien jakaminen yhteistyön edistämiseksi.
12. Käyttäjien opastus analyysitehtävän tai tarinan läpikäymisessä.
24. A1.Visualisoin$tavan valinta
(Visualize data by choosing visual encoding)
Tarkoituksenmukaisin visuaalinen esitystapa riippuu datan tyypistä (luokitteleva, järjestystä tai
määrää kuvaava). Esim. sijainti (x,y) (position) soveltuu hyvin kaikille kolmelle tyypille. Sitä vastoin
värisävy (hue) soveltuu hyvin luokittelevan datan esittämiseen, mutta varsin huonosti
määrällistä datan esittämiseen. (Mackinley 1986 ref. Munzner 2009.)
Huom! Ylinnä
parhaiten soveltuva
visuaalinen esitys
tapa, alinna
huonoin vaihtoehto.
25. Shape of Science: http://www.scimagojr.com/shapeofscience/
A2. Datajoukon valinta
(Filter out data to focus on relevant items)
26. 1. 2.
Victor Hugo: Kurjat. Henkilöiden esiintyminen kirjan samassa kappaleessa (mitä
tummempi väri sitä useampi esiintyminen). http://bost.ocks.org/mike/miserables
1. Aakkosjärjestys
2. Esiintymiskertojen lukumäärän mukaan.
A3. Laji6elu, järjestäminen
(Sort items to expose patterns)
27. A4. Jalostaminen
(Derive values or models from source data)
• Visuaalinen analysointi on iteratiivinen prosessi.
• Käyttäjä saattaa havaita alkuperäisen datan
käyttötarkoitukseen soveltumattomaksi.
• Muuttujien arvojen muuntaminen tai uusien muuttujien
muodostaminen aiempien pohjalta. Esimerkiksi
• summamuuttujien, keskilukujen tai hajontalukujen sekä
monimutkaisempien tilastollisten
analysointimenetelmien hyödyntäminen visualisointien
tuottamisessa
• visualisointien yhteydessä käyttäjälle esitetään
automaattisesti laskettuja tunnuslukuja.
35. Lähteet
• Card, S.K., MacKinlay, J.D. & Shneiderman, B. (1999). Readings in Information Visualizations: Using
Vision to Think. Morgan Kaufmann Publisher.
• Eppler, M., & Burkhard, R. (2004). Knowledge Visualization. Towards a New Discipline and its Fields of
Application. NetAcademy.
• Gershon, N., Eick, S.G. & Card, S. (1998). Information visualization. Interaction, 5(2), 5 – 15.
http://dx.doi.org/10.1145/274430.274432
• Heer, J., Mackinley, J.D., Stolte, C. & Agrawala, M. (2008). Graphical Histories for Visualization:
Supporting Analysis, Communication, and Evaluation. IEEE Transactions on Visualization and
Computer Graphics, 14(6), 1189 – 1196. http://dx.doi.org/10.1109/TVCG.2008.137
• Heer, J. & Shneiderman, B. (2012). Interactive dynamics for visual analysis. Communications of the
ACM, 55(4), 45 – 54. DOI: http://dx.doi.org/10.1145/2133806.2133821
• Kosara, R. (2007). The Missing Link Between Information Visualization and Art. Proceedings of the
11th International Conference Information Visualization, IEEE Computer Society Washington, DC,
USA, 631-636. http://dx.doi.org/10.1109/IV.2007.130
• Kosara, R. and Mackinlay, J. (2013). Storytelling: The Next Step for Visualization. IEEE Computer
(Special Issue on Cutting-Edge Research in Visualization), 46(5), 44–50.
http://kosara.net/papers/2013/Kosara_Computer_2013.pdf
• Lau, A. & Moere, A.V. (2007). Towards a Model of Information Aesthetics in Information Visualization.
Proceeding IV '07 Proceedings of the 11th International Conference Information Visualization
Washington, DC, USA, 87 – 92. http://dx.doi.org/10.1109/IV.2007.114
• Mackinlay, J. (1986). Automating the design of graphical presentations of relational information.
Journal ACM Transactions on Graphics (TOG). 5:2, 110 – 141.
http://dl.acm.org/citation.cfm?id=22950
36. Lähteet
• Masud, L., Valsecchi, F., Ciuccarelli, P., Ricci, D. & Caviglia, G. (2010). From Data to Knowledge.
Visualizations as transformation processes within the Data-Information-Knowledge continuum. Proceedings
of the 14th International Conference Information Visualisation, the 26-29 July 2010 in London United
Kingdom, 445-449. http://doi.ieeecomputersociety.org/10.1109/IV.2010.68
• Meyer, R. (2009). Knowledge Visualizations. In: proceeding of Media Informatics Advanced Seminar on
Information Visualization. Media Informatics.
https://www.medien.ifi.lmu.de/lehre/ws0809/hs/docs/meyer.pdf
• Munzner, T. (2009). Visualization. In: Shirley, P., and Marschner, S. (Eds.) (2009). Fundamentals of
Graphics, 3rd edition. AK Peters, 675-707.
http://www.cs.ubc.ca/labs/imager/tr/2009/VisChapter/akp-vischapter.pdf
• Pousman, Z., Stasko, J.T. & Mateas, M. (2007). Casual Information Visualization: Depictions of Data in
Everyday Life. Journal IEEE Transactions on Visualization and Computer Graphics, 13(6), 1145-1152.
http://dx.doi.org/10.1109/TVCG.2007.70541
• Tufte , E. R. (2001). The Visual Display of Quantitative Information. 2nd edition. Cheshire, CT: Graphics
Press.
• Utriainen, O. (2004). Kokeellisuus ja voiman käsitteen merkityksen rakentaminen: ymmärtäminen ja
selittäminen hahmottavassa ja mallintavassa lähestymistavassa. Helsinki: Helsingin yliopisto.
• Ziemkiewicz, C. & Kosara, R. (2009). Embedding Information Visualization within Visual Representation.
Advances in Information and Intelligent Systems. Vol. 251. Studies in Computational Intelligence. Springer
Berlin Heidelberg, 307-326. http://dx.doi.org/10.1007/978-3-642-04141-9_15
• Viégas, F. B. & Wattenberg, M. (2007). Artistic Data Visualization: Beyond Visual Analytics. Online
Communities and Social Computing. Lecture Notes in Computer Science, vol. 4564. Berlin: Springer,
182-191. http://dx.doi.org/10.1007/978-3-540-73257-0_21
• Wang, S., Tanahashi, Y., Leaf, N. & M.K-W. (2015). Design and Effects of Personal Visualizations. Computer
Graphics and Applications. http://doi.dx.org/10.1109/MCG.2015.74
37. Visualisoinnit (TTY-IISLab)
Meri Kailanto, Juho Koro, Antti Kortemaa, Kirsi Kuosa, Teemu Mäkelä, Jukka
Paukkeri, Petri Sandström, Teemo Tebest, Anne Tervakari
Tampereen teknillinen yliopisto, Matematiikan laitos
Lisätietoja: Anne Tervakari, anne.tervakari@tut.fi
37
TTY-IISLab