SlideShare uma empresa Scribd logo
1 de 50
Baixar para ler offline
Ivorion missio
Ivorio on Suomen johtava riippumaton big data asiantuntija.
Autamme asiakkaitamme selvitymään tiedon
vallankumouksesta voittajina.
Mitä tarkoittaa big data?
● Big data tarkoittaa kahta asiaa:
1. Havaintoa siitä, että dataa on koko ajan määrällisesti
enemmän ja sen muoto ja laatu vaihtelee suuresti
2. Ratkaisuja (tuotteet, palvelut, ohjelmistot,
teknologiat), joilla tuohon haasteeseen tartutaan
Big datan 3 V:tä, se käytetyin määritelmä
1.

Volume
Tietoa (dataa) on koko ajan enemmän. Se pitäisi pystyä
tallentamaan ja hyödyntämään.

2. Velocity
Tietoa (dataa) tulee koko ajan nopeammin. Päätöksiä pitäisi
pystyä tekemään nopeasti.

3. Variety
Tietoa (dataa) tulee kiihtyvällä tahdilla erilaisista lähteistä,
eikä se istu hyvin nykyisiin toimintamalleihin
Veracity, Value Virality, Validity, Viscosity… myös muita V-kirjaimia on lisätty kuvaamaan ilmiötä.
© Ivorio 2013

Mistä sitä dataa oikein tulee?
Digitaalinen todellisuus
(internet, sosiaalinen media)

Fyysinen todellisuus
(sensorit, esineiden internet)

Organisaation hallussa
tai saatavilla oleva data
(ERP, CRM, DW, RDBMS)

Saatavilla olevat datavarannot
(avoin data, datamarkkinat)

Potentiaalinen data
(ei vielä kerätä)
© Ivorio 2013

Suppein näkökulma dataan
“Eihän meillä edes ole big dataa!” “Pilvipalvelut sopivat pilotointiin.”

Tästä näkökulmasta big data
koskettaa ilmiönä n. 0.2 %
maailman organisaatioista
Yrityksen oma strukturoitu data
Yrityksen vielä hyödyntämätön data
Yrityksen vielä keräämätön data
© Ivorio 2013

Suppeahko näkökulma dataan
“Liiketoimintakriittistä dataa ei voida laittaa pilveen, ehkä jotain lokitietoja tms.”
“Privaattipilvi kiinnostaa!”

Tästä näkökulmasta big data
koskettaa ilmiönä n. 3 %
maailman organisaatioista
Yrityksen oma strukturoitu data
Yrityksen vielä hyödyntämätön data
Yrityksen vielä keräämätön data
© Ivorio 2013

Laaja näkökulma dataan
“Mihinkäs me laitetaan kaikki tuo data...”
“Olisiko julkisilla pilvipalveluilla jotain annettavaa?”

Tästä näkökulmasta big data
koskettaa ilmiönä n. 22 %
maailman organisaatioista
Yrityksen oma strukturoitu data
Yrityksen vielä hyödyntämätön data
Yrityksen vielä keräämätön data
© Ivorio 2013

Verkostoitunut näkökulma dataan
“Verkottunut yritys ei voi hillota dataansa!”

Tästä näkökulmasta big data
koskettaa ilmiönä n. 72 %
maailman organisaatioista

Kumppani

Kumppani

Organisaatio

Kumppani

Kumppani

Kumppani

Kumppani
© Ivorio 2013

Kokonaisvaltainen näkökulma dataan
“Palvelinkellarissa homehtuva data ei tuota lisäarvoa tai kilpailuetua!”

Tästä näkökulmasta big data koskettaa ilmiönä n. 98 %
maailman organisaatioista
Avoin data
(dokumentoidut rajapinnat)
Data marketplace
(pilvessä olevat datan markkinapaikat)
Datakauppiaat
(yksittäiset suoraan omaa tai
verkostonsa dataa myyvät)
Puoliavoin data
(ei rajapintoja, hajallaan)
Big datan hyödyntämiskohteita
● Markkinointi
● Suositukset (recommendation engine)
● Tilastollinen analyysi
● Tutkimus- ja kehitystyö
● Mallintaminen ja ennustaminen
● Resurssien kohdentaminen
Mahdollisuuksien tunnistaminen vaatii toimialan ja organisaation ymmärtämistä.
Kuinka suuret ovat big data -markkinat?
● Yleisin luku on välillä 15-50 mrd €
○ IDC sanoo (12/2012), että vuonna 2016 markkinoiden
koko on n. 26 mrd $
○ Gartner sanoo (10/2012), että vuonna 2012 big data markkinat olivat n. 28 mrd $
○ Wikibon ennustaa (02/2012), että big data -markkinat
ovat vuonna 2015 n. 54 mrd $
○ McKinseyn raportissa (05/2011) arvioitiin big datan
vuotuisen lisäarvo- ja kustannussäästöpotentiaalin
olevan vuonna 2011 arviolta 1 000 mrd €
“

McKinsey 2011:

Big data: The next frontier for innovation, competition and productivity

€250 billion - potential annual value
to Europe’s public sector
administration in use of big data more
efficiently.
“

General Electrics 2012

Industrial Internet: Pushing the Boundaries of Minds and Machines

Today, the people that manage big
data systems or perform advanced
analytics have developed unique
talents through self-driven
specialization, rather than through any
programs that build a standard set of
skills or principles
“

Gartner, 2013:

Survey Analysis: Big Data Adoption in 2013

64 % of organizations investing or
planning to invest in big data
technology.
“

Tieto Oyj, Q3/2013:
Osavuosikatsaus Q3 2013

Big datan odotetaan olevan yksi
tietotekniikkapalvelujen nopeimmin
kasvavista alueista keskipitkällä
aikavälillä.
Big datan haasteet Suomessa
1. Osaajapula (teknologiat, datatieteilijät)
2. Lähdedatan vaihteleva laatu ja kasvava määrä
3. Ilmiön ja teknologioiden jäsentymättömyys
%

Lähde: LVM:n Big data Suomessa -selvitys 09/2013
“

McKinsey, 2011:

Big data: The next frontier for innovation, competition and productivity

By 2018, the United States alone could
face a shortage of 140,000 to
190,000 people with deep analytical
skills.
“

Opetus- ja kulttuuriministeriö:

Huippuosaamisella on vaikutusta niin
julkishallinnon sisäiseen toiminnan
tehokkuuteen ja läpinäkyvyyteen kuin
pysyvän kilpailuedun saavuttamiseen
globaaleilla markkinoilla.
Big datan teknologiat
● Hadoop (tunnetuin yksittäinen uusi teknologia)
● NoSQL (uudenlaiset tietokannat)
● “Appliancet” (valmisratkaisut)
● In-memory-, In-database analytics
● Pilvipalvelut
○ Amazon Elastic MapReduce
○ Google BigQuery
○ Microsoft HDInsight
Hadoop
Big datan teollisuusstandardi
© Ivorio 2013

Tiedon rakenteisuus

Hadoopin asema big data -ilmiössä
Nearly all sectors in the US
economy had at least an
average of 200 terabytes of
stored data per company with
more than 1,000 employees.
McKinsey 2011

Hadoop

By 2015, 65 percent of packaged
analytic applications with
advanced analytics will come
embedded with Hadoop.
Gartner 2013

1 Gb

2 Tb

20 Tb

200 Tb

Tiedon määrä
Innoittajana Google
Googlen
julkaisu

Vuosi

Avoimen
lähdekoodi
n projekti

Vuosi

Mihin tarkoitukseen?

GFS ja
MapReduce

2004 Hadoop

2006

Datan tallentaminen ja
analysointi (klusteri)

Sawzall

2005 Pig ja Hive

2008

Massa-analytiikka

BigTable

2006 HBase

2008

Avain-arvopari -tietokanta
(NoSQL)

Pregel

2010

Giraph

2011

Graph-tietokanta

Dremel / F1

2010

Cloudera
Impala

2012

Nopeat kyselyt
(SQL)

Spanner

2012

?

????

Transaktiot
© Ivorio 2013

Hadoop Suomessa
Käyttäjiä lähitulevaisuudessa
Käyttäjiä
v. 2013 mm.
Vähittäiskauppa
Rovio
Sanoma
Supercell

Media

Palvelualat

Telekommunikaatio
Teollisuus
© Ivorio 2013

Hadoop-työpaikkojen tarjonta
Lähde: Indeed.com
Työpaikat pääasiassa Yhdysvalloissa
Mitä Hadoop tekee?
Hadoop auttaa rakentamaan klusterin
palvelimista
Miksi haluaisin Hadoop-klusterin?
- edullista tallennustilaa (mikä vaan x86-palvelin käy)
- tehokasta prosessointia (rinnakkaisuus)
- toimintavarmuutta
(moninkertainen tallennus)
- skaalautuvuutta
(klusteria helppo laajentaa)
- ekosysteemi, lisäosia ja laajennoksia!
Hadoopissa kaksi keskeistä komponenttia
HDFS

MapReduce

tiedostojärjestelmä

tiedonlouhintaa
Hadoop: arkkitehtuuri

Data
Node 1

MapReducen
idea/vahvuus on
rinnakkaistaa ja
hajauttaa
analytiikka.

Node 2

“raakadata”

“raakadata”

Map

Map

“välitulokset”

“välitulokset”

Reduce

Reduce

HDFS

HDFS

Node 1

Node2
Hadoopin käyttöönotto
Neljä vaihtoehtoa
1. http://hadoop.apache.org
2. Valmis jakelu
3. Hadoop osana Appliance-ratkaisua
4. Pilvipalvelu
1. http://hadoop.apache.org
Lataa, asenna ja konfiguroi
1. http://hadoop.apache.org
Vahvuudet (+) Ilmainen
Heikkoudet (-) Joutuu tekemään kaiken itse

“Harva organisaatio päätyy käyttämään
Hadoopia näin. Startup-yritysten,
tutkimuslaitosten ja yliopistojen vaihtoehto.”
2. Valmis jakelu
Otetaan käyttöön valmiiksi paketoitu kokonaisuus
Amazon
(AWS EMR)
Cloudera
(CHD)
Hortonworks (HDP)
MapR
(M7)
Microsoft
(HDInsight)
Pivotal
(Pivotal HD)
IBM
(IHC)
Intel
(Intel Distribution for Apache Hadoop)
2. Valmis jakelu
Vahvuudet (+)

Helppous, tuki, koulutus, partnerit ja
optimoitu suorituskyky

Heikkoudet (-)

Lukittumisuhka (lock-in), maksullinen

“Tyypillinen tapa tällä hetkellä ottaa
Hadoop käyttöön. Objektiivinen vertailu
hankalaa, tietoa vaikea saada.”
Hadoop-jakeluyritysten tunnettuus
3. Hadoop osana Appliance-ratkaisua
Big data Appliancet (esimerkkilista tunnetuista)
HP
(HAVEn)
IBM
(Infosphere BigInsights)
Microsoft
(Parallel Datawarehouse)
Oracle
(Big Data Appliance)
Pivotal
(Pivotal)
SAP
(SAP HANA Platform)
Teradata
(Teradata Aster Big Analytics Appliance)
3. Hadoop osana Appliance-ratkaisua
Hadoop-kytkökset
HP
(all leading distros)
IBM
(Cloudera)
Microsoft
(Hortonworks)
Oracle
(Cloudera)
Pivotal
(Pivotal HD)
SAP
(Intel, Hortonworks)
Teradata
(Hortonworks)
3. Hadoop osana Appliance-ratkaisua
Vahvuudet (+)

Kehittyneet ominaisuudet,
integroitavuus, tuki- ja partneriverkosto

Heikkoudet (-)

Kallis, vendor lock-in

“Tämä on se todennäköinen tapa, jolla
Hadoop hiipii yrityksiin osana isompaa
kokonaisuutta.”
4. Hadoop pilvipalveluna
Hadoop pilvipalveluna tarjolla mm.:
Amazon
(AWS Elastic MapReduse, EC2)
Microsoft
(Windows Azure HDInsight)
Joyent
(Joyent Hadoop)
Lisäksi esim. MapR M7:lla tehty terasortin
maailmanennätys
Google
(Google Compute Cloud)
© Ivorio 2013

Datan analysoiminen pilvessä
Terasortin maailmanennätys Googlen pilvipalvelussa:
“Since the servers used in MapR’s world record were
virtually instantiated in the Cloud, the cost estimate for
running the TeraSort was about $9 compared to the over
$5M estimate to run the previous record.”
Tästä on kysymys:

$9

vs.

$ 5 000 000

joustavuudesta!
4. Hadoop pilvipalveluna
Vahvuudet (+)

Nopea käyttöönotto, joustavuus

Heikkoudet (-)

Tietoturvahuolet, lainsäädäntö, lisää
osaamisvaatimuksia

“Helpoin, riskittömin ja nopein tapa pilotointiin,
demoamiseen ja testaamiseen. Todennäköisesti
tulevaisuudessa yhä merkittävämpi vaihtoehto
myös tuotantokäyttöön.”
4. Hadoop pilvipalveluna
Hadoopin käyttökohteita
Toimialue

Käyttökohde (case)

Finanssisektori

Riskianalyysi
Petosten tunnistaminen
Päätöksenteon nopeuttaminen
(lainahakemukset yms.)

Datatyyppi

Paikkatieto

Kommunikaatio

Puhelulokitietojen louhiminen (CDR)
Palvelin- ja
Investointipäätösten tukeminen
Resurssien allokointi (tietoliikennekaista yms.) muut lokit

Vähittäis- ja
verkkokauppa

360-asteen näkyvyys asiakkaaseen
Tuotekehitys, hankintapäätökset
Markkinoinnin vaikuttavuuden mittaaminen

Teollisuus

Tilaus-toimitusketjun optimointi
Tuotennon sujuvoittaminen
(lean manufacturing)
Varastoarvojen minimointi
Laadun parantaminen

Lähde: Hortonworks

Tekstiaineistot
Sensoridata
Sentimenttianalyysi
Clickstream
Kannattaako versio 2 ottaa
käyttöön?
Kyllä.
Nyt liikkeelle lähdettäessä ei ole mielekästä
takertua versioon 1.x. Harjoitteluun,
konseptointiin ja pilotointiin versio 1.x käy hyvin
tietenkin edelleen.
Ivorio tarjoaa Pohjoismaiden ensimmäisen
Hadoop-sertifikaatin. Ensimmäinen versio tuli
saataville syyskuussa 2013 suomeksi ja
myöhemmin sertifikaatista tulevat myös ruotsinja englanninkieliset versiot.
MITÄ PITÄISI TEHDÄ?
Ehdotus 1: Lähteä liikkeelle
Pilvipalveluiden kohdalla mm. Accenture
suositteli jo vuonna 2009, että liikkeelle
kannattaa lähteä heti ja ei niille
vähäarvoisimmilla sovelluksilla, vaan
liiketoiminnalle merkityksellisillä.
Kuunneltiinko? Olisko kannattanut?
Ehdotus 2: Datakartoitus
Kartoitetaan datalähteet (nykyiset,
potentiaaliset), arvioidaan kiinnostavuutta
liiketoiminnan ongelmien näkökulmasta.
Ehdotus 3: Teknologiakartoitus
Peilataan omien datalähteiden mahdollisuuksia
tarjolla olevien teknologioiden tarjoamiin
vaihtoehtoihin. Otetaan huomioon osaaminen,
teknologioiden kypsyys, kustannuskset (elinkaari)
ja odotettavissa olevat hyödyt.
Ehdotus 4: Laaditaan datastrategia
Laaditaan strateginen kartta tulevaisuuteen.
Miten tulevaisuuden markkinoilla aiotaan tuottaa
lisäarvoa ja pitää sekä parantaa omaa asemaa
arvoketjussa?
Kiitos

Mais conteúdo relacionado

Mais procurados

Kuntasektorin datan avaus ja jakelu Suomessa
Kuntasektorin datan avaus ja jakelu SuomessaKuntasektorin datan avaus ja jakelu Suomessa
Kuntasektorin datan avaus ja jakelu SuomessaJukka Helin
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorioivoriofinland
 
Big data tietoisku julkishallinnolle 2.10.2013
Big data  tietoisku julkishallinnolle 2.10.2013Big data  tietoisku julkishallinnolle 2.10.2013
Big data tietoisku julkishallinnolle 2.10.2013ivoriofinland
 
Big Data -esitys, Arcada ammattikorkeakoulu
Big Data -esitys, Arcada ammattikorkeakouluBig Data -esitys, Arcada ammattikorkeakoulu
Big Data -esitys, Arcada ammattikorkeakouluImmo Salo
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Mika Aho
 
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...ivoriofinland
 
Eväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenEväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenMika Aho
 
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenBig datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenJari Jussila
 
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...Solutive Oy
 
Tutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanTutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanJari Jussila
 
Analytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäAnalytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäJari Jussila
 
Analytiikka liiketoiminnassa
Analytiikka liiketoiminnassaAnalytiikka liiketoiminnassa
Analytiikka liiketoiminnassaJari Jussila
 
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo Salo
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo SaloPilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo Salo
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo SaloImmo Salo
 
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusSosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusJari Jussila
 
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...ivoriofinland
 
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxSinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxJaana Sinipuro
 
Big data koskettaa kaikkia
Big data koskettaa kaikkiaBig data koskettaa kaikkia
Big data koskettaa kaikkiaivoriofinland
 

Mais procurados (20)

Kuntasektorin datan avaus ja jakelu Suomessa
Kuntasektorin datan avaus ja jakelu SuomessaKuntasektorin datan avaus ja jakelu Suomessa
Kuntasektorin datan avaus ja jakelu Suomessa
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorio
 
Big data tietoisku julkishallinnolle 2.10.2013
Big data  tietoisku julkishallinnolle 2.10.2013Big data  tietoisku julkishallinnolle 2.10.2013
Big data tietoisku julkishallinnolle 2.10.2013
 
Big Data -esitys, Arcada ammattikorkeakoulu
Big Data -esitys, Arcada ammattikorkeakouluBig Data -esitys, Arcada ammattikorkeakoulu
Big Data -esitys, Arcada ammattikorkeakoulu
 
Big data -strategia
Big data  -strategiaBig data  -strategia
Big data -strategia
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
 
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
 
Eväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenEväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseen
 
Teemu Ropponen
Teemu RopponenTeemu Ropponen
Teemu Ropponen
 
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenBig datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
 
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...
Tiedolla johtaminen ja visuaalinen analytiikka - Prosessipäivät 2015 Solutive...
 
BiFF_avaus_20151029
BiFF_avaus_20151029BiFF_avaus_20151029
BiFF_avaus_20151029
 
Tutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanTutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaan
 
Analytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäAnalytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessä
 
Analytiikka liiketoiminnassa
Analytiikka liiketoiminnassaAnalytiikka liiketoiminnassa
Analytiikka liiketoiminnassa
 
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo Salo
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo SaloPilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo Salo
Pilvipalvelut, Tampere 25.10.2013, Eufris Oy, Immo Salo
 
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusSosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
 
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
 
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxSinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
 
Big data koskettaa kaikkia
Big data koskettaa kaikkiaBig data koskettaa kaikkia
Big data koskettaa kaikkia
 

Semelhante a Big data esitys, 14.11.2013, Ivorio Oy

Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...BearingPoint Finland
 
Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläivoriofinland
 
6Aika_presentaatio_Mika_Honkanen
6Aika_presentaatio_Mika_Honkanen6Aika_presentaatio_Mika_Honkanen
6Aika_presentaatio_Mika_HonkanenMika Honkanen
 
Big data mita se on 10 casea
Big data mita se on 10 caseaBig data mita se on 10 casea
Big data mita se on 10 caseaASML
 
Valikoidut kirjoitukset Oskari Lappalainen
Valikoidut kirjoitukset Oskari LappalainenValikoidut kirjoitukset Oskari Lappalainen
Valikoidut kirjoitukset Oskari LappalainenOskari Lappalainen
 
Big data ja liiketoiminnan etiikka
Big data ja liiketoiminnan etiikkaBig data ja liiketoiminnan etiikka
Big data ja liiketoiminnan etiikkaJyrki Kasvi
 
Mitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaMitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaNorth Patrol
 
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021Sitra / Hyvinvointi
 
Citizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaCitizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaAffecto
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Tilastokeskus
 
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oy
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oyPilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oy
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oyivoriofinland
 
Isosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo KoskimäkiIsosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo KoskimäkiTilastokeskus
 
Tiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenTiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenJyrki Kasvi
 
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024Kari Klossner
 
OKRoadshow Mikkeli 13.10.2014: Avoin tieto Lappeenrannassa
OKRoadshow Mikkeli 13.10.2014: Avoin tieto LappeenrannassaOKRoadshow Mikkeli 13.10.2014: Avoin tieto Lappeenrannassa
OKRoadshow Mikkeli 13.10.2014: Avoin tieto LappeenrannassaDigitalmikkeli
 
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko Babitzin
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko BabitzinTiedolla johtamisen tulevaisuus ja avoin data, Mikko Babitzin
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko BabitzinTilastokeskus
 
Julkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleenJulkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleenJyrki Kasvi
 
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen? Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen? THL
 

Semelhante a Big data esitys, 14.11.2013, Ivorio Oy (20)

Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
 
Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:llä
 
6Aika_presentaatio_Mika_Honkanen
6Aika_presentaatio_Mika_Honkanen6Aika_presentaatio_Mika_Honkanen
6Aika_presentaatio_Mika_Honkanen
 
Big data mita se on 10 casea
Big data mita se on 10 caseaBig data mita se on 10 casea
Big data mita se on 10 casea
 
Valikoidut kirjoitukset Oskari Lappalainen
Valikoidut kirjoitukset Oskari LappalainenValikoidut kirjoitukset Oskari Lappalainen
Valikoidut kirjoitukset Oskari Lappalainen
 
Big data ja liiketoiminnan etiikka
Big data ja liiketoiminnan etiikkaBig data ja liiketoiminnan etiikka
Big data ja liiketoiminnan etiikka
 
Mitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaMitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassa
 
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021
Reilu datatalouden kypsyysmalli yrityksille -kehittämistyöpaja 23.3.2021
 
Bisnesstreffit turku 20150206_jsa
Bisnesstreffit turku 20150206_jsaBisnesstreffit turku 20150206_jsa
Bisnesstreffit turku 20150206_jsa
 
Citizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaCitizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoa
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas
 
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oy
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oyPilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oy
Pilvipalvelut, IGP esitys 14.05.2014, immo salo, ivorio oy
 
Isosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo KoskimäkiIsosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo Koskimäki
 
Tiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenTiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseen
 
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024
Kilpailukykyä datasta tapahtuman esitelmä Tampereella helmikuussa 2024
 
OKRoadshow Mikkeli 13.10.2014: Avoin tieto Lappeenrannassa
OKRoadshow Mikkeli 13.10.2014: Avoin tieto LappeenrannassaOKRoadshow Mikkeli 13.10.2014: Avoin tieto Lappeenrannassa
OKRoadshow Mikkeli 13.10.2014: Avoin tieto Lappeenrannassa
 
Julkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleenJulkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleen
 
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko Babitzin
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko BabitzinTiedolla johtamisen tulevaisuus ja avoin data, Mikko Babitzin
Tiedolla johtamisen tulevaisuus ja avoin data, Mikko Babitzin
 
Julkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleenJulkisen tiedon hallinta päälaelleen
Julkisen tiedon hallinta päälaelleen
 
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen? Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
 

Big data esitys, 14.11.2013, Ivorio Oy

  • 1.
  • 2. Ivorion missio Ivorio on Suomen johtava riippumaton big data asiantuntija. Autamme asiakkaitamme selvitymään tiedon vallankumouksesta voittajina.
  • 3. Mitä tarkoittaa big data? ● Big data tarkoittaa kahta asiaa: 1. Havaintoa siitä, että dataa on koko ajan määrällisesti enemmän ja sen muoto ja laatu vaihtelee suuresti 2. Ratkaisuja (tuotteet, palvelut, ohjelmistot, teknologiat), joilla tuohon haasteeseen tartutaan
  • 4. Big datan 3 V:tä, se käytetyin määritelmä 1. Volume Tietoa (dataa) on koko ajan enemmän. Se pitäisi pystyä tallentamaan ja hyödyntämään. 2. Velocity Tietoa (dataa) tulee koko ajan nopeammin. Päätöksiä pitäisi pystyä tekemään nopeasti. 3. Variety Tietoa (dataa) tulee kiihtyvällä tahdilla erilaisista lähteistä, eikä se istu hyvin nykyisiin toimintamalleihin Veracity, Value Virality, Validity, Viscosity… myös muita V-kirjaimia on lisätty kuvaamaan ilmiötä.
  • 5. © Ivorio 2013 Mistä sitä dataa oikein tulee? Digitaalinen todellisuus (internet, sosiaalinen media) Fyysinen todellisuus (sensorit, esineiden internet) Organisaation hallussa tai saatavilla oleva data (ERP, CRM, DW, RDBMS) Saatavilla olevat datavarannot (avoin data, datamarkkinat) Potentiaalinen data (ei vielä kerätä)
  • 6. © Ivorio 2013 Suppein näkökulma dataan “Eihän meillä edes ole big dataa!” “Pilvipalvelut sopivat pilotointiin.” Tästä näkökulmasta big data koskettaa ilmiönä n. 0.2 % maailman organisaatioista Yrityksen oma strukturoitu data Yrityksen vielä hyödyntämätön data Yrityksen vielä keräämätön data
  • 7. © Ivorio 2013 Suppeahko näkökulma dataan “Liiketoimintakriittistä dataa ei voida laittaa pilveen, ehkä jotain lokitietoja tms.” “Privaattipilvi kiinnostaa!” Tästä näkökulmasta big data koskettaa ilmiönä n. 3 % maailman organisaatioista Yrityksen oma strukturoitu data Yrityksen vielä hyödyntämätön data Yrityksen vielä keräämätön data
  • 8. © Ivorio 2013 Laaja näkökulma dataan “Mihinkäs me laitetaan kaikki tuo data...” “Olisiko julkisilla pilvipalveluilla jotain annettavaa?” Tästä näkökulmasta big data koskettaa ilmiönä n. 22 % maailman organisaatioista Yrityksen oma strukturoitu data Yrityksen vielä hyödyntämätön data Yrityksen vielä keräämätön data
  • 9. © Ivorio 2013 Verkostoitunut näkökulma dataan “Verkottunut yritys ei voi hillota dataansa!” Tästä näkökulmasta big data koskettaa ilmiönä n. 72 % maailman organisaatioista Kumppani Kumppani Organisaatio Kumppani Kumppani Kumppani Kumppani
  • 10. © Ivorio 2013 Kokonaisvaltainen näkökulma dataan “Palvelinkellarissa homehtuva data ei tuota lisäarvoa tai kilpailuetua!” Tästä näkökulmasta big data koskettaa ilmiönä n. 98 % maailman organisaatioista Avoin data (dokumentoidut rajapinnat) Data marketplace (pilvessä olevat datan markkinapaikat) Datakauppiaat (yksittäiset suoraan omaa tai verkostonsa dataa myyvät) Puoliavoin data (ei rajapintoja, hajallaan)
  • 11. Big datan hyödyntämiskohteita ● Markkinointi ● Suositukset (recommendation engine) ● Tilastollinen analyysi ● Tutkimus- ja kehitystyö ● Mallintaminen ja ennustaminen ● Resurssien kohdentaminen Mahdollisuuksien tunnistaminen vaatii toimialan ja organisaation ymmärtämistä.
  • 12. Kuinka suuret ovat big data -markkinat? ● Yleisin luku on välillä 15-50 mrd € ○ IDC sanoo (12/2012), että vuonna 2016 markkinoiden koko on n. 26 mrd $ ○ Gartner sanoo (10/2012), että vuonna 2012 big data markkinat olivat n. 28 mrd $ ○ Wikibon ennustaa (02/2012), että big data -markkinat ovat vuonna 2015 n. 54 mrd $ ○ McKinseyn raportissa (05/2011) arvioitiin big datan vuotuisen lisäarvo- ja kustannussäästöpotentiaalin olevan vuonna 2011 arviolta 1 000 mrd €
  • 13. “ McKinsey 2011: Big data: The next frontier for innovation, competition and productivity €250 billion - potential annual value to Europe’s public sector administration in use of big data more efficiently.
  • 14. “ General Electrics 2012 Industrial Internet: Pushing the Boundaries of Minds and Machines Today, the people that manage big data systems or perform advanced analytics have developed unique talents through self-driven specialization, rather than through any programs that build a standard set of skills or principles
  • 15. “ Gartner, 2013: Survey Analysis: Big Data Adoption in 2013 64 % of organizations investing or planning to invest in big data technology.
  • 16. “ Tieto Oyj, Q3/2013: Osavuosikatsaus Q3 2013 Big datan odotetaan olevan yksi tietotekniikkapalvelujen nopeimmin kasvavista alueista keskipitkällä aikavälillä.
  • 17. Big datan haasteet Suomessa 1. Osaajapula (teknologiat, datatieteilijät) 2. Lähdedatan vaihteleva laatu ja kasvava määrä 3. Ilmiön ja teknologioiden jäsentymättömyys % Lähde: LVM:n Big data Suomessa -selvitys 09/2013
  • 18. “ McKinsey, 2011: Big data: The next frontier for innovation, competition and productivity By 2018, the United States alone could face a shortage of 140,000 to 190,000 people with deep analytical skills.
  • 19. “ Opetus- ja kulttuuriministeriö: Huippuosaamisella on vaikutusta niin julkishallinnon sisäiseen toiminnan tehokkuuteen ja läpinäkyvyyteen kuin pysyvän kilpailuedun saavuttamiseen globaaleilla markkinoilla.
  • 20. Big datan teknologiat ● Hadoop (tunnetuin yksittäinen uusi teknologia) ● NoSQL (uudenlaiset tietokannat) ● “Appliancet” (valmisratkaisut) ● In-memory-, In-database analytics ● Pilvipalvelut ○ Amazon Elastic MapReduce ○ Google BigQuery ○ Microsoft HDInsight
  • 22. © Ivorio 2013 Tiedon rakenteisuus Hadoopin asema big data -ilmiössä Nearly all sectors in the US economy had at least an average of 200 terabytes of stored data per company with more than 1,000 employees. McKinsey 2011 Hadoop By 2015, 65 percent of packaged analytic applications with advanced analytics will come embedded with Hadoop. Gartner 2013 1 Gb 2 Tb 20 Tb 200 Tb Tiedon määrä
  • 23. Innoittajana Google Googlen julkaisu Vuosi Avoimen lähdekoodi n projekti Vuosi Mihin tarkoitukseen? GFS ja MapReduce 2004 Hadoop 2006 Datan tallentaminen ja analysointi (klusteri) Sawzall 2005 Pig ja Hive 2008 Massa-analytiikka BigTable 2006 HBase 2008 Avain-arvopari -tietokanta (NoSQL) Pregel 2010 Giraph 2011 Graph-tietokanta Dremel / F1 2010 Cloudera Impala 2012 Nopeat kyselyt (SQL) Spanner 2012 ? ???? Transaktiot
  • 24. © Ivorio 2013 Hadoop Suomessa Käyttäjiä lähitulevaisuudessa Käyttäjiä v. 2013 mm. Vähittäiskauppa Rovio Sanoma Supercell Media Palvelualat Telekommunikaatio Teollisuus
  • 25. © Ivorio 2013 Hadoop-työpaikkojen tarjonta Lähde: Indeed.com Työpaikat pääasiassa Yhdysvalloissa
  • 26. Mitä Hadoop tekee? Hadoop auttaa rakentamaan klusterin palvelimista Miksi haluaisin Hadoop-klusterin? - edullista tallennustilaa (mikä vaan x86-palvelin käy) - tehokasta prosessointia (rinnakkaisuus) - toimintavarmuutta (moninkertainen tallennus) - skaalautuvuutta (klusteria helppo laajentaa) - ekosysteemi, lisäosia ja laajennoksia!
  • 27. Hadoopissa kaksi keskeistä komponenttia HDFS MapReduce tiedostojärjestelmä tiedonlouhintaa
  • 28. Hadoop: arkkitehtuuri Data Node 1 MapReducen idea/vahvuus on rinnakkaistaa ja hajauttaa analytiikka. Node 2 “raakadata” “raakadata” Map Map “välitulokset” “välitulokset” Reduce Reduce HDFS HDFS Node 1 Node2
  • 29. Hadoopin käyttöönotto Neljä vaihtoehtoa 1. http://hadoop.apache.org 2. Valmis jakelu 3. Hadoop osana Appliance-ratkaisua 4. Pilvipalvelu
  • 31. 1. http://hadoop.apache.org Vahvuudet (+) Ilmainen Heikkoudet (-) Joutuu tekemään kaiken itse “Harva organisaatio päätyy käyttämään Hadoopia näin. Startup-yritysten, tutkimuslaitosten ja yliopistojen vaihtoehto.”
  • 32. 2. Valmis jakelu Otetaan käyttöön valmiiksi paketoitu kokonaisuus Amazon (AWS EMR) Cloudera (CHD) Hortonworks (HDP) MapR (M7) Microsoft (HDInsight) Pivotal (Pivotal HD) IBM (IHC) Intel (Intel Distribution for Apache Hadoop)
  • 33. 2. Valmis jakelu Vahvuudet (+) Helppous, tuki, koulutus, partnerit ja optimoitu suorituskyky Heikkoudet (-) Lukittumisuhka (lock-in), maksullinen “Tyypillinen tapa tällä hetkellä ottaa Hadoop käyttöön. Objektiivinen vertailu hankalaa, tietoa vaikea saada.”
  • 35. 3. Hadoop osana Appliance-ratkaisua Big data Appliancet (esimerkkilista tunnetuista) HP (HAVEn) IBM (Infosphere BigInsights) Microsoft (Parallel Datawarehouse) Oracle (Big Data Appliance) Pivotal (Pivotal) SAP (SAP HANA Platform) Teradata (Teradata Aster Big Analytics Appliance)
  • 36. 3. Hadoop osana Appliance-ratkaisua Hadoop-kytkökset HP (all leading distros) IBM (Cloudera) Microsoft (Hortonworks) Oracle (Cloudera) Pivotal (Pivotal HD) SAP (Intel, Hortonworks) Teradata (Hortonworks)
  • 37. 3. Hadoop osana Appliance-ratkaisua Vahvuudet (+) Kehittyneet ominaisuudet, integroitavuus, tuki- ja partneriverkosto Heikkoudet (-) Kallis, vendor lock-in “Tämä on se todennäköinen tapa, jolla Hadoop hiipii yrityksiin osana isompaa kokonaisuutta.”
  • 38. 4. Hadoop pilvipalveluna Hadoop pilvipalveluna tarjolla mm.: Amazon (AWS Elastic MapReduse, EC2) Microsoft (Windows Azure HDInsight) Joyent (Joyent Hadoop) Lisäksi esim. MapR M7:lla tehty terasortin maailmanennätys Google (Google Compute Cloud)
  • 39. © Ivorio 2013 Datan analysoiminen pilvessä Terasortin maailmanennätys Googlen pilvipalvelussa: “Since the servers used in MapR’s world record were virtually instantiated in the Cloud, the cost estimate for running the TeraSort was about $9 compared to the over $5M estimate to run the previous record.” Tästä on kysymys: $9 vs. $ 5 000 000 joustavuudesta!
  • 40. 4. Hadoop pilvipalveluna Vahvuudet (+) Nopea käyttöönotto, joustavuus Heikkoudet (-) Tietoturvahuolet, lainsäädäntö, lisää osaamisvaatimuksia “Helpoin, riskittömin ja nopein tapa pilotointiin, demoamiseen ja testaamiseen. Todennäköisesti tulevaisuudessa yhä merkittävämpi vaihtoehto myös tuotantokäyttöön.”
  • 42. Hadoopin käyttökohteita Toimialue Käyttökohde (case) Finanssisektori Riskianalyysi Petosten tunnistaminen Päätöksenteon nopeuttaminen (lainahakemukset yms.) Datatyyppi Paikkatieto Kommunikaatio Puhelulokitietojen louhiminen (CDR) Palvelin- ja Investointipäätösten tukeminen Resurssien allokointi (tietoliikennekaista yms.) muut lokit Vähittäis- ja verkkokauppa 360-asteen näkyvyys asiakkaaseen Tuotekehitys, hankintapäätökset Markkinoinnin vaikuttavuuden mittaaminen Teollisuus Tilaus-toimitusketjun optimointi Tuotennon sujuvoittaminen (lean manufacturing) Varastoarvojen minimointi Laadun parantaminen Lähde: Hortonworks Tekstiaineistot Sensoridata Sentimenttianalyysi Clickstream
  • 43. Kannattaako versio 2 ottaa käyttöön? Kyllä. Nyt liikkeelle lähdettäessä ei ole mielekästä takertua versioon 1.x. Harjoitteluun, konseptointiin ja pilotointiin versio 1.x käy hyvin tietenkin edelleen.
  • 44. Ivorio tarjoaa Pohjoismaiden ensimmäisen Hadoop-sertifikaatin. Ensimmäinen versio tuli saataville syyskuussa 2013 suomeksi ja myöhemmin sertifikaatista tulevat myös ruotsinja englanninkieliset versiot.
  • 46. Ehdotus 1: Lähteä liikkeelle Pilvipalveluiden kohdalla mm. Accenture suositteli jo vuonna 2009, että liikkeelle kannattaa lähteä heti ja ei niille vähäarvoisimmilla sovelluksilla, vaan liiketoiminnalle merkityksellisillä. Kuunneltiinko? Olisko kannattanut?
  • 47. Ehdotus 2: Datakartoitus Kartoitetaan datalähteet (nykyiset, potentiaaliset), arvioidaan kiinnostavuutta liiketoiminnan ongelmien näkökulmasta.
  • 48. Ehdotus 3: Teknologiakartoitus Peilataan omien datalähteiden mahdollisuuksia tarjolla olevien teknologioiden tarjoamiin vaihtoehtoihin. Otetaan huomioon osaaminen, teknologioiden kypsyys, kustannuskset (elinkaari) ja odotettavissa olevat hyödyt.
  • 49. Ehdotus 4: Laaditaan datastrategia Laaditaan strateginen kartta tulevaisuuteen. Miten tulevaisuuden markkinoilla aiotaan tuottaa lisäarvoa ja pitää sekä parantaa omaa asemaa arvoketjussa?