SlideShare uma empresa Scribd logo
1 de 40
Tiedon määrä kasvaa rajusti – keinot hallita
Semanttinen teknologia avuksi
Sisällön- & dokumenttien hallinta '13
Heimo Hänninen
12.6.2013
Esittely
Talent Base
Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla
menetelmillä tarkoituksenmukaisia IT-ratkaisuja.
1 Strategia
2 Prosessit
3 Ratkaisusuunnittelu
Palvelualueemme
Yksittäisestä sovelluksesta kokonaisuuden hallintaan
Avaintiedon
hallinta
(MDM)
Sisällönhallinta (ECM)
Asiakkuudenhallinta (CRM)
Verkkokauppa
Sähköiset palvelut
Talent Base apuna semanttisen tiedonhallinnan
kehittämisessä
Perustan luominen (master data management)
• Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit,
projektointi…
Sisällönhallinta
• Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti
Semanttisen tiedonhallinnan käyttöönotto
• Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu)
• 360 näkyvyyden luonti
• Ontology Systems kumppani (www.ontology.com)
Faktapohjainen tiedonhallinta
• Liiketoimintaontologian luonti
• liiketoimintasanastot
Best place is
cloud base…
Informaatio tsunami
Haaste
Tiedon määrä kasvaa
2011-02-09 9
Tiedon määrä kasvaa
2011-02-09 10
Informaation määrä
tuplautuu kahdessa
vuodessa!
Mitä minä kommunikoin?
Miten sinä ymmärrät?
Haaste
Semantiikan kolmio: puhumme
symboleilla, ajattelemme
konsepteilla, tarkoitamme aitoja asioita
2011-06-17 12
Asiakas?
• “symbol”
Nimi
• “concept”
Henkilökohtainen rajallinen käsitys
oliosta “ajatusolio päässäsi”
• “referent”
Todellinen olio
http://www.yso.fi/
onto/liito/p1332
Henkilö
Leasing firma
Yritysasiakas
Myyntipäällikkö
Company Customer
Client
Asiakas = joka maksaa
auton huoltolaskun
http://jhsmeta.fi/
sanasto/id/henkilö
/J15152
Asiakas = joka noutaa
auton
Huoltopäällikkö
Liike-elämän hengen velttous:
Huomenna huomataan, että tänään
ei tehty mitään päätöksiä uusista
kehityshankkeista
Haaste
Ei käsitellä tänään. Kirjoittajan huomio
näinä ankean talouden aikoina.
Esityksen agenda
1. Tiedonhallinnan ongelmat => liiketoiminnan
haasteet
2. Ontologia ja semanttinen tiedonhallinta
1. Mitä se on?
2. Miten se tehdään?
3. Yhteenveto
Tiedonhallinnan ongelmat
liiketoiminnan haasteet
Tiedonhallinnan haasteet
Epäyhtenäiset käsitteet ja kuvaukset
Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)
Tiedon huono laatu
Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)
Tieto ei ole rakenteista
Tieto on hajallaan, usein siiloissa
Rajoittunut tietoisuus relevantista tiedosta
Liiketoiminnan tempo vaatii tietoa nopeasti
Semanttinen
teknologia
auttaa
Liiketoiminnan ongelmia
Ihmiset
turhautuu
Huonoja
päätöksiä
Turhaa työtä /
huono
tuottavuus
Väärinkäsityksiä
Huonoa
palvelua
"Cognitive
treshold
exeeded"
Kun kompleksisuus ylittää ymmärryksen  ihminen hyppää faktoista
taikauskoon päätöksenteossa (Rebecca Costa)
Liiketoiminnan ongelmia
Ihmiset
turhautuu
Huonoja
päätöksiä
Turhaa työtä /
huono
tuottavuus
Väärinkäsityksiä
Huonoa
palvelua
"Cognitive
treshold
exeeded"
Semanttinen tiedonhallinta
Semanttinen teknologia - häh?
Kielitieteessä
• Fonologia = äänteet,
• Morfologia = lauseiden
muodostuminen
• Semantiikka = merkitykset
• Pragmatiikka = sanat kontekstissa
• esim. ironia, terminologia
politiikassa, piilomerkitykset
Filosofia
• Ontologia = filosofinen
tiede, tutkii olemisen kategorioita
Semanttinen teknologia
• Ontologia = konseptuaalinen
tietomalli
tietämysrakenteelle, kohde
spesifinen
• Semanttisuus = merkityksiä
hyödyntävä, (kieltä ja merkityksiä
rajatusti ymmärtävä)
Suunnattu graafi - peruspalikka
• RDF tripletti edustaa nimettyä suunnattua graafia.
• Siten se soveltuu paremmin tietynlaisen tietämyksen
mallintamiseen kuin relaatiomalli.
Heimo
Tämä kalvo
On luonut
Subject Predicate  Object
Ontologian luonti – Graafi konsepti
ASPEN, an industry-leading Advanced
Service Platform for Ethernet Networks
A-2200
Access
Aspen
A-2200
Service
platform
Access
is a type of product
contains a product
is a type of product
Ethernet
Networks
is applicable for
Mitä on ontologia?
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
Mitä on ontologia - tietokoneelle?
Mikä on ontologiapalvelu?
Talent Basen määritelmä:
Ontologiapalvelu on tiedonhallintakyvykkyys:
• Luoda konseptuaalinen malli tietovarantojen päälle:
– Käsin mallintaen tai
– Automaattisesti (varmistettava luotettavuustaso)
• Palvella tietointensiivisiä sovelluksia:
- Muodostaa yhteinen malli olennaiselle tiedolle
- Tiedon haku liiketoimintakäsitteiden avulla
- Yhdistellä tietoa yli siilojen
- Linkittää data ja sisältö liiketoiminnan kontekstiin
- Tuo ei-rakenteisen tiedon analytiikan saataville
- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)
• Toteutettu semanttisella teknologialla
• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)
Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
Data ja sisältö
Ontologiapalvelu
Ontologia tiedonhallinnan maailmassa
projekti
tuotepalvelu
työkalu toimitus
ihminen
ratkaisu
asiakas teknologia
tarpeet
hyödyt
Sovellukset
Käyttäjät
Haku Help desk
Projektin
työpöytä
Tuote-opas
CMSTietämyksen
integrointi BI
Tiedonhallinnan tasot – semantic CM
Metadata
•Tietotyypit
•Kuvaava
•Hallinnointi & käsittely
Luokittelut
•Taksonomia
•Tesaurus
•Sanasto
Konseptuaalinen
•Laaja tesaurus
•Ontologia
Ilmaisuvoima
Metatiedon
uuttaminen
Luokittelun
ehdottaminen
Asioiden
yhdistely
Sisällön rajallinen
ymmärrys
Päättely
Semanttinen vs. perinteinen sisällönhallinta
Semanttinen Perinteinen
Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti
Haun fokus • Entiteetit, suhteet + sisältö • Teksti
Metadatan taso • Tietämyskartta • Arvot ja datatyypit
Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä)
Sisällön luokittelu • Hallittu termistö,
määritelmät, synonyymit,
relaatiot jne.
• Dokumenttityypit, vapaat
”tägit”
Linkitys liiketoiminnan
tietotarpeisiin
• Kuvattu: taksonomiaan,
tesaurukseen, ontologiaan
• Eri järjestelmässä (paras
arvaus haun pohjalta)
Jokapäiväinen ontologiamme – Google search
Tekstihaku
• Haetaan
sanoja
indeksoidusta
sisällöstä
Luokittelu
• Hakutulokset
ehostetaan
vertaamalla
luokitteleviin
termeihin
Tekstianalyysi
• Tulosten
relevanssi
määräytyy
semanttisen
analyysin
pohjalta
Konseptuaa-
linen
• Sanoja
verrataan
tunnettuihin
konsepteihin
• Kielelliset
analyysit
Linked Open
Data yhdistetty
• Vertaus
globaaleihin
konsepteihin.
• Linkitetyt
hakutulokset.
• Päättely
• Luonnollisen
kielen ymmärtä-
minen
tänään
Sanoista asioihin, asioista konsepteihin
Knowledge from
Freebase.com via API
By knowledge graph:
http://www.freebase.com/m/040zch
Known
concept
Knowledge graph - esimerkki
Miten se tehdään?
Ontologia ja semanttinen tiedonhallinta
-rooli
Tietoarkkitehtuurin kerrokset
33
Rakenne
ERP
projekti
tuotepalvelu
työkalu toimitus
ihminen
IntraEmailsMDM
IA tasot
Konseptuaalinen
Looginen
Toteutus
ratkaisu
CMS
asiakas
Tietotyypit
Data
ja sisältö
- metadata
Ontologia
Tietämyskartta:
-Liiket. entiteetit
-attribuutit
-suhteet
Järjestelmät
-tietokuvaukset
Asiayhteys
teknologia
tarpeet
hyödyt
Luokittelut
Big Data
Liike-
toiminta
prosessi
T&K Tuotanto Myynti Huolto
Minulle tärkeä tieto.
Hyviä päätöksiä.
Laadukas tieto.
Saatavuus.
Yhteinen kieli.
Jaettu ymmärrys.
Ontologiaratkaisun rakennuspalikat
ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ
projekti
tuotepalvelu
työkalu toimitus
ihmine
n
ratkaisu
asiakas teknologia
tarpeet
hyödyt Rakenteinen
tieto
Muu sisältö
+ +
STANDARDITRDFS, OWL, SKOS
RIF
ISO Topic Maps
RFF/XML
SPARQL
Web API
XML, JSON-LD, RDFa
ODBC/JDBC Unicode
Tiedonhallinan kypsyys
Tiedot ja data
siiloissa
Tiedot
kuvattu,
Siilojen
mäppäys
Bisnestarpeet
mäpätty
tietoon
Päättely ja
analytiikka,
Säännöt
Strateginen
johtamisväline
Ennusteet
Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys
Kyvykkyys
Vertikaali
ratkaisu
Tietämyksen
integrointi palvelu
Ei tarvitse olla
täydellistä ollakseen
hyödyllistä
Sanasto
Tyypillisiä käyttötapauksia
• Automatisoida operaattori-portaalin sisällönhallintaa
– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio
• Hallita tietoa & mainoksia portaalissa
– uutiset eri lähteistä reititetään, mainosten täsmäys
• ”Älykkäät” asiantuntijan apuvälineet
– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen
• Tietämystason tiedon integrointi
– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio
• Tärkeän tiedon uuttaminen isoista datamääristä
– Telco operaattoreiden BSS/OSS datan louhinta
• Globaali avoin tieto (julkishallinto, bisnes)
– Tiedon yhdistely ja käyttö Web APIn kautta
– Programmableweb.com (MuleSoft)
– http://www.bbc.co.uk/ontologies/
Opiskele lisää semanttista tiedonkäsittelyä
• Suomessa:
– http://data.aalto.fi/
– http://jhsmeta.fi/sanasto/
– http://informationthinker.blogspot.fi/ (Heimon blogi)
• W3C:
– http://www.w3.org/standards/semanticweb/
– http://www.w3schools.com/web/web_semantic.asp
• Toimittajien valitut palat (MBS warning!):
– http://www.cambridgesemantics.com/semantic-university/
– http://www.poolparty.biz/videos/
– http://www.fluidops.com/publications/
– http://www.ontology.com/resources/
– http://www.programmableweb.com/ (Web API)
The Semantic Web = a Web with a meaning.
Yhteenveto
Yhteenveto
• Semanttinen teknologia tarjoaa joustavaa ja tehokasta
informaation hallintaa:
– Tehokkaampia keinoja hallita tieto-tsunamia
– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan
– Tehostaa tiedon hakua
– Automatisoi metatiedon luontia (auto tagging)
– Tuo ei-rakenteisen tiedon analytiikan saataville
– Metatasolla on kettärämpää mallintaa liiketoimintaa
• Vaikka iso asia - liikkeelle pääsee helposti
• Semanttinen netti = Linked Open Data (web of data)
• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)
Kysymysten aika
olkaa hyvä!
Kiitos!
Heimo.hanninen@talentbase.fi

Mais conteúdo relacionado

Semelhante a Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

Semanttinen Web
Semanttinen WebSemanttinen Web
Semanttinen Web
Tapva
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen data
FloApps
 
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2    onko tätä tutkittu aiemminTutkimusta tutkielmaan 2    onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
Anne Holappa
 

Semelhante a Tiedonhallinnan ongelmat ja semanttisen teknologian keinot (20)

Analytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäAnalytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessä
 
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskeroAvoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
 
Semanttinen Web
Semanttinen WebSemanttinen Web
Semanttinen Web
 
1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet
 
Tiedonhankinta
TiedonhankintaTiedonhankinta
Tiedonhankinta
 
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajanaUusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
Uusi SharePoint 2013 paremman liiketoiminnan mahdollistajana
 
Sähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallintaSähköinen työpöytä - suunnittelu, toteutus, hankehallinta
Sähköinen työpöytä - suunnittelu, toteutus, hankehallinta
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
 
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenSemanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen data
 
Julkinen Data Business mallit
Julkinen Data Business mallitJulkinen Data Business mallit
Julkinen Data Business mallit
 
Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011Datajournalimin työpaja Apps4Finland 2011
Datajournalimin työpaja Apps4Finland 2011
 
Rpresentation
RpresentationRpresentation
Rpresentation
 
Metsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkostoMetsäalan innovaatio- ja osaamisverkosto
Metsäalan innovaatio- ja osaamisverkosto
 
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanTalent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
 
Mitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassaMitä ottaa huomioon modernin CMS:n hankinnassa
Mitä ottaa huomioon modernin CMS:n hankinnassa
 
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaanRatkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
Ratkaisuja järjestöjen nettipalveluiden löytämisen ongelmaan
 
Yhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhintaYhteiskunnan mittaaminen: Big data ja tiedonlouhinta
Yhteiskunnan mittaaminen: Big data ja tiedonlouhinta
 
Näin ostat intranetin
Näin ostat intranetinNäin ostat intranetin
Näin ostat intranetin
 
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2    onko tätä tutkittu aiemminTutkimusta tutkielmaan 2    onko tätä tutkittu aiemmin
Tutkimusta tutkielmaan 2 onko tätä tutkittu aiemmin
 

Tiedonhallinnan ongelmat ja semanttisen teknologian keinot

  • 1. Tiedon määrä kasvaa rajusti – keinot hallita Semanttinen teknologia avuksi Sisällön- & dokumenttien hallinta '13 Heimo Hänninen 12.6.2013
  • 3. Talent Base Luomme asiakkaillemme kilpailuetua suunnittelemalla parhailla menetelmillä tarkoituksenmukaisia IT-ratkaisuja.
  • 4. 1 Strategia 2 Prosessit 3 Ratkaisusuunnittelu Palvelualueemme
  • 5. Yksittäisestä sovelluksesta kokonaisuuden hallintaan Avaintiedon hallinta (MDM) Sisällönhallinta (ECM) Asiakkuudenhallinta (CRM) Verkkokauppa Sähköiset palvelut
  • 6. Talent Base apuna semanttisen tiedonhallinnan kehittämisessä Perustan luominen (master data management) • Datan profilointi, data standardit & tietomallit, business case, evaluoinnit, arkkitehtuurit, projektointi… Sisällönhallinta • Metadatamallit, taksonomiat, verkkosisällön hallinta, strategian luonti Semanttisen tiedonhallinnan käyttöönotto • Hallitut ensiaskeleet (esim. asiakastiedon hallinta, dokumenttien luokittelu) • 360 näkyvyyden luonti • Ontology Systems kumppani (www.ontology.com) Faktapohjainen tiedonhallinta • Liiketoimintaontologian luonti • liiketoimintasanastot
  • 10. Tiedon määrä kasvaa 2011-02-09 10 Informaation määrä tuplautuu kahdessa vuodessa!
  • 11. Mitä minä kommunikoin? Miten sinä ymmärrät? Haaste
  • 12. Semantiikan kolmio: puhumme symboleilla, ajattelemme konsepteilla, tarkoitamme aitoja asioita 2011-06-17 12 Asiakas? • “symbol” Nimi • “concept” Henkilökohtainen rajallinen käsitys oliosta “ajatusolio päässäsi” • “referent” Todellinen olio http://www.yso.fi/ onto/liito/p1332 Henkilö Leasing firma Yritysasiakas Myyntipäällikkö Company Customer Client Asiakas = joka maksaa auton huoltolaskun http://jhsmeta.fi/ sanasto/id/henkilö /J15152 Asiakas = joka noutaa auton Huoltopäällikkö
  • 13. Liike-elämän hengen velttous: Huomenna huomataan, että tänään ei tehty mitään päätöksiä uusista kehityshankkeista Haaste Ei käsitellä tänään. Kirjoittajan huomio näinä ankean talouden aikoina.
  • 14. Esityksen agenda 1. Tiedonhallinnan ongelmat => liiketoiminnan haasteet 2. Ontologia ja semanttinen tiedonhallinta 1. Mitä se on? 2. Miten se tehdään? 3. Yhteenveto
  • 16. Tiedonhallinnan haasteet Epäyhtenäiset käsitteet ja kuvaukset Tiedon määrä kasvaa (nopeammin kuin käsittelykyky) Tiedon huono laatu Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut) Tieto ei ole rakenteista Tieto on hajallaan, usein siiloissa Rajoittunut tietoisuus relevantista tiedosta Liiketoiminnan tempo vaatii tietoa nopeasti Semanttinen teknologia auttaa
  • 17. Liiketoiminnan ongelmia Ihmiset turhautuu Huonoja päätöksiä Turhaa työtä / huono tuottavuus Väärinkäsityksiä Huonoa palvelua "Cognitive treshold exeeded" Kun kompleksisuus ylittää ymmärryksen  ihminen hyppää faktoista taikauskoon päätöksenteossa (Rebecca Costa)
  • 18. Liiketoiminnan ongelmia Ihmiset turhautuu Huonoja päätöksiä Turhaa työtä / huono tuottavuus Väärinkäsityksiä Huonoa palvelua "Cognitive treshold exeeded"
  • 20. Semanttinen teknologia - häh? Kielitieteessä • Fonologia = äänteet, • Morfologia = lauseiden muodostuminen • Semantiikka = merkitykset • Pragmatiikka = sanat kontekstissa • esim. ironia, terminologia politiikassa, piilomerkitykset Filosofia • Ontologia = filosofinen tiede, tutkii olemisen kategorioita Semanttinen teknologia • Ontologia = konseptuaalinen tietomalli tietämysrakenteelle, kohde spesifinen • Semanttisuus = merkityksiä hyödyntävä, (kieltä ja merkityksiä rajatusti ymmärtävä)
  • 21. Suunnattu graafi - peruspalikka • RDF tripletti edustaa nimettyä suunnattua graafia. • Siten se soveltuu paremmin tietynlaisen tietämyksen mallintamiseen kuin relaatiomalli. Heimo Tämä kalvo On luonut Subject Predicate  Object
  • 22. Ontologian luonti – Graafi konsepti ASPEN, an industry-leading Advanced Service Platform for Ethernet Networks A-2200 Access Aspen A-2200 Service platform Access is a type of product contains a product is a type of product Ethernet Networks is applicable for
  • 23. Mitä on ontologia? Yritys @nimi Heimo @rooli konsultti @sivu http://link @sposti heimo… Työntekijä @toimiala MDM… @kaupunki Espoo @nimi Talent Base Listaa MDM toimialan konsultit Espoossa. @ID 2157464-4 työsuhde Organisaation todellinen maailma Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta Valitut oliot, yhteydet, ominaisuudet Liiketoiminnan tarpeet (sovellukset) Logiikka: päättely, haut, navigointi ym. Faktat, informaatio URL
  • 24. Yritys @nimi Heimo @rooli konsultti @sivu http://link @sposti heimo… Työntekijä @toimiala MDM… @kaupunki Espoo @nimi Talent Base Listaa MDM toimialan konsultit Espoossa. @ID 2157464-4 työsuhde Organisaation todellinen maailma Ontologia = Tietämyskartta Subjektiivinen kuvaus maailmasta Valitut oliot, yhteydet, ominaisuudet Liiketoiminnan tarpeet (sovellukset) Logiikka: päättely, haut, navigointi ym. Faktat, informaatio URL Mitä on ontologia - tietokoneelle?
  • 25. Mikä on ontologiapalvelu? Talent Basen määritelmä: Ontologiapalvelu on tiedonhallintakyvykkyys: • Luoda konseptuaalinen malli tietovarantojen päälle: – Käsin mallintaen tai – Automaattisesti (varmistettava luotettavuustaso) • Palvella tietointensiivisiä sovelluksia: - Muodostaa yhteinen malli olennaiselle tiedolle - Tiedon haku liiketoimintakäsitteiden avulla - Yhdistellä tietoa yli siilojen - Linkittää data ja sisältö liiketoiminnan kontekstiin - Tuo ei-rakenteisen tiedon analytiikan saataville - Koskematta tietolähteisiin (haku lähteistä tarvittaessa) • Toteutettu semanttisella teknologialla • Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus) Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
  • 26. Data ja sisältö Ontologiapalvelu Ontologia tiedonhallinnan maailmassa projekti tuotepalvelu työkalu toimitus ihminen ratkaisu asiakas teknologia tarpeet hyödyt Sovellukset Käyttäjät Haku Help desk Projektin työpöytä Tuote-opas CMSTietämyksen integrointi BI
  • 27. Tiedonhallinnan tasot – semantic CM Metadata •Tietotyypit •Kuvaava •Hallinnointi & käsittely Luokittelut •Taksonomia •Tesaurus •Sanasto Konseptuaalinen •Laaja tesaurus •Ontologia Ilmaisuvoima Metatiedon uuttaminen Luokittelun ehdottaminen Asioiden yhdistely Sisällön rajallinen ymmärrys Päättely
  • 28. Semanttinen vs. perinteinen sisällönhallinta Semanttinen Perinteinen Pienen tietoyksikkö • Entiteetti (asia) • Dokumentti Haun fokus • Entiteetit, suhteet + sisältö • Teksti Metadatan taso • Tietämyskartta • Arvot ja datatyypit Kuvaavan luokittelun luonti • Uuttaminen, ehdottava • Käsin (ei tehdä) Sisällön luokittelu • Hallittu termistö, määritelmät, synonyymit, relaatiot jne. • Dokumenttityypit, vapaat ”tägit” Linkitys liiketoiminnan tietotarpeisiin • Kuvattu: taksonomiaan, tesaurukseen, ontologiaan • Eri järjestelmässä (paras arvaus haun pohjalta)
  • 29. Jokapäiväinen ontologiamme – Google search Tekstihaku • Haetaan sanoja indeksoidusta sisällöstä Luokittelu • Hakutulokset ehostetaan vertaamalla luokitteleviin termeihin Tekstianalyysi • Tulosten relevanssi määräytyy semanttisen analyysin pohjalta Konseptuaa- linen • Sanoja verrataan tunnettuihin konsepteihin • Kielelliset analyysit Linked Open Data yhdistetty • Vertaus globaaleihin konsepteihin. • Linkitetyt hakutulokset. • Päättely • Luonnollisen kielen ymmärtä- minen tänään
  • 30. Sanoista asioihin, asioista konsepteihin Knowledge from Freebase.com via API By knowledge graph: http://www.freebase.com/m/040zch Known concept
  • 31. Knowledge graph - esimerkki
  • 32. Miten se tehdään? Ontologia ja semanttinen tiedonhallinta
  • 33. -rooli Tietoarkkitehtuurin kerrokset 33 Rakenne ERP projekti tuotepalvelu työkalu toimitus ihminen IntraEmailsMDM IA tasot Konseptuaalinen Looginen Toteutus ratkaisu CMS asiakas Tietotyypit Data ja sisältö - metadata Ontologia Tietämyskartta: -Liiket. entiteetit -attribuutit -suhteet Järjestelmät -tietokuvaukset Asiayhteys teknologia tarpeet hyödyt Luokittelut Big Data Liike- toiminta prosessi T&K Tuotanto Myynti Huolto Minulle tärkeä tieto. Hyviä päätöksiä. Laadukas tieto. Saatavuus. Yhteinen kieli. Jaettu ymmärrys.
  • 34. Ontologiaratkaisun rakennuspalikat ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ projekti tuotepalvelu työkalu toimitus ihmine n ratkaisu asiakas teknologia tarpeet hyödyt Rakenteinen tieto Muu sisältö + + STANDARDITRDFS, OWL, SKOS RIF ISO Topic Maps RFF/XML SPARQL Web API XML, JSON-LD, RDFa ODBC/JDBC Unicode
  • 35. Tiedonhallinan kypsyys Tiedot ja data siiloissa Tiedot kuvattu, Siilojen mäppäys Bisnestarpeet mäpätty tietoon Päättely ja analytiikka, Säännöt Strateginen johtamisväline Ennusteet Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys Kyvykkyys Vertikaali ratkaisu Tietämyksen integrointi palvelu Ei tarvitse olla täydellistä ollakseen hyödyllistä Sanasto
  • 36. Tyypillisiä käyttötapauksia • Automatisoida operaattori-portaalin sisällönhallintaa – Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio • Hallita tietoa & mainoksia portaalissa – uutiset eri lähteistä reititetään, mainosten täsmäys • ”Älykkäät” asiantuntijan apuvälineet – Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen • Tietämystason tiedon integrointi – EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio • Tärkeän tiedon uuttaminen isoista datamääristä – Telco operaattoreiden BSS/OSS datan louhinta • Globaali avoin tieto (julkishallinto, bisnes) – Tiedon yhdistely ja käyttö Web APIn kautta – Programmableweb.com (MuleSoft) – http://www.bbc.co.uk/ontologies/
  • 37. Opiskele lisää semanttista tiedonkäsittelyä • Suomessa: – http://data.aalto.fi/ – http://jhsmeta.fi/sanasto/ – http://informationthinker.blogspot.fi/ (Heimon blogi) • W3C: – http://www.w3.org/standards/semanticweb/ – http://www.w3schools.com/web/web_semantic.asp • Toimittajien valitut palat (MBS warning!): – http://www.cambridgesemantics.com/semantic-university/ – http://www.poolparty.biz/videos/ – http://www.fluidops.com/publications/ – http://www.ontology.com/resources/ – http://www.programmableweb.com/ (Web API) The Semantic Web = a Web with a meaning.
  • 39. Yhteenveto • Semanttinen teknologia tarjoaa joustavaa ja tehokasta informaation hallintaa: – Tehokkaampia keinoja hallita tieto-tsunamia – Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan – Tehostaa tiedon hakua – Automatisoi metatiedon luontia (auto tagging) – Tuo ei-rakenteisen tiedon analytiikan saataville – Metatasolla on kettärämpää mallintaa liiketoimintaa • Vaikka iso asia - liikkeelle pääsee helposti • Semanttinen netti = Linked Open Data (web of data) • Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)

Notas do Editor

  1. Brain will not get bigger – amount of information willVuoteen 2006 menessäluotutieto, luodaannytallevuodessa!TiedonharkittupoistaminenmaksaaenemmänkuinuudenkapasiteetinlisääminenThe world’s information is doubling every two years. In 2011 the world will create a staggering 1.8 zettabytes. By 2020 the world will generate 50 times the amount of information and 75 times the number of "information containers" while IT staff to manage it will grow less than 1.5 times. (EMC)On halvempaalisätätallennuskapasiteettiakuintehdäanalyyttistätiedonpoistamista.
  2. Brain will not get bigger – amount of information willVuoteen 2006 menessäluotutieto, luodaannytallevuodessa!TiedonharkittupoistaminenmaksaaenemmänkuinuudenkapasiteetinlisääminenThe world’s information is doubling every two years. In 2011 the world will create a staggering 1.8 zettabytes. By 2020 the world will generate 50 times the amount of information and 75 times the number of "information containers" while IT staff to manage it will grow less than 1.5 times. (EMC)On halvempaalisätätallennuskapasiteettiakuintehdäanalyyttistätiedonpoistamista.
  3. Sama pätee järjestelmille, organisaatioille
  4. VS. Huoltopäällikkö: Asiakas = henkilö joka tuo auton huoltoon! Hänelle soitetaan kun auto valmis.Klassikko: tilaa Tallinnassa viineri
  5. Sama pätee järjestelmille, organisaatioille
  6. Data Warehousing Institute kysely US yrityksissä:suurinyksittäinensyydatanlaatuonglemiinhuonot tai puuttuvattermienmäärittelyt
  7. First came Enron, with $65.5 billion in assets, going belly-up and becoming the largest bankruptcy in U.S. history at that time. Chairman Kenneth Lay said that Enron's decision to file bankruptcy would “stabilize the company,” but over the next five years the company was completely liquidated. The stock went from a high of $84.63 in December 2000 to a whopping 26¢ one year later.TUI Travel Plc, which owns the Thomson travel agency, acquired rival company First Choice in 2007. An error during the integration of First Choice’s accounting software with TUI Travel’s own systems meant that discounts offered by First Choice sales people were not registered on TUI's accounts.This meant TUI Travel plc overstated its revenue for the last year to the tune of £117 million. Ihmisetvaihtaatyöpaikkaajostekeminen, välineetjaympäristö & kulttuurieityydytä.Vuosien 2010 ja 2011 aikana Euroopan keskuspankki osti Kreikan velkakirjoja sijoittajilta polkuhintaan. IDC recently undertook a large global survey of information workers and IT professionals on behalf of Adobe to better understand the productivity challenges that cost information workers time, and put a dollar value on that unproductive time. The bottom line: conservatively, the cost to an organization of 1,000 employees is nearly $16m a year.http://www.rebeccacosta.com/book-interview.htmwhen complexity exceeds our cognitive ability. We become vulnerable to unproven beliefs. This is also what happened when we made the decision to go into Iraq. The situation was complex and we had very little data to go on. So we made the decision substantially based on our belief that the country wouldbe safer if we sent troops into Iraq.
  8. First came Enron, with $65.5 billion in assets, going belly-up and becoming the largest bankruptcy in U.S. history at that time. Chairman Kenneth Lay said that Enron's decision to file bankruptcy would “stabilize the company,” but over the next five years the company was completely liquidated. The stock went from a high of $84.63 in December 2000 to a whopping 26¢ one year later.TUI Travel Plc, which owns the Thomson travel agency, acquired rival company First Choice in 2007. An error during the integration of First Choice’s accounting software with TUI Travel’s own systems meant that discounts offered by First Choice sales people were not registered on TUI's accounts.This meant TUI Travel plc overstated its revenue for the last year to the tune of £117 million. Ihmisetvaihtaatyöpaikkaajostekeminen, välineetjaympäristö & kulttuurieityydytä.Vuosien 2010 ja 2011 aikana Euroopan keskuspankki osti Kreikan velkakirjoja sijoittajilta polkuhintaan. IDC recently undertook a large global survey of information workers and IT professionals on behalf of Adobe to better understand the productivity challenges that cost information workers time, and put a dollar value on that unproductive time. The bottom line: conservatively, the cost to an organization of 1,000 employees is nearly $16m a year.http://www.rebeccacosta.com/book-interview.htmwhen complexity exceeds our cognitive ability. We become vulnerable to unproven beliefs. This is also what happened when we made the decision to go into Iraq. The situation was complex and we had very little data to go on. So we made the decision substantially based on our belief that the country wouldbe safer if we sent troops into Iraq.
  9. Pitäisivastatakohteesta:Mitäovattarkoitukset (ontologisetkysymykset)Mikä on kielellistenilmaisujenjaniidentarkoitustensuhde (semantiikankysymykset)Kuinkaem. suhteidenkytkennätvoioppia (oppimisenkysymykset)Kuinkakommunikoimmetarkoituksia (kommunikoinninkysymykset)Konseptuaalinen (alias kognitiivinen) lähestymistapa:Kielellistenilmaisujentarkoituksetovatmielikuvaentiteettejä – kognitiivisiarakenteitakielenkäyttäjänpäässä.Kieliitsessään on osakognitiivistarakennetta – eiirrallinen tai riippumatonitsemaailmankuvaustaKieliedustaakonseptia, eimaailmaa!
  10. Ontologia = konseptuaalinen tietomalli = ylätason tietomalli = bisnes informaation malliSemanttisessa teknologiassa:-asiat kuvataan ja identifioidaan (luotettava ID …. Useita nimiä)-tyypitetään-linkitetään toisiin asioihin-asioihin liitettään tietoresursseja (RDF – URL)+ LOD: ontologiat julkaistaan muille käytettäväksi (linkitys: meidän toimipiste on Lontoossa  Lontoon kotisivut + metron reittiopas)Google http://www.cambridgesemantics.com/semantic-university/introduction-to-the-semantic-web
  11. Ontologia = konseptuaalinen tietomalli = ylätason tietomalli = bisnes informaation malliSemanttisessa teknologiassa:-asiat kuvataan ja identifioidaan (luotettava ID …. Useita nimiä)-tyypitetään-linkitetään toisiin asioihin-asioihin liitettään tietoresursseja (RDF – URL)+ LOD: ontologiat julkaistaan muille käytettäväksi (linkitys: meidän toimipiste on Lontoossa  Lontoon kotisivut + metron reittiopas)Google http://www.cambridgesemantics.com/semantic-university/introduction-to-the-semantic-web
  12. The most common ontology powered tool today, which everyone uses many times per dayGoogle – graph -- Freebase
  13. NSA – ne tietävät mitä sinä ajattelet!
  14. Otetaan esim. yksi vertikaali ja toteutetaan se kunnolla ensin, eli business case: NSN operaattori portaali, mainosten targetointi netissä, dokumenttien automaattinen luokittelu
  15. Globaali: Kun yhteystiedoissa Martin James kohdalla klikkaat suunnittele matka: lähin bussi lentoasemalle  edullisimman lennon varaus  metro Lontooseen  Trip Advisor kevereitten suosittelema hotelli  viesti What’sAppilla Martinille jossa on ko. Suunnitelma.Asiakkaat ei ole tyytyväisiä palveluumme:Keitä he ovat ja mitkä on kunkin tarpeet?   palvelumme ja niiden hyödyt?Tärkeimmät päätökset tehdään tuntumalla – ei faktoillaDataan ei voi luottaa, sitä ei ole saatavilla tai se ei ole yhteismitallistaTietojärjestelmien tekeminen ja liittäminen kallistaYhteinen kieli puuttuu, tietomallit, käsitteet ja määritelmät sopimatta Jopa 40% IT budjetista menee integraatioihin (IBM 2005)Työn tuottavuus huono ja innovointi piilossaSisäiset ideat ei saavuta päätöksentekoa, kukaan ei tiedä mitä naapurissa tapahtuuTietotyön ergonomia hukassaTietojärjestelmien muutosnopeus ei riitä bisneksen vauhtiinLiiketoiminnan tarvitsema tieto ei ole mallinnettu ja se on syvällä järjestelmissä