Gezamenlijke presentatie van ArchiXL en DIKW over belangrijke ontwikkelingen op het gebied van data en informatie en wat dit betekent voor organisaties.
Presentatie Enterprise Architectuur - Agile en Essentie
Visie op de toekomst van informatie
1. Visie op de toekomst van
informatie
19 april 2016
Danny Greefhorst en Dinand Kleijbeuker
2. Data, informatie en kennis is wat ons verbindt
2
DIKW
ArchiXL
data, informatie en kennis
architectuurvisie en beleid
business demand
semantiek
kennismanagement
feiten
data technologie
data operations
data science
BIG Data
data governance
intelligence
3. Anticipeer op onbekende behoeften door
just enough, just in time structuur en betekenis
3
gebruiker aanbieder
4. data
Het onderscheid tussen gestructureerde data en
ongestructureerde data is niet meer relevant
4
database XML
fixed record
metadata
document
e-mail
social media
ECM
datamodel
video
audio
ontologie
5. Verbindt data over organisatiegrenzen
5
klant
contact
persoon
onderpand
faillissement
gereclasseerde
kraakpand
6. Locatie is de ultieme verbindende factor; vrijwel alle
data is geo-data
6
7. Over vrijwel alles is straks data beschikbaar; de
uitdaging is te bepalen wat ermee te doen
7
Van 5 miljard naar 50 miljard devices online in 2020*
*Dave Evans (April 2011). "The Internet of Things: How the Next Evolution of the Internet Is Changing Everything" (PDF). Cisco.
Retrieved 15 February 2016
8. Data is minder belangrijk; het gaat om de algoritmen
8
http://www.gartner.com/technology/research/algorithm-economy/
14. Wij kunnen dit alles aan elkaar verbinden
14
DIKW
ArchiXL
data, informatie en kennis
architectuurvisie en beleid
business demand
semantiek
kennismanagement
feiten
data technologie
data operations
data science
IT supply
data governance
intelligence
Editor's Notes
Datawarehouses, datamarts en rapportages zouden moeten zijn gedreven vanuit de informatiebehoefte van de gebruiker. In de praktijk duurt het te lang om op de traditionele manier de informatiebehoefte invullen. Een meer agile aanpak is wenselijk waarbij sneller kan worden ingesprongen op behoeften van gebruikers. Een data lake, gebaseerd op big data technieken kan een uitkomst bieden. Zo heeft bol.com al een hadoop cluster ingericht naast haar traditionele datawarehouse om te kunnen voldoen aan snel veranderende informatiebehoeften. Het vantevoren structureren van gegevens is daarbij niet meer zo belangrijk; er wordt later wel bepaald welke relevante structuur aanwezig is in de gegevens in het data lake.
Gebruikers moeten zowel met gestructureerde als met ongestructureerde gegevens werken. Een kunstmatig onderscheid daarin maken is lastig; de gebruiker moet gewoon ondersteunt worden en wil helemaal niet weten dat er twee verschillende werelden zijn. In zijn ERP systeem wil de gebruiker ook direct documenten kunnen bewerken. Het denken in termen van documenten werkt ook niet meer; een document is een relatief willekeurige groepering van gegevens. Het gaat niet om het document, maar om de gegevens en informatie die erin zitten. De DIV professional manifesteert zich als informatieprofessional, archivering heet ineens informatiebeheer en het Ngi-NGN (vereniging van IT-professionals) gaat fuseren met het KNVI (vereniging van bibliotheekprofessionals).
De betekenis en daarmee de bruikbaarheid van gegevens neemt toe door relaties te leggen met andere gegevens. Door gegevens met elkaar te vergelijken onstaat meer inzicht in de kwaliteit, die daardoor verbeterd kan worden. Ontologieën, vocabulaires en thesauri zorgen voor een duidelijke betekenis. Door gegevens expliciet aan dergelijke kennismodellen te verbinden verbetert dus ook de betekenis en bruikbaarheid. Dit alles is de kerngedachte achter Linked Data.
Het blijkt dat circa driekwart van de gegevens geo-data is. Veel van de landelijke geo-basisregistraties bevatten vooral ook administratieve gegevens. De standaarden voor het publiceren van geo-data gaan samen met web standaarden. Het Kadaster gaat haar gegevens in PDOK ontsluiten als Linked Data en middels API’s
Voorbeelden: Sensor data (auto’s; windmolens; wild live sensors; gsm; etc.)
Big Data gaat voor een belangrijk deel over analytics, en dat is eigenlijk niets nieuws. Het is nu alleen veel waardevoller omdat er een overvloed aan data ontstaat. Ook kunstmatige intelligentie-technieken zoals reasoning, machine learning en natuurlijke taal verwerking krijgen volop nieuwe kansen. Je kunt dit soort diensten inmiddels gewoon uit de cloud afnemen van Amazon, Google, IBM en Microsoft. Gartner spreekt over een ”algorith economy”. De algorithem, dat is waar je bedrijfswaarde in zit, zegt Gartner.
Voorbeeld van een open data ontwikkel platform: Quantopian“Wie niet kan delen, kan ook niet vermenigvuldigen” Loesje