Golf van data die over ons heen spoelt. Mensen en bedrijven helpen omgaan met grote hoeveelheden gegevens.
Data is belangrijk. In veel gevallen worden gegevens vastgeleged ofwel op ons mandaat of met ons geld ofwel over ons. In alle gevallen hebben wij er recht op om deze data te krijgen.
Waarom gebeurt het dan niet?
Veel goede wil op dit vlak, maar toch veel obstakels om het volledige potentieel te benutten.
Hieronder de verschillende niveau’s waarop data vrijgegeven kan worden.
Om wat voor reden dan ook is er geen open data beschikbaar. We moeten dan ons doel op andere manieren bereiken.
Essentieel om verschillende gegevens aan elkaar te koppelen maar nog steeds niet beschikbaar tenzij tegen significante kosten.
We wilden deze reistijden kaart maken naar voorbeeld van mySociety: http://leapfrog.nl/blog/archives/2008/08/15/the-making-of-a-travel-time-map-of-the-netherlands/
9292ov is gewoon te scrapen.
Mogen we het wel gebruiken? Willen we wel dat anderen het gebruiken? Wat als ze er geld mee verdienen?
CC-by, CC-zero
Rijksoverheid.nl licentie: http://www.rijksoverheid.nl/copyright/nederlandse-vertaling-cc0
Ik weet niet of ze het beseffen, maar met de lancering van de nieuwe website hebben ze alles van de Rijksoverheid op een CC-0 licentie beschikbaar gemaakt. Code > Law.
De data kan open zijn, en dan kunnen er nog zulke grote voordelen zijn voor alle partijen om samen te werken.
Dennis Stevense doet het dan toch gewoon ondanks tegenstribbelen van de NS.
Rotterdam zou kunnen scoren met de data van het openbaar vervoer
Mee te werken maar lastiger dan nodig.
De stemmingsuitslagen van de Tweede Kamer worden niet op een manier vrijgegeven dat het voor journalisten makkelijk is om het politieke proces te controleren.
In Amerika hebben de twee grootste kranten hun eigen databases met stemmingsuitslagen aangelegde. Over de Nederlandse stand van open data in de journalistiek zal ik het hier maar niet hebben.
Er is een grote academische wereld van GIS gebruikers met grote ingewikkelde tools en veel kennis en eigen jargon. Deze tools moeten minder ingewikkeld, minder duur en meer web native gemaakt worden willen we er echt iets aan hebben.
Zelf een concept gemaakt van de verkiezingsuitslagen: http://alper.nl/dingen/2010/03/verkiezingsuitslagen-gevisualiseerd/
ClearMaps by Sunlight
http://sunlightlabs.com/blog/2010/clearmaps-mapping-framework/
Niemand in de webdev wereld snapt dit echt en ik heb in de afgelopen 20 jaar niet echt hele relevante semweb oplossingen gezien. Wel veel ingewikkeld jargon en moeilijk te gebruiken tools. LinkedData is een goed idee maar het mag niet alleen maar een academisch idee blijven.
HTML, JavaScript, PHP
We moeten deze data geven aan de web developers. Liever half af en bruikbaar dan perfect over vijf jaar. Web developers zijn relevant en ‘they ship code.’
Maar dan moet er nog iets veranderd worden. Een XML beschrijving die niet helemaal klopt. Een informatiearchitectuur of site templates waar geen rekening gehouden is met hergebruik.
Voor zo’n kleine wijziging kun je dan blij zijn als het binnen 3 maanden doorgevoerd is.
Dan bel je met een grote IT consultant en dan zeggen ze dat ze geen capaciteit hebben. Dan vraag je je af of dat jouw probleem moet zijn, maar dat wordt het dan wel.
Als je mazzel hebt is het echt open a la (OSM en Wikipedia) en kun/moet je het zelf aanpassen.
Anekdote OCW. Data opengegooid mbv grote consultant. Geen touw vast te knopen aan de interne tabellen/datamodellen. En dan je afvragen waarom niemand het gebruikt.
Beoogd gebruik, API-voorbeelden zijn toch wel ergens goed voor.
Ideale situatie.
Update, wijziging, fout. Bron, server, tussenpersoon. Bit-rot.
Alles gaat stuk, dat is niet erg. Het is een feit en een voorwaarde voor innovatie.
En dan weet je niet waar je moet zijn, en loop je weer tegen de vorige problemen aan.
Wat kunnen we hier dan aan doen?
Alle mensen die in Amerika (SF etc.) dit soort dingen doen, hebben niet een direct mandaat, maar ze zitten op een plek dat ze het kunnen doen. Wat er moet gebeuren en wat de organisatie wil dat je doet is niet altijd hetzelfde. Mandaat nemen is dan het devies.
Ook als je buiten de organisatie staat.
Bewustwording. Kennis nodig van een open data workflow op alle niveaus.
Ketenbenadering nodig voor het gehele open data proces in de samenleving:
- Verzamelaars moeten weten dat de gegevens die ze verzamelen open gaan zijn.
- Invoer moet gebeuren in formaten die later weer handig ontsloten kunnen worden.
- Beheer moet op zo’n manier dat het webtoegankelijk, available en real-time mogelijk is.
- Ontsluiten moet op manieren die herbruikbaar en helder is voor ontwikkelaars en onder een duidelijke licentie.
- Verwerken door applicatie-bouwers met de affordances van open data.
- Gebruikers moeten ook begrip hebben dat niet alles misschien altijd klopt, maar dat de directe beschikbaarheid en manipuleerbaarheid ook waarde heeft.