Collaborilla - An enhancement to the Conzilla concept browser for enabling co...
Tillvägagångssätt för omvandling och publicering av data som LOD
1. Tillvägagångssätt för omvandling och
publicering av data som LOD
Hannes Ebner <hannes@metasolutions.se>
Matthias Palmér <matthias@metasolutions.se>
MetaSolutions AB
http://metasolutions.se
2. Översikt
● Förarbete - avgränsningar
● Olika angreppsätt för olika källor
○ Webbdokument
○ Tabulär data
○ Relationell data
○ Data tillhandahållen via API:er
● EntryStore
3. Förarbete - avgränsningar
E-delegationens arbete kring öppna data har lett till en
vägledning som är en bra grund även för länkade data.
"vägledning för vidarutnyttjande
av offentlig information"
http://www.edelegationen.se/Stod-
och-verktyg/Oppna-data-psi/
4. Datakälla - Webbdokument
(X)HTML/RDFa genererat på serversidan
● Genomförbarhet beror på ramverket
Fördelar
● Oftast direkt tillgång till databasen
● Automatiskt stöd i populära CMS (t.ex. Drupal)
● Inget behov för specifik RDF-infrastruktur
Nackdelar
● RDF måste extraheras ur (X)HTML
● Ingen SPARQL-endpoint
● Manuell editering av mallar (templates)
5. Datakälla - Tabulär data
RDF Refine
● Baserat på Open Refine
● Kan identifiera och länka till externa resurser
● RDF konstruktion via mallar
Fördelar
● Klarar stora datamängder
● Automatisk identifiering och länkning
(reconciliation)
● Föreslår relaterade datakällor med Sindice
Nackdelar
● Manuell hantering via GUI
● Ingen komplett lösning, kombinera med triplestore
7. Datakälla - Relationella data
D2RQ
● Relationella databaser som virtuella grafer
Fördelar
● Inbyggt gränssnitt för LD
● SPARQL endpoint med GUI
● Stödjer många databaser
● Stöd för RDF dumpar för import i nativa triple
stores
Nackdelar
● Fungerar bäst med väldesignade databaser
● D2Rs query översättning inte lämplig för
produktivmiljöer
8. Datakälla - data tillgänglig via APIer
Virtuoso Sponger
● agerar RDF middleware mot bl. a. APIer
Fördelar
● Färdiga lösningar för många APIer
● Skalbart med cachning
● Kompetent lösning med mycket dokumentation
Nackdelar
● Del av större lösning - tämligen komplicerat
● Delar av lösningen är inte open source
9. Molntjänst för enkel publicering av LOD
● Baserad på EntryStore
○ Open Source plattform
○ Kan driftsättas internt eller som molntjänst
○ Mål är att bidra till en ökad publicering av LOD
● Initialt fokus på
○ Beskrivning av resurser med metadata,
t.ex. dokument
○ Statistikdata från SCB
○ Energidata från Knivsta kommun
10. WebbApp
Arkitekturskiss entrystore.js
LOD
EntryStore - molntjänst
Resurser Sökindex Rättigheter Triple store
Config Tabular importer Config Webbdokument importer
Relational importer Config API based importer Config
Kalkylb
RDB
Doku API
lad ment