Na základě dohody řešitelských pracovišť, vydavatele editorů a spoluautorů jsme přistoupili k uveřejnění digitální kopie knihy GEOGRAFICKÁ DATA v informační společnosti. Domníváme se, že přesto že tato kniha vyšla již před třemi roky, obsahuje řadu faktů, která jsou obecně platná i dnes. A jelikož na našem trhu obdobné publikace chybí, domníváme se, že publikace může být například dobrou pomůckou pro středoškolské učitelé, ale může pomoci k objasnění základních pojmů i odborníkům z dalších oborů.
Pokud se domníváte, že tato publikace může být užitečná i pro vaše kolegy a známé pošlete jím informaci, že si mohou publikaci volně stáhnout.
2. Výzkumný ústav geodetický, topografický a kartografický, v.v.i.
Geografický ústav, Přírodovědecká fakulta Masarykovy univerzity
Lesprojekt Služby, s.r.o.
Ročník 53 Publikace č. 43
Geografická data
v informační společnosti
Karel Charvát
Milan Kocáb
Milan Konečný
Petr Kubíček
Zdiby 2007
3. Recenzenti:
Prof. RNDr. Jiří Hřebíček, CSc., Masarykova univerzita v Brně
Prof. Ing. Bohuslav Veverka, DrSc., Fakulta stavební ČVUT v Praze
ISBN 978-80-85881-28-8
4. AKADEMIE VĚD ČESKÉ REPUBLIKY
Tato publikace byla vydaná na základě výsledků řešení projektů Akademie věd České
republiky „Informační společnost“ tematického programu „ II. Národní program výzkumu
– TP2“ (2004 – 2007):
• Management geografických informací a znalostí
(Reg.č.T206030407)
Cílem projektu bylo vytvoření uceleného systému managementu geografických informací
a znalostí a jejich uplatnění v praktických aplikacích.
Řešitel: Ing. Milan Kocáb, MBA
Spoluřešitelé: Ing. Stanislav Holý, Doc. RNDr. Milan Konečný, CSc.
• Mobilní sběr prostorových dat pro mapovaní v reálném čase
(Reg.č. T101630421)
Cílem řešeného projektu bylo vytvořit základní infrastrukturu pro on-line vkládání
prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení.
Řešitel: Doc. RNDr. Milan Konečný, CSc.
Spoluřešitelé: Ing. Milan Kocáb, MBA, Ing. Jiří Krejza
• Navigační a logistické systémy
(Reg.č.T109890411)
Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému.
Řešitel: Ing. Zbyněk Křivánek
Spoluřešitelé: Ing. Jaroslav Jansa, Ing. Milan Kocáb, MBA
• Systém přenosu dokumentačních dat pro aktualizaci informačního systému
státní správy zeměměřictví a katastru
(Reg.č.1ET206030506)
Cílem projektu byl rozvoj informačních technologií ve sféře tvorby aktualizačních souborů
pro státní správu zeměměřictví a katastru.
Řešitel: Ing. Milan Kocáb, MBA
Spoluřešitelé: Ing. Stanislav Holý, Ing. Pavel Kosta
5.
6. KOLEKTIV AUTORŮ:
Lesprojekt Služby, s.r.o., Kostelec nad Labem:
RNDr. Karel Charvát
Výzkumný ústav geodetický, topografický
a kartografický, v.v.i., Zdiby:
Ing. Milan Kocáb, MBA
Geografický ústav,
Přírodovědecká fakulta Masarykovy univerzity v Brně:
Doc. RNDr. Milan Konečný, CSc.
Geografický ústav,
Přírodovědecká fakulta Masarykovy univerzity v Brně:
RNDr. Petr Kubíček, CSc.
Seznam pracovníků, kteří se dále podíleli na zpracování publikace:
Brázdilová J. (MU Brno), Cajthaml T. (VÚGTK), Čepický J. (HSRS), Drbal A. (VÚGTK),
Dutka M. (VÚGTK), Dvořák P. (Wirelessinfo), Friedmannová L. (MU Brno), Gnip P.
(Wirelessinfo), Holý S. (HSRS), Horák P. (HelpForest), Ježek J. (HSRS), Kafka Š. (HSRS),
Karavdić J. (VÚGTK), Kosta P. (GESKO), Krejza J. (LESP), Křivánek Z. (LESP), Musil M.
(Wirelessinfo), Řezník T. (MU Brno), Stachoň Z. (MU Brno), Staněk K. (MU Brno), Střelková
J. (VÚGTK), Talhofer V. (MU Brno), Tryhubová P. (VÚGTK), Valdová I. (VÚGTK, ČÚZK),
Vaniš P. (VÚGTK), Vlk M. (Wirelessinfo), Zaoralová J. (VÚGTK), Zbořil J. (MU Brno)
Odborná redakce
Petr Kubíček
Technická redakce
Alexandr Drbal, Václav Nejedlý, Filip Antoš, Jaroslava Matesová, Ivana Skulínková,
Václava Skulínková, Štěpán Böhm, Helena Vovsová
7.
8. OBSAH
Úvod 9
Použitá terminologie 13
Hlavní používané zkratky 15
ČÁST I SPRAVADAT
Kapitola 1: SPRAVADAT 21
Kapitola 2: GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY V NÁRODNÍ
GEOINFORMAČNÍ INFRASTRUKTUŘE 23
Kapitola 3: METADATA, TEZAURY A KATALOGOVÉ SLUŽBY 29
Kapitola 4: INTEROPERABILITA, DATOVÉ MODELY
A GENERALIZACE DAT 49
Kapitola 5: ARCHITEKTURA PRO SDI A JEDNOTLIVÉ STANDARDY
PRO JEJÍ PODPORU 63
Kapitola 6: SDÍLENÍ PROSTOROVÝCH DAT A SLUŽEB
A MOŽNÉ OBCHODNÍ MODELY 69
Kapitola 7: VYBRANÁ PILOTNÍ ŘEŠENÍ PROJEKTU SPRAVADAT 85
ČÁST II MOBILDAT
Kapitola 1: VYBRANÉ PROBLÉMY MOBILNÍHO SBĚRU GEODAT 99
Kapitola 2: HLAVNÍ ČINNOSTI PŘI VKLÁDÁNÍ GEODAT
V MOBILNÍM PROSTŘEDÍ 105
Kapitola 3: VYUŽITÍ WEBOVÝCH SLUŽEB PRO MOBILNÍ SBĚR
GEODAT 113
Kapitola 4: ARCHITEKTURA SYSTÉMU MOBILDAT 121
Kapitola 5: METADATOVÉ PROFILY V MOBILNÍM MAPOVÁNÍ 125
Kapitola 6: NÁČRTOVÝ SYSTÉM A JEHO VYUŽITÍ V MOBILNÍM
MAPOVÁNÍ 131
Kapitola 7: TEMATICKÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI
Z PILOTNÍHO PROJEKTU 141
Kapitola 8: VELKOMĚŘÍTKOVÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI
Z PILOTNÍHO PROJEKTU 149
9. ČÁST III NAVLOG
Kapitola 1: NAVLOG 157
Kapitola 2: METODIKA TESTOVÁNÍ INTEGROVANÉHO PŘIJÍMAČE
GPS EGNOS 161
Kapitola 3: PŘEHLED SOUČASNÝCH METOD URČOVÁNÍ POLOHY 169
Kapitola 4: MOŽNOSTI MOBILNÍHO PŘENOSU DAT A VÝVOJ
KOMUNIKAČNÍHO MODULU 177
Kapitola 5: JAK ŘEŠIT NAVIGAČNÍ A LOGISTICKÉ ÚLOHY NA
ZÁKLADĚ STANDARDŮ OGC/SERVEROVÉ ŘEŠENÍ
NAVIGAČNÍCH A LOGISTICKÝCH ÚLOH 189
Kapitola 6: IMPLEMENTACE KLIENTSKÝCH ŘEŠENÍ 203
ČÁST IV GEOPLAN
Kapitola 1: GEODATA PRO AKTUALIZACI INFORMAČNÍHO
SYSTÉMU ZEMĚMĚŘICTVÍ A KATASTRU 215
Kapitola 2: DATA GEOMETRICKÉHO PLÁNU OBSAŽENÁ VE
VÝMĚNNÉM FORMÁTU 223
Kapitola 3: VYUŽITÍ PŘÍMÉHO PŘÍSTUPU KE GEODATŮM V
ZEMĚMĚŘICTVÍ 229
Kapitola 4: KOMUNIKAČNÍ SÍTĚ VHODNÉ PRO ZEMĚMĚŘIČE 235
Kapitola 5: ÚLOHA NÁČRTŮ V NOVÉM MAPOVÁNÍ A PŘI TVORBĚ
GEOMETRICKÝCH PLÁNŮ 245
Kapitola 6: ZPRACOVÁNÍ GEOMETRICKÝCH PLÁNŮ
PROSTŘEDNICTVÍM WEBOVÉ APLIKACE 255
Doslov 269
Literatura 271
10. ÚVOD
Po až hvězdném a zejména úspěšném období zavádění geografických informačních
systémů (GIS) do každodenního života se komunita specialistů, ale i laických uživatelů
zabývajících se či využívajících geografickou (prostorovou informaci), vrátila jako by
zpět, právě k ní.
Zatímco v počátcích využití GIS se hodila veškerá data a informace, která byla
v digitální formě k dispozici, a ne vždy byla kombinována a spojována oprávněně, v
pozdějším období se jasně ukázalo, že geografická data bez standardů a metadatových
služeb, bez zajištění harmonizace a interoperability nejsou to, co by nám pomáhalo nalézt
pravdivou a správnou informaci pro naše řešení.
Svět kolem nás také nezůstal stát a výrazně se změnil od doby, kdy kanadský vědec
Roger Tomlinson přišel poprvé s teorií a praxí GIS. Postupně přicházely nové informační
a komunikační technologie, nejprve malé počítače, posléze laptopy. Vzrůstala i nabídka
nových podrobných zdrojů prostorových dat, které již nevznikaly pouhou digitalizací
map, ale stále více přicházejí ze satelitů, digitálních fotogrammetrických snímků, radarů
či skenerů umístěných na letadlech. Přenosu a využití dat napomohl i nárust paměťových
datových medií a zejména nové, progresivně se rozvíjející možnosti internetu a Webu
(obě média nebyla ještě ani počátkem 80.let v učebnicích GIS vůbec zmiňována). I díky
internetu se objevují a stávají populárními mezi širokou veřejností nové typy vyhledávačů
pracujících s geografickými daty, jakými je například Google. Ve všech těchto procesech
hrají významnou úlohu GIS, čímž došlo k obrovskému navýšení potenciálu jejich využití.
Technologie se nevyvíjejí ve vzduchoprázdnu a jejich úspěšnost je závislá také na
tom, jak napomáhají řešení každodenních problémů. Svět se v minulých letech globalizoval,
kdysi industriální společnost se v rozvinutých a ekonomicky silnějších zemích změnila
na společnost informační s ambicemi směřujícími ke společnosti znalostní. A právě
požadavek znalostní společnosti směřuje opět k datům a informacím, či na vyšší úrovni
znalostem, které budeme pomocí nových technologií doručovat našim uživatelům, ať už
v rámci e-governmentu, e-commerce, realizací projektů jako je Digitální Země, e-Europe,
či dalších.
Ve své památné prezidentské řeči na kongresu ICA v Barceloně v r. 1995 tehdejší
prezident Mezinárodní kartografické asociace (ICA) Joel Morrison upozornil, že uplatnění
geografických informací v tehdejší době záleželo na rozvoji geografického myšlení,
které je výrazně pomalejší, než druhá složka procesu, rozvoj moderních technologií.
V té době často docházelo k diskuzím, jak nejlépe využít rychle se rozvíjející technologie.
Podíváme-li se několik let zpátky na projevy představitelů největších firem, skutečných
leaderů v oblasti GI byznysu, jakými jsou americké globálně operující firmy Intergraph,
ESRI či Bentley, zjistíme, že i v této oblasti se situace změnila. S prudkým rozvojem
informační společnosti, zejména v ekonomicky rozvinutých zemích, vidíme, že řada
nových požadavků společnosti si přímo vynucuje použití geografických informací.
Elektronické vládnutí (e-government) nebo požadavky na kontrolu kvality životního
prostředí, inteligentní dopravu, moderní zbrojní systémy atp., nelze bez prostorové složky
uspokojivě řešit.
11. Nejnovějším příkladem, který znamená výrazný obrat v přístupu k prostorovým
datům, byla několikaletá diskuze o evropské iniciativě, později legislativní směrnici
INSPIRE (Infrastructure for Spatial Information in Europe). Po dřívějších neúspěšných
pokusech vybudovat geoinformační infrastrukturu v Evropě (GII resp. SDI) se v
návaznosti na iniciativy přicházející z oblasti životního prostředí, zejména snahu pokrytí
požadavků na neustálou informovanost o stavu životního prostředí pro evropské obyvatele
kdykoliv a kdekoliv, se země Evropské unie sice obtížně, ale nakonec přece jenom
dohodly na vybudování zmíněné informační infrastruktury. Ta by měla navazovat na již
dříve uskutečněné kroky nejen v rámci Společenství, ale i v jednotlivých zemích. Jedním
z klíčových předpokladů, jež jsou také diskutovány v této knize, je interoperabilita. Řada
významných aktivit vychází z tzv. Evropského interoperabilního rámce.
Evropský interoperabilní rámec (IDABC; Interoperable Delivery of European
eGoverment Services to Public Administrations, Businesses and Citizens) představuje
využití informačních a komunikačních technologií pro podporu přeshraničních služeb
veřejného sektoru pro všechny občany a společnosti. Tato iniciativa by tak měla zajistit
kvalitní elektronické služby veřejné správy pro všechny koncové uživatele. Konkrétně se
jedná o zajištění konzistentních elektronických služeb v oblastech zemědělství, vzdělávání,
zaměstnanosti, sociálních věcí, životního prostředí, statistik či výběrových řízení. Jedním
ze základních kamenů implementačních projektů je zapojení Open Source software.
Výsledkem aktivit budou certifikované služby IDABC v roce 2009.
Vznik SDI, v našem případě INSPIRE, je předpokladem pro nový rozvoj vědeckých
disciplín, například kartografie. V současnosti je prostřednictvím inteligentního přístupu do
databází a interaktivní uživatelské podpory možné nejen nalézt vhodné mapy na Internetu,
ale také je vytvářet a modifikovat podle specifických a individuálních požadavků. Namísto
pouhého užití map, které byly někým vytvořeny předem, dovolují tyto nové výzkumné
možnosti jednotlivcům využívat kartografii interaktivně, na základně přání individuálního
uživatele, zkoumat a reprezentovat prostorové informace. Nové technologie umožňují “živé
spojení” mezi instinktivní vnitřní sférou naší prostorové kognice prostřednictvím přímé
interakce s novou generací kartografických vizualizací, a tím i s potenciálně nekonečnými
zdroji na Internetu.
Uvedené příklady dokumentují, že dochází k progresivnímu rozvoji sběru
a dostupnosti geografických dat a informací. Ty jsou pomocí nových technologií
zpracovávány a vizualizovány pro potřeby co nejširšího okruhu uživatelů. V souvislosti s
tím je také potřeba zásadně řešit složitou problematiku zapojení geografických informací
do širokého proudu informačních a komunikačních technologií a jejich aplikací a naopak,
aplikovat vlivy rozvoje informační společnosti na celou oblast geografických informací.
V tomto duchu byly formulovány a řešeny i projekty, jež jsou popisovány v
předkládané knize. Všechny byly financovány Grantovou agenturou Akademie věd České
republiky v rámci programu Informační společnost, tématického programu”II. Národní
program výzkumu - TP2. Jde o následující:
• Management geografických informací a znalostí (SPRAVADAT).
Jeho cílem bylo vytvoření uceleného systému managementu geografických
informací a znalostí a jejich uplatnění v praktických aplikacích. Jde o vyřešení tvorby,
uložení a distribuci velkých datových souborů typu katastr nemovitostí, Státní mapa 1 :
5000, báze geografických dat apod.
12. • Mobilní sběr prostorových dat pro mapovaní v reálném čase (MOBILDAT).
Cílem projektu bylo vytvořit základní infrastrukturu pro on-line vkládání
prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení. Řešitelé
vytvořily serverovou služby, které bude tvořit rozhraní mezi distribuovaným GIS a
mobilním zařízením uživatele. Služba také poskytuje možnost interaktivních korekcí
vkládaných údajů přímo v terénu a výrazně usnadní a zrychlí proces aktualizace dat v
GIS.
• Navigační a logistické systémy (NAVLOG).
Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému,
sloužícího pro potřeby českého aplikovaného a průmyslového výzkumu a pro výběr
optimálních praktických řešení pro energetiku a dopravní telematiku.
• Systém přenosu dokumentačních dat pro aktualizaci informačního systému
státní správy zeměměřictví a katastru (GEOPLAN)
Cílem projektu byl další rozvoj informačních technologií ve sféře tvorbyaktualizačních
souborů pro státní správu zeměměřictví a katastru. Vyřešení podmínek přímé datové
aktualizace souborů informačního systému katastru nemovitostí s využitím jak výměnných
formátů dat, tak i nových webových technologií.
Řada tezí a výstupů z výše uvedených projektů byla ověřována i v rámci výzkumného
záměru MŠMT ČR, projekt MSM0021622418 s názvem „Dynamická geovizualizace v
krizovém managementu“.
Autoři knihy nemají ambici popsat podrobně všechny otázky související s řešenými
projekty. Řada z nich je v široké vědecké komunitě otevřena a zatím nedořešena. Ambicí
autorů je ale ukázat, na jaké úrovni vývoje je výzkum v České republice resp. v EU a ve
světě v uvedených oblastech a tam, kde jsou nedořešené otázky, ukázat, jaké směry řešení
v budoucnosti vidí.
Vzhledem k omezenému rozsahu publikace byla pro potřeby čtenářů na adrese
www.spravageodat.cz vytvořena doplňková informační stránka o výše zmíněných
projektech, barevné verze obrázků a další důležité veřejné výstupy.
MILAN KONEČNÝ
13.
14. POUŽITÁ TERMINOLOGIE
Následující výčet obsahuje vysvětlení vybraných terminologických výrazů z
publikace. Pro ucelenější přehled a vysvětlení odborných termínů v oblasti geoinformačních
technologií odkazujeme na Terminologický slovník VÚGTK [160] a oborovou normu
– překlad odpovídajících CEN norem.
Ambiguita Neznámý počet celých vlnových délek nacházejících se mezi družicemi GPS
a přijímačem, nejednoznačnost.
Bezdrátové sítě Bezdrátový typ počítačové sítě, která jako přenosové médium používá elektro-
magnetické rádiové vlny v pásmech řádu GHz (gigahertzů).
Digitální náčrt Náčrt v digitálním vyjádření obsahu předmětů a šetření pro potřebu
velkoměřítkového mapování a katastru.
Gazeteer, prostorový tezaurus Seznam toponym seřazený dle abecedy nebo jinak, určující polohu a přednostně
též variantní jména, typ objektu a další informace.
Geodata 1: data s implicitním nebo explicitním vztahem k místu na Zemi
2: počítačově zpracovatelná forma informace týkající se jevů přímo nebo
nepřímo přidružených k místu na Zemi
3: data identifikující geografickou polohu a charakteristiky přírodních a antropo-
genních jevů a hranic mezi nimi.
Geodetický systém Společný název pro souřadnicový, výškový a tíhový systém.
Geometrický plán Je grafickou částí listin, podle nichž má být proveden zápis do katastru nemovi-
tostí. Vyhotovuje se vždy na základě výsledků geodetických prací v terénu
a obsahuje grafické zobrazení nemovitosti před změnou a po ní a další údaje
podle stanovených požadavků.
Geoprvek Modelový obraz lokalizovatelného objektu reálného světa, který je dále
nedělitelný na jednotky stejné třídy a který zahrnuje lokalizaci.
INSPIRE INfrastructure for SPatial InfoRmation in Europe je iniciativou Evropské
komise. Stejnojmenná směrnice Evropské komise a Rady si klade za cíl vytvořit
evropský legislativní rámec potřebný k vybudování evropské infrastruktury
prostorových informací. Hlavním cílem INSPIRE je poskytnout větší množství
kvalitních a standardizovaných prostorových informací pro vytváření
a uplatňování politik Společenství na všech úrovních členských států.
Integrace geodat Spojování a kombinace geodat z různých zdrojů, v poslední době především
v kontextu s využitím webových XML služeb.
Internetová síť Světová komunikační síť, umožňující připojeným počítačům komunikovat
s ostatními veřejnými segmenty napojenými na tuto síť.
Interoperabilita geodat 1: schopnost komunikovat, realizovat programy nebo přenášet data mezi
různými funkčními jednotkami způsobem, který vyžaduje od uživatele malé
nebo žádné znalosti o jednotlivých charakteristikách těchto jednotek
2: schopnost technického zařízení či softwaru od různých výrobců spolu
úspěšně komunikovat a spolupracovat.
Kálmanův filtr Filtr, který odhaduje stav pohyblivého systému ze série neúplných a rušených
měření.
Katastrální operát 1: souhrn měřického a písemného operátu pozemkového katastru
2: souborné označení pro dokumentační materiály potřebné pro vedení a obnovu
katastru nemovitostí ČR (soubor geodetických informací katastru nemovitostí,
soubor popisných informací katastru nemovitostí, souhrnné přehledy o půdním
fondu z katastru nemovitostí, dokumentace výsledků šetření a měření pro vedení
a obnovu souboru geodetických informací, sbírka listin).
Metadata Data popisující a dokumentující data, data o datech.
15. Místopisný náčrt Náčrt situace umístění bodu bodového pole vzhledem k okolním objektům,
součást formuláře geodetických údajů.
Mobilní klient Klientská část v architektuře klient-server, která je součástí přenosného zařízení
(např. PDA, mobilního telefonu apod.).
ON LINE přístup ke Zpřístupnění ke geodatům formou webových XML služeb nebo webových
geodatům aplikací.
Open Source Způsob distribuce programů, dat apod., která splňují jak otevřenost zdrojového
kódu, tak umožnění jeho dalšího šíření a úprav.
Pilotní studie Primární studie užitá pro ověření fungování systému.
Případová studie Vzorové zpracování zadaného tematu.
Scénář Podrobný technický popis postupu.
Senzor Prvek nebo zařízení určené k měření fyzikální veličiny.
Souřadnicový systém 1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku,
referenčním bodu a užitém kartografickém zobrazení
2: sada matematických pravidel pro specifikování způsobu, jakým jsou
souřadnice přiřazovány k bodům (ČSN ISO 19111).
Standardizace geodat Soubor opatření zabezpečující jednotnou podobu geografických dat.
Státní souřadnicový systém 1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku,
referenčním bodu a užitém kartografickém zobrazení
2: sada matematických pravidel pro specifikování způsobu, jakým jsou
souřadnice přiřazovány k bodům (ČSN ISO 19111)
3: systém, určený pro specifické práce v určeném prostoru v rámci státu.
Tablet Zařízení na převod obrazu do digitální formy ; skládá se z pevné podložky obsa-
hující elektronické zařízení generující elektromagnetické pole a z pohyblivého
snímacího zařízení v podobě pera nebo grafického kurzoru se záměrným křížem
a lupou.
Telematika Obor zaměřující se na určování polohy pohybujícího se objektu.
Tenký klient Klientský software v architektuře sítě klient-server, jehož funkčnost je závislá
na centrálním serveru.
Tezaurus Hierarchicky uspořádaný terminologický slovník lexikálních jednotek obsahu-
jící popisovače a vztahy mezi nimi.
Tlustý klient Klientský software v architektuře sítě klient-server, který pracuje nezávisle na
centrálním serveru. Obvykle poskytuje větší funkcionalitu než tenký klient.
Triangulační list Plošná evidenční jednotka v bývalé československé trigonometrické síti.
Výměnný formát geodat Kódový záznam dat, který se používá k přenosu mezi jednotlivými programy
nebo zařízeními.
Vzhled jevu Abstrakce jevů reálného světa, překlad termínu feature v ČSN ISO normách
řady 19100, ekvivalent k pojmu geoprvek.
Webové mapové služby Poskytování mapových výstupů prostřednictvím internetu bez nutnosti přenosu
zdrojových souborů dat.
Webové služby Systém umožňující součinnou spolupráci počítačů v síti. Poskytovatel služby
nabízí prostřednictvím standardních rozhraní určitá data a služby. Klient najde
adresu služby v registru webových služeb, načte si její popis a využívá ji.
16. HLAVNÍ POUŽÍVANÉ ZKRATKY
A-GPS Asistované GPS
AGS Astronomicko-geodetická síť
AJAX Asynchronous Javascript And XML
ANSI American National Standards Institute
AOA Angle Of Arrival
AP Access Point
AST position paper Architecture & Standards Position Paper
AV ČR Akademie věd České republiky
BBWA Broadband Wireless Access (bezdrátové metropolitní sítě)
BIH Bureau International de I’Heure
BPEJ Bonitní půdně ekologická jednotka
Bpv Výškový systém baltský - po vyrovnání
BSS Basic Service Set
CAGI Česká asociace pro geoinformace
CBCH Cell Broadcast Channel
CDMA Code Division Multiple Access
CLI Command Line Interface
CORBA Common Object Request Broker Architecture
CTRS Konvenční terestrický systém
CQL Common Query Language
CSMA/CA Carrier Sense Multiple Access With Collision Avoidance
CSW Catalogue Services for the Web
CZEPOS Česká permanentní síť pro určování polohy
ČR Česká republika
ČSJNS Československá jednotná nivelační síť
ČSN České technické normy
ČSÚ Český statistický úřad
CSV Comma Separated Value(s) (importní/exportní formát do databáze)
ČÚZK Český úřad zeměměřický a katastrální
DBU Deutsche Bundesstiftung Umwelt
DCMI Dublin Core Metadata Initiative
DGN Design (formát výkresů v produktech firmy Bentley Systeme)
DGPS Diferenční GPS
DKM Digitální katastrální mapa
DIKAT Systém pro tvorbu a vedení informačních systémů o území a automatizované vyhotovení
geometrického plánu
E-CGI Enhanced Cell Global Identity
E-OTD Enhanced Observed Time Diference
ebRIM Electronic Bussiness Registry Information Model
EGM Earth Gravity Model
EGNOS European Geostationary Navigation Overlay Service
EPSG European Petroleum Survey Group
17. ESS Extended Service Set
ETRF European Terrestrial Reference Frame (Evropský terestrický referenční rámec)
ETRS European Terrestrial Reference System (Evropský terestrický referenční systém)
ETSI European Telecommunications Standards Institute
EUREF European Reference Organisation for Quality Assured Breast Screening and Diagnostic
Services
EVRF European Vertical Reference System
EXIF EXchangeable Image File Format
FHSS Frequency Hopping Spread Spectrum
FKP Flächenkorrekturparameter
FTP File Transfer Protocol
FSC Fujitsu-Siemens Computers
FSÚ Federální statistický úřad
GALILEO Evropský družicový navigační systém
GDAL Geospatial Data Abstraction Library
GDI Geographic Data Infrastructure
GeoSl AČR Geografická služba Armády ČR
GFM General Feature Model
GII Geospatial Information Infrastructure
GIS Geografický informační systém
GLONASS GLObaľnaja NAvigacionnaja Sputnikovaja Sistěma (ruský družicový navigační systém)
GML Geography Markup Language
GNSS Global Navigation Satellite System
GP Geometrický plán
GPL General Public Licence (všeobecná veřejná licence)
GPRS General Packet Radio Service
GPS Global Positions System (americký družicový navigační systém)
GRASS Geographic Resources Analysis Support System
GSM Mobilní bezdrátové sítě (GPRS, UMTS)
GUI Graphic User Interface
IAPP Inter-Access Point Protocol
IBO Information Bearing Objects
ICAO International Civil Aviation Organisation
IEEE Institute of Electrical and Electronical Engineers
IERS International Earth Rotation Service (Mezinárodní služba rotace Země)
IIM Information Interchanges Model
IMO International Maritime Organisation
INSPIRE INfrastructure for SPatial InfoRmation in Europe
IPR Intellectual Property Rights
IPTC International Press and Telecommunications Council
IrDA Infrared Data Association
IS Informační systém
ISO International Organisation for Standardisation
ISKN Informační systém katastru nemovitostí v ČR
ISM Industry, Science, Medical
18. ITRF International Terrestrial Reference System
ETRS European Terrestrial Reference System (uživatelský geocentrický souřadnicový systém)
ITU-T International Telecommunications Union - Telecommunications Standardization Sector
KM-D Katastrální mapa v digitální formě
KN Katastr nemovitosti
LADGPS Local Area DGPS
LAN Local Area Network (místní síť)
LMU Location Measurement Unit
MAC Media Access Protocol
MetaIS Metainformační systém
MLC Mobile Location Center
MMC MultiMedia Computer
MS Mobilní stanice
MT Mobile Terminal
N.N. Normal Null
NAA Newspaper Association of America
NATO North Atlantic Treaty Organisation (Organizace Severoatlantické smlouvy)
NavLog Navigation Log
NGII Národní geoinformační infrastruktura ČR
NMEA National Marine Electronics Association
NNSS Navy Navigation Satellite System (Námořní navigační družicový systém)
NVF Nový výměnný formát KN
OGC Open Geospatial Consortium
PBPP Podrobné body polohového pole
PC Výpočetní technika, komunikační technika
PDA Personal Data Assistant
PDOP Position Dilution of Precision
PII Prostorová informační infrastruktura
PKMP Prvky katastrální mapy
POS Personal Operating Space
PPP Public Private Partnership
PROJ Cartographic Projections Library
PRS Pseudoreferenční stanice
PyWPS Python Web Processing Service
QoS Quality of Service
RDF Resource Description Framework
RINEX Receiver Independent Exchange
RTK Real Time Kinematic
RETM Rastrové ekvivalenty topografických map
S-42 Souřadnicový systém 1942
S-Gr95 Tíhový systém 1995
S-JTSK Státní souřadnicový systém jednotné trigonometrické sítě katastrální
S-SK Souřadnicový systém stabilního katastru
SDI Spatial Data Infrastructure
19. SGI Soubor geodetických informací
SGS Srovnávací grafický soubor
SIG Special Industry Group
SLD Styled Layer Descriptor
SLR Satellite Laser Ranging
SMLC Serving Mobile Location Center
SMPS Simple Mobile Positioning System
SPI Soubor popisných informací
SQL Structured Query Language (strukturovaný dotazovací jazyk)
SW Software
SWOT Strengths, Weaknesses, Opportunities, Threats
TDD Time-Division Duplex
TS AČR Topografická služba Armády ČR
UML Unified Modeling Language (grafický jazyk pro vizualizaci, specifikaci, navrhování
a dokumentaci programových systémů)
UMTS Universal Mobile Telecommunications System (Universální mobilní telekomunikační
systém)
UTM Universal Transversal Mercator
VFK Výměnný formát katastru
VGA Video Graphics Array (grafický adapter pro PC)
VPN Virtual Private Network
VÚGTK Výzkumný ústav geodetický, topografický a kartografický
WADGPS Wide Area DGPS
WCS Web Coverage Service
WECA Wireless Ethernet Compatibility Aliance
WEP Wired Equivalent Privacy
WEP Wireless Encryption Protocol
WFS Web Feature Service
WGS 84 World Geodetic System 1984 (Světový geodetický systém 1984)
WiFi Wireless Fidelity
Wirelessinfo Virtuální výzkumné a inovační centrum se zaměřením na GIS
WLAN Wireless Local Area Network
WMC Web Map Context
WMS Web Map Service
WPAN Wireless Personal Area Network
WPS Web Processing Service
WWW World Wide Web
XML eXtensible Markup Language (rozšiřitelný značkovací jazyk)
XMP eXtensible Metadata Platform
ZABAGED Základní báze geografických dat
ZÚ Zeměměřický úřad
ZHB Zhušťovací bod
ZPH Zjišťování průběhu hranic
ZPMZ Záznam podrobného měření změn
22. Kapitola 1: SPRAVADAT
MILAN KONEČNÝ, PETR KUBÍČEK, KAREL CHARVÁT
1. Úvod
Cílem projektu SpravaDat - Management geografických informací a znalostí bylo
napomoci rozvoji geoinformační infrastruktury (SDI) v ČR a přispět k řešení otázky
komercializace prostorových (geografických) dat. Hlavním úkolem projektu SpravaDat
bylo navrhnout a implementovat takové modely využívání prostorových dat, které umožní
jejich co nejširší využití.
Projekt výrazně napomohl analyzovat současnou situaci a vytvořit podmínky vedoucí
k zavádění INSPIRE v ČR. Tým autorů se podílel i na formování národního stanoviska
k některým dokumentům INSPIRE a jeho výsledky jsou dnes již přímo součástí postupně
vytvářené Národní geoinformační infrastruktury (NSDI) pro implementaci INSPIRE.
Projekt ale nebyl přímo svázán s praktickým zaváděním INSPIRE a jelikož se jednalo
o projekt výzkumný, v některých částech výrazně překračoval i rámce dané INSPIRE.
Jak již bylo řečeno, hlavním cílem projektu bylo napomoci lepšímu využívání
prostorových dat. V posledních letech byly v ČR pilotně implementovány i standardizované
technologie umožňující vytváření skutečného trhu s daty a prostorové infrastruktury.
Přesto se však ještě nedá plně hovořit o existenci národní prostorové infrastruktury a již
vůbec ne o plně rozvinutém trhu s geoprostorovými daty. Existuje zde jednak výrazná
poptávka po efektivnější práci s daty v oblasti státní správy a samosprávy, a to především
v oblasti přístupu k datům a jejich sdílení (náznak řešení demonstruje kraj Vysočina), ale
i rozsáhlý tržní potenciál pro využívání prostorových dat jak jednotlivci, tak i organizacemi.
V budoucnosti bude vzrůstat požadavek na poskytování dat pomocí integrovaných
služeb (viz kapitola 6, 7). Zkušenosti v Evropě i u nás ukazují, že budoucnost v práci s
prostorovými daty je v prostředí Webu. Plnému rozvití však dosud bránila řada faktorů.
Jako hlavní lze zmínit:
• Nevyjasnění některých legislativních otázek v oblasti přístupu k prostorovým datům
v rámci státní správy a samosprávy (zde již dochází k výraznému posunu především
zásluhou činnosti Nemofora).
• Vysoká cena geoprostorových dat, která je obvykle dána dvěma hlavními faktory:
· Současné modely nabízení dat jsou orientovány především na nabízení
ucelených datových setů, které jsou pro mnoho uživatelů cenově nedostupné.
To na druhou stranu ovlivňuje, že neexistuje dostatečně velká poptávka po
datech, která by pak umožnila tato data zlevnit.
· Na trhu jsou nabízena obvykle data, ne služby. Velká většina budoucích
potenciálních zákazníků bude požadovat informační a znalostní služby, ne
primární data.
• Nedostatečná informovanost mezi uživateli i poskytovateli prostorových dat
o nejnovějších standardech a technologiích v oblasti sdílení geoprostorových dat
a služeb.
21
23. • Nedostatečná podpora těmto technologiím a standardům ze strany vývojářských
týmů.
Projekt SpravaDat se snažil reagovat na tyto překážky a poskytl jak teoretické
analýzy, tak prakticky prezentoval výsledky výzkumu vedoucí k překonání těchto bariér.
Následující text je rozčleněn do kapitol, které v jistém smyslu kopírují organizaci
pracovních týmů INSPIRE. I přesto, že v publikaci popsané výsledky projektů se někdy
liší od doporučení týmů INSPIRE (doporučení pracovních týmů a výzkumy v rámci
SpravaDat probíhaly paralelně), domníváme se, že toto členění může napomoci čtenářům
lépe pochopit a implementovat doporučení, která z INSPIRE přicházejí. Budování
NSDI bude na jedné straně plně v souladu s požadavky INSPIRE, ale na druhé straně
bude postihovat i národní specifika. Možné odlišnosti oproti doporučením pracovních
týmů INSPIRE mohou vycházet i z toho, že především v oblasti budování technologické
infrastruktury pro SDI je Česká republika výrazně nad průměrem Evropy.
Členění kapitoly věnované projektu SpravaDat je následující:
· GIS v národní geoinformační infrastruktuře.
· Metadata a katalogové služby.
· Interoperabilita, datové modely a generalizace dat.
· Architektura pro SDI a jednotlivé standardy pro její podporu.
· Sdílení prostorových dat a služeb a možné obchodní modely.
· Popis konkrétních pilotních řešení, která jsou výstupem z projektu
SpravaDat.
22
24. Kapitola 2: GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY
V NÁRODNÍ GEOINFORMAČNÍ INFRASTRUKTUŘE
PAVLA TRYHUBOVÁ
1. Národní geoinformační infrastruktura (NGII)
Bez prostorových dat si dnes nedokážeme život představit. Každý z nás v životě už
někdy něco hledal nebo hledá a geodata mu pomohou najít správný směr, ať už použije
klasickou papírovou mapu nebo moderní GPS navigaci. Problém nastává, když chceme
najít „správnou“ klasickou mapu nebo „správná“ data pro GPS navigaci.
Prostorová data hrají důležitou roli nejen při hledání cest, ale i při rozhodování
vládních složek a organizací. Vláda plánuje politiku pro zemědělství, průmysl, regionální
rozvoj, dopravu a bezpečnost, sleduje postup řešení své strategie a ověření dosažených
výsledků. Kvalitní geodatové a mapové podklady jsou důležité pro efektivní vývoj tržního
hospodářství. Podobné příklady můžeme uvést i z dalších evropských zemí, například
při navrhování dopravní sítě nebo sledování znečištění životního prostředí. Zvládat tyto
procesy na evropské úrovni ale není možné bez určité úrovně integrace, harmonizace
a interoperability dat (Pauknerová, Tryhubová [140]).
Díky těmto požadavkům je v současné době vyvíjena řada aktivit na globální,
evropské i národní úrovni s cílem zabezpečit tyto podmínky pomocí jednotné infrastruktury
prostorových informací, která je často označována dalšími termíny, např. infrastruktura
prostorových dat, prostorové informační infrastruktury (PII), v globálním kontextu známé
jako SDI (Spatial Data Infrastructure), či GDI (Geographic Data Infrastructure). V této
knize je použit termín GII - Geospatial Information Infrastructure. Zimová [179] uvádí,
že více než polovina z celkového počtu zemí světa deklaruje své aktivity v nějaké formě
budování SDI.
Funkční geoinformační infrastruktura se stává přirozeným požadavkem informační
společnosti, a proto v řadě významných dokumentů z poslední doby - z oblasti veřejné
správy i z profesní sféry - je vyjádřena nutnost formulovat strategii vytváření národní
geoinformační infrastruktury v podmínkách České republiky a určit cíle a projekty, které
vedou k její realizaci. Specifikace programu Národní geoinformační infrastruktury České
republiky (NGII) je součástí cílů uvedených v dokumentech Státní informační politika,
Koncepce budování informačních systémů veřejné správy a Akční plán realizace státní
informační politiky.
Národní geoinformační infrastrukturu České republiky lze popsat jako soubor
vzájemně provázaných podmínek, které v prostředí ČR umožňují zajistit a zpřístupnit co
největšímu okruhu uživatelů širokou škálu geoinformací uživatelsky vhodnou formou při
plném využití potenciálu moderních (geo)informačních a komunikačních technologií.
[117]
23
25. 2. Podmínky pro fungování NGII
Shrňme si základní podmínky pro fungování NGII - existence geodat a geoinformací,
harmonizace a interoperabilita dat, jejich snadná dostupnost a znalost podmínek, za kterých
mohou být využívána. Aby výše uvedené podmínky byly splněny, musíme znát vlastnosti
geodat a způsoby jejich využívání.
Z vlastností jsou to především dva možné modely dat: vektorový a rastrový model
dat. V GIS mohou být také použity snímky a obrázky (mapky, letecké snímky) nebo
soubory vektorových dat stažitelné ve formátech SHP, DGN a podobně. Výrazně se
prosazuje používání internetu. Internetové stránky umožňují kopírovat databáze a nebo
výpisy z informačních systémů využitelné v GIS. V informačních systémech jsou použity
textové formáty dat nazývané registry a číselníky. Data jsou doplněna údaji o geografické
lokalizaci, kterou mohou být gegrafické souřadnice místa, nebo přesná adresa, označení
určitého regionu, a podobně. Statistické klasifikace a číselníky vyhlašuje Český statistický
úřad. Číselníkem se rozumí uspořádaný seznam kódů a jim přiřazených významů.
Číselníky jsou součástí statistického informačního systému. Statistická data lze zejména
použít v tematickém mapování, při tvorbě kartogramů, kartodiagramů a podobně. Český
statistický úřad vede registr ekonomických subjektů a registr sčítacích obvodů.
Umístění geodat na webové stránky skrývá několik úskalí souvisejících s jejich
objemem a rozsahem. Některé zdroje nabízejí pokrytí celé České republiky, jiné pouze
určité zájmové oblasti. Příkladem jsou ortofotomapy nebo již existující tematické mapy.
Problémy nastávají tam, kde poskytovatelé geodat nemají dostatečně velký internetový
prostor pro umístění dat nebo nechtějí nabídnout vše zdarma, a tak na webové stránky
umísťují pouze ukázky dat nebo metadata. S tímto problémem úzce souvisí poskytování
geodat. Poskytovatelé mají dvě možnosti: za úplatu nebo zdarma – většina poskytovatelů
nabízí geodata především za úplatu, pokud jsou zdarma ke stažení, tak pouze pro
nekomerční účely.
Další vlastností je dostupnost umístěných geodat. Nejsnadnější, nejrychlejší
a nejlevnější dostupnost je pomocí internetu. To znamená stažení geodat přímo z
webových stránek. Tato forma dostupnosti ale není příliš oblíbená mezi poskytovateli
geodat. Důvodem je nebezpečí jejich zneužití, které může vést až k nekontrolovanému
šíření geodat mezi uživateli a jejich využíváním v komerčním prostředí, a tím i porušování
autorského zákona. Poskytovatelé řeší tuto situaci několika způsoby. Nutnou registrací
vstupu do informačního systému, ve kterém si lze data vyhledávat, kupovat a stahovat (e-
obchod) nebo osobní návštěvou firmy, kdy je potřeba vyplnit formuláře a písemně o data
zažádat. Teprve později po vyřízení všech formalit dochází k dodání geodat na CD-ROM.
Internet poskytovatelé využívají k poskytování informací o vlastnictví geodat. Z těchto a
dalších důvodů je důležitou součástí geodat jejich popis.
Popis dat je označován obvykle jako metadata a v minulosti byl velmi často
podceňován a opomíjen. Pro informovanost o geodatech jsou metadata důležitou
složkou prostorově lokalizovaných dat. Metadata jsou definována jako „data o datech”
a v nejrůznějších podobách jsou využívána již poměrně dlouhou dobu v oblastech
zabývajících se uchováváním a zpřístupňováním informací a samozřejmě také v GIS.
24
26. Problematika metadat byla diskutována a řešena i v projektu INSPIRE. Detailně danou
problematiku rozebírá a komentuje kapitola 3.
3. INSPIRE
Iniciativa INSPIRE se stala evropskou směrnicí po jejím schválení Evropským
parlamentem v listopadu roku 2006. Směrnice INSPIRE a její přijetí představuje klíčový
moment pro budoucnost tvorby infrastruktury prostorových informací v Evropské Unii.
INSPIRE podporuje harmonizaci prostorových formátů dat, dostupnost datových sad
a schopnost vyhledat různé datové sady.
INSPIRE je založena na souboru základních principů:
• data by měla být sbírána pouze jednou a udržována na té úrovni, kde je sbírání dat
nejúčinnější;
• mělo by být možné propojit prostorové informace z různých evropských zdrojů a
mezi mnoho uživatelů a aplikací;
• mělo by být možné pro informace sebrané na jedné úrovni jejich sdílení do všech
ostatních úrovní;
• na všech úrovních by mělo být dostatečné množství geodat za podmínek, které
umožní jejich rozsáhlé použití;
• mělo by být snadné najít, která geodata jsou dostupná, která se hodí pro zvláštní
použití a za jakých podmínek mohou být získána a používána;
• geodata by měla být snadno pochopitelná a interpretovatelná.
Směrnice chce zajistit vytvoření evropské prostorové informační infrastruktury,
která zpřístupní uživatelům integrované prostorové informační služby. Tyto služby
by měly umožnit uživatelům pomoci při vyhledávání a zpřístupňování geografických
informací z široké škály zdrojů, od místní úrovně ke globální úrovni, interoperabilní
cestou. Uživatelské cíle INSPIRE zahrnují politiky a evropské manažery na národní a
místní úrovni, občany a organizace [51].
INSPIRE bude provozován na jednom webovém portálu, kde bude možné nalézt
existující data. Jestliže tato data neexistují, členské státy EU budou muset takové datové
sady vytvořit. Datové sady musí vyhovovat standardům, které zajistí propojení s daty
z jiných zemí a z podkladů různých měřítek. Výhody pro Evropskou unii, jakož i běžného
občana jsou zřejmé. Pokud stát zpřístupní a otevře používání prostorových dat, umožní
mimo jiné prostřednictvím internetu jejich kontrolu, například plnění územního plánu
nebo zapsání osobního vlastnictví, s použitím mobilního telefonu nalezení nejbližší banky
nebo zdravotního střediska [162].
25
27. 3.1 Obsah směrnice INSPIRE
Směrnice obsahuje následující kapitoly:
Kap. 1 Obecná ustanovení
Kap. 2 Metadata
Kap. 3 Interoperabilita prostorových datových sad a služeb
Kap. 4 Síťové služby
Kap. 5 Sdílení dat a znovu využití dat
Kap. 6 Koordinace a doplňující opatření
Kap. 7 Závěrečná ustanovení
Přílohy I, II, III.
Konkrétní znění české verze směrnice a aktuální vývoj situace související s její
implementací lze nalézt na adrese: http://www.cenia.cz/web/www/web-pub2.nsf/$pid/
MZPMSFGR0A25.
3.2 Obecné principy se vztahem ke geodatům
• Pro geodata zavést koordinační opatření a koordinační struktury na úrovni veřejné
správy pro spojení informací a znalostí z různých odvětví, které by zohledňovaly
rozdělení pravomocí a odpovědností v členských státech.
• Propojení geodat s dalšími informačními oblastmi (školství, vzdělávání a politika).
• Data by měla být sbírána jednou a držena na té úrovni, kde je sbírání dat
nejefektivnější.
• Orgány a instituce Společenství mají mít harmonizované podmínky a integrovaný
přístup k souborům prostorových dat a službám zohledňující regionální rozdíly.
• Poskytovat o geodatech objektivní, důvěryhodné a srovnatelné informace na úrovni
Společenství.
• Zajistit propojené síťové služby, které naleznou, transformují, zobrazí a stáhnou
prostorová data.
• Usnadnit finanční náhrady za využívání prostorových dat a nadstandardních služeb.
• Je třeba usnadnit přístup a zajistit možnost opakovaného použití prostorových dat,
jež přesahují správní a státní hranice.
• Členské státy zajistí přístup ke službám uvedeným prostřednictvím geoportálu
Společenství.
• Členské státy umožní veřejným orgánům a institucím členských států přístup ke
geodatům a zajistí jejich dostupnost bez omezení (transakční, procesní, zákonné,
institucionální nebo finanční povahy).
• Zajistit snadno použitelné služby pro veřejnost a přístup k nim pomocí
komunikačního prostředku. Jde o služby vyhledávací (na základě obsahu metadat),
prohlížecí, stahování, transformační a vyvolávací.
• Pro účely služeb je třeba zavést několik vyhledávajících kritérií: klíčová slova,
třídění prostorových dat a služeb, kvalita a přesnost prostorových dat, úroveň
souladu se specifikacemi pro harmonizaci prostorových dat, zeměpisná poloha,
podmínky přístupu a použití geodat a služeb, veřejné orgány, které jsou pověřeny
vypracováním, řízením, údržbou a šířením souborů prostorových dat a služeb.
26
28. • Členské státy nesmějí omezit přístup k informací o emisích do životního prostředí.
• Členské státy zajistí, aby vyhledávací a prohlížecí služby byly veřejnosti přístupné
zdarma.
• Data mohou být poskytována pomocí prohlížecích služeb ve formě zabraňující
opětovnému použití a mohou obsahovat licenční smlouvu.
• Vybírají-li orgány veřejné moci poplatky za transformační a vyvolávací služby,
musí členské státy zajistit, aby bylo možné použít služeb elektronického obchodu.
• Otevřenost národních infrastruktur pro další vlastníky geodat (třetí stranu).
• Členské státy přijmou příslušná opatření, aby zabránily narušení hospodářské
soutěže.
• Zajistit propojení sítí pro zpřístupnění metadat veřejným orgánům a třetím stranám
na základě žádosti.
• Implementační pravidla stanovující podmínky pro harmonizaci prostorových dat
a předpisy pro výměnu prostorových dat zajistí interoperabilitu prostorových dat
nebo interakci služeb.
• Komise stanoví implementační pravidla tak, aby zvýšila možnost opakovaného
využití souborů prostorových dat a jejich služeb třetími stranami. Tato prováděcí
pravidla mohou obsahovat zavedení společných podmínek pro udělování licencí.
4. Závěr
Žijeme v době, kdy kvalita a kvantita informací o světě kolem nás se vyvíjí úžasnou
rychlostí. Zvyšují se požadavky na uchovávání a zpracovávání informací.
V současnosti je vyvíjena řada aktivit na globální, evropské i národní úrovni s cílem
zabezpečit výše zmiňované podmínky (harmonizace, informovanost a dostupnost geodat)
pomocí jednotné infrastruktury prostorových informací. Jak již bylo řečeno, v INSPIRE
je řada klíčových doporučení nezbytných pro podporu vysoké úrovně NGII. Odborná
komunita pracující s prostorovými daty věří, že INSPIRE je prvním krokem pro vytvoření
Evropského SDI. Pro realizaci této myšlenky je nutné zvyšovat povědomí o NGII mezi
všemi zainteresovanými složkami - poskytovateli ostatních dat, ministerstvy, privátním
sektorem a veřejností.
V průběhu posledních let se situace v ČR mění k lepšímu – rozvíjí se informační
systémy, na webových stránkách přibývají portály. Veřejná správa poskytuje stále více
informací. Dostupnost geodat se rok od roku zlepšuje. Díky vznikajícím informačním
portálům a geoportálům snadněji vyhledává a má geografické informace k dispozici
stále více uživatelů. Česká republika tak vytváří podmínky pro fungování NGII a splňuje
požadavky INSPIRE. Menší nedostatky existují v harmonizaci dat, např. chybí národní
profil metadat. Dalším krokem na cestě k úspěšnému vybudování NGII bude naplnění
požadavků směrnice INSPIRE.
27
30. Kapitola 3: METADATA, TEZAURY A KATALOGOVÉ
SLUŽBY
ŠTĚPÁN KAFKA, TOMÁŠ ŘEZNÍK, PETR KUBÍČEK, KAREL CHARVÁT, TOMÁŠ
CAJTHAML
1. Metadata
Potřeba metadat se objevila již v době, kdy byly pořizovány první rastrové mapové
podklady a digitální data vůbec. Tehdy se začala objevovat i poptávka po informacích
o prostorových datech. Tyto informace tak vlastně navazují na mimorámové údaje map
v analogové podobě, zpracovávané v předchozích letech, které poskytovaly obdobným
způsobem zásadní informace o prostorových datech.
Metadata lze definovat jako data o datech nebo datových sadách, tedy jako množinu
informací popisujících daná data. Jde o popis obsahu, reprezentaci, geografický a časový
rozsah, prostorové reference, jakost a správu sady geografických dat. Je důležité, že právě
metadata umožňují integrovat geodata z různých datových sad a zdrojů (organizací,
segmentů veřejné správy apod.), čímž naplňují jeden z hlavních principů a požadavků na
interoperabilitu dat a informačních systémů (především charakteru GIS).
Pro správu metadat se používá metainformační systém. Metainformační systém
(MetaIS) je informační systém, který dokáže sofistikovaně pracovat s metadaty a vyřizovat
požadavky na něho kladené. Důležitými charakteristikami MetaIS jsou především tyto
operace nad metadaty:
• Identifikace metadat (schopnost zpracovat neomezené množství metadat).
• Verifikace metadat (ověření správnosti testováním).
• Interpretace metadat (zpracování obsahu metadat, validita).
• Distribuce metadat (prezentace ve vhodné formě).
Uživatelé MetaIS mohou vyhledávat metadata o požadovaných datových sadách s
využitím standardních vyhledávacích mechanismů. MetaIS většinou publikuje svá metadata
prostřednictvím služby WWW. Z metadatových standardů relevantních pro projekt
SpravaDat a i pro budování NSDI je třeba zmínit dva, Dublin Core a ISO19115/19119.
Obr. 1: Využití metadat v praxi
29
31. 1.1 Dublin Core - ISO 15836
Dublin Core je standard určený Tab. 1: Dublin Core Metadata Element Set
k vytváření metadat dokumentů na Anglicky Česky
internetu. Vychází z knihovních systémů. Title Název
Jde o jednoduchý systém složený z Creator Tvůrce
několika položek s prefixem „DC“. Je Subject Předmět
možno vytvářet další podtřídy rozšířením Description Popis
předdefinovaných pomocí tečky. Tato
Publisher Vydavatel
metadata je možno vkládat do hlaviček
Contributor Přispěvatel
HTML dokumentů. Existují vyhledávače,
Date Datum
které je umí zpracovávat a tak poskytovat
tříděné informace na rozdíl od „textových“ Type Typ
webových vyhledávačů. Format Formát
Identifier Identifikátor
Standard Dublin Core obsahuje
Source Zdroj
základní sadu patnácti prvků (Dublin Core
Language Jazyk
Metadata Element Set), z nichž žádný není
povinný: viz tab. 1. Relation Vztah
Coverage Pokrytí
Rights Práva
1.2 ISO 19115/19119 metadata
1.2.1 ISO19115
Norma ISO 19115 standardizuje metapopis prostorových dat. Počítá se s tím, že
bude postupně nahrazovat současně používané standardy: FGDC (USA), ANZLIC
(Austrálie), CEN (EU). Z informací uveřejněných na internetu vyplývá, že jak výrobci
softwaru, tak i producenti dat postupně na tuto normu přecházejí. Současné aktivity EU v
oblasti prostorové infrastruktury (INSPIRE) počítají s touto normou jako jedinou pro popis
prostorových dat. V ČR byly zrušeny předběžné normy CEN a do češtiny byla přeložena
norma ISO (překlad dalších souvisejících norem ISO 191xx v současné době postupně
probíhá), která také byla přijata za normu ČSN.
Norma byla inspirována stávajícími metadatovými normami, je však značně
rozsáhlejší a snaží se implementovat řadu číselníků, které omezují zadávání volného textu.
Měla by přispět k ujednocení interpretace jednotlivých položek. Textových položek však
nadále zůstává velké množství. Norma navazuje na další normy série ISO 191xx (ISO
19103 Conceptual Schema Language, ISO 19107 Spatial Schema, ISO 19108 Temporal
schema, ISO 19109 Rules for Application Schema, ISO 19118 Encoding). Vychází
z jednotného „General feature“ modelu používaného jak OGC tak v rámci norem ISO
191xx. Obsahuje povinné, nepovinné a podmíněně povinné položky. Norma také definuje
jakési jádro metadat (Core metadata), které by mělo být doporučeným základem pro
všechny metadatové záznamy. Norma předkládá popis struktury metadat ve formě UML
modelů a datového slovníku metadat, který poskytuje detailnější informace o jednotlivých
položkách. Datový slovník obsahuje normalizované krátké a dlouhé jednoznačné názvy
jednotlivých položek, které jsou dále používány v návazných normách.
30
32. S použitím této normy se počítá nejen pro popis datových sad, ale také webových
služeb (WMS apod.).
Základní (implicitní) jednotkou pro metadatový popis je datová sada (dataset).
Norma umožňuje také popisovat metadaty jednotlivé třídy geoprvků (feature types), třídy
atributů (feature attributes), instance geoprvků (feature instances) a atributů (attribute
instance). Je uplatněn také mechanismus pro popis jednotlivých listů mapového díla (tiles)
nebo pro definování vzájemné hierarchie (superset, subset).
Pro přehlednost je norma tematicky rozčleněna do 12 balíčků (tab. 2, obr. 2).
Tab. 2: Metadatové balíčky
Č Název balíčku Obsah
1. MD_Metadata Základní balíček agreguje další balíčky. Dále obsahuje
informace o jazyku a znakových sadách dat i metadat, iden-
tifikátor metadatového záznamu, datumové razítko apod.
2. MD_Identification Citace, formát dat, ukázka, užití, zda je součástí jiné datové
sady (DS)
3. MD_Constraints Omezení použití, autorská práva …
4. DQ_DataQuality Kvalita dat, údaje o historii vzniku apod.
5. MD_MaintenanceInformation Způsob údržby, údaje o aktualizaci
6. MD_SpatialRepresentation Rastr/vektor, geometrie, topologie…
7. MD_ReferenceSystem Souřadnicové systémy, projekce
8. MD_ContentInformation Popis rastrových dat nebo citace katalogu atributů
9. MD_PortrayalCatalogueReference Způsob grafické prezentace dat
10. MD_Distribution Poskytované formáty dat, on-line přístup, ceny apod.
11. MD_MetadataExtensionInformation Uživatelská rozšíření
12. MD_ApplicationSchemaInformation Dokumentace aplikačního schématu DS
Obr. 2: UML model metadat na úrovni základních balíčků
31
33. CORE metadata:
Standard definuje seznam položek, které tvoří jádro (CORE) metadat (viz tab. 3).
Ne všechny položky jsou zde povinné, ale jsou doporučené pro základní popis dat.
Tab. 3: CORE metadata (M – povinný, O=volitelný, C = povinný za urč. podmínek)
Prvek Povinný Umístění
Název datové sady M MD_Metadata > MD_DataIdentification.citation > CI_Cita-
tion.title
Typ prostorové reprezentace O (MD_Metadata > MD_DataIdentification.spatialRepresen-
tationType
Referenční kalendářní datum M MD_Metadata > MD_DataIdentification.citation > CI_Cita-
datové sady tion.date
Referenční systém M MD_Metadata > MD_ReferenceSystem
Odpovědná strana O MD_Metadata > MD_DataIdentification.pointOfContact >
CI_ResponsibleParty
Původ (rodokmen) O MD_Metadata > DQ_DataQuality.lineage > LI_Lineage
Geografická poloha datové C MD_Metadata > MD_DataIdentification.extent > EX_Ex-
sady (4 souřadnicemi nebo tent > EX_GeographicExtent > EX_GeographicBounding-
geografickým identifikátorem) Box or EX_GeographicDescription
On-line zdroj O MD_Metadata > MD_Distribution > MD_DigitalTransfer-
Option.onLine > CI_OnlineResource
Jazyk datové sady M MD_Metadata > MD_DataIdentification.language
Identifikátor souboru metadat O MD_Metadata.fileIdentifier
Znaková sada datové sady C MD_Metadata > MD_DataIdentification.characterSet
Název metadatové normy O MD_Metadata.metadataStandardName
Tematická kategorie datové sady M MD_Metadata > MD_DataIdentification.topicCategory
Metadata standard version O MD_Metadata.metadataStandardVersion
Prostorové rozlišení datové sady O MD_Metadata > MD_DataIdentification.spatialResolution >
MD_Resolution.equivalentScale or MD_Resolution.distance
Jazyk metadat C MD_Metadata.language
Abstrakt (výtah) popisující dato- M MD_Metadata > MD_DataIdentification.abstract
vou sadu
Znaková sada metadat C MD_Metadata.characterSet
Distribuční formát O MD_Metadata > MD_Distribution > MD_Format.name and
MD_Format.version
Kontaktní místo pro metadata M MD_Metadata.contact > CI_ResponsibleParty
Doplňková informace o rozsahu O MD_Metadata > MD_DataIdentification.extent > EX_Ex-
datové sady (vertikálním a tent> EX_TemporalExtent or EX_VerticalExtent
časovém)
Datumové razítko metadat M MD_Metadata.dateStamp
Kompatibilita s Dublin Core:
Dublin Core (dále DC) je standard pro vytváření metadat pro popis internetových
zdrojů. Vychází z knihovnických systémů a definuje jen velice omezené množství
základních položek s možností jejich další strukturalizace ve stromové struktuře podle
potřeb uživatelů. Položky jsou pouze textového charakteru a pro popis geografických dat
32
34. jsou nedostatečné. Protože jde o normu, která má být používaná i v rámci Informačních
systémů veřejné správy v ČR, je třeba zhodnotit její kompatibilitu s ISO. Již tvůrci normy
ISO 19115 deklarují kompatibilitu s DC. Kompatibilita je možná převodem komplexních
položek ISO 19115 do Dublin Core. Vzhledem k nižší úrovni strukturovanosti DC se
s převodem v opačném směru příliš nepočítá. Tabulka nám ukazuje možnost vzájemného
mapovaní jednotlivých položek těchto norem (viz tab. 4).
Tab. 4: Příklad mapování položek ISO 19115 na DC
Dublin Core ISO 19115
DC.Title MD_DataIdentification/citation/title
DC.Title.Alternative MD_DataIdentification/citation/alternateTitle
DC.Creator.PersonalName MD_DataIdentification/citation/citedResponsibleParty/individu-
alName
DC.Creator.PersonalName.Address MD_DataIdentification/citation/citedResponsibleParty/con-
tactInfo/address
DC.Subject.Keywords MD_DataIdentification/descriptiveKeywords
DC.Description MD_DataIdentification/abstract
DC.Publisher MD_DataIdentification/citation/citedResponsibleParty/organi-
sationName
DC.Date MD_DataIdentification/citation/date/date
DC.Type Dáno kontextem = „Data.Spatial“
DC.Format MD_dataIndentification/resourceFormat
DC.Identifier fileIdentifier
DC.Source dataSet
DC.Language” SCHEME=”ISO639-1” language/isoCode
CONTENT=”cz”>
DC.Relation” CONTENT=”5468”> parentIdentifier, další vazby v různých částech normy
DC.Coverage MD_DataIdentification/extent
DC.Rights MD_DataIdentification/citation + MD_DataIdentification/re-
sourceConstraints
Komunitní profily:
Standard ISO je
rozšiřitelný. Jeho součástí je postup
pro rozšiřování (extensions) a
komunitní profily. Profil musí
vždy obsahovat CORE položky
(jádro) a použít další standardně
definované položky pro účely profilu
(viz obr. 3). Teprve nenajde-li se
odpovídající položka, je možno
vytvářet jednotlivá rozšíření.
Vytváření profilů je popsáno
v normě ISO 19106. Obr. 3: Vytváření komunitního profilu
33
35. Identifikátory:
Jednoznačný identifikátor metadatového záznamu je možno volitelně zadat
v elementu FileIdentifier. Obsahem může být libovolný řetězec. Identifikátor dat (a dalších
entit) je možno zadat volitelně v elementu <citation>. Pomocí těchto identifikátorů se
mohou jednotlivé části metadat na sebe odkazovat (např. v elementu parentIdentifier).
Kromě toho je v normě definován typ MD_IdentifierType (obrázek), který je používán
v MD_Citation, MD_AggregateInformation apod… Řetězcový kód je zde doplněn
informací o zodpovědné autoritě (citací) (viz obr.4).
Obr. 4: Struktura MD_IdetifierType
Norma dále neřeší způsob vedení a tvar unikátních identifikátorů. Vzhledem
k očekávané výměně dat v rámci národní či nadnárodní prostorové infrastruktury je velice
důležité stanovit takové identifikátory, které budou jednoznačné i v takovémto kontextu.
Tento problém se řeší v některých systémech přidělením počítačem vygenerovaného
náhodného řetězce, který je s vysokou pravděpodobností neopakovatelný.
Doporučováno je spíše použití způsobu známého k označování tříd v jazyce Java
nebo jmenných prostorů v XML schématech, tedy řetězce odpovídajícího URL dané
organizace a další části odpovídající identifikaci v rámci této organizace.
Popis struktury dat:
Podrobný popis datového modelu vlastních dat je velice důležitý pro jejich
praktické využití. Zatímco norma ISO 19115 umožňuje podrobný popis obsahu rastrových
dat, vlastní popis struktury vektorových dat zde není řešen (narozdíl od FGDC apod.).
K popisu datového modelu mají sloužit normy ISO 19109 – „Rules for application schema“
a 19110 – „Feature catalog“.
K odkazu na Feature katalog slouží element MD_FeatureCatalogueDescription,
v němž je možnost katalog citovat pomocí třídy CI_CitationType. Tato citace je spíše
popisného charakteru a nemá předpoklady pro automatické zpracování (jednoznačná
vazba např. pomocí URI apod.)
Aplikační schéma je možno zařadit do metadatového záznamu pomocí elementu
ApplicationSchemaInfo, kde se předpokládá vložení modelu v binárním tvaru tak, jak byl
pořízen v některém modelovacím nástroji (UML), a grafické reprezentace tohoto modelu.
Vlastní formát těchto dat je ponechán na uživateli. Interoperabilita v tomto případě není
opět příliš zaručena.
Z General Feature Modelu (GFM) vyplývá opačná možnost – přiřadit metadata jako
jeden z atributů objektů na různých úrovních aplikačního schématu, a to jak třídám prvků
34
36. (features) a atributů, tak jejich jednotlivým instancím. V praxi je také očekáván přístup od
datového modelu směrem k metadatům, nikoli obráceně.
I když ve světě existuje řada příkladů použití metadat, autorům není známo řešení
problematiky popisu datového modelu v návaznosti na metadata. Je však jasné, že
k úplnému popisu datové sady potřebujeme popsat datový model (např. pomocí ISO 19190
nebo 19110).
1.2.2 ISO 19119 metadata
Tato norma poskytuje normalizované zásady pro vývoj softwaru podporujícího
uvažované geografické služby, který uživatelům umožní zpřístupnění potřebných
geografických dat z rozmanitých zdrojů a jejich zpracování přes generické rozhraní
spojující jinak neslučitelné softwarové prostředky.
V souvislosti s tím norma podrobně pojednává o architektuře geografických služeb
a analyzuje výpočetní, informační, inženýrský a technologický pohled na otevřené
distribuované zpracování dat. V jeho přílohách je ošetřena shoda geografických služeb s
touto normou, uvedeny jejich příklady, definován datový sborník metadat geografických
služeb a popsáno zobrazení do existujících platforem distribuovaného zpracování dat.
Dle ISO 19119 jsou instance metadat kategorizovány podle následující taxonomie
• Geografické služby pro interakci s uživatelem - Geographic human interaction
service.
• Geografické služby pro správu informací a modelů - Geographic model/information
management services.
• Geografické služby řídící návaznost úloh - Geographic workflow/task management
services.
• Geografické služby pro zpracování prostorových informací - Geographic processing
services – spatial.
• Geografické služby pro zpracování tematických informací - Geographic processing
services – thematic.
• Geografické služby pro zpracování časových informací - Geographic processing
services – temporal.
• Geografické služby pro zpracování metadat - Geographic processing services –
metadata.
• Geografické komunikační služby - Geographic communication services.
• Správa geografických systémů - Geographic system management services.
1.2.3 Implementace
Vlastní implementaci řeší standard ISO 19139. Jde o soubor XML schémat,
která slouží pro definování XML dokumentu s metadaty. Zde jsou provedena některá
zjednodušení, například všechny odkazy na externí zdroje jsou nahrazeny datovými typy.
Jsou zjednodušeny i některé datové typy a vypuštěny elementy popisující dokumentaci
služby (MD_ServiceIdentification). Norma je dosud ve stavu draft dokumentu, proto např.
ESRI dosud nepodporuje export metadat v tomto formátu.
35
37. 1.2.4 Kritická místa platforem spojená s integrací metadat
• Standard je značně rozsáhlý, nesymetrický a nepřehledný (v řadě případů jsou
zde zachyceny podrobnosti DS, v jiných chybí potřebné elementy). Je vidět, že šlo
o konsensus široké komunity uživatelů vytvářený extenzivním způsobem.
• Data jsou uspořádána tak, že některé typy (např. Citation nebo responsibleParty) se
vyskytují na různých místech hierarchické struktury metadat v různých kontextech,
jejichž význam se může překrývat. Interpretace takovéto struktury nemusí být
jednoznačná a různými uživateli může být různě chápána a vyplňována.
• Celý standard je spíše postaven na textovém způsobu práce s informací, tedy
redundantní textové údaje není možné dekomponovat zpět do relační databáze.
Předpokládá se opětovné zadávání např. organizace či adresy na různých místech
v textovém tvaru. Výměna metadat mezi systémy bude patrně založena na tomto
„textovém“ tvaru.
Vlastní popis struktury dat není řešen v rámci standardu (narozdíl např. od FGDC
či aplikací ESRI). Předpokládá se datový model mimo tato metadata, ovšem není jasně
řečeno vzájemné provázání
1.3 Metadatové profily v rámci Evropy
V rámci různých projektů vznikla celá řada metadatových profilů, které představují
víceméně podmnožinu položek standardu ISO 19115 (ESA, Evropská vodní směrnice
atd.). V rámci projektu INSPIRE vznikl draft metadatového profilu pro vyhledávání
a oceňování metadat. Tento profil je nezávislý na standardech, ovšem implementace počítá
s normou ISO 19115/19119/19139. Výhodou je, že profil je velice úzký (v podstatě málo
nad rámec jádra ISO. Obsahuje ovšem i elementy potřebné pro popis webových služeb,
nikoli pouze dat). V současné době navrhované projekty vycházejí z tohoto standardu
(např. eWater [9]).
1.4 Metadatové profily v ČR
V ČR stále existuje řada aplikací používajících starý standard ISVS. Zavádění
norem ISO probíhá pomalu. Dosud nebyl stanoven národní profil metadat, spíše se počítá
s převzetím profilu INSPIRE. Vyplňování dalších položek nad rámec tohoto profilu bude
na potřebách jednotlivých uživatelů či komunit.
Vzhledem k určitým národním potřebám však bude pravděpodobně muset vzniknout
několik rozšíření, případně návodů / kuchařek pro vyplňování metadat. Jednak pro kódování
českých znakových sad (používané windows-1250 není součástí předdefinovaného
číselníku ISO), jednak bude potřeba definovat použití prostorových identifikátorů, tezaurů
apod.
V současné době jsou vytvářeny resortní profily Ministerstva životního prostředí
(MŽP) a Zeměměřického úřadu (ZÚ). Vycházejí z profilu INSPIRE a budou patrně
obsahovat další položky. Autoři systému Micka vytvořili stejnojmenný profil, který
vychází z profilu INSPIRE, z resortního profilu MŽP a je rozšířen o položky na základě
praktických potřeb jednotlivých uživatelů systému.
36
38. 2. Tezaury
Systémy pro vyhledávání a třídění informací v počítačovém prostředí procházejí
v posledních létech bouřlivým vývojem. Původně bylo vyhledávání počítačových informací
komplikovanou činností, která mohla být vykonávána pouze zaškolenými profesionály.
Postupně došlo v souvislosti s technologickým rozvojem k enormnímu nárůstu objemu
dostupných informací. Kromě nových zdrojů vytvářených přímo v digitálním prostředí
dochází i k digitalizaci původně jen papírových (analogových) zdrojů dat. S rozvojem
Internetu se nárůst objemu dostupných informací týká nejen databází obsahujících vědecké
texty, ale i běžných publikací jako jsou noviny, časopisy, krásná literatura i osobní zápisky
řady lidí ve formě webových stránek.
Zvýšený objem dostupných dat výrazně zkomplikoval vyhledávání relevantních
informací, obzvláště pro běžné koncové uživatele. Objevuje se však řada přístupů, které
různým skupinám uživatelů poskytují různě strukturovaný přístup ke zdrojům dat. Jedním
z nejčastěji využívaných přístupů k této problematice jsou řízené slovníky (controlled
vocabularies), konkrétně pak především tezaury (česky též thesaury, angl. thesaurus, pl.
thesauri).
Kontrolovaným slovníkem rozumíme seznam dohodnutých termínů převzatých
z běžného jazyka, u nichž je podchycena (kontrolována) gramatická forma (v cizojazyčných
kontrolovaných slovnících je navíc třeba sjednotit hláskování). V tezaurech jsou tyto
termíny navíc uspořádány v hierarchické struktuře, což přináší významné výhody při
vyhledávání informací (viz níže). Tezaury lze používat k indexování, ukládání, případně
vyhledávání záznamů. Mohou pracovat v kombinaci s řadou různých vyhledávacích
algoritmů a lze je využít ke zlepšení výsledků vyhledávání v různých typech záznamů (od
hledání v strukturovaných indexovaných databázích přes částečně strukturované sady dat
až po vyhledávání v heterogenních fulltextových dokumentech).
Tezaury se mohou pro zvýšení své využitelnosti různým způsobem sdružovat do
multitezaurových systémů, např. do multitezaurových prostředí, přepínacích tezaurových
systémů, složených tezaurů apod.
Tezaurus lze využít jak k vyhledávání, tak k indexování záznamů. Při indexování
jsou záznamy označovány pomocí řízených termínů. Při vyhledávání může uživatel buď
manuálně zadat všechny vyhledávané řetězce nebo zadá jeden termín a systém automaticky
zahrne všechna synonyma a gramatické tvary termínu.
Jak již bylo zmíněno, jedním z hlavních rysů tezaurů je využití hierarchických
a relačních vazeb, konkrétně vztahů označovaných ekvivalence, hierarchie a asociace.
Ekvivalence je vztah mezi synonymy. Všechna synonyma mohou být rovnocenná, obvykle
je však jeden z termínů zvolen jako preferovaný termín (preferred term), další synonyma
jsou pak označena jako alternativy k danému termínu. Vyhledávání je pak pro koncového
uživatele usnadněno tím, že ke vstupu do tezauru může použít kterékoliv z daných
synonym. Vzácně jsou navíc definovány vztahy mezi pseudosynonymy (quasi-synonyms)
– mezi slovy, která mají podobný, ne však totožný význam.
Hierarchie (na rozdíl od ekvivalence není symetrická) je v tezaurech vytvořena
vymezením vztahů mezi podřazenými pojmy (narrower term) – podtřídami (subclass)
37
39. a nadřazenými pojmy (broader term) – nadtřídami (superclass). Nejčastěji se v tezaurech
používá pouze jeden typ této vazby, výjimečně lze definovat více typů hierarchické
vazby.
Asociace (symetrický vztah) se používá k vytvoření vazby tehdy, pokud mezi
termíny existuje sémantický vztah, ale nelze jej označit pomocí ekvivalence ani hierarchie.
Pomocí asociace lze například spojit antonyma (slova s opačným významem) apod.
V případě multilinguálních (vícejazyčných) tezaurů pak navíc do hry vstupuje další
vztah – mezijazyková ekvivalence. Ta je obvykle definována pouze mezi preferovanými
termíny.
2.1 Tvorba tezaurů
Pokud pomineme možnost převzetí (a případné adaptace) již existujícího tezauru
(která bývá obvykle nerealizovatelná, protože drtivá většina tezaurů je vytvářena pro
specifickou databázi nebo sadu záznamů, což prakticky vylučuje jejich přenos a použití
v jiném než původním systému), je v případě potřeby nutno přikročit k vytvoření vlastního
tezauru.
Vytvářením tezaurů se zabývá několik mezinárodních standardů. Mezinárodní
standard ISO 2788 a americký národní standard ANSI/NISO Z39.19 obsahují doporučení
pro budování monolinguálních tezaurů, standard ISO 5964 pak pokrývá oblast budování
multilinguálních tezaurů.
Lze vymezit dva základní přístupy ke tvorbě tezaurů (v praxi se obvykle aplikují
oba přístupy společně):
• Postup shora dolů (top-down method):
· je sestavena skupina expertů, která rozhodne o rozsahu a přibližném okruhu
termínům které budou do tezauru zahrnuty,
· s využitím případných stávajících slovníků a/nebo tezaurů se rozhodne o
vztazích vybraných termínů,
· upřesní se okruh termínů vybraný dříve, zvolí se preferované termíny; stanoví
se ekvivalence mezi preferovanými termíny a jejich alternativami; stanoví se
hierarchie a asociace mezi preferovanými termíny,
· vytvoří se předběžná verze tezauru, následuje testování a úpravy.
• Postup zdola nahoru (bottom-up method)
· sestaví se skupina expertů sloužících jako poradci,
· vybere se sada již indexovaných dokumentů (pokud existují)
a indexové termíny z této sady se použijí jako předběžný seznam termínů,
· pokud nejsou k dispozici indexované dokumenty, vezme se sada dokumentů
používajících přirozený (tj. neřízený) jazyk a postupuje se analogicky,
· tezaurus se začne budovat na základě takto získané předběžné sady termínů:
ve spolupráci s experty a dalšími zdroji informací se upřesní význam všech
termínů, stanoví se vztahy mezi termíny,
· vytvoří se předběžná verze tezauru, následuje testování a úpravy.
38
40. 2.2 Integrace tezaurů
Integrace tezaurů nabývá na významu se vzrůstajícím počtem existujících tezaurů.
Tento jev je podmíněn nutností pokrýt všechny vědy, případně vědní disciplíny u věd
komplikovanějších (jako např. fyzika či geografie). Řešením je tvorba několika tezaurů. Ty
se mohou v určitých termínech vzájemně překrývat, případně mohou mít shodné termíny
zpracované v rozdílné kvalitě (stejně tak jako v atlasech bývají mapy, jejichž obsah se
překrývá, ale měřítko je odlišné).
Z předchozího odstavce vyplývá, že v těchto případech není možný přímý
automatický překlad dotazu z jednoho jazyka do jazyka jiného. I přesto lze vytvořit
multilinguální tezaurus. Za použití existujících slovníků může být využita existující
struktura pro překlad a rovněž pro kontrolu adekvátnosti daného překladu. Je třeba
zdůraznit, že pro multilinguální tezaury není třeba překlad samotných slov (což je účel
slovníků), ale klíčových frází.
Moderní informační systémy, jako např. WWW a digitální knihovny, obsahují více
dat, než kdy předtím. Tyto systémy je snadné používat; mají globální rozložení. Proto
jsou dostupné velkému množství heterogenních skupin. Na straně druhé právě velké
množství heterogenní informace vytváří požadavek takového nástroje pro uživatele, který
by mu umožnil pracovat s (pro něj) významnou částí dat. Jedním z těchto nástrojů jsou
tezaury. Osvědčily se jako způsob jednotného a stálého slovníku pro indexaci a získávání
tzv. informačních objektů (information bearing objects, IBO). Moderní multilinguální
a mezioborová informace vyžaduje více než jen tradiční jednojazyčné úzce zaměřené
tezaury. Široké spektrum klientů informačních systémů požaduje tezaury, které mohou být
použity „nespecialisty“.
Tezaury jsou dostupné pro různé oblasti zájmu se specifickou strukturou
a terminologií. Mnohdy však nejsou sjednoceny ani tezaury v rámci jednoho oboru
(zabývají se pouze specifickými oblastmi). V důsledku vzrůstu počtu informačních systémů
se zvyšuje poptávka po rozsáhlejších slovnících, které pokrývají širší oblasti informací
a současně jsou mnohem více selektivní. Jedním z řešení je použití sbírky tezaurů v souladu
se strukturou lidských znalostí. Tyto tezaury mohou být na sobě nezávislé nebo jsou ve
více či méně provázaném vztahu. V minulosti bylo mnoho tezaurů manuálně integrováno
do jednoho supertezauru. To je však nedostatečné pro vytvoření volněji spojených
informačních systémů, kde volné spojení (také tzv. federace) tezaurů je vhodnější
– umožňuje každému tezauru ponechat si svoji autonomii. Snaha o integraci tezaurů ve
federaci je nižší, než v jiných multi-tezaurových systémech. Důvodem je především fakt, že
po akceptování autonomie tezauru následuje akceptování určitých nekonzistencí. Federace
tezaurů nabízí nové způsoby indexování a vyhledávání. Proces indexování, stejně jako
vyhledávání v tezauru, těží z přístupu k různým (obecným a specializovaným) tezaurům,
které tvoří federaci tezaurů. Jeden či více tezaurů poskytují vstupní bod pro uživatele.
Automatické využití jiných tezaurů umožňuje uživatelům integraci obsahů jednotlivých
tezaurů okamžitě. Abychom se vyhnuli slovníku, který mate uživatele svojí obsáhlostí,
odlišujeme indexované tezaury od neindexovaných. Základní snahou je integrovat tezaury
při zachování jejich autonomie. Tento fakt je významný pro prostředí, jež podporuje platbu
za individuální používání tezauru. Federace tezaurů je zvláště užitečná pro indexování
39
41. a vyhledávání ve velkých informačních systémech. Těmi jsou například informační
systémy obsahující data z několika informačních systémů nebo informační systémy
integrující distribuované autonomní informační zdroje.
Příklady užitečnosti federace tezaurů jsou metainformace či katalogové systémy.
V posledních letech bylo sestaveno několik metadatových standardů a metainformačních
systémů. Klíčovými tématy pro poskytnutí jednotného vstupního bodu je interoperabilita
metainformačních systémů (která může existovat na regionální, národní a mezinárodní
úrovni) a k nim příslušející tezaury. Proto je jedním z účelů kostry federace tezaurů vyřešit
problém dotazování informačních objektů (IBO) indexovaných různými, potenciálně
se překrývajícími tezaury. Jiným příkladem v tomto směru jsou digitální knihovny,
jež obsahují široce distribuované informační objekty (jako např. textové dokumenty
v rozdílných jazycích). V podobném smyslu může být federace tezaurů použita jako nástroj
pro podporu vyhledávání mezi jazyky.
2.3 Způsoby integrace tezaurů
V minulosti byly tezaury manuálně integrovány do jednoho velkého „supertezauru“.
Naproti tomuto způsobu řešení je pro technickou interoperabilitu distribuovaných
informačních systémů vhodnější volnější integrace (loosely integration), zvaná federace
(viz dále). Tento způsob integrace umožňuje zachovat autonomii zúčastněných tezaurů.
V posledních letech navíc integrace nabývá jiných možností, které jsou důsledkem nových
technologií – jako např. WWW (World Wide Web), CORBA (Common Object Request
Broker Architecture) či programovacího jazyka Java.
Tezaury je možné integrovat třemi hlavními způsoby: federace (federation),
sjednocení (unions) a spojení (couplings).
• Federace je kombinace několika tezaurů při zachování jejich autonomie. Tezaury
zapojené do federace mohou být uchovávány v rozdílných databázích a spravovány
nezávisle na ostatních. Federace se skládá ze všech termínů a vztahů „členských“
tezaurů. Navíc obsahují informace o vztazích mezi termíny z různých tezaurů.
Koncepty, které existují ve více než jednom tezauru, jsou kombinovány do jednoho
federativního konceptu. Mohou být přidány jiné vztahy (jako např. hierarchické),
aby bylo zajištěno vhodnější odkazování mezi jednotlivými slovníky.
· Tato jednoduchá forma integrace tezaurů může vést k nekonzistencím, které
mohou být odstraněny pouze vyjmutím některých termínů či vztahů z jednoho
či více tezaurů. Akceptování těchto nekonzistencí je cenou za zachování
autonomie každého z integrovaných tezaurů. Jinými slovy můžeme říci, že
federace tezaurů není sama o sobě konzistentním tezaurem. Tato nevýhoda je
vyvážena snadností tvorby federace, zachováním autonomie integrovaných
tezaurů a užitečností v řadě aplikací – i přes určitou nekonzistenci.
• Sjednocení je (oproti federaci) považováno za krok dále při integraci tezaurů.
Integrovaný slovník prošel revizí, aby byla odstraněna nekonzistence. Výsledkem
je nový korektní tezaurus. Sjednocení tezaurů může tvořit základ nového tezauru,
který bude (po dokončení) nezávisle zlepšovat své zdrojové tezaury. Hlavní aplikací
u sjednocení je tvorba metatezaurů. Metatezaurus by se neměl vytvářet nezávisle
40
42. na zdrojových tezaurech. Na straně druhé je třeba, aby byl jednou za čas znovu
sestaven kvůli adaptaci na provedené změny. Praktickým příkladem metatezauru je
„Meta“, který vznikl sjednocením několika lékařských tezaurů [152].
• Spojení je zvláštním případem integrace mikrotezaurů (tj. tezaurů se
specializovanými slovníky; nazývané také jako subtezaury) s více obecnými
makrotezaury. Mikro- a makrotezaury se musí vzájemně přizpůsobit. Příkladem je
European Educational Thesaurus [155].
2.4 Metadata a tezaurus
Síťové systémy pro organizaci znalostí obvykle obsahují objekty různých typů. Tyto
objekty jsou popsány za použití velkého množství odlišných metadatových schémat. Z toho
důvodu je vytvořen stroj, který rozumí metadatovým popisům odpovídajícím schématům
různých oborů. Existují především tyto tři základní scénáře, podle kterých je požadována
interoperabilita mezi metadatovými popisy:
• Umožnit jednoduché vyhledávací rozhraní napříč heterogenními metadatovými
popisy.
• Umožnit integraci či spojení metadatových popisů, které jsou založeny na
doplňujících, avšak potenciálně se překrývajících metadatových schématech nebo
standardech.
• Umožnit rozdílné pohledy základních a kompletních metadatových popisů
závisejících na zájmu, úhlu pohledu a požadavcích uživatelů.
Metadatové popisy z rozdílných oborů nejsou sémanticky odlišné, nýbrž se vzájemně
překrývají a komplexním způsobem jsou příbuzné mezi sebou. Dosažení interoperability
mezi takovými metadatovými popisy je manuální tvorbou užitečné; manuální přiřazení
jeden k jednomu ale nevyhovuje mnoha existujícím metadatovým slovníkům. Výhodnějším
přístupem je využití faktu, že mnoho entit a vztahů se vyskytuje napříč všemi oblastmi
zájmu (např. lidé, místa, organizace, události, atd.).
Přístupem k heterogenním datovým zdrojům v síťové struktuře vznikly nové
problémy v oblastech zajištění terminologie a interoperability. Jsou zapotřebí řešení ke
zlepšení fulltextových vyhledávání a průvodce návrhem schémat kontrolovaných termínů
pro užití ve strukturovaných datech, včetně metadat.
Tezaury jsou vytvářeny v odlišných jazycích, s rozdílným účelem, úhlem pohledu
a na rozdílných úrovních abstrakce a detailu pro společný přístup ke specifickým sadám
sbírek informací. Proto je při integraci kladen důraz také na metadata. Ta mohou být
zpracována podle dvou základních norem:
• Dublin Core je obecným standardem pro metadata, který může být použit při popisu
dokumentů pro jejich hledání.
• ISO 19115 představuje normu, která je současně přijata za ČSN. Rozsah aplikačních
oblastí je v porovnání s Dublin Core širší.
41
43. 2.5 Prostorové tezaury
Prostorové tezaury začaly vznikat ve Velké Británii v 19. století jako výčet
geografických názvů tehdy známého světa s cílem dokumentovat rostoucí anglický vliv.
Na tuto tradici se opět začalo navazovat na počátku 90. let 20. století, kdy začal vznikat
web v takové podobě, jak jej známe dnes. Tehdy vyhledávače buď neexistovaly nebo
neposkytovaly dostatečně relevantní výsledky. Hlavní úlohu při hledání požadovaných
dat či informací tak hrály internetové portály, tj. webové servery, které slouží jako brána
do světa internetu. Typicky obsahovaly katalog odkazů, díky kterému plnily funkci
internetových rozcestníků. Teprve v pozdější době (druhá polovina 90. let) se začaly
vytvářet vyhledávače v podobě, jakou známe dodnes.
Pro oblast geografie jsou však tyto vyhledávače nedostačující, ve většině případů
obsahují podporu tzv. fulltextového vyhledávání, které je pouze jednou z částí geografického
vyhledávání. Proto bylo třeba obohatit „klasické“ vyhledávače o možnost jiných forem
vyhledávání. I tato snaha se postupem času ukázala jako nedostatečná, začíná proto tvorba
prostorových tezaurů, ve webovém podání někdy označovaných jako gazetteer – podle
Wikipedie definovaný jako geografický adresář dodávající důležité reference k vybranému
místu (místům), často v kombinaci s atlasem.
Formální definice tezaurů jsou uvedeny v mezinárodních i amerických standardech.
Jednak jde o ANSI/NISO Z39.19 stanovující pravidla pro tvorbu, formátování a správu
jednojazyčného tezauru. O stupeň výše jsou pak standardizační snahy Technické komise
46 Mezinárodní organizace pro standardizaci (ISO), která vytvořila dvojici standardů
– ISO 2788 (pro monolingvální standardy; tj. odpovídající Z39.19) a ISO 5964 (pro
multilingvální standardy).
Podle výše uvedených standardů můžeme prostorové tezaury chápat jako sadu
organizovaných geografických názvů a sadu standardizovaných recipročních vztahů
mezi těmito názvy. Název je pak v tomto významu slovo nebo fráze reprezentující
konceptuální kategorii. Vztahy mezi těmito pojmy jsou významné při vyhledávání
– kromě nadřazených a podřazených pojmů (jako např. kraj a okres v administrativní
hierarchii) – rozlišujeme také synonyma. Jinými slovy řečeno, pokud uživatel vyhledává
řeky, v běžném vyhledávači nenalezne výsledek, zatímco prostorový tezaurus jej navede
např. na databázi označenou vodní toky. Prostorové tezaury řeší sémantickou heterogenitu
mezi datovými zdroji, protože pomáhají rozvíjet popis pokrytý metadaty o hierarchickou
strukturu pojmů a synonyma velmi podobného významu. Nicméně je třeba dodat, že počet
slov obsažených v tezaurech je i tak omezen. Největší šance na získání požadovaných dat
jsou proto v té chvíli, kdy uživateli oznámíme, jaký prostorový tezaurus (tj. jaký konkrétní
výčet klíčových slov) je při popisu používán.
Z výše uvedených přístupů je patrné, že ideální popis tematického a prostorového
obsahu geografických dat si vyžaduje nejen metadata, ale také prostorový tezaurus. S tímto
přístupem počítají současné standardizační snahy v oblasti metadat – tj. standard CSDGM
(častěji v literatuře označovaný jako FGDC) a norma ISO 19115. U obou je možné
doplňovat klíčová slova konzistentním způsobem z formálně registrovaného tezauru.
Klíčová slova lze do metadat zadat také v libovolné podobě, čímž se však snižuje snadnost
nalezení potřebné informace. Kromě toho odebíráme jeden ze stavebních kamenů moderní
infrastruktury prostorových dat.
42