SlideShare a Scribd company logo
1 of 284
Download to read offline
Výzkumný ústav geodetický, topografický a kartografický, v.v.i.
            Geografický ústav, Přírodovědecká fakulta Masarykovy univerzity
                               Lesprojekt Služby, s.r.o.


Ročník 53                                                       Publikace č. 43




                Geografická data
            v informační společnosti


                                Karel Charvát
                                 Milan Kocáb
                               Milan Konečný
                                Petr Kubíček




                                  Zdiby 2007
Recenzenti:


Prof. RNDr. Jiří Hřebíček, CSc., Masarykova univerzita v Brně
Prof. Ing. Bohuslav Veverka, DrSc., Fakulta stavební ČVUT v Praze




ISBN 978-80-85881-28-8
AKADEMIE VĚD ČESKÉ REPUBLIKY


Tato publikace byla vydaná na základě výsledků řešení projektů Akademie věd České
republiky „Informační společnost“ tematického programu „ II. Národní program výzkumu
– TP2“ (2004 – 2007):
•     Management geografických informací a znalostí
      (Reg.č.T206030407)
Cílem projektu bylo vytvoření uceleného systému managementu geografických informací
a znalostí a jejich uplatnění v praktických aplikacích.
Řešitel:         Ing. Milan Kocáb, MBA
Spoluřešitelé:   Ing. Stanislav Holý, Doc. RNDr. Milan Konečný, CSc.


•     Mobilní sběr prostorových dat pro mapovaní v reálném čase
      (Reg.č. T101630421)
Cílem řešeného projektu bylo vytvořit základní infrastrukturu pro on-line vkládání
prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení.
Řešitel:         Doc. RNDr. Milan Konečný, CSc.
Spoluřešitelé:   Ing. Milan Kocáb, MBA, Ing. Jiří Krejza


•     Navigační a logistické systémy
      (Reg.č.T109890411)
Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému.
Řešitel:         Ing. Zbyněk Křivánek
Spoluřešitelé:   Ing. Jaroslav Jansa, Ing. Milan Kocáb, MBA


•     Systém přenosu dokumentačních dat pro aktualizaci informačního systému
      státní správy zeměměřictví a katastru
      (Reg.č.1ET206030506)
Cílem projektu byl rozvoj informačních technologií ve sféře tvorby aktualizačních souborů
pro státní správu zeměměřictví a katastru.
Řešitel:         Ing. Milan Kocáb, MBA
Spoluřešitelé:   Ing. Stanislav Holý, Ing. Pavel Kosta
KOLEKTIV AUTORŮ:




                 Lesprojekt Služby, s.r.o., Kostelec nad Labem:
                 RNDr. Karel Charvát


                 Výzkumný ústav geodetický, topografický
                 a kartografický, v.v.i., Zdiby:
                 Ing. Milan Kocáb, MBA


                 Geografický ústav,
                 Přírodovědecká fakulta Masarykovy univerzity v Brně:
                 Doc. RNDr. Milan Konečný, CSc.


                 Geografický ústav,
                 Přírodovědecká fakulta Masarykovy univerzity v Brně:
                 RNDr. Petr Kubíček, CSc.

        Seznam pracovníků, kteří se dále podíleli na zpracování publikace:
Brázdilová J. (MU Brno), Cajthaml T. (VÚGTK), Čepický J. (HSRS), Drbal A. (VÚGTK),
Dutka M. (VÚGTK), Dvořák P. (Wirelessinfo), Friedmannová L. (MU Brno), Gnip P.
(Wirelessinfo), Holý S. (HSRS), Horák P. (HelpForest), Ježek J. (HSRS), Kafka Š. (HSRS),
Karavdić J. (VÚGTK), Kosta P. (GESKO), Krejza J. (LESP), Křivánek Z. (LESP), Musil M.
(Wirelessinfo), Řezník T. (MU Brno), Stachoň Z. (MU Brno), Staněk K. (MU Brno), Střelková
J. (VÚGTK), Talhofer V. (MU Brno), Tryhubová P. (VÚGTK), Valdová I. (VÚGTK, ČÚZK),
Vaniš P. (VÚGTK), Vlk M. (Wirelessinfo), Zaoralová J. (VÚGTK), Zbořil J. (MU Brno)



                                    Odborná redakce
                                       Petr Kubíček


                                   Technická redakce
Alexandr Drbal, Václav Nejedlý, Filip Antoš, Jaroslava Matesová, Ivana Skulínková,
Václava Skulínková, Štěpán Böhm, Helena Vovsová
OBSAH


Úvod                                                       9
Použitá terminologie                                       13
Hlavní používané zkratky                                   15


ČÁST I         SPRAVADAT

Kapitola 1:    SPRAVADAT                                   21
Kapitola 2:    GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY V NÁRODNÍ
               GEOINFORMAČNÍ INFRASTRUKTUŘE                23
Kapitola 3:    METADATA, TEZAURY A KATALOGOVÉ SLUŽBY       29
Kapitola 4:    INTEROPERABILITA, DATOVÉ MODELY
               A GENERALIZACE DAT                          49
Kapitola 5:    ARCHITEKTURA PRO SDI A JEDNOTLIVÉ STANDARDY
               PRO JEJÍ PODPORU                            63
Kapitola 6:    SDÍLENÍ PROSTOROVÝCH DAT A SLUŽEB
               A MOŽNÉ OBCHODNÍ MODELY                     69
Kapitola 7:    VYBRANÁ PILOTNÍ ŘEŠENÍ PROJEKTU SPRAVADAT   85


ČÁST II        MOBILDAT

Kapitola 1:    VYBRANÉ PROBLÉMY MOBILNÍHO SBĚRU GEODAT     99
Kapitola 2:    HLAVNÍ ČINNOSTI PŘI VKLÁDÁNÍ GEODAT
               V MOBILNÍM PROSTŘEDÍ                        105
Kapitola 3:    VYUŽITÍ WEBOVÝCH SLUŽEB PRO MOBILNÍ SBĚR
               GEODAT                                      113
Kapitola 4:    ARCHITEKTURA SYSTÉMU MOBILDAT               121
Kapitola 5:    METADATOVÉ PROFILY V MOBILNÍM MAPOVÁNÍ      125
Kapitola 6:    NÁČRTOVÝ SYSTÉM A JEHO VYUŽITÍ V MOBILNÍM
               MAPOVÁNÍ                                    131
Kapitola 7:    TEMATICKÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI
               Z PILOTNÍHO PROJEKTU                        141
Kapitola 8:    VELKOMĚŘÍTKOVÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI
               Z PILOTNÍHO PROJEKTU                        149
ČÁST III      NAVLOG

Kapitola 1:   NAVLOG                                      157
Kapitola 2:   METODIKA TESTOVÁNÍ INTEGROVANÉHO PŘIJÍMAČE
              GPS EGNOS                                  161
Kapitola 3:   PŘEHLED SOUČASNÝCH METOD URČOVÁNÍ POLOHY    169
Kapitola 4:   MOŽNOSTI MOBILNÍHO PŘENOSU DAT A VÝVOJ
              KOMUNIKAČNÍHO MODULU                        177
Kapitola 5:   JAK ŘEŠIT NAVIGAČNÍ A LOGISTICKÉ ÚLOHY NA
              ZÁKLADĚ STANDARDŮ OGC/SERVEROVÉ ŘEŠENÍ
              NAVIGAČNÍCH A LOGISTICKÝCH ÚLOH             189
Kapitola 6:   IMPLEMENTACE KLIENTSKÝCH ŘEŠENÍ             203


ČÁST IV       GEOPLAN

Kapitola 1:   GEODATA PRO AKTUALIZACI INFORMAČNÍHO
              SYSTÉMU ZEMĚMĚŘICTVÍ A KATASTRU             215
Kapitola 2:   DATA GEOMETRICKÉHO PLÁNU OBSAŽENÁ VE
              VÝMĚNNÉM FORMÁTU                            223
Kapitola 3:   VYUŽITÍ PŘÍMÉHO PŘÍSTUPU KE GEODATŮM V
              ZEMĚMĚŘICTVÍ                                229
Kapitola 4:   KOMUNIKAČNÍ SÍTĚ VHODNÉ PRO ZEMĚMĚŘIČE      235
Kapitola 5:   ÚLOHA NÁČRTŮ V NOVÉM MAPOVÁNÍ A PŘI TVORBĚ
              GEOMETRICKÝCH PLÁNŮ                        245
Kapitola 6:   ZPRACOVÁNÍ GEOMETRICKÝCH PLÁNŮ
              PROSTŘEDNICTVÍM WEBOVÉ APLIKACE             255


Doslov                                                    269
Literatura                                                271
ÚVOD


       Po až hvězdném a zejména úspěšném období zavádění geografických informačních
systémů (GIS) do každodenního života se komunita specialistů, ale i laických uživatelů
zabývajících se či využívajících geografickou (prostorovou informaci), vrátila jako by
zpět, právě k ní.
      Zatímco v počátcích využití GIS se hodila veškerá data a informace, která byla
v digitální formě k dispozici, a ne vždy byla kombinována a spojována oprávněně, v
pozdějším období se jasně ukázalo, že geografická data bez standardů a metadatových
služeb, bez zajištění harmonizace a interoperability nejsou to, co by nám pomáhalo nalézt
pravdivou a správnou informaci pro naše řešení.
       Svět kolem nás také nezůstal stát a výrazně se změnil od doby, kdy kanadský vědec
Roger Tomlinson přišel poprvé s teorií a praxí GIS. Postupně přicházely nové informační
a komunikační technologie, nejprve malé počítače, posléze laptopy. Vzrůstala i nabídka
nových podrobných zdrojů prostorových dat, které již nevznikaly pouhou digitalizací
map, ale stále více přicházejí ze satelitů, digitálních fotogrammetrických snímků, radarů
či skenerů umístěných na letadlech. Přenosu a využití dat napomohl i nárust paměťových
datových medií a zejména nové, progresivně se rozvíjející možnosti internetu a Webu
(obě média nebyla ještě ani počátkem 80.let v učebnicích GIS vůbec zmiňována). I díky
internetu se objevují a stávají populárními mezi širokou veřejností nové typy vyhledávačů
pracujících s geografickými daty, jakými je například Google. Ve všech těchto procesech
hrají významnou úlohu GIS, čímž došlo k obrovskému navýšení potenciálu jejich využití.
       Technologie se nevyvíjejí ve vzduchoprázdnu a jejich úspěšnost je závislá také na
tom, jak napomáhají řešení každodenních problémů. Svět se v minulých letech globalizoval,
kdysi industriální společnost se v rozvinutých a ekonomicky silnějších zemích změnila
na společnost informační s ambicemi směřujícími ke společnosti znalostní. A právě
požadavek znalostní společnosti směřuje opět k datům a informacím, či na vyšší úrovni
znalostem, které budeme pomocí nových technologií doručovat našim uživatelům, ať už
v rámci e-governmentu, e-commerce, realizací projektů jako je Digitální Země, e-Europe,
či dalších.
       Ve své památné prezidentské řeči na kongresu ICA v Barceloně v r. 1995 tehdejší
prezident Mezinárodní kartografické asociace (ICA) Joel Morrison upozornil, že uplatnění
geografických informací v tehdejší době záleželo na rozvoji geografického myšlení,
které je výrazně pomalejší, než druhá složka procesu, rozvoj moderních technologií.
V té době často docházelo k diskuzím, jak nejlépe využít rychle se rozvíjející technologie.
Podíváme-li se několik let zpátky na projevy představitelů největších firem, skutečných
leaderů v oblasti GI byznysu, jakými jsou americké globálně operující firmy Intergraph,
ESRI či Bentley, zjistíme, že i v této oblasti se situace změnila. S prudkým rozvojem
informační společnosti, zejména v ekonomicky rozvinutých zemích, vidíme, že řada
nových požadavků společnosti si přímo vynucuje použití geografických informací.
Elektronické vládnutí (e-government) nebo požadavky na kontrolu kvality životního
prostředí, inteligentní dopravu, moderní zbrojní systémy atp., nelze bez prostorové složky
uspokojivě řešit.
Nejnovějším příkladem, který znamená výrazný obrat v přístupu k prostorovým
datům, byla několikaletá diskuze o evropské iniciativě, později legislativní směrnici
INSPIRE (Infrastructure for Spatial Information in Europe). Po dřívějších neúspěšných
pokusech vybudovat geoinformační infrastrukturu v Evropě (GII resp. SDI) se v
návaznosti na iniciativy přicházející z oblasti životního prostředí, zejména snahu pokrytí
požadavků na neustálou informovanost o stavu životního prostředí pro evropské obyvatele
kdykoliv a kdekoliv, se země Evropské unie sice obtížně, ale nakonec přece jenom
dohodly na vybudování zmíněné informační infrastruktury. Ta by měla navazovat na již
dříve uskutečněné kroky nejen v rámci Společenství, ale i v jednotlivých zemích. Jedním
z klíčových předpokladů, jež jsou také diskutovány v této knize, je interoperabilita. Řada
významných aktivit vychází z tzv. Evropského interoperabilního rámce.
       Evropský interoperabilní rámec (IDABC; Interoperable Delivery of European
eGoverment Services to Public Administrations, Businesses and Citizens) představuje
využití informačních a komunikačních technologií pro podporu přeshraničních služeb
veřejného sektoru pro všechny občany a společnosti. Tato iniciativa by tak měla zajistit
kvalitní elektronické služby veřejné správy pro všechny koncové uživatele. Konkrétně se
jedná o zajištění konzistentních elektronických služeb v oblastech zemědělství, vzdělávání,
zaměstnanosti, sociálních věcí, životního prostředí, statistik či výběrových řízení. Jedním
ze základních kamenů implementačních projektů je zapojení Open Source software.
Výsledkem aktivit budou certifikované služby IDABC v roce 2009.
       Vznik SDI, v našem případě INSPIRE, je předpokladem pro nový rozvoj vědeckých
disciplín, například kartografie. V současnosti je prostřednictvím inteligentního přístupu do
databází a interaktivní uživatelské podpory možné nejen nalézt vhodné mapy na Internetu,
ale také je vytvářet a modifikovat podle specifických a individuálních požadavků. Namísto
pouhého užití map, které byly někým vytvořeny předem, dovolují tyto nové výzkumné
možnosti jednotlivcům využívat kartografii interaktivně, na základně přání individuálního
uživatele, zkoumat a reprezentovat prostorové informace. Nové technologie umožňují “živé
spojení” mezi instinktivní vnitřní sférou naší prostorové kognice prostřednictvím přímé
interakce s novou generací kartografických vizualizací, a tím i s potenciálně nekonečnými
zdroji na Internetu.
       Uvedené příklady dokumentují, že dochází k progresivnímu rozvoji sběru
a dostupnosti geografických dat a informací. Ty jsou pomocí nových technologií
zpracovávány a vizualizovány pro potřeby co nejširšího okruhu uživatelů. V souvislosti s
tím je také potřeba zásadně řešit složitou problematiku zapojení geografických informací
do širokého proudu informačních a komunikačních technologií a jejich aplikací a naopak,
aplikovat vlivy rozvoje informační společnosti na celou oblast geografických informací.
      V tomto duchu byly formulovány a řešeny i projekty, jež jsou popisovány v
předkládané knize. Všechny byly financovány Grantovou agenturou Akademie věd České
republiky v rámci programu Informační společnost, tématického programu”II. Národní
program výzkumu - TP2. Jde o následující:
      •      Management geografických informací a znalostí (SPRAVADAT).
      Jeho cílem bylo vytvoření uceleného systému managementu geografických
informací a znalostí a jejich uplatnění v praktických aplikacích. Jde o vyřešení tvorby,
uložení a distribuci velkých datových souborů typu katastr nemovitostí, Státní mapa 1 :
5000, báze geografických dat apod.
•      Mobilní sběr prostorových dat pro mapovaní v reálném čase (MOBILDAT).
      Cílem projektu bylo vytvořit základní infrastrukturu pro on-line vkládání
prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení. Řešitelé
vytvořily serverovou služby, které bude tvořit rozhraní mezi distribuovaným GIS a
mobilním zařízením uživatele. Služba také poskytuje možnost interaktivních korekcí
vkládaných údajů přímo v terénu a výrazně usnadní a zrychlí proces aktualizace dat v
GIS.
      •      Navigační a logistické systémy (NAVLOG).
      Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému,
sloužícího pro potřeby českého aplikovaného a průmyslového výzkumu a pro výběr
optimálních praktických řešení pro energetiku a dopravní telematiku.
      •      Systém přenosu dokumentačních dat pro aktualizaci informačního systému
             státní správy zeměměřictví a katastru (GEOPLAN)
      Cílem projektu byl další rozvoj informačních technologií ve sféře tvorbyaktualizačních
souborů pro státní správu zeměměřictví a katastru. Vyřešení podmínek přímé datové
aktualizace souborů informačního systému katastru nemovitostí s využitím jak výměnných
formátů dat, tak i nových webových technologií.

      Řada tezí a výstupů z výše uvedených projektů byla ověřována i v rámci výzkumného
záměru MŠMT ČR, projekt MSM0021622418 s názvem „Dynamická geovizualizace v
krizovém managementu“.
       Autoři knihy nemají ambici popsat podrobně všechny otázky související s řešenými
projekty. Řada z nich je v široké vědecké komunitě otevřena a zatím nedořešena. Ambicí
autorů je ale ukázat, na jaké úrovni vývoje je výzkum v České republice resp. v EU a ve
světě v uvedených oblastech a tam, kde jsou nedořešené otázky, ukázat, jaké směry řešení
v budoucnosti vidí.
      Vzhledem k omezenému rozsahu publikace byla pro potřeby čtenářů na adrese
www.spravageodat.cz vytvořena doplňková informační stránka o výše zmíněných
projektech, barevné verze obrázků a další důležité veřejné výstupy.


                                                                        MILAN KONEČNÝ
POUŽITÁ TERMINOLOGIE

      Následující výčet obsahuje vysvětlení vybraných terminologických výrazů z
publikace. Pro ucelenější přehled a vysvětlení odborných termínů v oblasti geoinformačních
technologií odkazujeme na Terminologický slovník VÚGTK [160] a oborovou normu
– překlad odpovídajících CEN norem.


Ambiguita                       Neznámý počet celých vlnových délek nacházejících se mezi družicemi GPS
                                a přijímačem, nejednoznačnost.
Bezdrátové sítě                 Bezdrátový typ počítačové sítě, která jako přenosové médium používá elektro-
                                magnetické rádiové vlny v pásmech řádu GHz (gigahertzů).
Digitální náčrt                 Náčrt v digitálním vyjádření obsahu předmětů a šetření pro potřebu
                                velkoměřítkového mapování a katastru.
Gazeteer, prostorový tezaurus   Seznam toponym seřazený dle abecedy nebo jinak, určující polohu a přednostně
                                též variantní jména, typ objektu a další informace.
Geodata                         1: data s implicitním nebo explicitním vztahem k místu na Zemi
                                2: počítačově zpracovatelná forma informace týkající se jevů přímo nebo
                                nepřímo přidružených k místu na Zemi
                                3: data identifikující geografickou polohu a charakteristiky přírodních a antropo-
                                genních jevů a hranic mezi nimi.
Geodetický systém               Společný název pro souřadnicový, výškový a tíhový systém.
Geometrický plán                Je grafickou částí listin, podle nichž má být proveden zápis do katastru nemovi-
                                tostí. Vyhotovuje se vždy na základě výsledků geodetických prací v terénu
                                a obsahuje grafické zobrazení nemovitosti před změnou a po ní a další údaje
                                podle stanovených požadavků.
Geoprvek                        Modelový obraz lokalizovatelného objektu reálného světa, který je dále
                                nedělitelný na jednotky stejné třídy a který zahrnuje lokalizaci.
INSPIRE                         INfrastructure for SPatial InfoRmation in Europe je iniciativou Evropské
                                komise. Stejnojmenná směrnice Evropské komise a Rady si klade za cíl vytvořit
                                evropský legislativní rámec potřebný k vybudování evropské infrastruktury
                                prostorových informací. Hlavním cílem INSPIRE je poskytnout větší množství
                                kvalitních a standardizovaných prostorových informací pro vytváření
                                a uplatňování politik Společenství na všech úrovních členských států.
Integrace geodat                Spojování a kombinace geodat z různých zdrojů, v poslední době především
                                v kontextu s využitím webových XML služeb.
Internetová síť                 Světová komunikační síť, umožňující připojeným počítačům komunikovat
                                s ostatními veřejnými segmenty napojenými na tuto síť.
Interoperabilita geodat         1: schopnost komunikovat, realizovat programy nebo přenášet data mezi
                                různými funkčními jednotkami způsobem, který vyžaduje od uživatele malé
                                nebo žádné znalosti o jednotlivých charakteristikách těchto jednotek
                                2: schopnost technického zařízení či softwaru od různých výrobců spolu
                                úspěšně komunikovat a spolupracovat.
Kálmanův filtr                   Filtr, který odhaduje stav pohyblivého systému ze série neúplných a rušených
                                měření.
Katastrální operát              1: souhrn měřického a písemného operátu pozemkového katastru
                                2: souborné označení pro dokumentační materiály potřebné pro vedení a obnovu
                                katastru nemovitostí ČR (soubor geodetických informací katastru nemovitostí,
                                soubor popisných informací katastru nemovitostí, souhrnné přehledy o půdním
                                fondu z katastru nemovitostí, dokumentace výsledků šetření a měření pro vedení
                                a obnovu souboru geodetických informací, sbírka listin).
Metadata                        Data popisující a dokumentující data, data o datech.
Místopisný náčrt             Náčrt situace umístění bodu bodového pole vzhledem k okolním objektům,
                             součást formuláře geodetických údajů.
Mobilní klient               Klientská část v architektuře klient-server, která je součástí přenosného zařízení
                             (např. PDA, mobilního telefonu apod.).
ON LINE přístup ke           Zpřístupnění ke geodatům formou webových XML služeb nebo webových
geodatům                     aplikací.
Open Source                  Způsob distribuce programů, dat apod., která splňují jak otevřenost zdrojového
                             kódu, tak umožnění jeho dalšího šíření a úprav.
Pilotní studie               Primární studie užitá pro ověření fungování systému.
Případová studie             Vzorové zpracování zadaného tematu.
Scénář                       Podrobný technický popis postupu.
Senzor                       Prvek nebo zařízení určené k měření fyzikální veličiny.
Souřadnicový systém          1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku,
                             referenčním bodu a užitém kartografickém zobrazení
                             2: sada matematických pravidel pro specifikování způsobu, jakým jsou
                             souřadnice přiřazovány k bodům (ČSN ISO 19111).
Standardizace geodat         Soubor opatření zabezpečující jednotnou podobu geografických dat.
Státní souřadnicový systém   1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku,
                             referenčním bodu a užitém kartografickém zobrazení
                             2: sada matematických pravidel pro specifikování způsobu, jakým jsou
                             souřadnice přiřazovány k bodům (ČSN ISO 19111)
                             3: systém, určený pro specifické práce v určeném prostoru v rámci státu.
Tablet                       Zařízení na převod obrazu do digitální formy ; skládá se z pevné podložky obsa-
                             hující elektronické zařízení generující elektromagnetické pole a z pohyblivého
                             snímacího zařízení v podobě pera nebo grafického kurzoru se záměrným křížem
                             a lupou.
Telematika                   Obor zaměřující se na určování polohy pohybujícího se objektu.
Tenký klient                 Klientský software v architektuře sítě klient-server, jehož funkčnost je závislá
                             na centrálním serveru.
Tezaurus                     Hierarchicky uspořádaný terminologický slovník lexikálních jednotek obsahu-
                             jící popisovače a vztahy mezi nimi.
Tlustý klient                Klientský software v architektuře sítě klient-server, který pracuje nezávisle na
                             centrálním serveru. Obvykle poskytuje větší funkcionalitu než tenký klient.
Triangulační list            Plošná evidenční jednotka v bývalé československé trigonometrické síti.
Výměnný formát geodat        Kódový záznam dat, který se používá k přenosu mezi jednotlivými programy
                             nebo zařízeními.
Vzhled jevu                  Abstrakce jevů reálného světa, překlad termínu feature v ČSN ISO normách
                             řady 19100, ekvivalent k pojmu geoprvek.
Webové mapové služby         Poskytování mapových výstupů prostřednictvím internetu bez nutnosti přenosu
                             zdrojových souborů dat.
Webové služby                Systém umožňující součinnou spolupráci počítačů v síti. Poskytovatel služby
                             nabízí prostřednictvím standardních rozhraní určitá data a služby. Klient najde
                             adresu služby v registru webových služeb, načte si její popis a využívá ji.
HLAVNÍ POUŽÍVANÉ ZKRATKY

A-GPS               Asistované GPS
AGS                 Astronomicko-geodetická síť
AJAX                Asynchronous Javascript And XML
ANSI                American National Standards Institute
AOA                 Angle Of Arrival
AP                  Access Point
AST position paper Architecture & Standards Position Paper
AV ČR               Akademie věd České republiky
BBWA                Broadband Wireless Access (bezdrátové metropolitní sítě)
BIH                 Bureau International de I’Heure
BPEJ                Bonitní půdně ekologická jednotka
Bpv                 Výškový systém baltský - po vyrovnání
BSS                 Basic Service Set
CAGI                Česká asociace pro geoinformace
CBCH                Cell Broadcast Channel
CDMA                Code Division Multiple Access
CLI                 Command Line Interface
CORBA               Common Object Request Broker Architecture
CTRS                Konvenční terestrický systém
CQL                 Common Query Language
CSMA/CA             Carrier Sense Multiple Access With Collision Avoidance
CSW                 Catalogue Services for the Web
CZEPOS              Česká permanentní síť pro určování polohy
ČR                  Česká republika
ČSJNS               Československá jednotná nivelační síť
ČSN                 České technické normy
ČSÚ                 Český statistický úřad
CSV                 Comma Separated Value(s) (importní/exportní formát do databáze)
ČÚZK                Český úřad zeměměřický a katastrální
DBU                 Deutsche Bundesstiftung Umwelt
DCMI                Dublin Core Metadata Initiative
DGN                 Design (formát výkresů v produktech firmy Bentley Systeme)
DGPS                Diferenční GPS
DKM                 Digitální katastrální mapa
DIKAT               Systém pro tvorbu a vedení informačních systémů o území a automatizované vyhotovení
                    geometrického plánu
E-CGI               Enhanced Cell Global Identity
E-OTD               Enhanced Observed Time Diference
ebRIM               Electronic Bussiness Registry Information Model
EGM                 Earth Gravity Model
EGNOS               European Geostationary Navigation Overlay Service
EPSG                European Petroleum Survey Group
ESS         Extended Service Set
ETRF        European Terrestrial Reference Frame (Evropský terestrický referenční rámec)
ETRS        European Terrestrial Reference System (Evropský terestrický referenční systém)
ETSI        European Telecommunications Standards Institute
EUREF       European Reference Organisation for Quality Assured Breast Screening and Diagnostic
            Services
EVRF        European Vertical Reference System
EXIF        EXchangeable Image File Format
FHSS        Frequency Hopping Spread Spectrum
FKP         Flächenkorrekturparameter
FTP         File Transfer Protocol
FSC         Fujitsu-Siemens Computers
FSÚ         Federální statistický úřad
GALILEO     Evropský družicový navigační systém
GDAL        Geospatial Data Abstraction Library
GDI         Geographic Data Infrastructure
GeoSl AČR   Geografická služba Armády ČR
GFM         General Feature Model
GII         Geospatial Information Infrastructure
GIS         Geografický informační systém
GLONASS     GLObaľnaja NAvigacionnaja Sputnikovaja Sistěma (ruský družicový navigační systém)
GML         Geography Markup Language
GNSS        Global Navigation Satellite System
GP          Geometrický plán
GPL         General Public Licence (všeobecná veřejná licence)
GPRS        General Packet Radio Service
GPS         Global Positions System (americký družicový navigační systém)
GRASS       Geographic Resources Analysis Support System
GSM         Mobilní bezdrátové sítě (GPRS, UMTS)
GUI         Graphic User Interface
IAPP        Inter-Access Point Protocol
IBO         Information Bearing Objects
ICAO        International Civil Aviation Organisation
IEEE        Institute of Electrical and Electronical Engineers
IERS        International Earth Rotation Service (Mezinárodní služba rotace Země)
IIM         Information Interchanges Model
IMO         International Maritime Organisation
INSPIRE     INfrastructure for SPatial InfoRmation in Europe
IPR         Intellectual Property Rights
IPTC        International Press and Telecommunications Council
IrDA        Infrared Data Association
IS          Informační systém
ISO         International Organisation for Standardisation
ISKN        Informační systém katastru nemovitostí v ČR
ISM         Industry, Science, Medical
ITRF     International Terrestrial Reference System
ETRS     European Terrestrial Reference System (uživatelský geocentrický souřadnicový systém)
ITU-T    International Telecommunications Union - Telecommunications Standardization Sector
KM-D     Katastrální mapa v digitální formě
KN       Katastr nemovitosti
LADGPS   Local Area DGPS
LAN      Local Area Network (místní síť)
LMU      Location Measurement Unit
MAC      Media Access Protocol
MetaIS   Metainformační systém
MLC      Mobile Location Center
MMC      MultiMedia Computer
MS       Mobilní stanice
MT       Mobile Terminal
N.N.     Normal Null
NAA      Newspaper Association of America
NATO     North Atlantic Treaty Organisation (Organizace Severoatlantické smlouvy)
NavLog   Navigation Log
NGII     Národní geoinformační infrastruktura ČR
NMEA     National Marine Electronics Association
NNSS     Navy Navigation Satellite System (Námořní navigační družicový systém)
NVF      Nový výměnný formát KN
OGC      Open Geospatial Consortium
PBPP     Podrobné body polohového pole
PC       Výpočetní technika, komunikační technika
PDA      Personal Data Assistant
PDOP     Position Dilution of Precision
PII      Prostorová informační infrastruktura
PKMP     Prvky katastrální mapy
POS      Personal Operating Space
PPP      Public Private Partnership
PROJ     Cartographic Projections Library
PRS      Pseudoreferenční stanice
PyWPS    Python Web Processing Service
QoS      Quality of Service
RDF      Resource Description Framework
RINEX    Receiver Independent Exchange
RTK      Real Time Kinematic
RETM     Rastrové ekvivalenty topografických map
S-42     Souřadnicový systém 1942
S-Gr95   Tíhový systém 1995
S-JTSK   Státní souřadnicový systém jednotné trigonometrické sítě katastrální
S-SK     Souřadnicový systém stabilního katastru
SDI      Spatial Data Infrastructure
SGI            Soubor geodetických informací
SGS            Srovnávací grafický soubor
SIG            Special Industry Group
SLD            Styled Layer Descriptor
SLR            Satellite Laser Ranging
SMLC           Serving Mobile Location Center
SMPS           Simple Mobile Positioning System
SPI            Soubor popisných informací
SQL            Structured Query Language (strukturovaný dotazovací jazyk)
SW             Software
SWOT           Strengths, Weaknesses, Opportunities, Threats
TDD            Time-Division Duplex
TS AČR         Topografická služba Armády ČR
UML            Unified Modeling Language (grafický jazyk pro vizualizaci, specifikaci, navrhování
               a dokumentaci programových systémů)
UMTS           Universal Mobile Telecommunications System (Universální mobilní telekomunikační
               systém)
UTM            Universal Transversal Mercator
VFK            Výměnný formát katastru
VGA            Video Graphics Array (grafický adapter pro PC)
VPN            Virtual Private Network
VÚGTK          Výzkumný ústav geodetický, topografický a kartografický
WADGPS         Wide Area DGPS
WCS            Web Coverage Service
WECA           Wireless Ethernet Compatibility Aliance
WEP            Wired Equivalent Privacy
WEP            Wireless Encryption Protocol
WFS            Web Feature Service
WGS 84         World Geodetic System 1984 (Světový geodetický systém 1984)
WiFi           Wireless Fidelity
Wirelessinfo   Virtuální výzkumné a inovační centrum se zaměřením na GIS
WLAN           Wireless Local Area Network
WMC            Web Map Context
WMS            Web Map Service
WPAN           Wireless Personal Area Network
WPS            Web Processing Service
WWW            World Wide Web
XML            eXtensible Markup Language (rozšiřitelný značkovací jazyk)
XMP            eXtensible Metadata Platform
ZABAGED        Základní báze geografických dat
ZÚ             Zeměměřický úřad
ZHB            Zhušťovací bod
ZPH            Zjišťování průběhu hranic
ZPMZ           Záznam podrobného měření změn
ČÁST I
SPRAVADAT
20
Kapitola 1: SPRAVADAT
MILAN KONEČNÝ, PETR KUBÍČEK, KAREL CHARVÁT



1.    Úvod

       Cílem projektu SpravaDat - Management geografických informací a znalostí bylo
napomoci rozvoji geoinformační infrastruktury (SDI) v ČR a přispět k řešení otázky
komercializace prostorových (geografických) dat. Hlavním úkolem projektu SpravaDat
bylo navrhnout a implementovat takové modely využívání prostorových dat, které umožní
jejich co nejširší využití.
       Projekt výrazně napomohl analyzovat současnou situaci a vytvořit podmínky vedoucí
k zavádění INSPIRE v ČR. Tým autorů se podílel i na formování národního stanoviska
k některým dokumentům INSPIRE a jeho výsledky jsou dnes již přímo součástí postupně
vytvářené Národní geoinformační infrastruktury (NSDI) pro implementaci INSPIRE.
Projekt ale nebyl přímo svázán s praktickým zaváděním INSPIRE a jelikož se jednalo
o projekt výzkumný, v některých částech výrazně překračoval i rámce dané INSPIRE.
       Jak již bylo řečeno, hlavním cílem projektu bylo napomoci lepšímu využívání
prostorových dat. V posledních letech byly v ČR pilotně implementovány i standardizované
technologie umožňující vytváření skutečného trhu s daty a prostorové infrastruktury.
Přesto se však ještě nedá plně hovořit o existenci národní prostorové infrastruktury a již
vůbec ne o plně rozvinutém trhu s geoprostorovými daty. Existuje zde jednak výrazná
poptávka po efektivnější práci s daty v oblasti státní správy a samosprávy, a to především
v oblasti přístupu k datům a jejich sdílení (náznak řešení demonstruje kraj Vysočina), ale
i rozsáhlý tržní potenciál pro využívání prostorových dat jak jednotlivci, tak i organizacemi.
V budoucnosti bude vzrůstat požadavek na poskytování dat pomocí integrovaných
služeb (viz kapitola 6, 7). Zkušenosti v Evropě i u nás ukazují, že budoucnost v práci s
prostorovými daty je v prostředí Webu. Plnému rozvití však dosud bránila řada faktorů.
Jako hlavní lze zmínit:
•      Nevyjasnění některých legislativních otázek v oblasti přístupu k prostorovým datům
       v rámci státní správy a samosprávy (zde již dochází k výraznému posunu především
       zásluhou činnosti Nemofora).
•      Vysoká cena geoprostorových dat, která je obvykle dána dvěma hlavními faktory:
       ·      Současné modely nabízení dat jsou orientovány především na nabízení
              ucelených datových setů, které jsou pro mnoho uživatelů cenově nedostupné.
              To na druhou stranu ovlivňuje, že neexistuje dostatečně velká poptávka po
              datech, která by pak umožnila tato data zlevnit.
       ·      Na trhu jsou nabízena obvykle data, ne služby. Velká většina budoucích
              potenciálních zákazníků bude požadovat informační a znalostní služby, ne
              primární data.
•      Nedostatečná informovanost mezi uživateli i poskytovateli prostorových dat
       o nejnovějších standardech a technologiích v oblasti sdílení geoprostorových dat
       a služeb.

                                           21
•     Nedostatečná podpora těmto technologiím a standardům ze strany vývojářských
      týmů.
      Projekt SpravaDat se snažil reagovat na tyto překážky a poskytl jak teoretické
analýzy, tak prakticky prezentoval výsledky výzkumu vedoucí k překonání těchto bariér.
       Následující text je rozčleněn do kapitol, které v jistém smyslu kopírují organizaci
pracovních týmů INSPIRE. I přesto, že v publikaci popsané výsledky projektů se někdy
liší od doporučení týmů INSPIRE (doporučení pracovních týmů a výzkumy v rámci
SpravaDat probíhaly paralelně), domníváme se, že toto členění může napomoci čtenářům
lépe pochopit a implementovat doporučení, která z INSPIRE přicházejí. Budování
NSDI bude na jedné straně plně v souladu s požadavky INSPIRE, ale na druhé straně
bude postihovat i národní specifika. Možné odlišnosti oproti doporučením pracovních
týmů INSPIRE mohou vycházet i z toho, že především v oblasti budování technologické
infrastruktury pro SDI je Česká republika výrazně nad průměrem Evropy.
      Členění kapitoly věnované projektu SpravaDat je následující:
      ·    GIS v národní geoinformační infrastruktuře.
      ·    Metadata a katalogové služby.
      ·    Interoperabilita, datové modely a generalizace dat.
      ·    Architektura pro SDI a jednotlivé standardy pro její podporu.
      ·    Sdílení prostorových dat a služeb a možné obchodní modely.
      ·    Popis konkrétních pilotních řešení, která jsou výstupem z projektu
           SpravaDat.




                                         22
Kapitola 2: GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY
V NÁRODNÍ GEOINFORMAČNÍ INFRASTRUKTUŘE
PAVLA TRYHUBOVÁ



1.    Národní geoinformační infrastruktura (NGII)

       Bez prostorových dat si dnes nedokážeme život představit. Každý z nás v životě už
někdy něco hledal nebo hledá a geodata mu pomohou najít správný směr, ať už použije
klasickou papírovou mapu nebo moderní GPS navigaci. Problém nastává, když chceme
najít „správnou“ klasickou mapu nebo „správná“ data pro GPS navigaci.
       Prostorová data hrají důležitou roli nejen při hledání cest, ale i při rozhodování
vládních složek a organizací. Vláda plánuje politiku pro zemědělství, průmysl, regionální
rozvoj, dopravu a bezpečnost, sleduje postup řešení své strategie a ověření dosažených
výsledků. Kvalitní geodatové a mapové podklady jsou důležité pro efektivní vývoj tržního
hospodářství. Podobné příklady můžeme uvést i z dalších evropských zemí, například
při navrhování dopravní sítě nebo sledování znečištění životního prostředí. Zvládat tyto
procesy na evropské úrovni ale není možné bez určité úrovně integrace, harmonizace
a interoperability dat (Pauknerová, Tryhubová [140]).
      Díky těmto požadavkům je v současné době vyvíjena řada aktivit na globální,
evropské i národní úrovni s cílem zabezpečit tyto podmínky pomocí jednotné infrastruktury
prostorových informací, která je často označována dalšími termíny, např. infrastruktura
prostorových dat, prostorové informační infrastruktury (PII), v globálním kontextu známé
jako SDI (Spatial Data Infrastructure), či GDI (Geographic Data Infrastructure). V této
knize je použit termín GII - Geospatial Information Infrastructure. Zimová [179] uvádí,
že více než polovina z celkového počtu zemí světa deklaruje své aktivity v nějaké formě
budování SDI.
      Funkční geoinformační infrastruktura se stává přirozeným požadavkem informační
společnosti, a proto v řadě významných dokumentů z poslední doby - z oblasti veřejné
správy i z profesní sféry - je vyjádřena nutnost formulovat strategii vytváření národní
geoinformační infrastruktury v podmínkách České republiky a určit cíle a projekty, které
vedou k její realizaci. Specifikace programu Národní geoinformační infrastruktury České
republiky (NGII) je součástí cílů uvedených v dokumentech Státní informační politika,
Koncepce budování informačních systémů veřejné správy a Akční plán realizace státní
informační politiky.
      Národní geoinformační infrastrukturu České republiky lze popsat jako soubor
vzájemně provázaných podmínek, které v prostředí ČR umožňují zajistit a zpřístupnit co
největšímu okruhu uživatelů širokou škálu geoinformací uživatelsky vhodnou formou při
plném využití potenciálu moderních (geo)informačních a komunikačních technologií.
[117]



                                         23
2.    Podmínky pro fungování NGII

      Shrňme si základní podmínky pro fungování NGII - existence geodat a geoinformací,
harmonizace a interoperabilita dat, jejich snadná dostupnost a znalost podmínek, za kterých
mohou být využívána. Aby výše uvedené podmínky byly splněny, musíme znát vlastnosti
geodat a způsoby jejich využívání.
        Z vlastností jsou to především dva možné modely dat: vektorový a rastrový model
dat. V GIS mohou být také použity snímky a obrázky (mapky, letecké snímky) nebo
soubory vektorových dat stažitelné ve formátech SHP, DGN a podobně. Výrazně se
prosazuje používání internetu. Internetové stránky umožňují kopírovat databáze a nebo
výpisy z informačních systémů využitelné v GIS. V informačních systémech jsou použity
textové formáty dat nazývané registry a číselníky. Data jsou doplněna údaji o geografické
lokalizaci, kterou mohou být gegrafické souřadnice místa, nebo přesná adresa, označení
určitého regionu, a podobně. Statistické klasifikace a číselníky vyhlašuje Český statistický
úřad. Číselníkem se rozumí uspořádaný seznam kódů a jim přiřazených významů.
Číselníky jsou součástí statistického informačního systému. Statistická data lze zejména
použít v tematickém mapování, při tvorbě kartogramů, kartodiagramů a podobně. Český
statistický úřad vede registr ekonomických subjektů a registr sčítacích obvodů.
       Umístění geodat na webové stránky skrývá několik úskalí souvisejících s jejich
objemem a rozsahem. Některé zdroje nabízejí pokrytí celé České republiky, jiné pouze
určité zájmové oblasti. Příkladem jsou ortofotomapy nebo již existující tematické mapy.
Problémy nastávají tam, kde poskytovatelé geodat nemají dostatečně velký internetový
prostor pro umístění dat nebo nechtějí nabídnout vše zdarma, a tak na webové stránky
umísťují pouze ukázky dat nebo metadata. S tímto problémem úzce souvisí poskytování
geodat. Poskytovatelé mají dvě možnosti: za úplatu nebo zdarma – většina poskytovatelů
nabízí geodata především za úplatu, pokud jsou zdarma ke stažení, tak pouze pro
nekomerční účely.
       Další vlastností je dostupnost umístěných geodat. Nejsnadnější, nejrychlejší
a nejlevnější dostupnost je pomocí internetu. To znamená stažení geodat přímo z
webových stránek. Tato forma dostupnosti ale není příliš oblíbená mezi poskytovateli
geodat. Důvodem je nebezpečí jejich zneužití, které může vést až k nekontrolovanému
šíření geodat mezi uživateli a jejich využíváním v komerčním prostředí, a tím i porušování
autorského zákona. Poskytovatelé řeší tuto situaci několika způsoby. Nutnou registrací
vstupu do informačního systému, ve kterém si lze data vyhledávat, kupovat a stahovat (e-
obchod) nebo osobní návštěvou firmy, kdy je potřeba vyplnit formuláře a písemně o data
zažádat. Teprve později po vyřízení všech formalit dochází k dodání geodat na CD-ROM.
Internet poskytovatelé využívají k poskytování informací o vlastnictví geodat. Z těchto a
dalších důvodů je důležitou součástí geodat jejich popis.
      Popis dat je označován obvykle jako metadata a v minulosti byl velmi často
podceňován a opomíjen. Pro informovanost o geodatech jsou metadata důležitou
složkou prostorově lokalizovaných dat. Metadata jsou definována jako „data o datech”
a v nejrůznějších podobách jsou využívána již poměrně dlouhou dobu v oblastech
zabývajících se uchováváním a zpřístupňováním informací a samozřejmě také v GIS.

                                          24
Problematika metadat byla diskutována a řešena i v projektu INSPIRE. Detailně danou
problematiku rozebírá a komentuje kapitola 3.

3.    INSPIRE

      Iniciativa INSPIRE se stala evropskou směrnicí po jejím schválení Evropským
parlamentem v listopadu roku 2006. Směrnice INSPIRE a její přijetí představuje klíčový
moment pro budoucnost tvorby infrastruktury prostorových informací v Evropské Unii.
INSPIRE podporuje harmonizaci prostorových formátů dat, dostupnost datových sad
a schopnost vyhledat různé datové sady.
      INSPIRE je založena na souboru základních principů:
•     data by měla být sbírána pouze jednou a udržována na té úrovni, kde je sbírání dat
      nejúčinnější;
•     mělo by být možné propojit prostorové informace z různých evropských zdrojů a
      mezi mnoho uživatelů a aplikací;
•     mělo by být možné pro informace sebrané na jedné úrovni jejich sdílení do všech
      ostatních úrovní;
•     na všech úrovních by mělo být dostatečné množství geodat za podmínek, které
      umožní jejich rozsáhlé použití;
•     mělo by být snadné najít, která geodata jsou dostupná, která se hodí pro zvláštní
      použití a za jakých podmínek mohou být získána a používána;
•     geodata by měla být snadno pochopitelná a interpretovatelná.
      Směrnice chce zajistit vytvoření evropské prostorové informační infrastruktury,
která zpřístupní uživatelům integrované prostorové informační služby. Tyto služby
by měly umožnit uživatelům pomoci při vyhledávání a zpřístupňování geografických
informací z široké škály zdrojů, od místní úrovně ke globální úrovni, interoperabilní
cestou. Uživatelské cíle INSPIRE zahrnují politiky a evropské manažery na národní a
místní úrovni, občany a organizace [51].
       INSPIRE bude provozován na jednom webovém portálu, kde bude možné nalézt
existující data. Jestliže tato data neexistují, členské státy EU budou muset takové datové
sady vytvořit. Datové sady musí vyhovovat standardům, které zajistí propojení s daty
z jiných zemí a z podkladů různých měřítek. Výhody pro Evropskou unii, jakož i běžného
občana jsou zřejmé. Pokud stát zpřístupní a otevře používání prostorových dat, umožní
mimo jiné prostřednictvím internetu jejich kontrolu, například plnění územního plánu
nebo zapsání osobního vlastnictví, s použitím mobilního telefonu nalezení nejbližší banky
nebo zdravotního střediska [162].




                                         25
3.1 Obsah směrnice INSPIRE

     Směrnice obsahuje následující kapitoly:
     Kap. 1         Obecná ustanovení
     Kap. 2         Metadata
     Kap. 3         Interoperabilita prostorových datových sad a služeb
     Kap. 4         Síťové služby
     Kap. 5         Sdílení dat a znovu využití dat
     Kap. 6         Koordinace a doplňující opatření
     Kap. 7         Závěrečná ustanovení
     Přílohy I, II, III.
     Konkrétní znění české verze směrnice a aktuální vývoj situace související s její
implementací lze nalézt na adrese: http://www.cenia.cz/web/www/web-pub2.nsf/$pid/
MZPMSFGR0A25.

3.2 Obecné principy se vztahem ke geodatům
•     Pro geodata zavést koordinační opatření a koordinační struktury na úrovni veřejné
      správy pro spojení informací a znalostí z různých odvětví, které by zohledňovaly
      rozdělení pravomocí a odpovědností v členských státech.
•     Propojení geodat s dalšími informačními oblastmi (školství, vzdělávání a politika).
•     Data by měla být sbírána jednou a držena na té úrovni, kde je sbírání dat
      nejefektivnější.
•     Orgány a instituce Společenství mají mít harmonizované podmínky a integrovaný
      přístup k souborům prostorových dat a službám zohledňující regionální rozdíly.
•     Poskytovat o geodatech objektivní, důvěryhodné a srovnatelné informace na úrovni
      Společenství.
•     Zajistit propojené síťové služby, které naleznou, transformují, zobrazí a stáhnou
      prostorová data.
•     Usnadnit finanční náhrady za využívání prostorových dat a nadstandardních služeb.
•     Je třeba usnadnit přístup a zajistit možnost opakovaného použití prostorových dat,
      jež přesahují správní a státní hranice.
•     Členské státy zajistí přístup ke službám uvedeným prostřednictvím geoportálu
      Společenství.
•     Členské státy umožní veřejným orgánům a institucím členských států přístup ke
      geodatům a zajistí jejich dostupnost bez omezení (transakční, procesní, zákonné,
      institucionální nebo finanční povahy).
•     Zajistit snadno použitelné služby pro veřejnost a přístup k nim pomocí
      komunikačního prostředku. Jde o služby vyhledávací (na základě obsahu metadat),
      prohlížecí, stahování, transformační a vyvolávací.
•     Pro účely služeb je třeba zavést několik vyhledávajících kritérií: klíčová slova,
      třídění prostorových dat a služeb, kvalita a přesnost prostorových dat, úroveň
      souladu se specifikacemi pro harmonizaci prostorových dat, zeměpisná poloha,
      podmínky přístupu a použití geodat a služeb, veřejné orgány, které jsou pověřeny
      vypracováním, řízením, údržbou a šířením souborů prostorových dat a služeb.

                                         26
•     Členské státy nesmějí omezit přístup k informací o emisích do životního prostředí.
•     Členské státy zajistí, aby vyhledávací a prohlížecí služby byly veřejnosti přístupné
      zdarma.
•     Data mohou být poskytována pomocí prohlížecích služeb ve formě zabraňující
      opětovnému použití a mohou obsahovat licenční smlouvu.
•     Vybírají-li orgány veřejné moci poplatky za transformační a vyvolávací služby,
      musí členské státy zajistit, aby bylo možné použít služeb elektronického obchodu.
•     Otevřenost národních infrastruktur pro další vlastníky geodat (třetí stranu).
•     Členské státy přijmou příslušná opatření, aby zabránily narušení hospodářské
      soutěže.
•     Zajistit propojení sítí pro zpřístupnění metadat veřejným orgánům a třetím stranám
      na základě žádosti.
•     Implementační pravidla stanovující podmínky pro harmonizaci prostorových dat
      a předpisy pro výměnu prostorových dat zajistí interoperabilitu prostorových dat
      nebo interakci služeb.
•     Komise stanoví implementační pravidla tak, aby zvýšila možnost opakovaného
      využití souborů prostorových dat a jejich služeb třetími stranami. Tato prováděcí
      pravidla mohou obsahovat zavedení společných podmínek pro udělování licencí.

4.    Závěr

      Žijeme v době, kdy kvalita a kvantita informací o světě kolem nás se vyvíjí úžasnou
rychlostí. Zvyšují se požadavky na uchovávání a zpracovávání informací.
      V současnosti je vyvíjena řada aktivit na globální, evropské i národní úrovni s cílem
zabezpečit výše zmiňované podmínky (harmonizace, informovanost a dostupnost geodat)
pomocí jednotné infrastruktury prostorových informací. Jak již bylo řečeno, v INSPIRE
je řada klíčových doporučení nezbytných pro podporu vysoké úrovně NGII. Odborná
komunita pracující s prostorovými daty věří, že INSPIRE je prvním krokem pro vytvoření
Evropského SDI. Pro realizaci této myšlenky je nutné zvyšovat povědomí o NGII mezi
všemi zainteresovanými složkami - poskytovateli ostatních dat, ministerstvy, privátním
sektorem a veřejností.
       V průběhu posledních let se situace v ČR mění k lepšímu – rozvíjí se informační
systémy, na webových stránkách přibývají portály. Veřejná správa poskytuje stále více
informací. Dostupnost geodat se rok od roku zlepšuje. Díky vznikajícím informačním
portálům a geoportálům snadněji vyhledává a má geografické informace k dispozici
stále více uživatelů. Česká republika tak vytváří podmínky pro fungování NGII a splňuje
požadavky INSPIRE. Menší nedostatky existují v harmonizaci dat, např. chybí národní
profil metadat. Dalším krokem na cestě k úspěšnému vybudování NGII bude naplnění
požadavků směrnice INSPIRE.




                                          27
28
Kapitola 3: METADATA, TEZAURY A KATALOGOVÉ
SLUŽBY
ŠTĚPÁN KAFKA, TOMÁŠ ŘEZNÍK, PETR KUBÍČEK, KAREL CHARVÁT, TOMÁŠ
CAJTHAML



1.    Metadata
      Potřeba metadat se objevila již v době, kdy byly pořizovány první rastrové mapové
podklady a digitální data vůbec. Tehdy se začala objevovat i poptávka po informacích
o prostorových datech. Tyto informace tak vlastně navazují na mimorámové údaje map
v analogové podobě, zpracovávané v předchozích letech, které poskytovaly obdobným
způsobem zásadní informace o prostorových datech.
      Metadata lze definovat jako data o datech nebo datových sadách, tedy jako množinu
informací popisujících daná data. Jde o popis obsahu, reprezentaci, geografický a časový
rozsah, prostorové reference, jakost a správu sady geografických dat. Je důležité, že právě
metadata umožňují integrovat geodata z různých datových sad a zdrojů (organizací,
segmentů veřejné správy apod.), čímž naplňují jeden z hlavních principů a požadavků na
interoperabilitu dat a informačních systémů (především charakteru GIS).
      Pro správu metadat se používá metainformační systém. Metainformační systém
(MetaIS) je informační systém, který dokáže sofistikovaně pracovat s metadaty a vyřizovat
požadavky na něho kladené. Důležitými charakteristikami MetaIS jsou především tyto
operace nad metadaty:
•     Identifikace metadat (schopnost zpracovat neomezené množství metadat).
•     Verifikace metadat (ověření správnosti testováním).
•     Interpretace metadat (zpracování obsahu metadat, validita).
•     Distribuce metadat (prezentace ve vhodné formě).
       Uživatelé MetaIS mohou vyhledávat metadata o požadovaných datových sadách s
využitím standardních vyhledávacích mechanismů. MetaIS většinou publikuje svá metadata
prostřednictvím služby WWW. Z metadatových standardů relevantních pro projekt
SpravaDat a i pro budování NSDI je třeba zmínit dva, Dublin Core a ISO19115/19119.




                              Obr. 1: Využití metadat v praxi
                                          29
1.1 Dublin Core - ISO 15836

       Dublin Core je standard určený            Tab. 1: Dublin Core Metadata Element Set
k vytváření metadat dokumentů na                  Anglicky          Česky
internetu. Vychází z knihovních systémů.          Title             Název
Jde o jednoduchý systém složený z                 Creator           Tvůrce
několika položek s prefixem „DC“. Je               Subject           Předmět
možno vytvářet další podtřídy rozšířením          Description       Popis
předdefinovaných pomocí tečky. Tato
                                                  Publisher         Vydavatel
metadata je možno vkládat do hlaviček
                                                  Contributor       Přispěvatel
HTML dokumentů. Existují vyhledávače,
                                                  Date              Datum
které je umí zpracovávat a tak poskytovat
tříděné informace na rozdíl od „textových“        Type              Typ
webových vyhledávačů.                             Format            Formát
                                                  Identifier         Identifikátor
      Standard Dublin Core obsahuje
                                                  Source            Zdroj
základní sadu patnácti prvků (Dublin Core
                                                  Language          Jazyk
Metadata Element Set), z nichž žádný není
povinný: viz tab. 1.                              Relation          Vztah
                                                  Coverage          Pokrytí
                                                  Rights            Práva
1.2 ISO 19115/19119 metadata

1.2.1 ISO19115
       Norma ISO 19115 standardizuje metapopis prostorových dat. Počítá se s tím, že
bude postupně nahrazovat současně používané standardy: FGDC (USA), ANZLIC
(Austrálie), CEN (EU). Z informací uveřejněných na internetu vyplývá, že jak výrobci
softwaru, tak i producenti dat postupně na tuto normu přecházejí. Současné aktivity EU v
oblasti prostorové infrastruktury (INSPIRE) počítají s touto normou jako jedinou pro popis
prostorových dat. V ČR byly zrušeny předběžné normy CEN a do češtiny byla přeložena
norma ISO (překlad dalších souvisejících norem ISO 191xx v současné době postupně
probíhá), která také byla přijata za normu ČSN.
       Norma byla inspirována stávajícími metadatovými normami, je však značně
rozsáhlejší a snaží se implementovat řadu číselníků, které omezují zadávání volného textu.
Měla by přispět k ujednocení interpretace jednotlivých položek. Textových položek však
nadále zůstává velké množství. Norma navazuje na další normy série ISO 191xx (ISO
19103 Conceptual Schema Language, ISO 19107 Spatial Schema, ISO 19108 Temporal
schema, ISO 19109 Rules for Application Schema, ISO 19118 Encoding). Vychází
z jednotného „General feature“ modelu používaného jak OGC tak v rámci norem ISO
191xx. Obsahuje povinné, nepovinné a podmíněně povinné položky. Norma také definuje
jakési jádro metadat (Core metadata), které by mělo být doporučeným základem pro
všechny metadatové záznamy. Norma předkládá popis struktury metadat ve formě UML
modelů a datového slovníku metadat, který poskytuje detailnější informace o jednotlivých
položkách. Datový slovník obsahuje normalizované krátké a dlouhé jednoznačné názvy
jednotlivých položek, které jsou dále používány v návazných normách.
                                         30
S použitím této normy se počítá nejen pro popis datových sad, ale také webových
služeb (WMS apod.).
        Základní (implicitní) jednotkou pro metadatový popis je datová sada (dataset).
Norma umožňuje také popisovat metadaty jednotlivé třídy geoprvků (feature types), třídy
atributů (feature attributes), instance geoprvků (feature instances) a atributů (attribute
instance). Je uplatněn také mechanismus pro popis jednotlivých listů mapového díla (tiles)
nebo pro definování vzájemné hierarchie (superset, subset).
        Pro přehlednost je norma tematicky rozčleněna do 12 balíčků (tab. 2, obr. 2).
Tab. 2: Metadatové balíčky
 Č     Název balíčku                     Obsah
 1.    MD_Metadata                       Základní balíček agreguje další balíčky. Dále obsahuje
                                         informace o jazyku a znakových sadách dat i metadat, iden-
                                         tifikátor metadatového záznamu, datumové razítko apod.
 2.    MD_Identification                  Citace, formát dat, ukázka, užití, zda je součástí jiné datové
                                         sady (DS)
 3.    MD_Constraints                    Omezení použití, autorská práva …
 4.    DQ_DataQuality                    Kvalita dat, údaje o historii vzniku apod.
 5.    MD_MaintenanceInformation         Způsob údržby, údaje o aktualizaci
 6.    MD_SpatialRepresentation          Rastr/vektor, geometrie, topologie…
 7.    MD_ReferenceSystem                Souřadnicové systémy, projekce
 8.    MD_ContentInformation             Popis rastrových dat nebo citace katalogu atributů
 9.    MD_PortrayalCatalogueReference    Způsob grafické prezentace dat
 10.   MD_Distribution                   Poskytované formáty dat, on-line přístup, ceny apod.
 11.   MD_MetadataExtensionInformation   Uživatelská rozšíření
 12.   MD_ApplicationSchemaInformation   Dokumentace aplikačního schématu DS




                   Obr. 2: UML model metadat na úrovni základních balíčků
                                           31
CORE metadata:
      Standard definuje seznam položek, které tvoří jádro (CORE) metadat (viz tab. 3).
Ne všechny položky jsou zde povinné, ale jsou doporučené pro základní popis dat.
Tab. 3: CORE metadata (M – povinný, O=volitelný, C = povinný za urč. podmínek)
 Prvek                               Povinný Umístění
 Název datové sady                   M       MD_Metadata > MD_DataIdentification.citation > CI_Cita-
                                             tion.title
 Typ prostorové reprezentace         O       (MD_Metadata > MD_DataIdentification.spatialRepresen-
                                             tationType
 Referenční kalendářní datum         M       MD_Metadata > MD_DataIdentification.citation > CI_Cita-
 datové sady                                 tion.date
 Referenční systém                   M       MD_Metadata > MD_ReferenceSystem
 Odpovědná strana                    O       MD_Metadata > MD_DataIdentification.pointOfContact >
                                             CI_ResponsibleParty
 Původ (rodokmen)                    O       MD_Metadata > DQ_DataQuality.lineage > LI_Lineage
 Geografická poloha datové            C       MD_Metadata > MD_DataIdentification.extent > EX_Ex-
 sady (4 souřadnicemi nebo                   tent > EX_GeographicExtent > EX_GeographicBounding-
 geografickým identifikátorem)                 Box or EX_GeographicDescription
 On-line zdroj                       O       MD_Metadata > MD_Distribution > MD_DigitalTransfer-
                                             Option.onLine > CI_OnlineResource
 Jazyk datové sady                   M       MD_Metadata > MD_DataIdentification.language
 Identifikátor souboru metadat        O       MD_Metadata.fileIdentifier
 Znaková sada datové sady            C       MD_Metadata > MD_DataIdentification.characterSet
 Název metadatové normy              O       MD_Metadata.metadataStandardName
 Tematická kategorie datové sady M           MD_Metadata > MD_DataIdentification.topicCategory
 Metadata standard version           O       MD_Metadata.metadataStandardVersion
 Prostorové rozlišení datové sady    O       MD_Metadata > MD_DataIdentification.spatialResolution >
                                             MD_Resolution.equivalentScale or MD_Resolution.distance
 Jazyk metadat                       C       MD_Metadata.language
 Abstrakt (výtah) popisující dato-   M       MD_Metadata > MD_DataIdentification.abstract
 vou sadu
 Znaková sada metadat                C       MD_Metadata.characterSet
 Distribuční formát                  O       MD_Metadata > MD_Distribution > MD_Format.name and
                                             MD_Format.version
 Kontaktní místo pro metadata        M       MD_Metadata.contact > CI_ResponsibleParty
 Doplňková informace o rozsahu       O       MD_Metadata > MD_DataIdentification.extent > EX_Ex-
 datové sady (vertikálním a                  tent> EX_TemporalExtent or EX_VerticalExtent
 časovém)
 Datumové razítko metadat            M       MD_Metadata.dateStamp

         Kompatibilita s Dublin Core:
      Dublin Core (dále DC) je standard pro vytváření metadat pro popis internetových
zdrojů. Vychází z knihovnických systémů a definuje jen velice omezené množství
základních položek s možností jejich další strukturalizace ve stromové struktuře podle
potřeb uživatelů. Položky jsou pouze textového charakteru a pro popis geografických dat
                                                32
jsou nedostatečné. Protože jde o normu, která má být používaná i v rámci Informačních
systémů veřejné správy v ČR, je třeba zhodnotit její kompatibilitu s ISO. Již tvůrci normy
ISO 19115 deklarují kompatibilitu s DC. Kompatibilita je možná převodem komplexních
položek ISO 19115 do Dublin Core. Vzhledem k nižší úrovni strukturovanosti DC se
s převodem v opačném směru příliš nepočítá. Tabulka nám ukazuje možnost vzájemného
mapovaní jednotlivých položek těchto norem (viz tab. 4).
Tab. 4: Příklad mapování položek ISO 19115 na DC
 Dublin Core                        ISO 19115
 DC.Title                           MD_DataIdentification/citation/title
 DC.Title.Alternative               MD_DataIdentification/citation/alternateTitle
 DC.Creator.PersonalName            MD_DataIdentification/citation/citedResponsibleParty/individu-
                                    alName
 DC.Creator.PersonalName.Address    MD_DataIdentification/citation/citedResponsibleParty/con-
                                    tactInfo/address
 DC.Subject.Keywords                MD_DataIdentification/descriptiveKeywords
 DC.Description                     MD_DataIdentification/abstract
 DC.Publisher                       MD_DataIdentification/citation/citedResponsibleParty/organi-
                                    sationName
 DC.Date                            MD_DataIdentification/citation/date/date
 DC.Type                            Dáno kontextem = „Data.Spatial“
 DC.Format                          MD_dataIndentification/resourceFormat
 DC.Identifier                       fileIdentifier
 DC.Source                          dataSet
 DC.Language” SCHEME=”ISO639-1”     language/isoCode
 CONTENT=”cz”>
 DC.Relation” CONTENT=”5468”>       parentIdentifier, další vazby v různých částech normy
 DC.Coverage                        MD_DataIdentification/extent
 DC.Rights                          MD_DataIdentification/citation + MD_DataIdentification/re-
                                    sourceConstraints

       Komunitní profily:
         Standard        ISO        je
rozšiřitelný. Jeho součástí je postup
pro rozšiřování (extensions) a
komunitní profily. Profil musí
vždy obsahovat CORE položky
(jádro) a použít další standardně
definované položky pro účely profilu
(viz obr. 3). Teprve nenajde-li se
odpovídající položka, je možno
vytvářet        jednotlivá rozšíření.
Vytváření profilů je popsáno
v normě ISO 19106.                     Obr. 3: Vytváření komunitního profilu


                                          33
Identifikátory:
       Jednoznačný identifikátor metadatového záznamu je možno volitelně zadat
v elementu FileIdentifier. Obsahem může být libovolný řetězec. Identifikátor dat (a dalších
entit) je možno zadat volitelně v elementu <citation>. Pomocí těchto identifikátorů se
mohou jednotlivé části metadat na sebe odkazovat (např. v elementu parentIdentifier).
Kromě toho je v normě definován typ MD_IdentifierType (obrázek), který je používán
v MD_Citation, MD_AggregateInformation apod… Řetězcový kód je zde doplněn
informací o zodpovědné autoritě (citací) (viz obr.4).




                             Obr. 4: Struktura MD_IdetifierType

      Norma dále neřeší způsob vedení a tvar unikátních identifikátorů. Vzhledem
k očekávané výměně dat v rámci národní či nadnárodní prostorové infrastruktury je velice
důležité stanovit takové identifikátory, které budou jednoznačné i v takovémto kontextu.
Tento problém se řeší v některých systémech přidělením počítačem vygenerovaného
náhodného řetězce, který je s vysokou pravděpodobností neopakovatelný.
      Doporučováno je spíše použití způsobu známého k označování tříd v jazyce Java
nebo jmenných prostorů v XML schématech, tedy řetězce odpovídajícího URL dané
organizace a další části odpovídající identifikaci v rámci této organizace.
      Popis struktury dat:
       Podrobný popis datového modelu vlastních dat je velice důležitý pro jejich
praktické využití. Zatímco norma ISO 19115 umožňuje podrobný popis obsahu rastrových
dat, vlastní popis struktury vektorových dat zde není řešen (narozdíl od FGDC apod.).
K popisu datového modelu mají sloužit normy ISO 19109 – „Rules for application schema“
a 19110 – „Feature catalog“.
      K odkazu na Feature katalog slouží element MD_FeatureCatalogueDescription,
v němž je možnost katalog citovat pomocí třídy CI_CitationType. Tato citace je spíše
popisného charakteru a nemá předpoklady pro automatické zpracování (jednoznačná
vazba např. pomocí URI apod.)
      Aplikační schéma je možno zařadit do metadatového záznamu pomocí elementu
ApplicationSchemaInfo, kde se předpokládá vložení modelu v binárním tvaru tak, jak byl
pořízen v některém modelovacím nástroji (UML), a grafické reprezentace tohoto modelu.
Vlastní formát těchto dat je ponechán na uživateli. Interoperabilita v tomto případě není
opět příliš zaručena.
      Z General Feature Modelu (GFM) vyplývá opačná možnost – přiřadit metadata jako
jeden z atributů objektů na různých úrovních aplikačního schématu, a to jak třídám prvků
                                          34
(features) a atributů, tak jejich jednotlivým instancím. V praxi je také očekáván přístup od
datového modelu směrem k metadatům, nikoli obráceně.
      I když ve světě existuje řada příkladů použití metadat, autorům není známo řešení
problematiky popisu datového modelu v návaznosti na metadata. Je však jasné, že
k úplnému popisu datové sady potřebujeme popsat datový model (např. pomocí ISO 19190
nebo 19110).

1.2.2 ISO 19119 metadata
      Tato norma poskytuje normalizované zásady pro vývoj softwaru podporujícího
uvažované geografické služby, který uživatelům umožní zpřístupnění potřebných
geografických dat z rozmanitých zdrojů a jejich zpracování přes generické rozhraní
spojující jinak neslučitelné softwarové prostředky.
       V souvislosti s tím norma podrobně pojednává o architektuře geografických služeb
a analyzuje výpočetní, informační, inženýrský a technologický pohled na otevřené
distribuované zpracování dat. V jeho přílohách je ošetřena shoda geografických služeb s
touto normou, uvedeny jejich příklady, definován datový sborník metadat geografických
služeb a popsáno zobrazení do existujících platforem distribuovaného zpracování dat.
      Dle ISO 19119 jsou instance metadat kategorizovány podle následující taxonomie
•     Geografické služby pro interakci s uživatelem - Geographic human interaction
      service.
•     Geografické služby pro správu informací a modelů - Geographic model/information
      management services.
•     Geografické služby řídící návaznost úloh - Geographic workflow/task management
      services.
•     Geografické služby pro zpracování prostorových informací - Geographic processing
      services – spatial.
•     Geografické služby pro zpracování tematických informací - Geographic processing
      services – thematic.
•     Geografické služby pro zpracování časových informací - Geographic processing
      services – temporal.
•     Geografické služby pro zpracování metadat - Geographic processing services –
      metadata.
•     Geografické komunikační služby - Geographic communication services.
•     Správa geografických systémů - Geographic system management services.

1.2.3 Implementace
      Vlastní implementaci řeší standard ISO 19139. Jde o soubor XML schémat,
která slouží pro definování XML dokumentu s metadaty. Zde jsou provedena některá
zjednodušení, například všechny odkazy na externí zdroje jsou nahrazeny datovými typy.
Jsou zjednodušeny i některé datové typy a vypuštěny elementy popisující dokumentaci
služby (MD_ServiceIdentification). Norma je dosud ve stavu draft dokumentu, proto např.
ESRI dosud nepodporuje export metadat v tomto formátu.


                                          35
1.2.4 Kritická místa platforem spojená s integrací metadat
•     Standard je značně rozsáhlý, nesymetrický a nepřehledný (v řadě případů jsou
      zde zachyceny podrobnosti DS, v jiných chybí potřebné elementy). Je vidět, že šlo
      o konsensus široké komunity uživatelů vytvářený extenzivním způsobem.
•     Data jsou uspořádána tak, že některé typy (např. Citation nebo responsibleParty) se
      vyskytují na různých místech hierarchické struktury metadat v různých kontextech,
      jejichž význam se může překrývat. Interpretace takovéto struktury nemusí být
      jednoznačná a různými uživateli může být různě chápána a vyplňována.
•     Celý standard je spíše postaven na textovém způsobu práce s informací, tedy
      redundantní textové údaje není možné dekomponovat zpět do relační databáze.
      Předpokládá se opětovné zadávání např. organizace či adresy na různých místech
      v textovém tvaru. Výměna metadat mezi systémy bude patrně založena na tomto
      „textovém“ tvaru.
       Vlastní popis struktury dat není řešen v rámci standardu (narozdíl např. od FGDC
či aplikací ESRI). Předpokládá se datový model mimo tato metadata, ovšem není jasně
řečeno vzájemné provázání

1.3 Metadatové profily v rámci Evropy

       V rámci různých projektů vznikla celá řada metadatových profilů, které představují
víceméně podmnožinu položek standardu ISO 19115 (ESA, Evropská vodní směrnice
atd.). V rámci projektu INSPIRE vznikl draft metadatového profilu pro vyhledávání
a oceňování metadat. Tento profil je nezávislý na standardech, ovšem implementace počítá
s normou ISO 19115/19119/19139. Výhodou je, že profil je velice úzký (v podstatě málo
nad rámec jádra ISO. Obsahuje ovšem i elementy potřebné pro popis webových služeb,
nikoli pouze dat). V současné době navrhované projekty vycházejí z tohoto standardu
(např. eWater [9]).

1.4 Metadatové profily v ČR

        V ČR stále existuje řada aplikací používajících starý standard ISVS. Zavádění
norem ISO probíhá pomalu. Dosud nebyl stanoven národní profil metadat, spíše se počítá
s převzetím profilu INSPIRE. Vyplňování dalších položek nad rámec tohoto profilu bude
na potřebách jednotlivých uživatelů či komunit.
       Vzhledem k určitým národním potřebám však bude pravděpodobně muset vzniknout
několik rozšíření, případně návodů / kuchařek pro vyplňování metadat. Jednak pro kódování
českých znakových sad (používané windows-1250 není součástí předdefinovaného
číselníku ISO), jednak bude potřeba definovat použití prostorových identifikátorů, tezaurů
apod.
       V současné době jsou vytvářeny resortní profily Ministerstva životního prostředí
(MŽP) a Zeměměřického úřadu (ZÚ). Vycházejí z profilu INSPIRE a budou patrně
obsahovat další položky. Autoři systému Micka vytvořili stejnojmenný profil, který
vychází z profilu INSPIRE, z resortního profilu MŽP a je rozšířen o položky na základě
praktických potřeb jednotlivých uživatelů systému.
                                         36
2.    Tezaury
       Systémy pro vyhledávání a třídění informací v počítačovém prostředí procházejí
v posledních létech bouřlivým vývojem. Původně bylo vyhledávání počítačových informací
komplikovanou činností, která mohla být vykonávána pouze zaškolenými profesionály.
Postupně došlo v souvislosti s technologickým rozvojem k enormnímu nárůstu objemu
dostupných informací. Kromě nových zdrojů vytvářených přímo v digitálním prostředí
dochází i k digitalizaci původně jen papírových (analogových) zdrojů dat. S rozvojem
Internetu se nárůst objemu dostupných informací týká nejen databází obsahujících vědecké
texty, ale i běžných publikací jako jsou noviny, časopisy, krásná literatura i osobní zápisky
řady lidí ve formě webových stránek.
      Zvýšený objem dostupných dat výrazně zkomplikoval vyhledávání relevantních
informací, obzvláště pro běžné koncové uživatele. Objevuje se však řada přístupů, které
různým skupinám uživatelů poskytují různě strukturovaný přístup ke zdrojům dat. Jedním
z nejčastěji využívaných přístupů k této problematice jsou řízené slovníky (controlled
vocabularies), konkrétně pak především tezaury (česky též thesaury, angl. thesaurus, pl.
thesauri).
       Kontrolovaným slovníkem rozumíme seznam dohodnutých termínů převzatých
z běžného jazyka, u nichž je podchycena (kontrolována) gramatická forma (v cizojazyčných
kontrolovaných slovnících je navíc třeba sjednotit hláskování). V tezaurech jsou tyto
termíny navíc uspořádány v hierarchické struktuře, což přináší významné výhody při
vyhledávání informací (viz níže). Tezaury lze používat k indexování, ukládání, případně
vyhledávání záznamů. Mohou pracovat v kombinaci s řadou různých vyhledávacích
algoritmů a lze je využít ke zlepšení výsledků vyhledávání v různých typech záznamů (od
hledání v strukturovaných indexovaných databázích přes částečně strukturované sady dat
až po vyhledávání v heterogenních fulltextových dokumentech).
      Tezaury se mohou pro zvýšení své využitelnosti různým způsobem sdružovat do
multitezaurových systémů, např. do multitezaurových prostředí, přepínacích tezaurových
systémů, složených tezaurů apod.
      Tezaurus lze využít jak k vyhledávání, tak k indexování záznamů. Při indexování
jsou záznamy označovány pomocí řízených termínů. Při vyhledávání může uživatel buď
manuálně zadat všechny vyhledávané řetězce nebo zadá jeden termín a systém automaticky
zahrne všechna synonyma a gramatické tvary termínu.
      Jak již bylo zmíněno, jedním z hlavních rysů tezaurů je využití hierarchických
a relačních vazeb, konkrétně vztahů označovaných ekvivalence, hierarchie a asociace.
Ekvivalence je vztah mezi synonymy. Všechna synonyma mohou být rovnocenná, obvykle
je však jeden z termínů zvolen jako preferovaný termín (preferred term), další synonyma
jsou pak označena jako alternativy k danému termínu. Vyhledávání je pak pro koncového
uživatele usnadněno tím, že ke vstupu do tezauru může použít kterékoliv z daných
synonym. Vzácně jsou navíc definovány vztahy mezi pseudosynonymy (quasi-synonyms)
– mezi slovy, která mají podobný, ne však totožný význam.
     Hierarchie (na rozdíl od ekvivalence není symetrická) je v tezaurech vytvořena
vymezením vztahů mezi podřazenými pojmy (narrower term) – podtřídami (subclass)
                                           37
a nadřazenými pojmy (broader term) – nadtřídami (superclass). Nejčastěji se v tezaurech
používá pouze jeden typ této vazby, výjimečně lze definovat více typů hierarchické
vazby.
      Asociace (symetrický vztah) se používá k vytvoření vazby tehdy, pokud mezi
termíny existuje sémantický vztah, ale nelze jej označit pomocí ekvivalence ani hierarchie.
Pomocí asociace lze například spojit antonyma (slova s opačným významem) apod.
      V případě multilinguálních (vícejazyčných) tezaurů pak navíc do hry vstupuje další
vztah – mezijazyková ekvivalence. Ta je obvykle definována pouze mezi preferovanými
termíny.

2.1 Tvorba tezaurů
       Pokud pomineme možnost převzetí (a případné adaptace) již existujícího tezauru
(která bývá obvykle nerealizovatelná, protože drtivá většina tezaurů je vytvářena pro
specifickou databázi nebo sadu záznamů, což prakticky vylučuje jejich přenos a použití
v jiném než původním systému), je v případě potřeby nutno přikročit k vytvoření vlastního
tezauru.
       Vytvářením tezaurů se zabývá několik mezinárodních standardů. Mezinárodní
standard ISO 2788 a americký národní standard ANSI/NISO Z39.19 obsahují doporučení
pro budování monolinguálních tezaurů, standard ISO 5964 pak pokrývá oblast budování
multilinguálních tezaurů.
      Lze vymezit dva základní přístupy ke tvorbě tezaurů (v praxi se obvykle aplikují
oba přístupy společně):
•     Postup shora dolů (top-down method):
      ·      je sestavena skupina expertů, která rozhodne o rozsahu a přibližném okruhu
             termínům které budou do tezauru zahrnuty,
      ·      s využitím případných stávajících slovníků a/nebo tezaurů se rozhodne o
             vztazích vybraných termínů,
      ·      upřesní se okruh termínů vybraný dříve, zvolí se preferované termíny; stanoví
             se ekvivalence mezi preferovanými termíny a jejich alternativami; stanoví se
             hierarchie a asociace mezi preferovanými termíny,
      ·      vytvoří se předběžná verze tezauru, následuje testování a úpravy.
•     Postup zdola nahoru (bottom-up method)
      ·      sestaví se skupina expertů sloužících jako poradci,
      ·      vybere se sada již indexovaných dokumentů (pokud existují)
             a indexové termíny z této sady se použijí jako předběžný seznam termínů,
      ·      pokud nejsou k dispozici indexované dokumenty, vezme se sada dokumentů
             používajících přirozený (tj. neřízený) jazyk a postupuje se analogicky,
      ·      tezaurus se začne budovat na základě takto získané předběžné sady termínů:
             ve spolupráci s experty a dalšími zdroji informací se upřesní význam všech
             termínů, stanoví se vztahy mezi termíny,
      ·      vytvoří se předběžná verze tezauru, následuje testování a úpravy.



                                          38
2.2 Integrace tezaurů

      Integrace tezaurů nabývá na významu se vzrůstajícím počtem existujících tezaurů.
Tento jev je podmíněn nutností pokrýt všechny vědy, případně vědní disciplíny u věd
komplikovanějších (jako např. fyzika či geografie). Řešením je tvorba několika tezaurů. Ty
se mohou v určitých termínech vzájemně překrývat, případně mohou mít shodné termíny
zpracované v rozdílné kvalitě (stejně tak jako v atlasech bývají mapy, jejichž obsah se
překrývá, ale měřítko je odlišné).
       Z předchozího odstavce vyplývá, že v těchto případech není možný přímý
automatický překlad dotazu z jednoho jazyka do jazyka jiného. I přesto lze vytvořit
multilinguální tezaurus. Za použití existujících slovníků může být využita existující
struktura pro překlad a rovněž pro kontrolu adekvátnosti daného překladu. Je třeba
zdůraznit, že pro multilinguální tezaury není třeba překlad samotných slov (což je účel
slovníků), ale klíčových frází.
       Moderní informační systémy, jako např. WWW a digitální knihovny, obsahují více
dat, než kdy předtím. Tyto systémy je snadné používat; mají globální rozložení. Proto
jsou dostupné velkému množství heterogenních skupin. Na straně druhé právě velké
množství heterogenní informace vytváří požadavek takového nástroje pro uživatele, který
by mu umožnil pracovat s (pro něj) významnou částí dat. Jedním z těchto nástrojů jsou
tezaury. Osvědčily se jako způsob jednotného a stálého slovníku pro indexaci a získávání
tzv. informačních objektů (information bearing objects, IBO). Moderní multilinguální
a mezioborová informace vyžaduje více než jen tradiční jednojazyčné úzce zaměřené
tezaury. Široké spektrum klientů informačních systémů požaduje tezaury, které mohou být
použity „nespecialisty“.
       Tezaury jsou dostupné pro různé oblasti zájmu se specifickou strukturou
a terminologií. Mnohdy však nejsou sjednoceny ani tezaury v rámci jednoho oboru
(zabývají se pouze specifickými oblastmi). V důsledku vzrůstu počtu informačních systémů
se zvyšuje poptávka po rozsáhlejších slovnících, které pokrývají širší oblasti informací
a současně jsou mnohem více selektivní. Jedním z řešení je použití sbírky tezaurů v souladu
se strukturou lidských znalostí. Tyto tezaury mohou být na sobě nezávislé nebo jsou ve
více či méně provázaném vztahu. V minulosti bylo mnoho tezaurů manuálně integrováno
do jednoho supertezauru. To je však nedostatečné pro vytvoření volněji spojených
informačních systémů, kde volné spojení (také tzv. federace) tezaurů je vhodnější
– umožňuje každému tezauru ponechat si svoji autonomii. Snaha o integraci tezaurů ve
federaci je nižší, než v jiných multi-tezaurových systémech. Důvodem je především fakt, že
po akceptování autonomie tezauru následuje akceptování určitých nekonzistencí. Federace
tezaurů nabízí nové způsoby indexování a vyhledávání. Proces indexování, stejně jako
vyhledávání v tezauru, těží z přístupu k různým (obecným a specializovaným) tezaurům,
které tvoří federaci tezaurů. Jeden či více tezaurů poskytují vstupní bod pro uživatele.
Automatické využití jiných tezaurů umožňuje uživatelům integraci obsahů jednotlivých
tezaurů okamžitě. Abychom se vyhnuli slovníku, který mate uživatele svojí obsáhlostí,
odlišujeme indexované tezaury od neindexovaných. Základní snahou je integrovat tezaury
při zachování jejich autonomie. Tento fakt je významný pro prostředí, jež podporuje platbu
za individuální používání tezauru. Federace tezaurů je zvláště užitečná pro indexování

                                          39
a vyhledávání ve velkých informačních systémech. Těmi jsou například informační
systémy obsahující data z několika informačních systémů nebo informační systémy
integrující distribuované autonomní informační zdroje.
      Příklady užitečnosti federace tezaurů jsou metainformace či katalogové systémy.
V posledních letech bylo sestaveno několik metadatových standardů a metainformačních
systémů. Klíčovými tématy pro poskytnutí jednotného vstupního bodu je interoperabilita
metainformačních systémů (která může existovat na regionální, národní a mezinárodní
úrovni) a k nim příslušející tezaury. Proto je jedním z účelů kostry federace tezaurů vyřešit
problém dotazování informačních objektů (IBO) indexovaných různými, potenciálně
se překrývajícími tezaury. Jiným příkladem v tomto směru jsou digitální knihovny,
jež obsahují široce distribuované informační objekty (jako např. textové dokumenty
v rozdílných jazycích). V podobném smyslu může být federace tezaurů použita jako nástroj
pro podporu vyhledávání mezi jazyky.

2.3 Způsoby integrace tezaurů

      V minulosti byly tezaury manuálně integrovány do jednoho velkého „supertezauru“.
Naproti tomuto způsobu řešení je pro technickou interoperabilitu distribuovaných
informačních systémů vhodnější volnější integrace (loosely integration), zvaná federace
(viz dále). Tento způsob integrace umožňuje zachovat autonomii zúčastněných tezaurů.
V posledních letech navíc integrace nabývá jiných možností, které jsou důsledkem nových
technologií – jako např. WWW (World Wide Web), CORBA (Common Object Request
Broker Architecture) či programovacího jazyka Java.
      Tezaury je možné integrovat třemi hlavními způsoby: federace (federation),
sjednocení (unions) a spojení (couplings).
•     Federace je kombinace několika tezaurů při zachování jejich autonomie. Tezaury
      zapojené do federace mohou být uchovávány v rozdílných databázích a spravovány
      nezávisle na ostatních. Federace se skládá ze všech termínů a vztahů „členských“
      tezaurů. Navíc obsahují informace o vztazích mezi termíny z různých tezaurů.
      Koncepty, které existují ve více než jednom tezauru, jsou kombinovány do jednoho
      federativního konceptu. Mohou být přidány jiné vztahy (jako např. hierarchické),
      aby bylo zajištěno vhodnější odkazování mezi jednotlivými slovníky.
      ·      Tato jednoduchá forma integrace tezaurů může vést k nekonzistencím, které
             mohou být odstraněny pouze vyjmutím některých termínů či vztahů z jednoho
             či více tezaurů. Akceptování těchto nekonzistencí je cenou za zachování
             autonomie každého z integrovaných tezaurů. Jinými slovy můžeme říci, že
             federace tezaurů není sama o sobě konzistentním tezaurem. Tato nevýhoda je
             vyvážena snadností tvorby federace, zachováním autonomie integrovaných
             tezaurů a užitečností v řadě aplikací – i přes určitou nekonzistenci.
•     Sjednocení je (oproti federaci) považováno za krok dále při integraci tezaurů.
      Integrovaný slovník prošel revizí, aby byla odstraněna nekonzistence. Výsledkem
      je nový korektní tezaurus. Sjednocení tezaurů může tvořit základ nového tezauru,
      který bude (po dokončení) nezávisle zlepšovat své zdrojové tezaury. Hlavní aplikací
      u sjednocení je tvorba metatezaurů. Metatezaurus by se neměl vytvářet nezávisle

                                           40
na zdrojových tezaurech. Na straně druhé je třeba, aby byl jednou za čas znovu
      sestaven kvůli adaptaci na provedené změny. Praktickým příkladem metatezauru je
      „Meta“, který vznikl sjednocením několika lékařských tezaurů [152].
•     Spojení je zvláštním případem integrace mikrotezaurů (tj. tezaurů se
      specializovanými slovníky; nazývané také jako subtezaury) s více obecnými
      makrotezaury. Mikro- a makrotezaury se musí vzájemně přizpůsobit. Příkladem je
      European Educational Thesaurus [155].

2.4 Metadata a tezaurus

      Síťové systémy pro organizaci znalostí obvykle obsahují objekty různých typů. Tyto
objekty jsou popsány za použití velkého množství odlišných metadatových schémat. Z toho
důvodu je vytvořen stroj, který rozumí metadatovým popisům odpovídajícím schématům
různých oborů. Existují především tyto tři základní scénáře, podle kterých je požadována
interoperabilita mezi metadatovými popisy:
•     Umožnit jednoduché vyhledávací rozhraní napříč heterogenními metadatovými
      popisy.
•     Umožnit integraci či spojení metadatových popisů, které jsou založeny na
      doplňujících, avšak potenciálně se překrývajících metadatových schématech nebo
      standardech.
•     Umožnit rozdílné pohledy základních a kompletních metadatových popisů
      závisejících na zájmu, úhlu pohledu a požadavcích uživatelů.
       Metadatové popisy z rozdílných oborů nejsou sémanticky odlišné, nýbrž se vzájemně
překrývají a komplexním způsobem jsou příbuzné mezi sebou. Dosažení interoperability
mezi takovými metadatovými popisy je manuální tvorbou užitečné; manuální přiřazení
jeden k jednomu ale nevyhovuje mnoha existujícím metadatovým slovníkům. Výhodnějším
přístupem je využití faktu, že mnoho entit a vztahů se vyskytuje napříč všemi oblastmi
zájmu (např. lidé, místa, organizace, události, atd.).
      Přístupem k heterogenním datovým zdrojům v síťové struktuře vznikly nové
problémy v oblastech zajištění terminologie a interoperability. Jsou zapotřebí řešení ke
zlepšení fulltextových vyhledávání a průvodce návrhem schémat kontrolovaných termínů
pro užití ve strukturovaných datech, včetně metadat.
      Tezaury jsou vytvářeny v odlišných jazycích, s rozdílným účelem, úhlem pohledu
a na rozdílných úrovních abstrakce a detailu pro společný přístup ke specifickým sadám
sbírek informací. Proto je při integraci kladen důraz také na metadata. Ta mohou být
zpracována podle dvou základních norem:
•     Dublin Core je obecným standardem pro metadata, který může být použit při popisu
      dokumentů pro jejich hledání.
•     ISO 19115 představuje normu, která je současně přijata za ČSN. Rozsah aplikačních
      oblastí je v porovnání s Dublin Core širší.




                                        41
2.5 Prostorové tezaury

       Prostorové tezaury začaly vznikat ve Velké Británii v 19. století jako výčet
geografických názvů tehdy známého světa s cílem dokumentovat rostoucí anglický vliv.
Na tuto tradici se opět začalo navazovat na počátku 90. let 20. století, kdy začal vznikat
web v takové podobě, jak jej známe dnes. Tehdy vyhledávače buď neexistovaly nebo
neposkytovaly dostatečně relevantní výsledky. Hlavní úlohu při hledání požadovaných
dat či informací tak hrály internetové portály, tj. webové servery, které slouží jako brána
do světa internetu. Typicky obsahovaly katalog odkazů, díky kterému plnily funkci
internetových rozcestníků. Teprve v pozdější době (druhá polovina 90. let) se začaly
vytvářet vyhledávače v podobě, jakou známe dodnes.
       Pro oblast geografie jsou však tyto vyhledávače nedostačující, ve většině případů
obsahují podporu tzv. fulltextového vyhledávání, které je pouze jednou z částí geografického
vyhledávání. Proto bylo třeba obohatit „klasické“ vyhledávače o možnost jiných forem
vyhledávání. I tato snaha se postupem času ukázala jako nedostatečná, začíná proto tvorba
prostorových tezaurů, ve webovém podání někdy označovaných jako gazetteer – podle
Wikipedie definovaný jako geografický adresář dodávající důležité reference k vybranému
místu (místům), často v kombinaci s atlasem.
       Formální definice tezaurů jsou uvedeny v mezinárodních i amerických standardech.
Jednak jde o ANSI/NISO Z39.19 stanovující pravidla pro tvorbu, formátování a správu
jednojazyčného tezauru. O stupeň výše jsou pak standardizační snahy Technické komise
46 Mezinárodní organizace pro standardizaci (ISO), která vytvořila dvojici standardů
– ISO 2788 (pro monolingvální standardy; tj. odpovídající Z39.19) a ISO 5964 (pro
multilingvální standardy).
       Podle výše uvedených standardů můžeme prostorové tezaury chápat jako sadu
organizovaných geografických názvů a sadu standardizovaných recipročních vztahů
mezi těmito názvy. Název je pak v tomto významu slovo nebo fráze reprezentující
konceptuální kategorii. Vztahy mezi těmito pojmy jsou významné při vyhledávání
– kromě nadřazených a podřazených pojmů (jako např. kraj a okres v administrativní
hierarchii) – rozlišujeme také synonyma. Jinými slovy řečeno, pokud uživatel vyhledává
řeky, v běžném vyhledávači nenalezne výsledek, zatímco prostorový tezaurus jej navede
např. na databázi označenou vodní toky. Prostorové tezaury řeší sémantickou heterogenitu
mezi datovými zdroji, protože pomáhají rozvíjet popis pokrytý metadaty o hierarchickou
strukturu pojmů a synonyma velmi podobného významu. Nicméně je třeba dodat, že počet
slov obsažených v tezaurech je i tak omezen. Největší šance na získání požadovaných dat
jsou proto v té chvíli, kdy uživateli oznámíme, jaký prostorový tezaurus (tj. jaký konkrétní
výčet klíčových slov) je při popisu používán.
       Z výše uvedených přístupů je patrné, že ideální popis tematického a prostorového
obsahu geografických dat si vyžaduje nejen metadata, ale také prostorový tezaurus. S tímto
přístupem počítají současné standardizační snahy v oblasti metadat – tj. standard CSDGM
(častěji v literatuře označovaný jako FGDC) a norma ISO 19115. U obou je možné
doplňovat klíčová slova konzistentním způsobem z formálně registrovaného tezauru.
Klíčová slova lze do metadat zadat také v libovolné podobě, čímž se však snižuje snadnost
nalezení potřebné informace. Kromě toho odebíráme jeden ze stavebních kamenů moderní
infrastruktury prostorových dat.
                                          42
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti
Geografická data v informační společnosti

More Related Content

Similar to Geografická data v informační společnosti

Workshop invite - Big GI Data and Open GI Software
Workshop invite - Big GI Data and Open GI SoftwareWorkshop invite - Big GI Data and Open GI Software
Workshop invite - Big GI Data and Open GI Softwareplan4all
 
Workshop Lávka
Workshop LávkaWorkshop Lávka
Workshop Lávkaplan4all
 
Závěrečný úkol KPI
Závěrečný úkol KPIZávěrečný úkol KPI
Závěrečný úkol KPIgaucana
 
Integrální taktový grafikon v ČR 2012
Integrální taktový grafikon v ČR 2012Integrální taktový grafikon v ČR 2012
Integrální taktový grafikon v ČR 2012Zdeněk Michl
 
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatikyGeokomunita
 
Online služba Georeferencer / Vyhledávání pomocí MapRank
Online služba Georeferencer / Vyhledávání pomocí MapRankOnline služba Georeferencer / Vyhledávání pomocí MapRank
Online služba Georeferencer / Vyhledávání pomocí MapRankPetr Pridal
 
J.Peterka: Otevřená data v projektu NetMetr
J.Peterka:  Otevřená data v projektu NetMetrJ.Peterka:  Otevřená data v projektu NetMetr
J.Peterka: Otevřená data v projektu NetMetrCTU_cz
 
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat final
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat finalIndikátory pro územní plánování nejen v turistice na bázi otevřených dat final
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat finalWirelessInfo
 
KGE/GIS: přednáška 1 - úvod do problematiky
KGE/GIS: přednáška 1 - úvod do problematikyKGE/GIS: přednáška 1 - úvod do problematiky
KGE/GIS: přednáška 1 - úvod do problematikyJiří Šmída
 
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)Petr Koubský
 

Similar to Geografická data v informační společnosti (16)

Fossgis inspire
Fossgis inspireFossgis inspire
Fossgis inspire
 
Workshop invite - Big GI Data and Open GI Software
Workshop invite - Big GI Data and Open GI SoftwareWorkshop invite - Big GI Data and Open GI Software
Workshop invite - Big GI Data and Open GI Software
 
Workshop Lávka
Workshop LávkaWorkshop Lávka
Workshop Lávka
 
Závěrečný úkol KPI
Závěrečný úkol KPIZávěrečný úkol KPI
Závěrečný úkol KPI
 
ICTU
ICTUICTU
ICTU
 
Integrální taktový grafikon v ČR 2012
Integrální taktový grafikon v ČR 2012Integrální taktový grafikon v ČR 2012
Integrální taktový grafikon v ČR 2012
 
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky
2. cirkulář GIS Ostrava 2012: Současné výzvy geoinformatiky
 
Online služba Georeferencer / Vyhledávání pomocí MapRank
Online služba Georeferencer / Vyhledávání pomocí MapRankOnline služba Georeferencer / Vyhledávání pomocí MapRank
Online služba Georeferencer / Vyhledávání pomocí MapRank
 
J.Peterka: Otevřená data v projektu NetMetr
J.Peterka:  Otevřená data v projektu NetMetrJ.Peterka:  Otevřená data v projektu NetMetr
J.Peterka: Otevřená data v projektu NetMetr
 
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat final
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat finalIndikátory pro územní plánování nejen v turistice na bázi otevřených dat final
Indikátory pro územní plánování nejen v turistice na bázi otevřených dat final
 
Bod2007 Schwarz
Bod2007 SchwarzBod2007 Schwarz
Bod2007 Schwarz
 
KGE/GIS: přednáška 1 - úvod do problematiky
KGE/GIS: přednáška 1 - úvod do problematikyKGE/GIS: přednáška 1 - úvod do problematiky
KGE/GIS: přednáška 1 - úvod do problematiky
 
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)
Digitální technologie: celkový pohled (VŠE Praha, 4IT461, letní semestr 2016)
 
4 gnss 2011
4 gnss 20114 gnss 2011
4 gnss 2011
 
Ndk mu
Ndk muNdk mu
Ndk mu
 
Geomatika
GeomatikaGeomatika
Geomatika
 

More from Karel Charvat

Foodie Geoss aip 8 presentation new
Foodie Geoss aip 8 presentation newFoodie Geoss aip 8 presentation new
Foodie Geoss aip 8 presentation newKarel Charvat
 
ISAF 2015 Farmtelemetry
ISAF 2015 FarmtelemetryISAF 2015 Farmtelemetry
ISAF 2015 FarmtelemetryKarel Charvat
 
Envirofi FOODIE Data model
Envirofi FOODIE Data modelEnvirofi FOODIE Data model
Envirofi FOODIE Data modelKarel Charvat
 
Ict for a sustainable agriculture – public support needs
Ict for a sustainable agriculture – public support needsIct for a sustainable agriculture – public support needs
Ict for a sustainable agriculture – public support needsKarel Charvat
 
Aplication of remote sensing in Foodie
Aplication of remote sensing in FoodieAplication of remote sensing in Foodie
Aplication of remote sensing in FoodieKarel Charvat
 
Plan4 business vison for suistenable future final
Plan4 business   vison for suistenable future finalPlan4 business   vison for suistenable future final
Plan4 business vison for suistenable future finalKarel Charvat
 
The habitats approach to build the inspire infrastructure
The habitats approach to build the inspire infrastructureThe habitats approach to build the inspire infrastructure
The habitats approach to build the inspire infrastructureKarel Charvat
 
Plan4business technical solution
Plan4business technical solutionPlan4business technical solution
Plan4business technical solutionKarel Charvat
 
Smart opendata ISESS 2013
Smart opendata ISESS 2013Smart opendata ISESS 2013
Smart opendata ISESS 2013Karel Charvat
 
Statement club of ossiach
Statement club of ossiachStatement club of ossiach
Statement club of ossiachKarel Charvat
 
Inspire in pocket dresden 2
Inspire in  pocket dresden 2Inspire in  pocket dresden 2
Inspire in pocket dresden 2Karel Charvat
 
Gi2013 presentation mildorf+team_plan4_business_dresden
Gi2013 presentation mildorf+team_plan4_business_dresdenGi2013 presentation mildorf+team_plan4_business_dresden
Gi2013 presentation mildorf+team_plan4_business_dresdenKarel Charvat
 
Gi2013 vohnout&team-enviro grids
Gi2013 vohnout&team-enviro gridsGi2013 vohnout&team-enviro grids
Gi2013 vohnout&team-enviro gridsKarel Charvat
 
Gi2013 presentation mildorf+team_pprd_erra
Gi2013 presentation mildorf+team_pprd_erraGi2013 presentation mildorf+team_pprd_erra
Gi2013 presentation mildorf+team_pprd_erraKarel Charvat
 

More from Karel Charvat (20)

Process Model
Process ModelProcess Model
Process Model
 
Foodie Geoss aip 8 presentation new
Foodie Geoss aip 8 presentation newFoodie Geoss aip 8 presentation new
Foodie Geoss aip 8 presentation new
 
ISAF 2015 Farmtelemetry
ISAF 2015 FarmtelemetryISAF 2015 Farmtelemetry
ISAF 2015 Farmtelemetry
 
Envirofi FOODIE Data model
Envirofi FOODIE Data modelEnvirofi FOODIE Data model
Envirofi FOODIE Data model
 
Pomodore@1
Pomodore@1Pomodore@1
Pomodore@1
 
Hive OS
Hive OSHive OS
Hive OS
 
Ict for a sustainable agriculture – public support needs
Ict for a sustainable agriculture – public support needsIct for a sustainable agriculture – public support needs
Ict for a sustainable agriculture – public support needs
 
Aplication of remote sensing in Foodie
Aplication of remote sensing in FoodieAplication of remote sensing in Foodie
Aplication of remote sensing in Foodie
 
Plan4 business vison for suistenable future final
Plan4 business   vison for suistenable future finalPlan4 business   vison for suistenable future final
Plan4 business vison for suistenable future final
 
Centralab workshop
Centralab workshopCentralab workshop
Centralab workshop
 
The habitats approach to build the inspire infrastructure
The habitats approach to build the inspire infrastructureThe habitats approach to build the inspire infrastructure
The habitats approach to build the inspire infrastructure
 
Plan4business technical solution
Plan4business technical solutionPlan4business technical solution
Plan4business technical solution
 
Smart opendata ISESS 2013
Smart opendata ISESS 2013Smart opendata ISESS 2013
Smart opendata ISESS 2013
 
Statement club of ossiach
Statement club of ossiachStatement club of ossiach
Statement club of ossiach
 
Inspire in pocket dresden 2
Inspire in  pocket dresden 2Inspire in  pocket dresden 2
Inspire in pocket dresden 2
 
Agrixchange dresden
Agrixchange dresdenAgrixchange dresden
Agrixchange dresden
 
Gi2013 presentation mildorf+team_plan4_business_dresden
Gi2013 presentation mildorf+team_plan4_business_dresdenGi2013 presentation mildorf+team_plan4_business_dresden
Gi2013 presentation mildorf+team_plan4_business_dresden
 
Gi2013 vohnout&team-enviro grids
Gi2013 vohnout&team-enviro gridsGi2013 vohnout&team-enviro grids
Gi2013 vohnout&team-enviro grids
 
Apps4 europe 2
Apps4 europe 2Apps4 europe 2
Apps4 europe 2
 
Gi2013 presentation mildorf+team_pprd_erra
Gi2013 presentation mildorf+team_pprd_erraGi2013 presentation mildorf+team_pprd_erra
Gi2013 presentation mildorf+team_pprd_erra
 

Geografická data v informační společnosti

  • 1.
  • 2. Výzkumný ústav geodetický, topografický a kartografický, v.v.i. Geografický ústav, Přírodovědecká fakulta Masarykovy univerzity Lesprojekt Služby, s.r.o. Ročník 53 Publikace č. 43 Geografická data v informační společnosti Karel Charvát Milan Kocáb Milan Konečný Petr Kubíček Zdiby 2007
  • 3. Recenzenti: Prof. RNDr. Jiří Hřebíček, CSc., Masarykova univerzita v Brně Prof. Ing. Bohuslav Veverka, DrSc., Fakulta stavební ČVUT v Praze ISBN 978-80-85881-28-8
  • 4. AKADEMIE VĚD ČESKÉ REPUBLIKY Tato publikace byla vydaná na základě výsledků řešení projektů Akademie věd České republiky „Informační společnost“ tematického programu „ II. Národní program výzkumu – TP2“ (2004 – 2007): • Management geografických informací a znalostí (Reg.č.T206030407) Cílem projektu bylo vytvoření uceleného systému managementu geografických informací a znalostí a jejich uplatnění v praktických aplikacích. Řešitel: Ing. Milan Kocáb, MBA Spoluřešitelé: Ing. Stanislav Holý, Doc. RNDr. Milan Konečný, CSc. • Mobilní sběr prostorových dat pro mapovaní v reálném čase (Reg.č. T101630421) Cílem řešeného projektu bylo vytvořit základní infrastrukturu pro on-line vkládání prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení. Řešitel: Doc. RNDr. Milan Konečný, CSc. Spoluřešitelé: Ing. Milan Kocáb, MBA, Ing. Jiří Krejza • Navigační a logistické systémy (Reg.č.T109890411) Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému. Řešitel: Ing. Zbyněk Křivánek Spoluřešitelé: Ing. Jaroslav Jansa, Ing. Milan Kocáb, MBA • Systém přenosu dokumentačních dat pro aktualizaci informačního systému státní správy zeměměřictví a katastru (Reg.č.1ET206030506) Cílem projektu byl rozvoj informačních technologií ve sféře tvorby aktualizačních souborů pro státní správu zeměměřictví a katastru. Řešitel: Ing. Milan Kocáb, MBA Spoluřešitelé: Ing. Stanislav Holý, Ing. Pavel Kosta
  • 5.
  • 6. KOLEKTIV AUTORŮ: Lesprojekt Služby, s.r.o., Kostelec nad Labem: RNDr. Karel Charvát Výzkumný ústav geodetický, topografický a kartografický, v.v.i., Zdiby: Ing. Milan Kocáb, MBA Geografický ústav, Přírodovědecká fakulta Masarykovy univerzity v Brně: Doc. RNDr. Milan Konečný, CSc. Geografický ústav, Přírodovědecká fakulta Masarykovy univerzity v Brně: RNDr. Petr Kubíček, CSc. Seznam pracovníků, kteří se dále podíleli na zpracování publikace: Brázdilová J. (MU Brno), Cajthaml T. (VÚGTK), Čepický J. (HSRS), Drbal A. (VÚGTK), Dutka M. (VÚGTK), Dvořák P. (Wirelessinfo), Friedmannová L. (MU Brno), Gnip P. (Wirelessinfo), Holý S. (HSRS), Horák P. (HelpForest), Ježek J. (HSRS), Kafka Š. (HSRS), Karavdić J. (VÚGTK), Kosta P. (GESKO), Krejza J. (LESP), Křivánek Z. (LESP), Musil M. (Wirelessinfo), Řezník T. (MU Brno), Stachoň Z. (MU Brno), Staněk K. (MU Brno), Střelková J. (VÚGTK), Talhofer V. (MU Brno), Tryhubová P. (VÚGTK), Valdová I. (VÚGTK, ČÚZK), Vaniš P. (VÚGTK), Vlk M. (Wirelessinfo), Zaoralová J. (VÚGTK), Zbořil J. (MU Brno) Odborná redakce Petr Kubíček Technická redakce Alexandr Drbal, Václav Nejedlý, Filip Antoš, Jaroslava Matesová, Ivana Skulínková, Václava Skulínková, Štěpán Böhm, Helena Vovsová
  • 7.
  • 8. OBSAH Úvod 9 Použitá terminologie 13 Hlavní používané zkratky 15 ČÁST I SPRAVADAT Kapitola 1: SPRAVADAT 21 Kapitola 2: GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY V NÁRODNÍ GEOINFORMAČNÍ INFRASTRUKTUŘE 23 Kapitola 3: METADATA, TEZAURY A KATALOGOVÉ SLUŽBY 29 Kapitola 4: INTEROPERABILITA, DATOVÉ MODELY A GENERALIZACE DAT 49 Kapitola 5: ARCHITEKTURA PRO SDI A JEDNOTLIVÉ STANDARDY PRO JEJÍ PODPORU 63 Kapitola 6: SDÍLENÍ PROSTOROVÝCH DAT A SLUŽEB A MOŽNÉ OBCHODNÍ MODELY 69 Kapitola 7: VYBRANÁ PILOTNÍ ŘEŠENÍ PROJEKTU SPRAVADAT 85 ČÁST II MOBILDAT Kapitola 1: VYBRANÉ PROBLÉMY MOBILNÍHO SBĚRU GEODAT 99 Kapitola 2: HLAVNÍ ČINNOSTI PŘI VKLÁDÁNÍ GEODAT V MOBILNÍM PROSTŘEDÍ 105 Kapitola 3: VYUŽITÍ WEBOVÝCH SLUŽEB PRO MOBILNÍ SBĚR GEODAT 113 Kapitola 4: ARCHITEKTURA SYSTÉMU MOBILDAT 121 Kapitola 5: METADATOVÉ PROFILY V MOBILNÍM MAPOVÁNÍ 125 Kapitola 6: NÁČRTOVÝ SYSTÉM A JEHO VYUŽITÍ V MOBILNÍM MAPOVÁNÍ 131 Kapitola 7: TEMATICKÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI Z PILOTNÍHO PROJEKTU 141 Kapitola 8: VELKOMĚŘÍTKOVÉ MOBILNÍ MAPOVÁNÍ - ZKUŠENOSTI Z PILOTNÍHO PROJEKTU 149
  • 9. ČÁST III NAVLOG Kapitola 1: NAVLOG 157 Kapitola 2: METODIKA TESTOVÁNÍ INTEGROVANÉHO PŘIJÍMAČE GPS EGNOS 161 Kapitola 3: PŘEHLED SOUČASNÝCH METOD URČOVÁNÍ POLOHY 169 Kapitola 4: MOŽNOSTI MOBILNÍHO PŘENOSU DAT A VÝVOJ KOMUNIKAČNÍHO MODULU 177 Kapitola 5: JAK ŘEŠIT NAVIGAČNÍ A LOGISTICKÉ ÚLOHY NA ZÁKLADĚ STANDARDŮ OGC/SERVEROVÉ ŘEŠENÍ NAVIGAČNÍCH A LOGISTICKÝCH ÚLOH 189 Kapitola 6: IMPLEMENTACE KLIENTSKÝCH ŘEŠENÍ 203 ČÁST IV GEOPLAN Kapitola 1: GEODATA PRO AKTUALIZACI INFORMAČNÍHO SYSTÉMU ZEMĚMĚŘICTVÍ A KATASTRU 215 Kapitola 2: DATA GEOMETRICKÉHO PLÁNU OBSAŽENÁ VE VÝMĚNNÉM FORMÁTU 223 Kapitola 3: VYUŽITÍ PŘÍMÉHO PŘÍSTUPU KE GEODATŮM V ZEMĚMĚŘICTVÍ 229 Kapitola 4: KOMUNIKAČNÍ SÍTĚ VHODNÉ PRO ZEMĚMĚŘIČE 235 Kapitola 5: ÚLOHA NÁČRTŮ V NOVÉM MAPOVÁNÍ A PŘI TVORBĚ GEOMETRICKÝCH PLÁNŮ 245 Kapitola 6: ZPRACOVÁNÍ GEOMETRICKÝCH PLÁNŮ PROSTŘEDNICTVÍM WEBOVÉ APLIKACE 255 Doslov 269 Literatura 271
  • 10. ÚVOD Po až hvězdném a zejména úspěšném období zavádění geografických informačních systémů (GIS) do každodenního života se komunita specialistů, ale i laických uživatelů zabývajících se či využívajících geografickou (prostorovou informaci), vrátila jako by zpět, právě k ní. Zatímco v počátcích využití GIS se hodila veškerá data a informace, která byla v digitální formě k dispozici, a ne vždy byla kombinována a spojována oprávněně, v pozdějším období se jasně ukázalo, že geografická data bez standardů a metadatových služeb, bez zajištění harmonizace a interoperability nejsou to, co by nám pomáhalo nalézt pravdivou a správnou informaci pro naše řešení. Svět kolem nás také nezůstal stát a výrazně se změnil od doby, kdy kanadský vědec Roger Tomlinson přišel poprvé s teorií a praxí GIS. Postupně přicházely nové informační a komunikační technologie, nejprve malé počítače, posléze laptopy. Vzrůstala i nabídka nových podrobných zdrojů prostorových dat, které již nevznikaly pouhou digitalizací map, ale stále více přicházejí ze satelitů, digitálních fotogrammetrických snímků, radarů či skenerů umístěných na letadlech. Přenosu a využití dat napomohl i nárust paměťových datových medií a zejména nové, progresivně se rozvíjející možnosti internetu a Webu (obě média nebyla ještě ani počátkem 80.let v učebnicích GIS vůbec zmiňována). I díky internetu se objevují a stávají populárními mezi širokou veřejností nové typy vyhledávačů pracujících s geografickými daty, jakými je například Google. Ve všech těchto procesech hrají významnou úlohu GIS, čímž došlo k obrovskému navýšení potenciálu jejich využití. Technologie se nevyvíjejí ve vzduchoprázdnu a jejich úspěšnost je závislá také na tom, jak napomáhají řešení každodenních problémů. Svět se v minulých letech globalizoval, kdysi industriální společnost se v rozvinutých a ekonomicky silnějších zemích změnila na společnost informační s ambicemi směřujícími ke společnosti znalostní. A právě požadavek znalostní společnosti směřuje opět k datům a informacím, či na vyšší úrovni znalostem, které budeme pomocí nových technologií doručovat našim uživatelům, ať už v rámci e-governmentu, e-commerce, realizací projektů jako je Digitální Země, e-Europe, či dalších. Ve své památné prezidentské řeči na kongresu ICA v Barceloně v r. 1995 tehdejší prezident Mezinárodní kartografické asociace (ICA) Joel Morrison upozornil, že uplatnění geografických informací v tehdejší době záleželo na rozvoji geografického myšlení, které je výrazně pomalejší, než druhá složka procesu, rozvoj moderních technologií. V té době často docházelo k diskuzím, jak nejlépe využít rychle se rozvíjející technologie. Podíváme-li se několik let zpátky na projevy představitelů největších firem, skutečných leaderů v oblasti GI byznysu, jakými jsou americké globálně operující firmy Intergraph, ESRI či Bentley, zjistíme, že i v této oblasti se situace změnila. S prudkým rozvojem informační společnosti, zejména v ekonomicky rozvinutých zemích, vidíme, že řada nových požadavků společnosti si přímo vynucuje použití geografických informací. Elektronické vládnutí (e-government) nebo požadavky na kontrolu kvality životního prostředí, inteligentní dopravu, moderní zbrojní systémy atp., nelze bez prostorové složky uspokojivě řešit.
  • 11. Nejnovějším příkladem, který znamená výrazný obrat v přístupu k prostorovým datům, byla několikaletá diskuze o evropské iniciativě, později legislativní směrnici INSPIRE (Infrastructure for Spatial Information in Europe). Po dřívějších neúspěšných pokusech vybudovat geoinformační infrastrukturu v Evropě (GII resp. SDI) se v návaznosti na iniciativy přicházející z oblasti životního prostředí, zejména snahu pokrytí požadavků na neustálou informovanost o stavu životního prostředí pro evropské obyvatele kdykoliv a kdekoliv, se země Evropské unie sice obtížně, ale nakonec přece jenom dohodly na vybudování zmíněné informační infrastruktury. Ta by měla navazovat na již dříve uskutečněné kroky nejen v rámci Společenství, ale i v jednotlivých zemích. Jedním z klíčových předpokladů, jež jsou také diskutovány v této knize, je interoperabilita. Řada významných aktivit vychází z tzv. Evropského interoperabilního rámce. Evropský interoperabilní rámec (IDABC; Interoperable Delivery of European eGoverment Services to Public Administrations, Businesses and Citizens) představuje využití informačních a komunikačních technologií pro podporu přeshraničních služeb veřejného sektoru pro všechny občany a společnosti. Tato iniciativa by tak měla zajistit kvalitní elektronické služby veřejné správy pro všechny koncové uživatele. Konkrétně se jedná o zajištění konzistentních elektronických služeb v oblastech zemědělství, vzdělávání, zaměstnanosti, sociálních věcí, životního prostředí, statistik či výběrových řízení. Jedním ze základních kamenů implementačních projektů je zapojení Open Source software. Výsledkem aktivit budou certifikované služby IDABC v roce 2009. Vznik SDI, v našem případě INSPIRE, je předpokladem pro nový rozvoj vědeckých disciplín, například kartografie. V současnosti je prostřednictvím inteligentního přístupu do databází a interaktivní uživatelské podpory možné nejen nalézt vhodné mapy na Internetu, ale také je vytvářet a modifikovat podle specifických a individuálních požadavků. Namísto pouhého užití map, které byly někým vytvořeny předem, dovolují tyto nové výzkumné možnosti jednotlivcům využívat kartografii interaktivně, na základně přání individuálního uživatele, zkoumat a reprezentovat prostorové informace. Nové technologie umožňují “živé spojení” mezi instinktivní vnitřní sférou naší prostorové kognice prostřednictvím přímé interakce s novou generací kartografických vizualizací, a tím i s potenciálně nekonečnými zdroji na Internetu. Uvedené příklady dokumentují, že dochází k progresivnímu rozvoji sběru a dostupnosti geografických dat a informací. Ty jsou pomocí nových technologií zpracovávány a vizualizovány pro potřeby co nejširšího okruhu uživatelů. V souvislosti s tím je také potřeba zásadně řešit složitou problematiku zapojení geografických informací do širokého proudu informačních a komunikačních technologií a jejich aplikací a naopak, aplikovat vlivy rozvoje informační společnosti na celou oblast geografických informací. V tomto duchu byly formulovány a řešeny i projekty, jež jsou popisovány v předkládané knize. Všechny byly financovány Grantovou agenturou Akademie věd České republiky v rámci programu Informační společnost, tématického programu”II. Národní program výzkumu - TP2. Jde o následující: • Management geografických informací a znalostí (SPRAVADAT). Jeho cílem bylo vytvoření uceleného systému managementu geografických informací a znalostí a jejich uplatnění v praktických aplikacích. Jde o vyřešení tvorby, uložení a distribuci velkých datových souborů typu katastr nemovitostí, Státní mapa 1 : 5000, báze geografických dat apod.
  • 12. Mobilní sběr prostorových dat pro mapovaní v reálném čase (MOBILDAT). Cílem projektu bylo vytvořit základní infrastrukturu pro on-line vkládání prostorových dat zájmovými skupinami prostřednictvím mobilních zařízení. Řešitelé vytvořily serverovou služby, které bude tvořit rozhraní mezi distribuovaným GIS a mobilním zařízením uživatele. Služba také poskytuje možnost interaktivních korekcí vkládaných údajů přímo v terénu a výrazně usnadní a zrychlí proces aktualizace dat v GIS. • Navigační a logistické systémy (NAVLOG). Základním cílem projektu bylo vyvinutí modulárního logistického GIS systému, sloužícího pro potřeby českého aplikovaného a průmyslového výzkumu a pro výběr optimálních praktických řešení pro energetiku a dopravní telematiku. • Systém přenosu dokumentačních dat pro aktualizaci informačního systému státní správy zeměměřictví a katastru (GEOPLAN) Cílem projektu byl další rozvoj informačních technologií ve sféře tvorbyaktualizačních souborů pro státní správu zeměměřictví a katastru. Vyřešení podmínek přímé datové aktualizace souborů informačního systému katastru nemovitostí s využitím jak výměnných formátů dat, tak i nových webových technologií. Řada tezí a výstupů z výše uvedených projektů byla ověřována i v rámci výzkumného záměru MŠMT ČR, projekt MSM0021622418 s názvem „Dynamická geovizualizace v krizovém managementu“. Autoři knihy nemají ambici popsat podrobně všechny otázky související s řešenými projekty. Řada z nich je v široké vědecké komunitě otevřena a zatím nedořešena. Ambicí autorů je ale ukázat, na jaké úrovni vývoje je výzkum v České republice resp. v EU a ve světě v uvedených oblastech a tam, kde jsou nedořešené otázky, ukázat, jaké směry řešení v budoucnosti vidí. Vzhledem k omezenému rozsahu publikace byla pro potřeby čtenářů na adrese www.spravageodat.cz vytvořena doplňková informační stránka o výše zmíněných projektech, barevné verze obrázků a další důležité veřejné výstupy. MILAN KONEČNÝ
  • 13.
  • 14. POUŽITÁ TERMINOLOGIE Následující výčet obsahuje vysvětlení vybraných terminologických výrazů z publikace. Pro ucelenější přehled a vysvětlení odborných termínů v oblasti geoinformačních technologií odkazujeme na Terminologický slovník VÚGTK [160] a oborovou normu – překlad odpovídajících CEN norem. Ambiguita Neznámý počet celých vlnových délek nacházejících se mezi družicemi GPS a přijímačem, nejednoznačnost. Bezdrátové sítě Bezdrátový typ počítačové sítě, která jako přenosové médium používá elektro- magnetické rádiové vlny v pásmech řádu GHz (gigahertzů). Digitální náčrt Náčrt v digitálním vyjádření obsahu předmětů a šetření pro potřebu velkoměřítkového mapování a katastru. Gazeteer, prostorový tezaurus Seznam toponym seřazený dle abecedy nebo jinak, určující polohu a přednostně též variantní jména, typ objektu a další informace. Geodata 1: data s implicitním nebo explicitním vztahem k místu na Zemi 2: počítačově zpracovatelná forma informace týkající se jevů přímo nebo nepřímo přidružených k místu na Zemi 3: data identifikující geografickou polohu a charakteristiky přírodních a antropo- genních jevů a hranic mezi nimi. Geodetický systém Společný název pro souřadnicový, výškový a tíhový systém. Geometrický plán Je grafickou částí listin, podle nichž má být proveden zápis do katastru nemovi- tostí. Vyhotovuje se vždy na základě výsledků geodetických prací v terénu a obsahuje grafické zobrazení nemovitosti před změnou a po ní a další údaje podle stanovených požadavků. Geoprvek Modelový obraz lokalizovatelného objektu reálného světa, který je dále nedělitelný na jednotky stejné třídy a který zahrnuje lokalizaci. INSPIRE INfrastructure for SPatial InfoRmation in Europe je iniciativou Evropské komise. Stejnojmenná směrnice Evropské komise a Rady si klade za cíl vytvořit evropský legislativní rámec potřebný k vybudování evropské infrastruktury prostorových informací. Hlavním cílem INSPIRE je poskytnout větší množství kvalitních a standardizovaných prostorových informací pro vytváření a uplatňování politik Společenství na všech úrovních členských států. Integrace geodat Spojování a kombinace geodat z různých zdrojů, v poslední době především v kontextu s využitím webových XML služeb. Internetová síť Světová komunikační síť, umožňující připojeným počítačům komunikovat s ostatními veřejnými segmenty napojenými na tuto síť. Interoperabilita geodat 1: schopnost komunikovat, realizovat programy nebo přenášet data mezi různými funkčními jednotkami způsobem, který vyžaduje od uživatele malé nebo žádné znalosti o jednotlivých charakteristikách těchto jednotek 2: schopnost technického zařízení či softwaru od různých výrobců spolu úspěšně komunikovat a spolupracovat. Kálmanův filtr Filtr, který odhaduje stav pohyblivého systému ze série neúplných a rušených měření. Katastrální operát 1: souhrn měřického a písemného operátu pozemkového katastru 2: souborné označení pro dokumentační materiály potřebné pro vedení a obnovu katastru nemovitostí ČR (soubor geodetických informací katastru nemovitostí, soubor popisných informací katastru nemovitostí, souhrnné přehledy o půdním fondu z katastru nemovitostí, dokumentace výsledků šetření a měření pro vedení a obnovu souboru geodetických informací, sbírka listin). Metadata Data popisující a dokumentující data, data o datech.
  • 15. Místopisný náčrt Náčrt situace umístění bodu bodového pole vzhledem k okolním objektům, součást formuláře geodetických údajů. Mobilní klient Klientská část v architektuře klient-server, která je součástí přenosného zařízení (např. PDA, mobilního telefonu apod.). ON LINE přístup ke Zpřístupnění ke geodatům formou webových XML služeb nebo webových geodatům aplikací. Open Source Způsob distribuce programů, dat apod., která splňují jak otevřenost zdrojového kódu, tak umožnění jeho dalšího šíření a úprav. Pilotní studie Primární studie užitá pro ověření fungování systému. Případová studie Vzorové zpracování zadaného tematu. Scénář Podrobný technický popis postupu. Senzor Prvek nebo zařízení určené k měření fyzikální veličiny. Souřadnicový systém 1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku, referenčním bodu a užitém kartografickém zobrazení 2: sada matematických pravidel pro specifikování způsobu, jakým jsou souřadnice přiřazovány k bodům (ČSN ISO 19111). Standardizace geodat Soubor opatření zabezpečující jednotnou podobu geografických dat. Státní souřadnicový systém 1: systém, určený údaji o referenční ploše, orientaci sítě na ni, jejím měřítku, referenčním bodu a užitém kartografickém zobrazení 2: sada matematických pravidel pro specifikování způsobu, jakým jsou souřadnice přiřazovány k bodům (ČSN ISO 19111) 3: systém, určený pro specifické práce v určeném prostoru v rámci státu. Tablet Zařízení na převod obrazu do digitální formy ; skládá se z pevné podložky obsa- hující elektronické zařízení generující elektromagnetické pole a z pohyblivého snímacího zařízení v podobě pera nebo grafického kurzoru se záměrným křížem a lupou. Telematika Obor zaměřující se na určování polohy pohybujícího se objektu. Tenký klient Klientský software v architektuře sítě klient-server, jehož funkčnost je závislá na centrálním serveru. Tezaurus Hierarchicky uspořádaný terminologický slovník lexikálních jednotek obsahu- jící popisovače a vztahy mezi nimi. Tlustý klient Klientský software v architektuře sítě klient-server, který pracuje nezávisle na centrálním serveru. Obvykle poskytuje větší funkcionalitu než tenký klient. Triangulační list Plošná evidenční jednotka v bývalé československé trigonometrické síti. Výměnný formát geodat Kódový záznam dat, který se používá k přenosu mezi jednotlivými programy nebo zařízeními. Vzhled jevu Abstrakce jevů reálného světa, překlad termínu feature v ČSN ISO normách řady 19100, ekvivalent k pojmu geoprvek. Webové mapové služby Poskytování mapových výstupů prostřednictvím internetu bez nutnosti přenosu zdrojových souborů dat. Webové služby Systém umožňující součinnou spolupráci počítačů v síti. Poskytovatel služby nabízí prostřednictvím standardních rozhraní určitá data a služby. Klient najde adresu služby v registru webových služeb, načte si její popis a využívá ji.
  • 16. HLAVNÍ POUŽÍVANÉ ZKRATKY A-GPS Asistované GPS AGS Astronomicko-geodetická síť AJAX Asynchronous Javascript And XML ANSI American National Standards Institute AOA Angle Of Arrival AP Access Point AST position paper Architecture & Standards Position Paper AV ČR Akademie věd České republiky BBWA Broadband Wireless Access (bezdrátové metropolitní sítě) BIH Bureau International de I’Heure BPEJ Bonitní půdně ekologická jednotka Bpv Výškový systém baltský - po vyrovnání BSS Basic Service Set CAGI Česká asociace pro geoinformace CBCH Cell Broadcast Channel CDMA Code Division Multiple Access CLI Command Line Interface CORBA Common Object Request Broker Architecture CTRS Konvenční terestrický systém CQL Common Query Language CSMA/CA Carrier Sense Multiple Access With Collision Avoidance CSW Catalogue Services for the Web CZEPOS Česká permanentní síť pro určování polohy ČR Česká republika ČSJNS Československá jednotná nivelační síť ČSN České technické normy ČSÚ Český statistický úřad CSV Comma Separated Value(s) (importní/exportní formát do databáze) ČÚZK Český úřad zeměměřický a katastrální DBU Deutsche Bundesstiftung Umwelt DCMI Dublin Core Metadata Initiative DGN Design (formát výkresů v produktech firmy Bentley Systeme) DGPS Diferenční GPS DKM Digitální katastrální mapa DIKAT Systém pro tvorbu a vedení informačních systémů o území a automatizované vyhotovení geometrického plánu E-CGI Enhanced Cell Global Identity E-OTD Enhanced Observed Time Diference ebRIM Electronic Bussiness Registry Information Model EGM Earth Gravity Model EGNOS European Geostationary Navigation Overlay Service EPSG European Petroleum Survey Group
  • 17. ESS Extended Service Set ETRF European Terrestrial Reference Frame (Evropský terestrický referenční rámec) ETRS European Terrestrial Reference System (Evropský terestrický referenční systém) ETSI European Telecommunications Standards Institute EUREF European Reference Organisation for Quality Assured Breast Screening and Diagnostic Services EVRF European Vertical Reference System EXIF EXchangeable Image File Format FHSS Frequency Hopping Spread Spectrum FKP Flächenkorrekturparameter FTP File Transfer Protocol FSC Fujitsu-Siemens Computers FSÚ Federální statistický úřad GALILEO Evropský družicový navigační systém GDAL Geospatial Data Abstraction Library GDI Geographic Data Infrastructure GeoSl AČR Geografická služba Armády ČR GFM General Feature Model GII Geospatial Information Infrastructure GIS Geografický informační systém GLONASS GLObaľnaja NAvigacionnaja Sputnikovaja Sistěma (ruský družicový navigační systém) GML Geography Markup Language GNSS Global Navigation Satellite System GP Geometrický plán GPL General Public Licence (všeobecná veřejná licence) GPRS General Packet Radio Service GPS Global Positions System (americký družicový navigační systém) GRASS Geographic Resources Analysis Support System GSM Mobilní bezdrátové sítě (GPRS, UMTS) GUI Graphic User Interface IAPP Inter-Access Point Protocol IBO Information Bearing Objects ICAO International Civil Aviation Organisation IEEE Institute of Electrical and Electronical Engineers IERS International Earth Rotation Service (Mezinárodní služba rotace Země) IIM Information Interchanges Model IMO International Maritime Organisation INSPIRE INfrastructure for SPatial InfoRmation in Europe IPR Intellectual Property Rights IPTC International Press and Telecommunications Council IrDA Infrared Data Association IS Informační systém ISO International Organisation for Standardisation ISKN Informační systém katastru nemovitostí v ČR ISM Industry, Science, Medical
  • 18. ITRF International Terrestrial Reference System ETRS European Terrestrial Reference System (uživatelský geocentrický souřadnicový systém) ITU-T International Telecommunications Union - Telecommunications Standardization Sector KM-D Katastrální mapa v digitální formě KN Katastr nemovitosti LADGPS Local Area DGPS LAN Local Area Network (místní síť) LMU Location Measurement Unit MAC Media Access Protocol MetaIS Metainformační systém MLC Mobile Location Center MMC MultiMedia Computer MS Mobilní stanice MT Mobile Terminal N.N. Normal Null NAA Newspaper Association of America NATO North Atlantic Treaty Organisation (Organizace Severoatlantické smlouvy) NavLog Navigation Log NGII Národní geoinformační infrastruktura ČR NMEA National Marine Electronics Association NNSS Navy Navigation Satellite System (Námořní navigační družicový systém) NVF Nový výměnný formát KN OGC Open Geospatial Consortium PBPP Podrobné body polohového pole PC Výpočetní technika, komunikační technika PDA Personal Data Assistant PDOP Position Dilution of Precision PII Prostorová informační infrastruktura PKMP Prvky katastrální mapy POS Personal Operating Space PPP Public Private Partnership PROJ Cartographic Projections Library PRS Pseudoreferenční stanice PyWPS Python Web Processing Service QoS Quality of Service RDF Resource Description Framework RINEX Receiver Independent Exchange RTK Real Time Kinematic RETM Rastrové ekvivalenty topografických map S-42 Souřadnicový systém 1942 S-Gr95 Tíhový systém 1995 S-JTSK Státní souřadnicový systém jednotné trigonometrické sítě katastrální S-SK Souřadnicový systém stabilního katastru SDI Spatial Data Infrastructure
  • 19. SGI Soubor geodetických informací SGS Srovnávací grafický soubor SIG Special Industry Group SLD Styled Layer Descriptor SLR Satellite Laser Ranging SMLC Serving Mobile Location Center SMPS Simple Mobile Positioning System SPI Soubor popisných informací SQL Structured Query Language (strukturovaný dotazovací jazyk) SW Software SWOT Strengths, Weaknesses, Opportunities, Threats TDD Time-Division Duplex TS AČR Topografická služba Armády ČR UML Unified Modeling Language (grafický jazyk pro vizualizaci, specifikaci, navrhování a dokumentaci programových systémů) UMTS Universal Mobile Telecommunications System (Universální mobilní telekomunikační systém) UTM Universal Transversal Mercator VFK Výměnný formát katastru VGA Video Graphics Array (grafický adapter pro PC) VPN Virtual Private Network VÚGTK Výzkumný ústav geodetický, topografický a kartografický WADGPS Wide Area DGPS WCS Web Coverage Service WECA Wireless Ethernet Compatibility Aliance WEP Wired Equivalent Privacy WEP Wireless Encryption Protocol WFS Web Feature Service WGS 84 World Geodetic System 1984 (Světový geodetický systém 1984) WiFi Wireless Fidelity Wirelessinfo Virtuální výzkumné a inovační centrum se zaměřením na GIS WLAN Wireless Local Area Network WMC Web Map Context WMS Web Map Service WPAN Wireless Personal Area Network WPS Web Processing Service WWW World Wide Web XML eXtensible Markup Language (rozšiřitelný značkovací jazyk) XMP eXtensible Metadata Platform ZABAGED Základní báze geografických dat ZÚ Zeměměřický úřad ZHB Zhušťovací bod ZPH Zjišťování průběhu hranic ZPMZ Záznam podrobného měření změn
  • 21. 20
  • 22. Kapitola 1: SPRAVADAT MILAN KONEČNÝ, PETR KUBÍČEK, KAREL CHARVÁT 1. Úvod Cílem projektu SpravaDat - Management geografických informací a znalostí bylo napomoci rozvoji geoinformační infrastruktury (SDI) v ČR a přispět k řešení otázky komercializace prostorových (geografických) dat. Hlavním úkolem projektu SpravaDat bylo navrhnout a implementovat takové modely využívání prostorových dat, které umožní jejich co nejširší využití. Projekt výrazně napomohl analyzovat současnou situaci a vytvořit podmínky vedoucí k zavádění INSPIRE v ČR. Tým autorů se podílel i na formování národního stanoviska k některým dokumentům INSPIRE a jeho výsledky jsou dnes již přímo součástí postupně vytvářené Národní geoinformační infrastruktury (NSDI) pro implementaci INSPIRE. Projekt ale nebyl přímo svázán s praktickým zaváděním INSPIRE a jelikož se jednalo o projekt výzkumný, v některých částech výrazně překračoval i rámce dané INSPIRE. Jak již bylo řečeno, hlavním cílem projektu bylo napomoci lepšímu využívání prostorových dat. V posledních letech byly v ČR pilotně implementovány i standardizované technologie umožňující vytváření skutečného trhu s daty a prostorové infrastruktury. Přesto se však ještě nedá plně hovořit o existenci národní prostorové infrastruktury a již vůbec ne o plně rozvinutém trhu s geoprostorovými daty. Existuje zde jednak výrazná poptávka po efektivnější práci s daty v oblasti státní správy a samosprávy, a to především v oblasti přístupu k datům a jejich sdílení (náznak řešení demonstruje kraj Vysočina), ale i rozsáhlý tržní potenciál pro využívání prostorových dat jak jednotlivci, tak i organizacemi. V budoucnosti bude vzrůstat požadavek na poskytování dat pomocí integrovaných služeb (viz kapitola 6, 7). Zkušenosti v Evropě i u nás ukazují, že budoucnost v práci s prostorovými daty je v prostředí Webu. Plnému rozvití však dosud bránila řada faktorů. Jako hlavní lze zmínit: • Nevyjasnění některých legislativních otázek v oblasti přístupu k prostorovým datům v rámci státní správy a samosprávy (zde již dochází k výraznému posunu především zásluhou činnosti Nemofora). • Vysoká cena geoprostorových dat, která je obvykle dána dvěma hlavními faktory: · Současné modely nabízení dat jsou orientovány především na nabízení ucelených datových setů, které jsou pro mnoho uživatelů cenově nedostupné. To na druhou stranu ovlivňuje, že neexistuje dostatečně velká poptávka po datech, která by pak umožnila tato data zlevnit. · Na trhu jsou nabízena obvykle data, ne služby. Velká většina budoucích potenciálních zákazníků bude požadovat informační a znalostní služby, ne primární data. • Nedostatečná informovanost mezi uživateli i poskytovateli prostorových dat o nejnovějších standardech a technologiích v oblasti sdílení geoprostorových dat a služeb. 21
  • 23. Nedostatečná podpora těmto technologiím a standardům ze strany vývojářských týmů. Projekt SpravaDat se snažil reagovat na tyto překážky a poskytl jak teoretické analýzy, tak prakticky prezentoval výsledky výzkumu vedoucí k překonání těchto bariér. Následující text je rozčleněn do kapitol, které v jistém smyslu kopírují organizaci pracovních týmů INSPIRE. I přesto, že v publikaci popsané výsledky projektů se někdy liší od doporučení týmů INSPIRE (doporučení pracovních týmů a výzkumy v rámci SpravaDat probíhaly paralelně), domníváme se, že toto členění může napomoci čtenářům lépe pochopit a implementovat doporučení, která z INSPIRE přicházejí. Budování NSDI bude na jedné straně plně v souladu s požadavky INSPIRE, ale na druhé straně bude postihovat i národní specifika. Možné odlišnosti oproti doporučením pracovních týmů INSPIRE mohou vycházet i z toho, že především v oblasti budování technologické infrastruktury pro SDI je Česká republika výrazně nad průměrem Evropy. Členění kapitoly věnované projektu SpravaDat je následující: · GIS v národní geoinformační infrastruktuře. · Metadata a katalogové služby. · Interoperabilita, datové modely a generalizace dat. · Architektura pro SDI a jednotlivé standardy pro její podporu. · Sdílení prostorových dat a služeb a možné obchodní modely. · Popis konkrétních pilotních řešení, která jsou výstupem z projektu SpravaDat. 22
  • 24. Kapitola 2: GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY V NÁRODNÍ GEOINFORMAČNÍ INFRASTRUKTUŘE PAVLA TRYHUBOVÁ 1. Národní geoinformační infrastruktura (NGII) Bez prostorových dat si dnes nedokážeme život představit. Každý z nás v životě už někdy něco hledal nebo hledá a geodata mu pomohou najít správný směr, ať už použije klasickou papírovou mapu nebo moderní GPS navigaci. Problém nastává, když chceme najít „správnou“ klasickou mapu nebo „správná“ data pro GPS navigaci. Prostorová data hrají důležitou roli nejen při hledání cest, ale i při rozhodování vládních složek a organizací. Vláda plánuje politiku pro zemědělství, průmysl, regionální rozvoj, dopravu a bezpečnost, sleduje postup řešení své strategie a ověření dosažených výsledků. Kvalitní geodatové a mapové podklady jsou důležité pro efektivní vývoj tržního hospodářství. Podobné příklady můžeme uvést i z dalších evropských zemí, například při navrhování dopravní sítě nebo sledování znečištění životního prostředí. Zvládat tyto procesy na evropské úrovni ale není možné bez určité úrovně integrace, harmonizace a interoperability dat (Pauknerová, Tryhubová [140]). Díky těmto požadavkům je v současné době vyvíjena řada aktivit na globální, evropské i národní úrovni s cílem zabezpečit tyto podmínky pomocí jednotné infrastruktury prostorových informací, která je často označována dalšími termíny, např. infrastruktura prostorových dat, prostorové informační infrastruktury (PII), v globálním kontextu známé jako SDI (Spatial Data Infrastructure), či GDI (Geographic Data Infrastructure). V této knize je použit termín GII - Geospatial Information Infrastructure. Zimová [179] uvádí, že více než polovina z celkového počtu zemí světa deklaruje své aktivity v nějaké formě budování SDI. Funkční geoinformační infrastruktura se stává přirozeným požadavkem informační společnosti, a proto v řadě významných dokumentů z poslední doby - z oblasti veřejné správy i z profesní sféry - je vyjádřena nutnost formulovat strategii vytváření národní geoinformační infrastruktury v podmínkách České republiky a určit cíle a projekty, které vedou k její realizaci. Specifikace programu Národní geoinformační infrastruktury České republiky (NGII) je součástí cílů uvedených v dokumentech Státní informační politika, Koncepce budování informačních systémů veřejné správy a Akční plán realizace státní informační politiky. Národní geoinformační infrastrukturu České republiky lze popsat jako soubor vzájemně provázaných podmínek, které v prostředí ČR umožňují zajistit a zpřístupnit co největšímu okruhu uživatelů širokou škálu geoinformací uživatelsky vhodnou formou při plném využití potenciálu moderních (geo)informačních a komunikačních technologií. [117] 23
  • 25. 2. Podmínky pro fungování NGII Shrňme si základní podmínky pro fungování NGII - existence geodat a geoinformací, harmonizace a interoperabilita dat, jejich snadná dostupnost a znalost podmínek, za kterých mohou být využívána. Aby výše uvedené podmínky byly splněny, musíme znát vlastnosti geodat a způsoby jejich využívání. Z vlastností jsou to především dva možné modely dat: vektorový a rastrový model dat. V GIS mohou být také použity snímky a obrázky (mapky, letecké snímky) nebo soubory vektorových dat stažitelné ve formátech SHP, DGN a podobně. Výrazně se prosazuje používání internetu. Internetové stránky umožňují kopírovat databáze a nebo výpisy z informačních systémů využitelné v GIS. V informačních systémech jsou použity textové formáty dat nazývané registry a číselníky. Data jsou doplněna údaji o geografické lokalizaci, kterou mohou být gegrafické souřadnice místa, nebo přesná adresa, označení určitého regionu, a podobně. Statistické klasifikace a číselníky vyhlašuje Český statistický úřad. Číselníkem se rozumí uspořádaný seznam kódů a jim přiřazených významů. Číselníky jsou součástí statistického informačního systému. Statistická data lze zejména použít v tematickém mapování, při tvorbě kartogramů, kartodiagramů a podobně. Český statistický úřad vede registr ekonomických subjektů a registr sčítacích obvodů. Umístění geodat na webové stránky skrývá několik úskalí souvisejících s jejich objemem a rozsahem. Některé zdroje nabízejí pokrytí celé České republiky, jiné pouze určité zájmové oblasti. Příkladem jsou ortofotomapy nebo již existující tematické mapy. Problémy nastávají tam, kde poskytovatelé geodat nemají dostatečně velký internetový prostor pro umístění dat nebo nechtějí nabídnout vše zdarma, a tak na webové stránky umísťují pouze ukázky dat nebo metadata. S tímto problémem úzce souvisí poskytování geodat. Poskytovatelé mají dvě možnosti: za úplatu nebo zdarma – většina poskytovatelů nabízí geodata především za úplatu, pokud jsou zdarma ke stažení, tak pouze pro nekomerční účely. Další vlastností je dostupnost umístěných geodat. Nejsnadnější, nejrychlejší a nejlevnější dostupnost je pomocí internetu. To znamená stažení geodat přímo z webových stránek. Tato forma dostupnosti ale není příliš oblíbená mezi poskytovateli geodat. Důvodem je nebezpečí jejich zneužití, které může vést až k nekontrolovanému šíření geodat mezi uživateli a jejich využíváním v komerčním prostředí, a tím i porušování autorského zákona. Poskytovatelé řeší tuto situaci několika způsoby. Nutnou registrací vstupu do informačního systému, ve kterém si lze data vyhledávat, kupovat a stahovat (e- obchod) nebo osobní návštěvou firmy, kdy je potřeba vyplnit formuláře a písemně o data zažádat. Teprve později po vyřízení všech formalit dochází k dodání geodat na CD-ROM. Internet poskytovatelé využívají k poskytování informací o vlastnictví geodat. Z těchto a dalších důvodů je důležitou součástí geodat jejich popis. Popis dat je označován obvykle jako metadata a v minulosti byl velmi často podceňován a opomíjen. Pro informovanost o geodatech jsou metadata důležitou složkou prostorově lokalizovaných dat. Metadata jsou definována jako „data o datech” a v nejrůznějších podobách jsou využívána již poměrně dlouhou dobu v oblastech zabývajících se uchováváním a zpřístupňováním informací a samozřejmě také v GIS. 24
  • 26. Problematika metadat byla diskutována a řešena i v projektu INSPIRE. Detailně danou problematiku rozebírá a komentuje kapitola 3. 3. INSPIRE Iniciativa INSPIRE se stala evropskou směrnicí po jejím schválení Evropským parlamentem v listopadu roku 2006. Směrnice INSPIRE a její přijetí představuje klíčový moment pro budoucnost tvorby infrastruktury prostorových informací v Evropské Unii. INSPIRE podporuje harmonizaci prostorových formátů dat, dostupnost datových sad a schopnost vyhledat různé datové sady. INSPIRE je založena na souboru základních principů: • data by měla být sbírána pouze jednou a udržována na té úrovni, kde je sbírání dat nejúčinnější; • mělo by být možné propojit prostorové informace z různých evropských zdrojů a mezi mnoho uživatelů a aplikací; • mělo by být možné pro informace sebrané na jedné úrovni jejich sdílení do všech ostatních úrovní; • na všech úrovních by mělo být dostatečné množství geodat za podmínek, které umožní jejich rozsáhlé použití; • mělo by být snadné najít, která geodata jsou dostupná, která se hodí pro zvláštní použití a za jakých podmínek mohou být získána a používána; • geodata by měla být snadno pochopitelná a interpretovatelná. Směrnice chce zajistit vytvoření evropské prostorové informační infrastruktury, která zpřístupní uživatelům integrované prostorové informační služby. Tyto služby by měly umožnit uživatelům pomoci při vyhledávání a zpřístupňování geografických informací z široké škály zdrojů, od místní úrovně ke globální úrovni, interoperabilní cestou. Uživatelské cíle INSPIRE zahrnují politiky a evropské manažery na národní a místní úrovni, občany a organizace [51]. INSPIRE bude provozován na jednom webovém portálu, kde bude možné nalézt existující data. Jestliže tato data neexistují, členské státy EU budou muset takové datové sady vytvořit. Datové sady musí vyhovovat standardům, které zajistí propojení s daty z jiných zemí a z podkladů různých měřítek. Výhody pro Evropskou unii, jakož i běžného občana jsou zřejmé. Pokud stát zpřístupní a otevře používání prostorových dat, umožní mimo jiné prostřednictvím internetu jejich kontrolu, například plnění územního plánu nebo zapsání osobního vlastnictví, s použitím mobilního telefonu nalezení nejbližší banky nebo zdravotního střediska [162]. 25
  • 27. 3.1 Obsah směrnice INSPIRE Směrnice obsahuje následující kapitoly: Kap. 1 Obecná ustanovení Kap. 2 Metadata Kap. 3 Interoperabilita prostorových datových sad a služeb Kap. 4 Síťové služby Kap. 5 Sdílení dat a znovu využití dat Kap. 6 Koordinace a doplňující opatření Kap. 7 Závěrečná ustanovení Přílohy I, II, III. Konkrétní znění české verze směrnice a aktuální vývoj situace související s její implementací lze nalézt na adrese: http://www.cenia.cz/web/www/web-pub2.nsf/$pid/ MZPMSFGR0A25. 3.2 Obecné principy se vztahem ke geodatům • Pro geodata zavést koordinační opatření a koordinační struktury na úrovni veřejné správy pro spojení informací a znalostí z různých odvětví, které by zohledňovaly rozdělení pravomocí a odpovědností v členských státech. • Propojení geodat s dalšími informačními oblastmi (školství, vzdělávání a politika). • Data by měla být sbírána jednou a držena na té úrovni, kde je sbírání dat nejefektivnější. • Orgány a instituce Společenství mají mít harmonizované podmínky a integrovaný přístup k souborům prostorových dat a službám zohledňující regionální rozdíly. • Poskytovat o geodatech objektivní, důvěryhodné a srovnatelné informace na úrovni Společenství. • Zajistit propojené síťové služby, které naleznou, transformují, zobrazí a stáhnou prostorová data. • Usnadnit finanční náhrady za využívání prostorových dat a nadstandardních služeb. • Je třeba usnadnit přístup a zajistit možnost opakovaného použití prostorových dat, jež přesahují správní a státní hranice. • Členské státy zajistí přístup ke službám uvedeným prostřednictvím geoportálu Společenství. • Členské státy umožní veřejným orgánům a institucím členských států přístup ke geodatům a zajistí jejich dostupnost bez omezení (transakční, procesní, zákonné, institucionální nebo finanční povahy). • Zajistit snadno použitelné služby pro veřejnost a přístup k nim pomocí komunikačního prostředku. Jde o služby vyhledávací (na základě obsahu metadat), prohlížecí, stahování, transformační a vyvolávací. • Pro účely služeb je třeba zavést několik vyhledávajících kritérií: klíčová slova, třídění prostorových dat a služeb, kvalita a přesnost prostorových dat, úroveň souladu se specifikacemi pro harmonizaci prostorových dat, zeměpisná poloha, podmínky přístupu a použití geodat a služeb, veřejné orgány, které jsou pověřeny vypracováním, řízením, údržbou a šířením souborů prostorových dat a služeb. 26
  • 28. Členské státy nesmějí omezit přístup k informací o emisích do životního prostředí. • Členské státy zajistí, aby vyhledávací a prohlížecí služby byly veřejnosti přístupné zdarma. • Data mohou být poskytována pomocí prohlížecích služeb ve formě zabraňující opětovnému použití a mohou obsahovat licenční smlouvu. • Vybírají-li orgány veřejné moci poplatky za transformační a vyvolávací služby, musí členské státy zajistit, aby bylo možné použít služeb elektronického obchodu. • Otevřenost národních infrastruktur pro další vlastníky geodat (třetí stranu). • Členské státy přijmou příslušná opatření, aby zabránily narušení hospodářské soutěže. • Zajistit propojení sítí pro zpřístupnění metadat veřejným orgánům a třetím stranám na základě žádosti. • Implementační pravidla stanovující podmínky pro harmonizaci prostorových dat a předpisy pro výměnu prostorových dat zajistí interoperabilitu prostorových dat nebo interakci služeb. • Komise stanoví implementační pravidla tak, aby zvýšila možnost opakovaného využití souborů prostorových dat a jejich služeb třetími stranami. Tato prováděcí pravidla mohou obsahovat zavedení společných podmínek pro udělování licencí. 4. Závěr Žijeme v době, kdy kvalita a kvantita informací o světě kolem nás se vyvíjí úžasnou rychlostí. Zvyšují se požadavky na uchovávání a zpracovávání informací. V současnosti je vyvíjena řada aktivit na globální, evropské i národní úrovni s cílem zabezpečit výše zmiňované podmínky (harmonizace, informovanost a dostupnost geodat) pomocí jednotné infrastruktury prostorových informací. Jak již bylo řečeno, v INSPIRE je řada klíčových doporučení nezbytných pro podporu vysoké úrovně NGII. Odborná komunita pracující s prostorovými daty věří, že INSPIRE je prvním krokem pro vytvoření Evropského SDI. Pro realizaci této myšlenky je nutné zvyšovat povědomí o NGII mezi všemi zainteresovanými složkami - poskytovateli ostatních dat, ministerstvy, privátním sektorem a veřejností. V průběhu posledních let se situace v ČR mění k lepšímu – rozvíjí se informační systémy, na webových stránkách přibývají portály. Veřejná správa poskytuje stále více informací. Dostupnost geodat se rok od roku zlepšuje. Díky vznikajícím informačním portálům a geoportálům snadněji vyhledává a má geografické informace k dispozici stále více uživatelů. Česká republika tak vytváří podmínky pro fungování NGII a splňuje požadavky INSPIRE. Menší nedostatky existují v harmonizaci dat, např. chybí národní profil metadat. Dalším krokem na cestě k úspěšnému vybudování NGII bude naplnění požadavků směrnice INSPIRE. 27
  • 29. 28
  • 30. Kapitola 3: METADATA, TEZAURY A KATALOGOVÉ SLUŽBY ŠTĚPÁN KAFKA, TOMÁŠ ŘEZNÍK, PETR KUBÍČEK, KAREL CHARVÁT, TOMÁŠ CAJTHAML 1. Metadata Potřeba metadat se objevila již v době, kdy byly pořizovány první rastrové mapové podklady a digitální data vůbec. Tehdy se začala objevovat i poptávka po informacích o prostorových datech. Tyto informace tak vlastně navazují na mimorámové údaje map v analogové podobě, zpracovávané v předchozích letech, které poskytovaly obdobným způsobem zásadní informace o prostorových datech. Metadata lze definovat jako data o datech nebo datových sadách, tedy jako množinu informací popisujících daná data. Jde o popis obsahu, reprezentaci, geografický a časový rozsah, prostorové reference, jakost a správu sady geografických dat. Je důležité, že právě metadata umožňují integrovat geodata z různých datových sad a zdrojů (organizací, segmentů veřejné správy apod.), čímž naplňují jeden z hlavních principů a požadavků na interoperabilitu dat a informačních systémů (především charakteru GIS). Pro správu metadat se používá metainformační systém. Metainformační systém (MetaIS) je informační systém, který dokáže sofistikovaně pracovat s metadaty a vyřizovat požadavky na něho kladené. Důležitými charakteristikami MetaIS jsou především tyto operace nad metadaty: • Identifikace metadat (schopnost zpracovat neomezené množství metadat). • Verifikace metadat (ověření správnosti testováním). • Interpretace metadat (zpracování obsahu metadat, validita). • Distribuce metadat (prezentace ve vhodné formě). Uživatelé MetaIS mohou vyhledávat metadata o požadovaných datových sadách s využitím standardních vyhledávacích mechanismů. MetaIS většinou publikuje svá metadata prostřednictvím služby WWW. Z metadatových standardů relevantních pro projekt SpravaDat a i pro budování NSDI je třeba zmínit dva, Dublin Core a ISO19115/19119. Obr. 1: Využití metadat v praxi 29
  • 31. 1.1 Dublin Core - ISO 15836 Dublin Core je standard určený Tab. 1: Dublin Core Metadata Element Set k vytváření metadat dokumentů na Anglicky Česky internetu. Vychází z knihovních systémů. Title Název Jde o jednoduchý systém složený z Creator Tvůrce několika položek s prefixem „DC“. Je Subject Předmět možno vytvářet další podtřídy rozšířením Description Popis předdefinovaných pomocí tečky. Tato Publisher Vydavatel metadata je možno vkládat do hlaviček Contributor Přispěvatel HTML dokumentů. Existují vyhledávače, Date Datum které je umí zpracovávat a tak poskytovat tříděné informace na rozdíl od „textových“ Type Typ webových vyhledávačů. Format Formát Identifier Identifikátor Standard Dublin Core obsahuje Source Zdroj základní sadu patnácti prvků (Dublin Core Language Jazyk Metadata Element Set), z nichž žádný není povinný: viz tab. 1. Relation Vztah Coverage Pokrytí Rights Práva 1.2 ISO 19115/19119 metadata 1.2.1 ISO19115 Norma ISO 19115 standardizuje metapopis prostorových dat. Počítá se s tím, že bude postupně nahrazovat současně používané standardy: FGDC (USA), ANZLIC (Austrálie), CEN (EU). Z informací uveřejněných na internetu vyplývá, že jak výrobci softwaru, tak i producenti dat postupně na tuto normu přecházejí. Současné aktivity EU v oblasti prostorové infrastruktury (INSPIRE) počítají s touto normou jako jedinou pro popis prostorových dat. V ČR byly zrušeny předběžné normy CEN a do češtiny byla přeložena norma ISO (překlad dalších souvisejících norem ISO 191xx v současné době postupně probíhá), která také byla přijata za normu ČSN. Norma byla inspirována stávajícími metadatovými normami, je však značně rozsáhlejší a snaží se implementovat řadu číselníků, které omezují zadávání volného textu. Měla by přispět k ujednocení interpretace jednotlivých položek. Textových položek však nadále zůstává velké množství. Norma navazuje na další normy série ISO 191xx (ISO 19103 Conceptual Schema Language, ISO 19107 Spatial Schema, ISO 19108 Temporal schema, ISO 19109 Rules for Application Schema, ISO 19118 Encoding). Vychází z jednotného „General feature“ modelu používaného jak OGC tak v rámci norem ISO 191xx. Obsahuje povinné, nepovinné a podmíněně povinné položky. Norma také definuje jakési jádro metadat (Core metadata), které by mělo být doporučeným základem pro všechny metadatové záznamy. Norma předkládá popis struktury metadat ve formě UML modelů a datového slovníku metadat, který poskytuje detailnější informace o jednotlivých položkách. Datový slovník obsahuje normalizované krátké a dlouhé jednoznačné názvy jednotlivých položek, které jsou dále používány v návazných normách. 30
  • 32. S použitím této normy se počítá nejen pro popis datových sad, ale také webových služeb (WMS apod.). Základní (implicitní) jednotkou pro metadatový popis je datová sada (dataset). Norma umožňuje také popisovat metadaty jednotlivé třídy geoprvků (feature types), třídy atributů (feature attributes), instance geoprvků (feature instances) a atributů (attribute instance). Je uplatněn také mechanismus pro popis jednotlivých listů mapového díla (tiles) nebo pro definování vzájemné hierarchie (superset, subset). Pro přehlednost je norma tematicky rozčleněna do 12 balíčků (tab. 2, obr. 2). Tab. 2: Metadatové balíčky Č Název balíčku Obsah 1. MD_Metadata Základní balíček agreguje další balíčky. Dále obsahuje informace o jazyku a znakových sadách dat i metadat, iden- tifikátor metadatového záznamu, datumové razítko apod. 2. MD_Identification Citace, formát dat, ukázka, užití, zda je součástí jiné datové sady (DS) 3. MD_Constraints Omezení použití, autorská práva … 4. DQ_DataQuality Kvalita dat, údaje o historii vzniku apod. 5. MD_MaintenanceInformation Způsob údržby, údaje o aktualizaci 6. MD_SpatialRepresentation Rastr/vektor, geometrie, topologie… 7. MD_ReferenceSystem Souřadnicové systémy, projekce 8. MD_ContentInformation Popis rastrových dat nebo citace katalogu atributů 9. MD_PortrayalCatalogueReference Způsob grafické prezentace dat 10. MD_Distribution Poskytované formáty dat, on-line přístup, ceny apod. 11. MD_MetadataExtensionInformation Uživatelská rozšíření 12. MD_ApplicationSchemaInformation Dokumentace aplikačního schématu DS Obr. 2: UML model metadat na úrovni základních balíčků 31
  • 33. CORE metadata: Standard definuje seznam položek, které tvoří jádro (CORE) metadat (viz tab. 3). Ne všechny položky jsou zde povinné, ale jsou doporučené pro základní popis dat. Tab. 3: CORE metadata (M – povinný, O=volitelný, C = povinný za urč. podmínek) Prvek Povinný Umístění Název datové sady M MD_Metadata > MD_DataIdentification.citation > CI_Cita- tion.title Typ prostorové reprezentace O (MD_Metadata > MD_DataIdentification.spatialRepresen- tationType Referenční kalendářní datum M MD_Metadata > MD_DataIdentification.citation > CI_Cita- datové sady tion.date Referenční systém M MD_Metadata > MD_ReferenceSystem Odpovědná strana O MD_Metadata > MD_DataIdentification.pointOfContact > CI_ResponsibleParty Původ (rodokmen) O MD_Metadata > DQ_DataQuality.lineage > LI_Lineage Geografická poloha datové C MD_Metadata > MD_DataIdentification.extent > EX_Ex- sady (4 souřadnicemi nebo tent > EX_GeographicExtent > EX_GeographicBounding- geografickým identifikátorem) Box or EX_GeographicDescription On-line zdroj O MD_Metadata > MD_Distribution > MD_DigitalTransfer- Option.onLine > CI_OnlineResource Jazyk datové sady M MD_Metadata > MD_DataIdentification.language Identifikátor souboru metadat O MD_Metadata.fileIdentifier Znaková sada datové sady C MD_Metadata > MD_DataIdentification.characterSet Název metadatové normy O MD_Metadata.metadataStandardName Tematická kategorie datové sady M MD_Metadata > MD_DataIdentification.topicCategory Metadata standard version O MD_Metadata.metadataStandardVersion Prostorové rozlišení datové sady O MD_Metadata > MD_DataIdentification.spatialResolution > MD_Resolution.equivalentScale or MD_Resolution.distance Jazyk metadat C MD_Metadata.language Abstrakt (výtah) popisující dato- M MD_Metadata > MD_DataIdentification.abstract vou sadu Znaková sada metadat C MD_Metadata.characterSet Distribuční formát O MD_Metadata > MD_Distribution > MD_Format.name and MD_Format.version Kontaktní místo pro metadata M MD_Metadata.contact > CI_ResponsibleParty Doplňková informace o rozsahu O MD_Metadata > MD_DataIdentification.extent > EX_Ex- datové sady (vertikálním a tent> EX_TemporalExtent or EX_VerticalExtent časovém) Datumové razítko metadat M MD_Metadata.dateStamp Kompatibilita s Dublin Core: Dublin Core (dále DC) je standard pro vytváření metadat pro popis internetových zdrojů. Vychází z knihovnických systémů a definuje jen velice omezené množství základních položek s možností jejich další strukturalizace ve stromové struktuře podle potřeb uživatelů. Položky jsou pouze textového charakteru a pro popis geografických dat 32
  • 34. jsou nedostatečné. Protože jde o normu, která má být používaná i v rámci Informačních systémů veřejné správy v ČR, je třeba zhodnotit její kompatibilitu s ISO. Již tvůrci normy ISO 19115 deklarují kompatibilitu s DC. Kompatibilita je možná převodem komplexních položek ISO 19115 do Dublin Core. Vzhledem k nižší úrovni strukturovanosti DC se s převodem v opačném směru příliš nepočítá. Tabulka nám ukazuje možnost vzájemného mapovaní jednotlivých položek těchto norem (viz tab. 4). Tab. 4: Příklad mapování položek ISO 19115 na DC Dublin Core ISO 19115 DC.Title MD_DataIdentification/citation/title DC.Title.Alternative MD_DataIdentification/citation/alternateTitle DC.Creator.PersonalName MD_DataIdentification/citation/citedResponsibleParty/individu- alName DC.Creator.PersonalName.Address MD_DataIdentification/citation/citedResponsibleParty/con- tactInfo/address DC.Subject.Keywords MD_DataIdentification/descriptiveKeywords DC.Description MD_DataIdentification/abstract DC.Publisher MD_DataIdentification/citation/citedResponsibleParty/organi- sationName DC.Date MD_DataIdentification/citation/date/date DC.Type Dáno kontextem = „Data.Spatial“ DC.Format MD_dataIndentification/resourceFormat DC.Identifier fileIdentifier DC.Source dataSet DC.Language” SCHEME=”ISO639-1” language/isoCode CONTENT=”cz”> DC.Relation” CONTENT=”5468”> parentIdentifier, další vazby v různých částech normy DC.Coverage MD_DataIdentification/extent DC.Rights MD_DataIdentification/citation + MD_DataIdentification/re- sourceConstraints Komunitní profily: Standard ISO je rozšiřitelný. Jeho součástí je postup pro rozšiřování (extensions) a komunitní profily. Profil musí vždy obsahovat CORE položky (jádro) a použít další standardně definované položky pro účely profilu (viz obr. 3). Teprve nenajde-li se odpovídající položka, je možno vytvářet jednotlivá rozšíření. Vytváření profilů je popsáno v normě ISO 19106. Obr. 3: Vytváření komunitního profilu 33
  • 35. Identifikátory: Jednoznačný identifikátor metadatového záznamu je možno volitelně zadat v elementu FileIdentifier. Obsahem může být libovolný řetězec. Identifikátor dat (a dalších entit) je možno zadat volitelně v elementu <citation>. Pomocí těchto identifikátorů se mohou jednotlivé části metadat na sebe odkazovat (např. v elementu parentIdentifier). Kromě toho je v normě definován typ MD_IdentifierType (obrázek), který je používán v MD_Citation, MD_AggregateInformation apod… Řetězcový kód je zde doplněn informací o zodpovědné autoritě (citací) (viz obr.4). Obr. 4: Struktura MD_IdetifierType Norma dále neřeší způsob vedení a tvar unikátních identifikátorů. Vzhledem k očekávané výměně dat v rámci národní či nadnárodní prostorové infrastruktury je velice důležité stanovit takové identifikátory, které budou jednoznačné i v takovémto kontextu. Tento problém se řeší v některých systémech přidělením počítačem vygenerovaného náhodného řetězce, který je s vysokou pravděpodobností neopakovatelný. Doporučováno je spíše použití způsobu známého k označování tříd v jazyce Java nebo jmenných prostorů v XML schématech, tedy řetězce odpovídajícího URL dané organizace a další části odpovídající identifikaci v rámci této organizace. Popis struktury dat: Podrobný popis datového modelu vlastních dat je velice důležitý pro jejich praktické využití. Zatímco norma ISO 19115 umožňuje podrobný popis obsahu rastrových dat, vlastní popis struktury vektorových dat zde není řešen (narozdíl od FGDC apod.). K popisu datového modelu mají sloužit normy ISO 19109 – „Rules for application schema“ a 19110 – „Feature catalog“. K odkazu na Feature katalog slouží element MD_FeatureCatalogueDescription, v němž je možnost katalog citovat pomocí třídy CI_CitationType. Tato citace je spíše popisného charakteru a nemá předpoklady pro automatické zpracování (jednoznačná vazba např. pomocí URI apod.) Aplikační schéma je možno zařadit do metadatového záznamu pomocí elementu ApplicationSchemaInfo, kde se předpokládá vložení modelu v binárním tvaru tak, jak byl pořízen v některém modelovacím nástroji (UML), a grafické reprezentace tohoto modelu. Vlastní formát těchto dat je ponechán na uživateli. Interoperabilita v tomto případě není opět příliš zaručena. Z General Feature Modelu (GFM) vyplývá opačná možnost – přiřadit metadata jako jeden z atributů objektů na různých úrovních aplikačního schématu, a to jak třídám prvků 34
  • 36. (features) a atributů, tak jejich jednotlivým instancím. V praxi je také očekáván přístup od datového modelu směrem k metadatům, nikoli obráceně. I když ve světě existuje řada příkladů použití metadat, autorům není známo řešení problematiky popisu datového modelu v návaznosti na metadata. Je však jasné, že k úplnému popisu datové sady potřebujeme popsat datový model (např. pomocí ISO 19190 nebo 19110). 1.2.2 ISO 19119 metadata Tato norma poskytuje normalizované zásady pro vývoj softwaru podporujícího uvažované geografické služby, který uživatelům umožní zpřístupnění potřebných geografických dat z rozmanitých zdrojů a jejich zpracování přes generické rozhraní spojující jinak neslučitelné softwarové prostředky. V souvislosti s tím norma podrobně pojednává o architektuře geografických služeb a analyzuje výpočetní, informační, inženýrský a technologický pohled na otevřené distribuované zpracování dat. V jeho přílohách je ošetřena shoda geografických služeb s touto normou, uvedeny jejich příklady, definován datový sborník metadat geografických služeb a popsáno zobrazení do existujících platforem distribuovaného zpracování dat. Dle ISO 19119 jsou instance metadat kategorizovány podle následující taxonomie • Geografické služby pro interakci s uživatelem - Geographic human interaction service. • Geografické služby pro správu informací a modelů - Geographic model/information management services. • Geografické služby řídící návaznost úloh - Geographic workflow/task management services. • Geografické služby pro zpracování prostorových informací - Geographic processing services – spatial. • Geografické služby pro zpracování tematických informací - Geographic processing services – thematic. • Geografické služby pro zpracování časových informací - Geographic processing services – temporal. • Geografické služby pro zpracování metadat - Geographic processing services – metadata. • Geografické komunikační služby - Geographic communication services. • Správa geografických systémů - Geographic system management services. 1.2.3 Implementace Vlastní implementaci řeší standard ISO 19139. Jde o soubor XML schémat, která slouží pro definování XML dokumentu s metadaty. Zde jsou provedena některá zjednodušení, například všechny odkazy na externí zdroje jsou nahrazeny datovými typy. Jsou zjednodušeny i některé datové typy a vypuštěny elementy popisující dokumentaci služby (MD_ServiceIdentification). Norma je dosud ve stavu draft dokumentu, proto např. ESRI dosud nepodporuje export metadat v tomto formátu. 35
  • 37. 1.2.4 Kritická místa platforem spojená s integrací metadat • Standard je značně rozsáhlý, nesymetrický a nepřehledný (v řadě případů jsou zde zachyceny podrobnosti DS, v jiných chybí potřebné elementy). Je vidět, že šlo o konsensus široké komunity uživatelů vytvářený extenzivním způsobem. • Data jsou uspořádána tak, že některé typy (např. Citation nebo responsibleParty) se vyskytují na různých místech hierarchické struktury metadat v různých kontextech, jejichž význam se může překrývat. Interpretace takovéto struktury nemusí být jednoznačná a různými uživateli může být různě chápána a vyplňována. • Celý standard je spíše postaven na textovém způsobu práce s informací, tedy redundantní textové údaje není možné dekomponovat zpět do relační databáze. Předpokládá se opětovné zadávání např. organizace či adresy na různých místech v textovém tvaru. Výměna metadat mezi systémy bude patrně založena na tomto „textovém“ tvaru. Vlastní popis struktury dat není řešen v rámci standardu (narozdíl např. od FGDC či aplikací ESRI). Předpokládá se datový model mimo tato metadata, ovšem není jasně řečeno vzájemné provázání 1.3 Metadatové profily v rámci Evropy V rámci různých projektů vznikla celá řada metadatových profilů, které představují víceméně podmnožinu položek standardu ISO 19115 (ESA, Evropská vodní směrnice atd.). V rámci projektu INSPIRE vznikl draft metadatového profilu pro vyhledávání a oceňování metadat. Tento profil je nezávislý na standardech, ovšem implementace počítá s normou ISO 19115/19119/19139. Výhodou je, že profil je velice úzký (v podstatě málo nad rámec jádra ISO. Obsahuje ovšem i elementy potřebné pro popis webových služeb, nikoli pouze dat). V současné době navrhované projekty vycházejí z tohoto standardu (např. eWater [9]). 1.4 Metadatové profily v ČR V ČR stále existuje řada aplikací používajících starý standard ISVS. Zavádění norem ISO probíhá pomalu. Dosud nebyl stanoven národní profil metadat, spíše se počítá s převzetím profilu INSPIRE. Vyplňování dalších položek nad rámec tohoto profilu bude na potřebách jednotlivých uživatelů či komunit. Vzhledem k určitým národním potřebám však bude pravděpodobně muset vzniknout několik rozšíření, případně návodů / kuchařek pro vyplňování metadat. Jednak pro kódování českých znakových sad (používané windows-1250 není součástí předdefinovaného číselníku ISO), jednak bude potřeba definovat použití prostorových identifikátorů, tezaurů apod. V současné době jsou vytvářeny resortní profily Ministerstva životního prostředí (MŽP) a Zeměměřického úřadu (ZÚ). Vycházejí z profilu INSPIRE a budou patrně obsahovat další položky. Autoři systému Micka vytvořili stejnojmenný profil, který vychází z profilu INSPIRE, z resortního profilu MŽP a je rozšířen o položky na základě praktických potřeb jednotlivých uživatelů systému. 36
  • 38. 2. Tezaury Systémy pro vyhledávání a třídění informací v počítačovém prostředí procházejí v posledních létech bouřlivým vývojem. Původně bylo vyhledávání počítačových informací komplikovanou činností, která mohla být vykonávána pouze zaškolenými profesionály. Postupně došlo v souvislosti s technologickým rozvojem k enormnímu nárůstu objemu dostupných informací. Kromě nových zdrojů vytvářených přímo v digitálním prostředí dochází i k digitalizaci původně jen papírových (analogových) zdrojů dat. S rozvojem Internetu se nárůst objemu dostupných informací týká nejen databází obsahujících vědecké texty, ale i běžných publikací jako jsou noviny, časopisy, krásná literatura i osobní zápisky řady lidí ve formě webových stránek. Zvýšený objem dostupných dat výrazně zkomplikoval vyhledávání relevantních informací, obzvláště pro běžné koncové uživatele. Objevuje se však řada přístupů, které různým skupinám uživatelů poskytují různě strukturovaný přístup ke zdrojům dat. Jedním z nejčastěji využívaných přístupů k této problematice jsou řízené slovníky (controlled vocabularies), konkrétně pak především tezaury (česky též thesaury, angl. thesaurus, pl. thesauri). Kontrolovaným slovníkem rozumíme seznam dohodnutých termínů převzatých z běžného jazyka, u nichž je podchycena (kontrolována) gramatická forma (v cizojazyčných kontrolovaných slovnících je navíc třeba sjednotit hláskování). V tezaurech jsou tyto termíny navíc uspořádány v hierarchické struktuře, což přináší významné výhody při vyhledávání informací (viz níže). Tezaury lze používat k indexování, ukládání, případně vyhledávání záznamů. Mohou pracovat v kombinaci s řadou různých vyhledávacích algoritmů a lze je využít ke zlepšení výsledků vyhledávání v různých typech záznamů (od hledání v strukturovaných indexovaných databázích přes částečně strukturované sady dat až po vyhledávání v heterogenních fulltextových dokumentech). Tezaury se mohou pro zvýšení své využitelnosti různým způsobem sdružovat do multitezaurových systémů, např. do multitezaurových prostředí, přepínacích tezaurových systémů, složených tezaurů apod. Tezaurus lze využít jak k vyhledávání, tak k indexování záznamů. Při indexování jsou záznamy označovány pomocí řízených termínů. Při vyhledávání může uživatel buď manuálně zadat všechny vyhledávané řetězce nebo zadá jeden termín a systém automaticky zahrne všechna synonyma a gramatické tvary termínu. Jak již bylo zmíněno, jedním z hlavních rysů tezaurů je využití hierarchických a relačních vazeb, konkrétně vztahů označovaných ekvivalence, hierarchie a asociace. Ekvivalence je vztah mezi synonymy. Všechna synonyma mohou být rovnocenná, obvykle je však jeden z termínů zvolen jako preferovaný termín (preferred term), další synonyma jsou pak označena jako alternativy k danému termínu. Vyhledávání je pak pro koncového uživatele usnadněno tím, že ke vstupu do tezauru může použít kterékoliv z daných synonym. Vzácně jsou navíc definovány vztahy mezi pseudosynonymy (quasi-synonyms) – mezi slovy, která mají podobný, ne však totožný význam. Hierarchie (na rozdíl od ekvivalence není symetrická) je v tezaurech vytvořena vymezením vztahů mezi podřazenými pojmy (narrower term) – podtřídami (subclass) 37
  • 39. a nadřazenými pojmy (broader term) – nadtřídami (superclass). Nejčastěji se v tezaurech používá pouze jeden typ této vazby, výjimečně lze definovat více typů hierarchické vazby. Asociace (symetrický vztah) se používá k vytvoření vazby tehdy, pokud mezi termíny existuje sémantický vztah, ale nelze jej označit pomocí ekvivalence ani hierarchie. Pomocí asociace lze například spojit antonyma (slova s opačným významem) apod. V případě multilinguálních (vícejazyčných) tezaurů pak navíc do hry vstupuje další vztah – mezijazyková ekvivalence. Ta je obvykle definována pouze mezi preferovanými termíny. 2.1 Tvorba tezaurů Pokud pomineme možnost převzetí (a případné adaptace) již existujícího tezauru (která bývá obvykle nerealizovatelná, protože drtivá většina tezaurů je vytvářena pro specifickou databázi nebo sadu záznamů, což prakticky vylučuje jejich přenos a použití v jiném než původním systému), je v případě potřeby nutno přikročit k vytvoření vlastního tezauru. Vytvářením tezaurů se zabývá několik mezinárodních standardů. Mezinárodní standard ISO 2788 a americký národní standard ANSI/NISO Z39.19 obsahují doporučení pro budování monolinguálních tezaurů, standard ISO 5964 pak pokrývá oblast budování multilinguálních tezaurů. Lze vymezit dva základní přístupy ke tvorbě tezaurů (v praxi se obvykle aplikují oba přístupy společně): • Postup shora dolů (top-down method): · je sestavena skupina expertů, která rozhodne o rozsahu a přibližném okruhu termínům které budou do tezauru zahrnuty, · s využitím případných stávajících slovníků a/nebo tezaurů se rozhodne o vztazích vybraných termínů, · upřesní se okruh termínů vybraný dříve, zvolí se preferované termíny; stanoví se ekvivalence mezi preferovanými termíny a jejich alternativami; stanoví se hierarchie a asociace mezi preferovanými termíny, · vytvoří se předběžná verze tezauru, následuje testování a úpravy. • Postup zdola nahoru (bottom-up method) · sestaví se skupina expertů sloužících jako poradci, · vybere se sada již indexovaných dokumentů (pokud existují) a indexové termíny z této sady se použijí jako předběžný seznam termínů, · pokud nejsou k dispozici indexované dokumenty, vezme se sada dokumentů používajících přirozený (tj. neřízený) jazyk a postupuje se analogicky, · tezaurus se začne budovat na základě takto získané předběžné sady termínů: ve spolupráci s experty a dalšími zdroji informací se upřesní význam všech termínů, stanoví se vztahy mezi termíny, · vytvoří se předběžná verze tezauru, následuje testování a úpravy. 38
  • 40. 2.2 Integrace tezaurů Integrace tezaurů nabývá na významu se vzrůstajícím počtem existujících tezaurů. Tento jev je podmíněn nutností pokrýt všechny vědy, případně vědní disciplíny u věd komplikovanějších (jako např. fyzika či geografie). Řešením je tvorba několika tezaurů. Ty se mohou v určitých termínech vzájemně překrývat, případně mohou mít shodné termíny zpracované v rozdílné kvalitě (stejně tak jako v atlasech bývají mapy, jejichž obsah se překrývá, ale měřítko je odlišné). Z předchozího odstavce vyplývá, že v těchto případech není možný přímý automatický překlad dotazu z jednoho jazyka do jazyka jiného. I přesto lze vytvořit multilinguální tezaurus. Za použití existujících slovníků může být využita existující struktura pro překlad a rovněž pro kontrolu adekvátnosti daného překladu. Je třeba zdůraznit, že pro multilinguální tezaury není třeba překlad samotných slov (což je účel slovníků), ale klíčových frází. Moderní informační systémy, jako např. WWW a digitální knihovny, obsahují více dat, než kdy předtím. Tyto systémy je snadné používat; mají globální rozložení. Proto jsou dostupné velkému množství heterogenních skupin. Na straně druhé právě velké množství heterogenní informace vytváří požadavek takového nástroje pro uživatele, který by mu umožnil pracovat s (pro něj) významnou částí dat. Jedním z těchto nástrojů jsou tezaury. Osvědčily se jako způsob jednotného a stálého slovníku pro indexaci a získávání tzv. informačních objektů (information bearing objects, IBO). Moderní multilinguální a mezioborová informace vyžaduje více než jen tradiční jednojazyčné úzce zaměřené tezaury. Široké spektrum klientů informačních systémů požaduje tezaury, které mohou být použity „nespecialisty“. Tezaury jsou dostupné pro různé oblasti zájmu se specifickou strukturou a terminologií. Mnohdy však nejsou sjednoceny ani tezaury v rámci jednoho oboru (zabývají se pouze specifickými oblastmi). V důsledku vzrůstu počtu informačních systémů se zvyšuje poptávka po rozsáhlejších slovnících, které pokrývají širší oblasti informací a současně jsou mnohem více selektivní. Jedním z řešení je použití sbírky tezaurů v souladu se strukturou lidských znalostí. Tyto tezaury mohou být na sobě nezávislé nebo jsou ve více či méně provázaném vztahu. V minulosti bylo mnoho tezaurů manuálně integrováno do jednoho supertezauru. To je však nedostatečné pro vytvoření volněji spojených informačních systémů, kde volné spojení (také tzv. federace) tezaurů je vhodnější – umožňuje každému tezauru ponechat si svoji autonomii. Snaha o integraci tezaurů ve federaci je nižší, než v jiných multi-tezaurových systémech. Důvodem je především fakt, že po akceptování autonomie tezauru následuje akceptování určitých nekonzistencí. Federace tezaurů nabízí nové způsoby indexování a vyhledávání. Proces indexování, stejně jako vyhledávání v tezauru, těží z přístupu k různým (obecným a specializovaným) tezaurům, které tvoří federaci tezaurů. Jeden či více tezaurů poskytují vstupní bod pro uživatele. Automatické využití jiných tezaurů umožňuje uživatelům integraci obsahů jednotlivých tezaurů okamžitě. Abychom se vyhnuli slovníku, který mate uživatele svojí obsáhlostí, odlišujeme indexované tezaury od neindexovaných. Základní snahou je integrovat tezaury při zachování jejich autonomie. Tento fakt je významný pro prostředí, jež podporuje platbu za individuální používání tezauru. Federace tezaurů je zvláště užitečná pro indexování 39
  • 41. a vyhledávání ve velkých informačních systémech. Těmi jsou například informační systémy obsahující data z několika informačních systémů nebo informační systémy integrující distribuované autonomní informační zdroje. Příklady užitečnosti federace tezaurů jsou metainformace či katalogové systémy. V posledních letech bylo sestaveno několik metadatových standardů a metainformačních systémů. Klíčovými tématy pro poskytnutí jednotného vstupního bodu je interoperabilita metainformačních systémů (která může existovat na regionální, národní a mezinárodní úrovni) a k nim příslušející tezaury. Proto je jedním z účelů kostry federace tezaurů vyřešit problém dotazování informačních objektů (IBO) indexovaných různými, potenciálně se překrývajícími tezaury. Jiným příkladem v tomto směru jsou digitální knihovny, jež obsahují široce distribuované informační objekty (jako např. textové dokumenty v rozdílných jazycích). V podobném smyslu může být federace tezaurů použita jako nástroj pro podporu vyhledávání mezi jazyky. 2.3 Způsoby integrace tezaurů V minulosti byly tezaury manuálně integrovány do jednoho velkého „supertezauru“. Naproti tomuto způsobu řešení je pro technickou interoperabilitu distribuovaných informačních systémů vhodnější volnější integrace (loosely integration), zvaná federace (viz dále). Tento způsob integrace umožňuje zachovat autonomii zúčastněných tezaurů. V posledních letech navíc integrace nabývá jiných možností, které jsou důsledkem nových technologií – jako např. WWW (World Wide Web), CORBA (Common Object Request Broker Architecture) či programovacího jazyka Java. Tezaury je možné integrovat třemi hlavními způsoby: federace (federation), sjednocení (unions) a spojení (couplings). • Federace je kombinace několika tezaurů při zachování jejich autonomie. Tezaury zapojené do federace mohou být uchovávány v rozdílných databázích a spravovány nezávisle na ostatních. Federace se skládá ze všech termínů a vztahů „členských“ tezaurů. Navíc obsahují informace o vztazích mezi termíny z různých tezaurů. Koncepty, které existují ve více než jednom tezauru, jsou kombinovány do jednoho federativního konceptu. Mohou být přidány jiné vztahy (jako např. hierarchické), aby bylo zajištěno vhodnější odkazování mezi jednotlivými slovníky. · Tato jednoduchá forma integrace tezaurů může vést k nekonzistencím, které mohou být odstraněny pouze vyjmutím některých termínů či vztahů z jednoho či více tezaurů. Akceptování těchto nekonzistencí je cenou za zachování autonomie každého z integrovaných tezaurů. Jinými slovy můžeme říci, že federace tezaurů není sama o sobě konzistentním tezaurem. Tato nevýhoda je vyvážena snadností tvorby federace, zachováním autonomie integrovaných tezaurů a užitečností v řadě aplikací – i přes určitou nekonzistenci. • Sjednocení je (oproti federaci) považováno za krok dále při integraci tezaurů. Integrovaný slovník prošel revizí, aby byla odstraněna nekonzistence. Výsledkem je nový korektní tezaurus. Sjednocení tezaurů může tvořit základ nového tezauru, který bude (po dokončení) nezávisle zlepšovat své zdrojové tezaury. Hlavní aplikací u sjednocení je tvorba metatezaurů. Metatezaurus by se neměl vytvářet nezávisle 40
  • 42. na zdrojových tezaurech. Na straně druhé je třeba, aby byl jednou za čas znovu sestaven kvůli adaptaci na provedené změny. Praktickým příkladem metatezauru je „Meta“, který vznikl sjednocením několika lékařských tezaurů [152]. • Spojení je zvláštním případem integrace mikrotezaurů (tj. tezaurů se specializovanými slovníky; nazývané také jako subtezaury) s více obecnými makrotezaury. Mikro- a makrotezaury se musí vzájemně přizpůsobit. Příkladem je European Educational Thesaurus [155]. 2.4 Metadata a tezaurus Síťové systémy pro organizaci znalostí obvykle obsahují objekty různých typů. Tyto objekty jsou popsány za použití velkého množství odlišných metadatových schémat. Z toho důvodu je vytvořen stroj, který rozumí metadatovým popisům odpovídajícím schématům různých oborů. Existují především tyto tři základní scénáře, podle kterých je požadována interoperabilita mezi metadatovými popisy: • Umožnit jednoduché vyhledávací rozhraní napříč heterogenními metadatovými popisy. • Umožnit integraci či spojení metadatových popisů, které jsou založeny na doplňujících, avšak potenciálně se překrývajících metadatových schématech nebo standardech. • Umožnit rozdílné pohledy základních a kompletních metadatových popisů závisejících na zájmu, úhlu pohledu a požadavcích uživatelů. Metadatové popisy z rozdílných oborů nejsou sémanticky odlišné, nýbrž se vzájemně překrývají a komplexním způsobem jsou příbuzné mezi sebou. Dosažení interoperability mezi takovými metadatovými popisy je manuální tvorbou užitečné; manuální přiřazení jeden k jednomu ale nevyhovuje mnoha existujícím metadatovým slovníkům. Výhodnějším přístupem je využití faktu, že mnoho entit a vztahů se vyskytuje napříč všemi oblastmi zájmu (např. lidé, místa, organizace, události, atd.). Přístupem k heterogenním datovým zdrojům v síťové struktuře vznikly nové problémy v oblastech zajištění terminologie a interoperability. Jsou zapotřebí řešení ke zlepšení fulltextových vyhledávání a průvodce návrhem schémat kontrolovaných termínů pro užití ve strukturovaných datech, včetně metadat. Tezaury jsou vytvářeny v odlišných jazycích, s rozdílným účelem, úhlem pohledu a na rozdílných úrovních abstrakce a detailu pro společný přístup ke specifickým sadám sbírek informací. Proto je při integraci kladen důraz také na metadata. Ta mohou být zpracována podle dvou základních norem: • Dublin Core je obecným standardem pro metadata, který může být použit při popisu dokumentů pro jejich hledání. • ISO 19115 představuje normu, která je současně přijata za ČSN. Rozsah aplikačních oblastí je v porovnání s Dublin Core širší. 41
  • 43. 2.5 Prostorové tezaury Prostorové tezaury začaly vznikat ve Velké Británii v 19. století jako výčet geografických názvů tehdy známého světa s cílem dokumentovat rostoucí anglický vliv. Na tuto tradici se opět začalo navazovat na počátku 90. let 20. století, kdy začal vznikat web v takové podobě, jak jej známe dnes. Tehdy vyhledávače buď neexistovaly nebo neposkytovaly dostatečně relevantní výsledky. Hlavní úlohu při hledání požadovaných dat či informací tak hrály internetové portály, tj. webové servery, které slouží jako brána do světa internetu. Typicky obsahovaly katalog odkazů, díky kterému plnily funkci internetových rozcestníků. Teprve v pozdější době (druhá polovina 90. let) se začaly vytvářet vyhledávače v podobě, jakou známe dodnes. Pro oblast geografie jsou však tyto vyhledávače nedostačující, ve většině případů obsahují podporu tzv. fulltextového vyhledávání, které je pouze jednou z částí geografického vyhledávání. Proto bylo třeba obohatit „klasické“ vyhledávače o možnost jiných forem vyhledávání. I tato snaha se postupem času ukázala jako nedostatečná, začíná proto tvorba prostorových tezaurů, ve webovém podání někdy označovaných jako gazetteer – podle Wikipedie definovaný jako geografický adresář dodávající důležité reference k vybranému místu (místům), často v kombinaci s atlasem. Formální definice tezaurů jsou uvedeny v mezinárodních i amerických standardech. Jednak jde o ANSI/NISO Z39.19 stanovující pravidla pro tvorbu, formátování a správu jednojazyčného tezauru. O stupeň výše jsou pak standardizační snahy Technické komise 46 Mezinárodní organizace pro standardizaci (ISO), která vytvořila dvojici standardů – ISO 2788 (pro monolingvální standardy; tj. odpovídající Z39.19) a ISO 5964 (pro multilingvální standardy). Podle výše uvedených standardů můžeme prostorové tezaury chápat jako sadu organizovaných geografických názvů a sadu standardizovaných recipročních vztahů mezi těmito názvy. Název je pak v tomto významu slovo nebo fráze reprezentující konceptuální kategorii. Vztahy mezi těmito pojmy jsou významné při vyhledávání – kromě nadřazených a podřazených pojmů (jako např. kraj a okres v administrativní hierarchii) – rozlišujeme také synonyma. Jinými slovy řečeno, pokud uživatel vyhledává řeky, v běžném vyhledávači nenalezne výsledek, zatímco prostorový tezaurus jej navede např. na databázi označenou vodní toky. Prostorové tezaury řeší sémantickou heterogenitu mezi datovými zdroji, protože pomáhají rozvíjet popis pokrytý metadaty o hierarchickou strukturu pojmů a synonyma velmi podobného významu. Nicméně je třeba dodat, že počet slov obsažených v tezaurech je i tak omezen. Největší šance na získání požadovaných dat jsou proto v té chvíli, kdy uživateli oznámíme, jaký prostorový tezaurus (tj. jaký konkrétní výčet klíčových slov) je při popisu používán. Z výše uvedených přístupů je patrné, že ideální popis tematického a prostorového obsahu geografických dat si vyžaduje nejen metadata, ale také prostorový tezaurus. S tímto přístupem počítají současné standardizační snahy v oblasti metadat – tj. standard CSDGM (častěji v literatuře označovaný jako FGDC) a norma ISO 19115. U obou je možné doplňovat klíčová slova konzistentním způsobem z formálně registrovaného tezauru. Klíčová slova lze do metadat zadat také v libovolné podobě, čímž se však snižuje snadnost nalezení potřebné informace. Kromě toho odebíráme jeden ze stavebních kamenů moderní infrastruktury prostorových dat. 42