Digitalizace mapovych sbirek a archivu II.
Kartografická společnost ČR
5. listopadu 2011, ČUZK
Online služba Georeferencer
Mgr. Petr Přidal, Moravská zemská knihovna
Vyhledávání pomocí MapRank
Mgr. Petr Přidal, Klokan Technologies GmbH
Online služba Georeferencer / Vyhledávání pomocí MapRank
1. Digitalizace mapových sbírek a archivů II
Praha, 4. listopadu 2011
Petr Přidal
KLOKAN TECHNOLOGIES - Museo 300 KLOKAN TECHN
KLOKAN TECHNOLOGIES - Museo 500 KLOKAN TECHN
KLOKAN TECHNOLOGIES - Museo 700 KLOKAN TECHN
ONLINE SLUŽBA
GEOREFERENCER VÝHLEDÁVÁNÍ
POMOCÍ MAPRANK
Old Maps Online
Projekt TEMAP (NAKI) s partnery UK a MU
2. Staré mapy online
2008-2011
Publikování map krok za krokem + open-source software.
http://help.oldmapsonline.org/
6. VÝSTUPY PROJEKTU:
ONLINE SLUŽBY PRO ČESKÉ KNIHOVNY:
BOUNDING BOX + GEOREFERENCER
MAPRANKSEARCH
OPEN-SOURCE SOFTWARE
METODIKA PRO PUBLIKOVANÍ
NASKENOVANÝCH MAP V ČEŠTINĚ
(PUBLIKACE DO KONCE TOHOTO ROKU)
7.
8. MEZINÁRODNÍ DOPAD:
OPEN-SOURCE SOFTWARE:
IIPIMAGE (JPEG2000, WATERMARK)
MAPTILER, GDAL2TILES
OPENLAYERS, ...
MEZINÁRODNÍ SPOLUPRÁCE
SOFTWARE ZDARMA A KOMPONENTY
POUŽÍVANÉ DNES V RŮZNÝCH PROJEKTECH PO
CELÉM SVĚTĚ
9. OPEN SOURCE SOFTWARE:
• Publikovaní skenů online:
• Dynamické image servery (přímo z JPEG2000 nebo TIFF) zdarma! JPEG
• Náš “IIPImage JPEG2000” s podporou Zoomify + DeepZoom +
Watermarking + MemCached
2000
• Předrenderované dlaždice, rýchlé a jednoduché:
• Náš “OpenTiler” - dlaždičkovací aplikace pro generování dlaždic i s
watermarkem (http://goo.gl/2EXbV)
• “OpenLayers Zoomify” - open source JavaScript (nejen) prohlížečka
• Publikování georeferencovaných map (pro GIS):
• WMS: zdarma MapServer, GeoServer,
• “MapTiler” desktopová aplikace pro vygenerování dlaždic MapTiler
• “GDAL2Tiles” generování dlaždic
14. Petr Přidal
petr.pridal@mzk.cz
ONLINE SLUŽBA
GEOREFERENCER
Movarská zemská knihovna: Projekt TEMAP (NAKI) s partnery UK a MU
Digitalizace mapových sbírek a archivů II
Praha, 4. listopadu 2011
15. ÚVODNÍ SLOVO
Velké kolekce starých map jsou skenovány a publikovány
v digitálních repositářích na webu. Ale...
MAPY NEJSOU POUZE OBRÁZKY!
... v momentě kdy jsou georeferencované, jsou mnohem
atraktivnější a použitelnější: vizualizace, výzkum,
porovnávaní, kontext místa, anotace, geografické hledaní...
16. PROBLÉMY
• Georeferencování je časově náročný proces
• Naskenované mapové kolekce jsou příliš velké (tisíce map)
• Archiválie musí zůstat archiválií. Georeferencovaná kopie jako
alternativa.
• Existuje více přístupů ke georeferenci starých map, není jen jeden
spravný postup - především pro mapy před rokem 1850 - vedle
výsledku je nezbytné znát i postup “jak” byla georeference
vytvořena
• Diskový prostor: georeferencovaná kopie vedle originálního skenu
• Znalost GISu je nezbtná
• Pracovníci musí mít přístup k velkým souborům (JPEG/TIFF/...)
17. GEOREFERENCER JAKO ŘEŠENÍ
• Uživatelsky-jednoduchý online nástroj: ve webovém prohlížeči
• Stačí přístoupit na web, přihlásit se a začít
• Jednoduchý a relativně zábavný proces
• Otevřený pro online návštěvníky, organizované skupiny
dobrovolníků, crowdsourcing
• GIS software není nezbytný, žádné soubory na lokálním disku
• Výstupy pro GIS - vytvoření GeoTIFFu/GeoJP2 je možné pokud má
človek přístup k původním obrazům ve vysokém rozlišení
• Vytvořeno v knihovně - pro knihovny a ostatní paměťové instutuce
GEOREFERENCER: OD SCANU K MAPĚ.
18.
19.
20.
21.
22.
23. MOTIVACE PRO GEOREFERENCER
INSTITUCE: JEDNOTLIVCI:
• Rozšíření metadat (MARC,
DC, ISO 19139) • Georeferencování jakéhokoliv
online obrazu na Internetu
• Zapojení návštěvníků
• Kombinování map ruzných
• Atraktivní 3D vizalizace institucí
(Google Earth)
• Vytvoření vlastních
• GIS služby (WMS, WMTS/ virtuálních mapových kolekcí
TMS, ...) možné
• Online výzkum, porovnávání,
• Statistiky & vždy link na analýza, sdílení, ...
originální web instituce
24. PILOTNÍ APLIKACE
• Moravská zemská knihovna, CZ (studenti)
• Nationaal Archief, Netherlands (organizovaní dobrovolníci)
• National Library of Scotland (online návštěvníci, kdokoliv)
PRVNÍ FUNKČNÍ PROTOTYP SLUŽBY:
HTTP://WWW.GEOREFERENCER.ORG/
PRVNÍ INTEGRACE S KOLEKCÍ:
HTTP://MAPY.MZK.CZ/
28. GEOREFERENCER PILOTY
Kdokoliv může spolupracovat...
http://mapy.mzk.cz/
http://geo.nls.uk/maps/georeferencer/
České knihovny jsou pozvány ke spolupráci...
Stačí vystavit mapy (např. Zoomify, nebo jinak) na
vlastním webu a připravit metadata pro pilot.
Proces automatizujeme - možná přímá integrace s
vaším webem bude možná během příštího roku.
29. UNIKÁTNÍ TECHNOLOGIE
• Škálovatelná architektura. Centralizovaná služba pro
všechny knihovny a jejich mapy. Služba je
aktualizovaná “za chodu”. SAAS.
• Funguje “v cloudu” - Google AppEngine.
• Serverové zpracování. OpenSource GIS stack (Proj4,
GDAL, MapSever). Closure Library na klientovi.
MINIMÁLNÍ ÚSILÍ PRO SPOLUPRACOVÁNÍ.
SCANY JSOU POUŽITÉ PŘÍMO Z EXISTUJÍCÍCH ONLINE
REPOSITÁŘŮ!
34. SPATIAL REFERENCE SYSTEMS
Coordinate systems with map projection, for example
OSGB or S-JTSK and in general any reference system
from EPSG database usable in Georeferencer
35. IMPROVED BASE MAPS
Out-of-copyright base maps, agreements with local
authorities for using official mapping data (WMS).
Fast and visually appealing version of OpenStreetMap as
an alternative - probably from MapQuest.
OpenAerialMap.
36. HIGH QUALITY GEOCODING
Fast and reliable search in gazeteer database based on
OpenStreetMap or GeoNames.org data.
Online service, without license restrictions of Google
GeoCoding API - usable both in GeoReferencer a
GeoParser services.
37. API FOR DATA INTERCHANGE
AND 3RD PARTY FUNCTIONALITY
REST API based on JSON for exchange of data between
Georeferencer and third-party applications.
JavaScript API for easy integration into library websites.
38. COLLABORATIVE EDITING
Technical solution of the problem of concurent team
editing of map georeference by serveral people in the
same moment - locking and communication a la online
chat in a web browser (via HTTP Comet)
39. CROWDSOURCING
Social aspects:
Motivation. Team. Competition. Guiding. Rewarding.
40. DUPLICATES +
AUTOGEOREFERENCING
Research and development
of algorithms and
application for raster
image analysis.
Target: detection of scans
of the same map (via
“image hash”) and
following automatical
assignment of ground
control points.
42. GEOREFERENCING OF MAP SERIES
Database of Czech map series
with GIS-ready map indexes.
Integration with
Georeferencer: georeferencing
with the help of existing map
indexes.
Authorities for cataloguing of
map series.
Maybe a new project:
OpenMapIndexes.org
43. WEBGL EARTH
Google Earth-like visualization of georeferenced maps in
a web browser or on mobile devices.
100% open-source, no license restrictions, runs without
a need to install any extra software. Under development.
http://www.webglearth.com/
44. KLOKAN TECHNOLOGIES - Museo 300
KLOKAN TECHNOLOGIES - Museo 500
KLOKAN TECHNOLOGIES - Museo 700
45.
46. KLOKAN TECHNOLOGIES - Museo 300
KLOKAN TECHNOLOGIES - Museo 500
KLOKAN TECHNOLOGIES - Museo 700
47. Petr Přidal
petr.pridal@klokantech.com
KLOKAN TECHNOLOGIES - Museo 300 KLOKAN TECHNOLOGIES - Museo Sans 500
KLOKAN TECHNOLOGIES - Museo 500 KLOKAN TECHNOLOGIES - Museo Sans 500
KLOKAN TECHNOLOGIES - Museo 700 KLOKAN TECHNOLOGIES - Museo Sans 700
VÝHLEDÁVÁNÍ POMOCÍ MAPRANK
Digitalizace mapových sbírek a archivů II
Praha, 4. listopadu 2011
48. GEOGRAPHICAL SEARCHING
• Research, scientific articles, work on Ph.D. thesis (Petr Přidal),
Computer Science + Geodesy and Cartography
• Alternative projects tested in OldMapsOnline.org (R&D project in MZK):
• Lucene with GeoTemporal Ext. (LGTE) from DigMap.eu
• Alexandria Digital Library
• TimeMap.net (ECAI.org)
• Google GeoSearch API
• Knowledge of traditional GIS search methods (PostGIS, ...)
Result: Development of a new geographical search engine
for map collections.
50. CORE FEATURES
• Map-driven interface: Simple. Intuitive. Web 2.0.
Users love it!
• Combined queries: Where, When, Who & What
• Results sorted geographically with an advanced
spatial ranking algorithm.
• Instant search. Immediate delivery of the results by
moving the map or typing.
• It is fast. Even for large databases (million+ records).
55. METADATA & CUSTOMIZATION
• Indexing metadata in MARC, DublinCore, ISO
19139 formats, ...
• Batch import or harvesting: OAI-PMH or OGC CWS
• Numerical geographical boundaries necessary!
(MARC 034, DublinCore DCMI) - enrichment with
Geoparser or Georeferencer tools
• Possible customization of the user interface,
integration into products or websites
• For developers: REST API (JSON format), queries
following OpenSearch.org
56. MAPRANK RANKING &
SCALABILITY
• MapRank ranking: an advanced algorithm calculating
similarity of geographical area of query and area covered
by every document and combining it with map scale, time
range, predefined categories and traditional full text
search.
• Data indexing implemented specifically to provide ranked
real-time results even for large databases. Traditional R-
Tree indexing or Lucene are failing.
• Server component: FastCGI, C++
• Default user interface developed with Closure JavaScript
Library + Closure Compiler.
57.
58. Česká republika:
Projekt aplikace této unikátní technologie
pro hledání map v knihovním katalogu.
http://www.mapranksearch.cz/
Indexovány všechny mapy v Souborném
katalogu ČR - napříč institucemi.