Este documento resume varios proyectos de colaboración entre el Instituto Geográfico Nacional de España (IGN) y el Grupo de Ontología e Ingeniería del Conocimiento (OEG) de la Universidad Politécnica de Madrid. Se describen proyectos sobre PhenomenOntology, mapeo semántico, detección de duplicados, norma ISO 19150 y conflación semántica. También se mencionan trabajos actuales sobre anotación semántica de servicios RESTful geoespaciales y publicación de datos geoespaciales enlazados
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Colaboraciones IGN/CNIG - OEG
1. Colaboraciones IGN/CNIG – OEG
Luis M. Vilches-Blazquez
lmvilches@fi.upm.es
Ontology Engineering Group
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819
2. Índice
• Convenios bilaterales
• PhenomenOntology
• Descubrimiento de mappings
• Heurísticas detección duplicados
• Asesoramiento en ISO 19150
• España Virtual
• Conflación semántica (PT 1.4)
• Anotación semántica de servicios RESTful geo (PT 7.2)
• GeoLinked Data (PT 7.1)
Reunión bilateral IGN/CNIG – OEG 2
Luis Manuel Vilches Blázquez
3. Convenios bilaterales
IGN – OEG
(2007 - 2008)
José Ángel Ramos, Luis M. Vilches, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819
4. PhenomenOntology
PhenomenOntology
Catálogos de fenómenos
Reunión bilateral IGN/CNIG – OEG 4
Luis Manuel Vilches Blázquez
5. PhenomenOntology
BCN25 PhenomenOntology v3.5
03
0301 Río 0304 Cauce artificial
- Comp. de río
- Comp. del cauce artific.
• Eje
• Eje
• Margen
• Margen
• Eje conexión
• Eje conexión
- Régimen
- Situación
• Permanente
• Desconocido
• No permanente
• Subterráneo
- Categoría del río
• Superficial
• Desconocida
• Elevado
• Primera
• Segunda
• Tercera
• Cuarta
Reunión bilateral IGN/CNIG – OEG 5
Luis Manuel Vilches Blázquez
6. Descubrimiento de mappings (simples y complejos)
03 CAUDAL
MARGEN
0301 Río
- Componente de río
- Régimen
- Categoría del río
0304 Cauce art.
- Componente del
cauce artificial NO PERMANENTE
- Situación
Reunión bilateral IGN/CNIG – OEG 6
Luis Manuel Vilches Blázquez
7. Heurísticas detección de duplicados
1:25.000
multilingüe 1:200.000 1:50.000 1:1.000.000
multilingüe multilingüe multilingüe
BTN25
BCN200 CHE EGM
1:500.000 1:200.000
multilingüe multilingüe
Atlas Otros conjuntos ERM
de datos
Nomenclátor Waterbase
NGN Conciso
ICA
1:1.000.000 1:250.000 a
1:25.000 multilingüe
multilingüe 1:10M.
monolingüe 1:5.000
monolingüe
Reunión bilateral IGN/CNIG – OEG 7
Luis Manuel Vilches Blázquez
8. Heurísticas detección duplicados
Problemas en duplicidad de instancias
• En varias fuentes (2 ó +) • En una única fuente
• Diferentes tipos de fenómenos • Diferentes tipos de fenómenos
• Abreviaturas • Abreviaturas
• Diferentes valores en atributos • Diferentes valores en atributos
• Diferente idioma • Diferente idioma
• Similitud/Proximidad en nombre • Similitud/Proximidad en nombre
instancias instancias
• Presencia de tipología de • Tildes
fenómenos • Agrupación de tipos de fenómeno
• Ausencia de tipología de dentro de nombre de instancia
fenómenos • Caracteres "extraños" (ñ, ç, ª, º,
• Definición de diferentes etc.)
componentes • Contexto - Diferente localización
• Diferenciación entre mayúsculas y espacial
minúsculas • Duplicidad
• Alteración en orden de nombrado • Presencia de nombre
8
alternativo/asociado
Reunión bilateral IGN/CNIG – OEG 8
Luis Manuel Vilches Blázquez
9. Heurísticas detección duplicados
• Comparar (x1.label є "y") con (x3.label є "?")... ^ (xN.label є "?") dif./existentes
fuentes
• Comparar (x2.label є "z") con (x3.label є "?")... ^ (xN.label є "?") dif./existentes
fuentes
• Interpretación resultados de comparativa
• Si (x1.label є "y") ^ (x2.label є "z") =
• Comprobar posible mapping (léxico/sintáctico) de ("y" ^ "z") con conceptos de
hydrOntology
• Interpretación resultados de proceso mapping
• Si establecimiento mapping =
• Comprobar presencia en hydrOntology
• Buscar "y" v "z" en rdf:label
• Ofrecer rdf:comment de "y" ^ "z"
• Comprobar jerarquía de "y" ^ "z" en hydrOntology
• Ofrecer al usuario relación "y" ^ "z" (application ontology)
• Interpretación del conjunto de resultados obtenidos para obtener el idóneo
• Proponer "y" ^ "z" (lista alternativas)
• Comprobación y selección con usuario
Reunión bilateral IGN/CNIG – OEG 9
Luis Manuel Vilches Blázquez
10. Asesoramiento en ISO 19150
ISO 19150-2 New work item proposal: ISO 19150-2,
ISO 19150-1 New work item proposal: ISO/TS 19150-1, Geographic information - Ontology - Part 2: Rules for
Geographic information - Ontology - Part 1: Framework developing ontologies in the Web Ontology Language
Reunión bilateral IGN/CNIG – OEG 10
Luis Manuel Vilches Blázquez
11. Conflación semántica
José Ángel Ramos, Luis M. Vilches, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819
12. Conflación semántica
Mappings R2O+
La ampliación del lenguaje implica una modificación
en la aplicación que permite definirlos manualmente.
Esta aplicación es un plugin de la plataforma NeOn
Toolkit.
Interfaz original Interfaz ampliado
Reunión bilateral IGN/CNIG – OEG 12
Luis Manuel Vilches Blázquez
13. Conflación semántica
OEGMappings – Objetivos:
• Evaluación del descubrimiento automático de
mappings de la aplicación IGN MapDiscover.
• Incorporación de nuevas técnicas de
descubrimiento .
• Incorporación de nuevas fuentes, ampliando el
número y tipo de fuentes integradas.
Reunión bilateral IGN/CNIG – OEG 13
Luis Manuel Vilches Blázquez
14. Conflación semántica
OEGMappings – Evaluación
Se han evaluado las técnicas existentes en IGN
MapDiscover, su calidad y el aporte de las técnicas
específicas para el dominio geográfico.
Reunión bilateral IGN/CNIG – OEG 14
Luis Manuel Vilches Blázquez
15. Trabajo actual
?
PhenomenOntology Laguna
OMI
Laguna
Red de ontologías
Laguna de agua dulce
de GeoLinked Data
Laguna de agua salada
SPARQL Endpoints
URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tae%C3%B1a%2C%20Laguna%20de
URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tollos%2C%20Laguna%20de%20los
[…]
NGCE BCN200 NOMGEO URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Hilejas%2C%20Laguna%20de%20las
URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Tejo%2C%20Laguna%20del
[…]
URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20de%20Paniagua
URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20Laguna%20
[…]
La respuesta final está compuesta por 1.806 URI
(38 provenientes de NGCE, 1.416 de NOMGEO y 406 de BCN200).
Reunión bilateral IGN/CNIG – OEG 15
Luis Manuel Vilches Blázquez
16. Anotación semántica de servicios
RESTful geoespaciales
Victor Saquicela, Luis M. Vilches, Oscar Corcho
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819
17. Anotación semántica de servicios RESTful geoespaciales
• Service . Retrieves information related to a country.
• http://ws.geonames.org/countryInfo?country=ES
Reunión bilateral IGN/CNIG – OEG 17
Luis Manuel Vilches Blázquez
18. Anotación semántica de servicios RESTful geoespaciales
• Service . http://ws.geonames.org/countryInfo?country=ES
Service
<geonames>
<country>
<countryCode>ES</countryCode>
<countryName>Spain</countryName>
<isoNumeric>724</isoNumeric>
<isoAlpha3>ESP</isoAlpha3>
<fipsCode>SP</fipsCode>
<continent>EU</continent>
<capital>Madrid</capital>
<areaInSqKm>504782.0</areaInSqKm>
<population>40491000</population>
<currencyCode>EUR</currencyCode>
<languages>es-ES,ca,gl,eu</languages>
<geonameId>2510769</geonameId>
<bBoxWest>-18.169641494751</bBoxWest
<bBoxNorth>43.791725</bBoxNorth>
<bBoxEast>4.3153896</bBoxEast>
<bBoxSouth>27.6388</bBoxSouth>
</country>
</geonames>
•Service.
countryInfo($country,bBoxSouth,isoNumeric,continent,fipsCode,areaInSqKm,
languages,isoAlpha3,countryCode,bBoxNorth,population,bBoxWest,currency
Code,bBoxEast,capital,geonameId,countryName)
Reunión bilateral IGN/CNIG – OEG 18
Luis Manuel Vilches Blázquez
19. Asignación Semántica
• Service. countryInfo($country,bBoxSouth,isoNumeric,continent,fipsCode,areaInSqKm,languages,isoAlpha3
,countryCode,bBoxNorth,population,bBoxWest,currencyCode,bBoxEast,capital,geonameId,countryName)
Africa
Internet Europe
Asia
continent North America
South America
RESTful service Americas
parameter Latin America
http://dbpedia.org/ontology/Continent
republic nation kingdom …….
empty
http://dbpedia.org/ontology/Country France, Israel,
SpellingSuggestions Brazil, Canada,
http://dbpedia.org/ontology/countryWithFirstAstronaut Mexico, Belize,
country http://dbpedia.org/ontology/FigureSkater/country Korea, ……….
………..
Internet John Curry, Janet
……….. Thompson,
countryName
http://dbpedia.org/ontology/Country/anthem Kumiko Koiwai,
name ………..
RESTful service parameter
gens
epithet
public
figure
figure
Reunión bilateral IGN/CNIG – OEG 19
Luis Manuel Vilches Blázquez
20. GeoLinked Data
Luis M. Vilches, Boris Villazón-Terrazas, Victor Saquicela,
Alexander de León, Oscar Corcho, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819
21. Generación de RDF
Fuentes de información
Red de ontologías
WGS84 Geo
Positioning: an RDF
vocabulary scv:Dimension
scv:Item
W3C 4 scv:Dataset
hydrographical Vocabulary
phenomena (rivers,
Time ontology lakes, etc.)
O.
hasStatisticalData Statistics
hasLat/Long WGS84 hasLat/Long
SCOVO
SCOVO
hydrOntology hasLocation/isLocated FAO
on
Vocabulary for
geometry2RDF
hydrOntology FAO
O.
Time
instants, intervals,
durations, etc.
NOR2O
UNESCO Geopolitical
EGM / ERM 4 hasGeometry
hasGeometry
ontology
W3C Time
GeoNames
… GML
Legend
Generación de RDF
Names and
international code
Ontology for OGC GML 4 systems for
territories and
Ontology
Geography Markup Specification
Language groups
Specification 4
Thesaurus
Reunión bilateral IGN/CNIG – OEG 21
Luis Manuel Vilches Blázquez
26. Trabajo actual
owl:sameAs owl:sameAs
Genérico
owl:sameAs
BTN25 BCN200 NGCE NOMGEO
Reunión bilateral IGN/CNIG – OEG 26
Luis Manuel Vilches Blázquez
27. Trabajo actual
owl:sameAs owl:sameAs
Genérico
owl:sameAs
BTN25 BCN200 NGCE NOMGEO
Reunión bilateral IGN/CNIG – OEG 27
Luis Manuel Vilches Blázquez
28. Interlinking to the Web of Data
http://geo.linkeddata.es/NGCE/resource/Provincia/Madrid
owl:sameAs http://geo.linkeddata.es/resource/Provincia/Madrid
Reunión bilateral IGN/CNIG – OEG 28
Luis Manuel Vilches Blázquez
29. Trabajo actual
owl:sameAs owl:sameAs
Genérico
owl:sameAs
BTN25 BCN200 NGCE NOMGEO
Reunión bilateral IGN/CNIG – OEG 29
Luis Manuel Vilches Blázquez
30. Interlinking to the Web of Data
http://geo.linkeddata.es/resource/Provincia/Madrid
http://dbpedia.org/page/Madrid
owl:sameAs
http://sws.geonames.org/6355233/
Reunión bilateral IGN/CNIG – OEG 30
Luis Manuel Vilches Blázquez
31. Trabajo actual
owl:sameAs owl:sameAs
Genérico
owl:sameAs
BTN25 BCN200 NGCE NOMGEO
Reunión bilateral IGN/CNIG – OEG 31
Luis Manuel Vilches Blázquez
32. Interlinking to the Web of Data
http://dbpedia.org/page/Madrid
http://sws.geonames.org/6355233/
Reunión bilateral IGN/CNIG – OEG 32
Luis Manuel Vilches Blázquez
33. Colaboraciones IGN/CNIG – OEG
Luis M. Vilches-Blazquez
lmvilches@fi.upm.es
Ontology Engineering Group
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
Phone: 34.91.3363670, Fax: 34.91.3524819