Este documento describe el núcleo de metadatos documentales de los recursos de información estadística del Instituto Canario de Estadística (ISTAC), el cual incluye 70 metadatos organizados en 11 bloques. Explica que los metadatos facilitan la gestión y comprensión de los recursos siguiendo el principio 15 del código de buenas prácticas de estadísticas europeas. Además, señala que los metadatos pueden mapearse con los estándares Dublin Core y Data Documentation Initiative, y que se usan para gestionar
Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC
1. Diseño y usos del núcleo de metadatos documentales de los
recursos de información estadística del ISTAC
González Yanes, Jesús Alberto
jgonyanp@gobiernodecanarias.org
Instituto Canario de Estadística (ISTAC)
Resumen:
El núcleo de metadatos documentales de los recursos de información estadística del ISTAC lo
componen 70 metadatos organizados en los siguientes bloques.
› Versiones
› Identificadores
› Idiomas
› Clasificadores temáticos del contenido
› Descriptores de contenido
› Descriptores de clase de recurso
› Descriptores de producción de un recurso
› Descriptores de publicación de un recurso
› Descriptores de relaciones entre recursos
› Descriptores de propiedad intelectual
› Descriptores de interacción con los usuarios
Una buena parte de los metadatos son mapeables con el estándar de metadatos
documentales Dublin Core (DC) en su versión ampliada y con algunos metadatos de Data
Documentation Initiative (DDI) tanto en su segunda versión como en la tercera.
En la ponencia se abordará la definición y los usos del núcleo de metadatos para facilitar la
gestión de los recursos y ayudar a los usuarios a la compresión de los mismos, siguiendo el
principio 15 del código de buenas prácticas de las estadísticas europeas que establece que
“las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de
forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a
las mismas de forma imparcial, con metadatos y orientación de apoyo”.
Palabras clave: Difusión estadística, metadatos, Data Document Iniciative, Dublin Core, PC-
Axis, SDMX.
2. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
Índice
1. LOS RECURSOS DE INFORMACIÓN ESTADÍSTICA (RIE)..............................................................3
2. LOS METADATOS SOBRE LOS RIE .................................................................................................4
Distinción entre datos y metadatos .....................................................................................................5
Metadatos sobre metadatos ................................................................................................................5
¿Qué es y para qué sirve un sistema de metadatos estadísticos? .....................................................5
Los metadatos desde la perspectiva de sus usuarios .........................................................................6
Usuarios de datos estadísticos............................................................................................................7
Productores de datos estadísticos ......................................................................................................7
Herramientas software ........................................................................................................................7
3. EL NÚCLEO DE METADATOS DOCUMENTALES DE LOS RIE DEL ISTAC....................................7
Estándares de referencia ....................................................................................................................7
Los metadatos del núcleo....................................................................................................................7
4. EL NUCLEO DE METADATOS EN EL GESTOR DE PUBLICACIONES ESTADÍSTICAS (GPE)....13
El ciclo de vida de un RIE..................................................................................................................13
Tipo de recursos y métodos de documentación soportados por el GPE...........................................15
5. UN EJEMPLO DE USO: EL BUSCADOR WEB. ...............................................................................16
6. BIBLIOGRAFÍA BÁSICA DE REFERENCIA .....................................................................................17
González Yanes, Jesús Alberto 2
3. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
1. LOS RECURSOS DE INFORMACIÓN ESTADÍSTICA (RIE)
El Núcleo de Metadatos Documentales de los Recursos de Información Estadística del ISTAC
establece el conjunto de metadatos que comparten todos los resultados estadísticos de una
operación estadística, independientemente de su tipo o formato.
Definimos como operación estadística base al conjunto de tareas estadísticas que tienen como
objetivo la obtención de resultados estadísticos inéditos y su posterior publicación. Por lo tanto,
tales operaciones son las columnas sobre las que se sostiene el sistema de información
estadística pública.
El principal resultado de una operación estadística base es la matriz de microdatos estadísticos
y a partir de los mismos, a través de métodos de agregación, se pueden obtener otros
resultados que denominamos macrodatos estadísticos. Estos macrodatos los podemos
clasificar en:
1. Matrices de macrodatos
2. Cubos estadísticos
3. Tablas estadísticas
Y a partir de ellos se obtienen representaciones visuales sintéticas, tales como gráficos o
mapas.
Una publicación estadística se constituye por la agrupación, ordenación y análisis de diversos
resultados estadísticos. Y una noticia estadística no es más que una información sintética
surgida de una publicación estadística y que nace con vocación de comunicación generalista.
Definimos pues como recurso de información estadística tanto a los resultados
estadísticos como a las publicaciones y noticias estadísticas. En definitiva, el presente
documento establece el conjunto de metadatos documentales que comparten los siguientes
recursos de información estadística:
Recursos estadísticos
Tipo Tipo DCMI (1) Código
DATASET Dataset DS
DATASET > matriz de datos Dataset DSM
DATASET > cubo Dataset DSC
DATASET > tabla Dataset DST
FIGURA Image F
FIGURA > gráfico Image FG
FIGURA > mapa Image FM
COLECCIÓN DE DATOS Y FIGURAS Colecction P
COLECCIÓN > datos detallados Colecction PDD
COLECCIÓN > análisis y descripción de datos Colecction PAD
NOTICIA Collecction N
NOTICIA > estadística Collecction NE
Por ahora se excluyen de este núcleo de metadatos los recursos complementarios, tales como:
Recursos complementarios
Tipo Tipo DCMI (1) Código
METODOLOGÍA Text M
METODOLOGÍA > metodología Text MM
METODOLOGÍA > recomendación metodológica Text MRM
METODOLOGÍA > normativa metodológica Text MNM
METODOLOGÍA > cuaderno de trabajo metodológico Text MCTM
METODOLOGÍA > informe de calidad Text MIC
METODOLOGÍA > cuestionario Text MC
METODOLOGÍA > conceptos y definiciones Dataset, Text MCD
VOCABULARIO Dataset, Text V
González Yanes, Jesús Alberto 3
4. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
VOCABULARIO > clasificación o lista de códigos Dataset, Text VCLC
VOCABULARIO > tesauro Dataset, Text VCT
VOCABULARIO > ontología Dataset, Text VCO
INVESTIGACIÓN Text I
INVESTIGACIÓN > informe de investigación Text III
INVESTIGACIÓN > artículo de investigación Text IAI
(1) Se pone a título referencial el tipo principal en Dublín Core. Algunos de los recursos, se podrían asociar a
otros tipos.
2. LOS METADATOS SOBRE LOS RIE
El Código de Buenas Prácticas de las Estadísticas Europeas en su principio número 15,
sobre accesibilidad y claridad, establece que “Las estadísticas europeas deberían presentarse
de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles,
asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y
orientación de apoyo”.
Una definición utilizada con frecuencia nos dice que los metadatos son "datos sobre datos",
en general un objeto que describe o dice algo sobre otro objeto de información. De
manera formal podríamos decir que un metadato es un dato que se encarga de mantener un
registro sobre el significado, contexto o propósito de un objeto informativo, con la pretensión de
poder descubrir, entender, extraer y administrar dicho objeto.
Figura 1. Tipos de metadatos
De acuerdo con la W3C Resource Description Framework (RDF) un recurso es un elemento
abstracto que representa tanto un objeto físico (por ejemplo una persona o un libro), como un
objeto conceptual (por ejemplo un color o la clase de cosas que tienen colores). Asimismo, una
propiedad es un aspecto específico, característica, atributo, o relación utilizado para describir
un recurso.
Un recurso específico junto con una propiedad determinada, más el valor de dicha propiedad
para ese recurso es una sentencia. Estas tres partes individuales de una sentencia se
denominan, respectivamente, sujeto, predicado y objeto. Por lo tanto podríamos decir que la
suma de predicado y objeto nos aporta el conocimiento asociado a un recurso determinado.
PREDICADO + OBJETO = CONOCIMIENTO
Asociados a los predicados existen conjuntos de estándares que normalizan el qué se debe
decir de los recursos. Entre estos estándares se encuentra el Dublin Core como propuesta
generalista de documentación de recursos, o dentro del negocio estadístico nos encontramos
González Yanes, Jesús Alberto 4
5. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
con la Data Documentation Initiative (DDI) o con el Statistical Data and Metadata
Documentation (SDMX). Asimismo, asociados al objeto existen vocabularios controlados tales
como clasificaciones, listas de código armonizadas, tesauros u ontologías que surgen con el
objetivo de facilitar la interoperabilidad semántica y la gestión automática del conocimiento.
El término metadato se usa habitualmente con dos categorías semánticas:
1. Metadato como predicado: Se usa habitualmente para referirse al conjunto de
propiedades de un recurso.
2. Metadato como predicado más objeto: Se usa para referirse al valor de una
propiedad que tiene un determinado recurso.
Distinción entre datos y metadatos
La mayoría de las veces no es posible diferenciar entre datos y metadatos. Por ejemplo, un
poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado
a una canción que lo usa como texto. Muchas veces, los datos son tanto "datos" como
"metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato
referente al texto (dato como metadato).
Metadatos sobre metadatos
Debido a que los metadatos son datos, es posible crear metadatos sobre metadatos. Aunque, a
primera vista parece absurdo, los metadatos sobre metadatos pueden ser muy útiles. Por
ejemplo, fusionando dos imágenes y sus metadatos distintos puede ser muy importante deducir
cuál es el origen de cada grupo de metadatos, registrando ello en metadatos sobre los
metadatos.
¿Qué es y para qué sirve un sistema de metadatos estadísticos?
De acuerdo con la definición anterior de metadatos, podríamos afirmar que un Sistema de
Metadatos Estadísticos ofrece información sobre las colecciones de objetos estadísticos y la
relación entre ellos, así como sobre los procesos en los que están involucrados, describiendo
cada uno de los eventos, sus componentes y cada una de las restricciones que se les aplican.
Asimismo, los metadatos de la información estadística informan a los usuarios sobre los datos
existentes describiendo: los conceptos, las fuentes, la calidad, su distribución, el formato,
restricciones de seguridad, frecuencia de actualización, etcétera; de tal manera que sirven para
describir un conjunto de datos estadísticos, contestando a las preguntas: “de qué”, “de cuándo”,
“de dónde”, “de quién son”, “de dónde son” y “el cómo” se han generado los datos.
Por tanto, los metadatos estadísticos constituyen la información que permite que los datos
estadísticos sean bien entendidos, compartidos y explotados de manera eficaz por todo
tipo de usuarios a lo largo del tiempo; y se utilizan para poder identificar, acceder y usar
los datos. Los objetivos que se persiguen con la creación de los metadatos son los siguientes:
• Que se pueda buscar y encontrar los conjuntos de datos, es decir, saber qué datos
existen, qué datos hay disponibles de una determinada zona y para un tema
determinado, a una escala o en general con unas características específicas que el
usuario demanda.
• Que se pueda valorar la calidad del conjunto de datos, valoración requerida para ser
utilizado como fuente de datos en otros procesos dentro de una misma organización o
para el intercambio entre organizaciones.
• Que se pueda elegir cuál es el conjunto de datos más idóneo, comparando los distintos
conjuntos de datos entre sí, de modo que se pueda seleccionar cuáles cumplen los
requisitos del usuario de manera óptima para el propósito que se persigue.
González Yanes, Jesús Alberto 5
6. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
• Evitar la duplicidad de trabajo, informando sobre la información existente, su ubicación
y su disponibilidad.
• Facilitar la utilización de los datos, mediante la descripción de todas las características
técnicas relevantes de los datos, del modo más objetivo, más amplio y completo,
haciendo posible su explotación y su ayuda a los usuarios de los datos tanto en la
obtención de resultados como en su mantenimiento y actualización.
Asimismo, un Sistema de Metadatos Estadísticos puede ser una herramienta que permita a
una organización estadística realizar con eficacia las siguientes funciones:
• Facilitar la gestión de todas las fases de la producción estadística de los datos
(colección de datos, almacenaje, evaluación y difusión).
• Planificación, diseño, puesta en ejecución de operaciones estadísticas y su evaluación.
• Gestión de actividades metodológicas.
• Gestión de la cooperación con los usuarios finales de los datos.
• Mejora de la calidad de los datos estadísticos.
• Gestión de las fuentes de datos y cooperación estadísticas con los proveedores.
• Difusión de la información estadística a los usuarios finales. Los usuarios finales
necesitan metadatos fiables para buscar, navegar e interpretar. Deben haber también
metadatos disponibles para facilitar el post-procesado de datos estadísticos.
• Mejorar la integración entre Sistemas de Información Estadística (autonómicos,
nacionales o internacionales).
• Mejorar la integración entre Administración y Oficinas estadísticas para el intercambio
de registros administrativos para fines estadísticos.
• Gestión, unificación y estandardización de los flujos de trabajo dentro de las oficinas de
estadística.
• Base de conocimiento de las oficinas estadísticas que además permite compartir tal
conocimiento entre el personal estadístico.
• Unificación de conceptos y de terminología estadística como vehículo para una mejor
comunicación y entendimiento entre todos los agentes del Sistema de Información
Estadística.
Los metadatos desde la perspectiva de sus usuarios
Para describir las capacidades que potencialmente tiene un sistema de metadatos estadístico
se va a mostrar las diferentes necesidades que tienen los distintos actores que utilizan este tipo
de sistemas. Para ello será necesario categorizar los tipos de usuario de forma que dicha
categoría nos ayude a identificar las necesidades de cada colectivo. En primer lugar se
encuentran los usuarios de datos estadísticos que necesitan estos datos para analizarlos y
estudiarlos, y cuyo objetivo final es obtener ciertas conclusiones que ayuden a realizar de
forma efectiva sus tareas y responsabilidades. En segundo lugar están los productores de
datos estadísticos que son las personas encargadas de la producción de los distintos datos
estadísticos. Por último se ha incorporado un tercer tipo de usuario que son las herramientas
software que se utilizan en la producción y utilización de datos estadísticos. Naturalmente, las
necesidades de estas herramientas pueden derivarse directamente o indirectamente de las
necesidades de los usuarios y los productores de datos estadísticos. Sin embargo, este tipo de
herramientas juegan un papel tan importante que parece adecuado prestar especial atención a
estas necesidades.
González Yanes, Jesús Alberto 6
7. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
Usuarios de datos estadísticos
Las necesidades que un usuario de datos estadístico necesita de un sistema de información
estadístico se pueden reflejar describiendo el ciclo de acciones que este tipo de usuarios
realiza para llevar a cabo sus tareas. Un usuario con algún tipo de pregunta o problema busca
datos estadísticos de relevancia para su problema. Una vez que los identifica, el usuario
decide recuperar estos datos. Posteriormente, el usuario analiza e interpreta los datos
estadísticos que ha recuperado. Posiblemente, el usuario reitera parte del proceso realizando
nuevas búsquedas, recuperaciones y análisis hasta obtener los datos deseados. En cada uno
de los pasos que se han descrito, el usuario de datos estadísticos necesita algún tipo de
metadatos. La amplitud y profundidad de esos datos dependerán de los conocimientos previos
del usuario y de los objetivos a alcanzar.
Productores de datos estadísticos
Este tipo de usuarios participan en las distintas actividades definidas en un sistema de
producción estadística: diseño, implementación, operación, mantenimiento,
monitorización y evaluación. Todas las personas incluidas en este grupo tienen necesidades
de metadatos. Un diseñador de estadísticas necesita conocer cuáles son las necesidades del
usuario, cómo se han diseñado estadísticas similares en otras agencias, etc. Un proveedor que
aporta datos quiere saber el propósito de la estadística y los beneficios y costes de su
participación. La persona encargada de producir las estadísticas necesita saber los pasos a
seguir para que el resultado sea correcto. Un auditor requiere metadatos relacionados con la
funcionalidad del sistema y la retroalimentación de los usuarios.
Herramientas software
Este tipo de herramientas necesitan metadatos para poder funcionar correctamente. Necesita
descripciones formales de los datos que tiene que procesar; metadatos textuales que
posibiliten mostrar información de interés a los usuarios de la herramienta. Además, los
usuarios de las herramientas necesitan metadatos sobre la propia herramienta para saber
utilizarla apropiadamente y para poder interpretar adecuadamente el resultado de los análisis.
3. EL NÚCLEO DE METADATOS DOCUMENTALES DE LOS RIE
DEL ISTAC.
Estándares de referencia
En la definición del núcleo de metadatos se han tenido en consideración los siguientes
estándares:
1. Dublin Core¸ como estándar genérico para la documentación de recursos, en su
versión extendida de elementos refinados compuesta por 40 tipos de metadatos.
2. Data Documentation Initiative (DDI), tanto en su versión 2 como en su versión 3.
3. PC-Axis, en su versión 2008.
Los metadatos del núcleo
Los metadatos se agrupan en los once bloques conceptuales que enumeramos a continuación:
1. VERSION
2. IDENTIFICADORES
González Yanes, Jesús Alberto 7
8. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
3. IDIOMAS
4. CLASIFICADORES TEMÁTICOS DE CONTENIDO
5. DESCRIPTORES DE CONTENIDO
6. DESCRIPTORES DE CLASE DE RECURSO
7. DESCRIPTORES DE PRODUCCIÓN DE UN RECURSO
8. DESCRIPTORES DE PUBLICACIÓN DE UN RECURSO
9. DESCRIPTORES DE RELACIONES ENTRE RECURSOS
10. DESCRIPTORES DE PROPIEDAD INTELECTUAL
11. DESCRIPTORES DE INTERACCIÓN CON USUARIOS
Figura 2. Estándares de referencia utilizados en el diseño del núcleo
BLOQUE 1: Metadatos de versión.
En este bloque se especifican los metadatos asociados a una versión de un recurso.
Previamente se ha definido qué es lo que se entiende por versión, tendiendo en consideración
el documento “Policy-making for Research Data in Repositories: A Guide” del que se extrae la
siguiente información:
Digital data can be copied, altered or deleted very easily... This makes it very important
to be able to demonstrate the authenticity of data, and to prevent unauthorised access
to data for ethical, legal and quality reasons. An important related concept is that of the
master file, a formalised and checked final copy of the data (or other materials), or copy
at a certain stage of development (as opposed to temporary working versions of data
and other files) (UKDA, 2008a).
Asimismo en el mismo documento se especifica:
Policy considerations for the deposit of multiple versions of a dataset:
• The repository uses explicit version numbers which are reflected in dataset names.
• The repository records version and status e.g. draft, interim, final, internal.
• The repository stores multiple copies of a dataset in different formats.
• The repository keeps the original copies of data and documentation as deposited.
• The repository stores supplemental digital objects with the data file/s.
• The repository records relationships between items, such as ‘supercedes’ or is
superceded by’.
En ese sentido, se entiende como versión una nueva realización de un recurso que modifica el
contenido de la versión anterior y lo inhabilita. Por lo tanto, cuando un recurso se publica en
distintos soportes no son distintas versiones, sino distintos recursos y la información sobre la
relación entre ellos se debe contemplar en el bloque 9 del núcleo de metadatos.
Los metadatos asociados a este bloque son los que a continuación se describen:
González Yanes, Jesús Alberto 8
9. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
› VERSION: Identificación de la versión del recurso.
› VERSION_RATIONALE_TYPE: Información sobre el tipo o la naturaleza del cambio
de versión del recurso.
› VERSION_RATIONALE: Información detallada de los cambios que generan la nueva
versión del recurso.
› DATE_VERSION: Fecha de modificación del recurso dando lugar a la nueva versión
del mismo.
› DATE_NEXTVERSION: Fecha en la que la próxima actualización del recurso estará
disponible internamente. En ella se contempla la fecha en la que el recurso debe estar
actualizado dentro del ISTAC para su posterior publicación.
› VERSION_RESPONSIBILITY: Personal responsable de la versión del recurso.
› PROC_STATUS: Estado del ciclo de vida en el que se encuentra una versión de un
recurso.
BLOQUE 2: Metadatos de identificación.
› IDENTIFIER: Secuencia de caracteres usados para identificar unívocamente un
recurso dentro del ISTAC.
› IDENTIFIER_UNIVERSAL: Identificador universal del recurso.
› TITLE: El nombre dado a un recurso estadístico.
› SUBTITLE: El subtítulo que complementa o especifica el título del recurso.
› TITLE_ALTERNATIVE: Cualquier alternativa al título usada para sustituir al título
formal del recurso. Puede incluir abreviaturas.
BLOQUE 3: Metadatos de idiomas.
› LANGUAGE: Identificación del idioma principal del recurso.
› LANGUAGES: Idiomas utilizados en el contenido del recurso.
BLOQUE 4: Metadatos de clasificación temática de contenidos
› SURVEY_CODE: Código de la operación estadística a la que se asocia el recurso.
› SURVEY_TITLE: Nombre de la operación estadística a la que se asocia el recurso.
› SURVEY_ALTERNATIVE: Acrónimo de la operación estadística a la que se asocia el
recurso.
› SUBJECT_AREAS: Nombres de las áreas temáticas en la que se clasifica el
recurso, según clasificación del ISTAC, tanto las primarias como las secundarias.
González Yanes, Jesús Alberto 9
10. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
› SUBJECT_CODES: Códigos compactos de las áreas temáticas en las que se
clasifica el recurso, según clasificación ISTAC, tanto la primaria como las
secundarias.
BLOQUE 5: Metadatos de descripción de contenidos
› DESCRIPTION: Una descripción del contenido del recurso.
› ABSTRACT: Una resumen del contenido del recurso.
› KEYWORDS: Palabras claves que describen el recurso en las que se excluyen las
espaciales y temporales. Se fomentará el uso de vocabularios controlados como el
tesauro Eurovoc.
› COVERAGE_SPATIAL: En este metadato se documentan, mediante literales, las
unidades espaciales sobre las que el recurso aporta información.
› COVERAGE_SPATIAL_CODES: En este metadato se documentan, mediante
códigos, las unidades espaciales sobre las que el recurso aporta información.
› COVERAGE_TEMPORAL: En este metadato se documentan, mediante literales, las
unidades temporales sobre las que el recurso aporta información.
› COVERAGE_TEMPORAL_CODES: En este metadato se documentan, mediante
códigos, las unidades temporales sobre las que el recurso aporta información.
BLOQUE 6: Metadatos de descripción de clase de recurso
› TYPE: Establece la naturaleza o el género del recurso.
› FORMAT: El formato de datos de un recurso, usado para identificar el software y
posiblemente el hardware que se necesitaría para mostrar el recurso. (Ver el punto
DATA FILE FORMAT del documento Policy-making for Research Data in
Repositories: A Guide).
› FORMAT_EXTENT: El tamaño o duración del recurso. (Ver el punto VOLUMEN AND
SIZE LIMITATIONS del documento Policy-making for Research Data in Repositories:
A Guide).
BLOQUE 7: Metadatos de descripción de producción.
› CREATOR: Organización productora de la versión de un recurso.
› CONTRIBUTOR: Organizaciones que han contribuido a la producción del recurso.
› DATE_CREATED: Fecha de la creación del recurso (no de la modificación o
actualización del mismo).
› LAST_UPDATE: Fecha de la última actualización de datos del recurso.
› DATE_SUBMITTED: Fecha de solicitud de publicación del recurso por parte de su
productor en el ISTAC.
› DATE_NEXTUPDATE: Fecha pública de la próxima actualización del recurso.
› UPDATE_FREQUENCY: Frecuencia con la que se actualiza un recurso.
González Yanes, Jesús Alberto 10
11. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
› RANGEDATES_VALID: Rango de fechas en el que recurso es válido oficialmente. Si
carece de validez oficial, se especifica a través del texto “Sin validez oficial”.
› CONFORMSTO: Una referencia a un estándar establecido que el recurso cumple.
BLOQUE 8: Metadatos de descripción de publicación.
› PUBLISHER: Entidades responsables de la publicación del recurso.
› MEDIATOR: Entidades responsables de la puesta a disposición de un recurso. En
este metadato se contempla tanto la publicación por parte del ISTAC como por parte
de otras instituciones a las que el ISTAC le proporciona el recurso.
› DATE_ACCEPTED: Fecha de aceptación de un recurso para su publicación. Se
refiere a la fecha en el que el responsable de difusión acepta que un recurso en
correcto para su publicación.
› DATE_ISSUED: Fecha de aceptación de la publicación formal del recurso.
› RANGEDATES_AVALIABLE: Rango de fechas en el que recurso estará o estuvo
publicado en la Web.
› AUDIENCE: Público objetivo del recurso.
› EDUCATION_LEVEL: Nivel educativo necesario para comprender el recurso.
› BIBLIOGRAPHIC_CITATION: Forma de citar el recurso.
BLOQUE 9: Metadatos de relaciones entre recursos.
› SOURCE: Describe unívocamente los recursos de información, internos o externos,
que se han utilizado para la elaboración del recurso actual.
Relación de coexistencia de versiones
Hablamos de versiones cuando un recurso es modificado y sustituido por otro recurso. Sin
embargo un recurso puede ser modificado y generar otro recurso con el que coexiste. En este
caso, el recurso derivado es considerado como un nuevo recurso y en su identificación se trata
como tal (por lo tanto no entra dentro de la política de versionado del ISTAC).
Existen diferentes posibilidades de coexistencias de recursos que son versiones entre si, como
por ejemplo un recurso en distintos idiomas o formatos. La directriz general dentro del ISTAC
es evitar en lo posible generar versiones de coexistencia de recursos, pues con ello se
aumenta la complejidad del mantenimiento de la coherencia de la información entre los
mismos.
› ISVERSIONOF: El recurso documentado es una versión del recurso referido.
› HASVERSION: Los recursos referidos son una versión del recurso documentado.
Relación de sustitución
› REPLACES: Identifica los recursos a los que sustituye el recurso descrito.
› ISREPLACEDBY: Identifica el recurso que sustituyó al recurso descrito.
González Yanes, Jesús Alberto 11
12. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
Relación de requerimiento
› REQUIRES: El recurso descrito requiere los recursos referidos para apoyar su
función, entrega o la coherencia de contenido. (Estos recursos pueden ser otros
recursos de información estadística, pero también pueden ser conceptos,
publicaciones metodológicas, etc.)
› ISREQUIREDBY: Identifica los recursos que requieren el recurso descrito, sea física
o lógicamente
Relación de parte
› HASPART: El recurso descrito incluye a los recursos referidos física o lógicamente.
› ISPARTOF: El recurso descrito es parte física o lógica del recurso referido
Relación de cita
› ISREFERENCEDBY: El recurso descrito es citado por el recurso referido
› REFERENCES: El recurso descrito cita a los recursos referidos
Relación de cambio de formato
› ISFORMATOF: El recurso descrito tiene el mismo contenido intelectual del recurso
referido, pero está presentado en otro formato.
› HASFORMAT: El recurso descrito preexistió al recurso referido, que es
esencialmente el mismo contenido intelectual presentado en otro formato.
BLOQUE 10: Metadatos de relaciones entre recursos.
› RIGHTSHOLDER: Organizaciones que poseen o gestionan los derechos sobre el
recurso.
› DATE_COPYRIGHTED: Fecha de copyright del recurso.
› LICENSE: Documento legal que otorga permiso oficial para hacer algo con el
recurso.
› ACCESSRIGHTS: Información sobre quién puede acceder al recurso o una
indicación sobre su seguridad. Puede incluir información respecto al acceso o
restricciones basadas en la privacidad, seguridad y otras reglas.
BLOQUE 11: Metadatos de descriptores de interacción con usuarios.
› VISIT_COUNT: Número de veces en el que el recurso ha sido visitado por los
usuarios.
› VISIT_TIME: Tiempo que los usuarios han dedicado a la visita de un recurso.
› VISIT_LASTDAY: Fecha de la última visita realizada por los usuarios.
González Yanes, Jesús Alberto 12
13. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
› SHARE_COUNT: Número de veces en el que el recurso ha sido compartido entre
usuarios (por ejemplo a través de funcionalidades como “enviar a”, o a través de
redes sociales como facebook o agregadores de noticias como menéame).
› DOWNLOAD_COUNT: Número de veces en el que el recurso ha sido descargado o
impreso por los usuarios.
› BOOKMARK_COUNT: Número de veces en el que el recurso ha sido marcado como
favorito por los usuarios en acciones tales como “Agregar a favoritos” o agregando a
sitios como delicious.
› TAGS: Etiquetado por parte de usuarios.
4. EL NUCLEO DE METADATOS EN EL GESTOR DE
PUBLICACIONES ESTADÍSTICAS (GPE).
El ciclo de vida de un RIE
El Gestor de Publicaciones Estadísticas (GPE) es una herramienta que permite meta-informar y
publicar recursos estadísticos y que tiene como resultado la integración del ciclo de vida de las
últimas etapas de la producción y las etapas de la difusión estadística. En este ciclo de vida se
consideran los siguientes estados en los que puede encontrarse un RIE:
Figura 3. Estados en el ciclo de vida de un RIE
FASE DE PRODUCCIÓN:
Estado de producción: El RIE se encuentra en fase de producción y/o meta-documentación
por parte de un técnico de ayuda a la producción o de un técnico de producción.
Estado de aceptación de producción: El RIE se ha terminado de producir y documentar y se
encuentra pendiente del visto bueno del técnico de producción responsable del mismo.
FASE DE DIFUSIÓN:
González Yanes, Jesús Alberto 13
14. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
Estado de aceptación de publicación: Se ha solicitado la publicación del RIE y se encuentra
pendiente del visto bueno del técnico de difusión responsable del mismo.
Estado de publicando: Se ha aceptado la publicación del RIE y se ha programado la fecha y
hora de su publicación.
Estado de publicado: Se ha publicado el RIE en la Web del ISTAC.
Estado de archivado: Se ha eliminado el RIE de la Web del ISTAC y se ha archivado en el
gestor documental.
Cuando un RIE no es aceptado tanto en la fase de producción, por parte del técnico de
producción responsable del RIE, como en la fase de difusión por parte del técnico de difusión
entonces dicho recurso se devuelve al estado de producción; realizándose el aviso oportuno al
personal involucrado . Asimismo cuando se produce un fallo en la publicación, por ejemplo por
la caída de servidores, entonces se devuelve al estado de publicando.
Las fases del ciclo de vida del RIE, con sus estados e incidencias, se esquematizan en el
siguiente diagrama de flujo:
Figura 4. Diagrama de flujo del ciclo de vida de un RIE
González Yanes, Jesús Alberto 14
15. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
Tipo de recursos y métodos de documentación soportados por el GPE
Los recursos que en estos momentos son gestionados por el GPE son los siguientes:
1. Cubos estadísticos en formato PC-Axis
2. Publicaciones detalladas de datos, entendidas como colección de cubos PC-Axis
3. Cualquier tipo de recurso en formato PDF
La forma de carga de metadatos esta adaptada a cada formato de recurso, según las
siguientes características:
1. Fichero PC-Axis: Se aprovecha la metadocumentación de estos ficheros para la carga
automática de metadatos en el GPE. Asimsimo, durante las fases de gestión del ciclo
de vida se cargan automáticamente otro conjunto de metadatos. El resto de ellos se
cargan manualmente.
2. Publicación entendida como colección de PC-Axis: Se heredan algunos de los
metadatos de la colección de ficheros PX. Asimsimo, durante las fases de gestión del
ciclo de vida se cargan automáticamente otro conjunto de metadatos. El resto de ellos
se cargan manualmente.
3. Cualquier tipo de recurso en formato PDF: Se cargan manualmente todos los
metadatos requeridos y se incrustan al PDF los metadatos que faciliten a los usuarios
su futura gestión. Para ello se utiliza Adobe XMP (Extensible Metadata Platform).
Adobe XMP (Extensible Metadata Platform) facilita la captura,
preservación e intercambio de metadatos en distintos medios digitales y
flujos de trabajos.
XMP usa XML para describir los metadatos. Dado que está diseñada para existir con cualquier
formato de archivo, XMP proporciona una solución potente y flexible para gestionar de forma
inteligente los medios digitales. Al ser completamente personalizable y ampliable, XMP permite
que los grupos de trabajo y las organizaciones personalicen los metadatos necesarios para
potenciar su producción y flujos de trabajo de publicación. Adobe XMP permite:
1. Gestionar y automatizar más eficazmente los medios al permitir que los grupos de
trabajo definan los metadatos en función de sus necesidades.
2. Expresar los datos en XML, lo que permite que los usuarios y sistemas que dependen
de este lenguaje lo puedan comprender.
3. Mantener los metadatos a lo largo del curso del flujo de trabajo.
Figura 5. Pantalla del GPE de visualización de los metadatos de un RIE
González Yanes, Jesús Alberto 15
16. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
5. UN EJEMPLO DE USO: EL BUSCADOR WEB.
El uso más frecuentemente mencionado sobre metadatos es la refinación de consultas en
buscadores. En ese sentido, el nuevo buscador de la página Web del ISTAC (actualmente en
desarrollo) aprovecha el núcleo de metadatos para facilitar a los usuarios sus búsquedas. Para
ello utiliza distintos metadatos del núcleo, entre los que distinguimos los siguientes:
› TYPE: Establece la naturaleza o el género del recurso.
El buscador utiliza este metadato para filtrar automáticamente el tipo de información
que busca el usuario; por ejemplo si buscas datos el buscador te permite filtrar esos
recursos de otros como metodologías, cuestionarios, etc.
Asimismo, una vez seleccionado el tipo de recurso el buscador ayuda a los usuarios a restringir
sus búsquedas mediante el uso de lo que se conoce como facet (facetas). Para ello se usan los
siguientes metadatos:
› SURVEY_TITLE: Nombre de la operación estadística a la que se asocia el recurso.
› SUBJECT_AREAS: Nombres de las áreas temáticas en la que se clasifica el
recurso, según clasificación del ISTAC, tanto las primarias como las secundarias.
› COVERAGE_TEMPORAL: En este metadato se documentan, mediante literales, las
unidades temporales sobre las que el recurso aporta información.
› COVERAGE_SPATIAL: En este metadato se documentan, mediante literales, las
unidades espaciales sobre las que el recurso aporta información.
Figura 6. Pantalla del buscador en el que se puede observar el uso de metadatos
González Yanes, Jesús Alberto 16
17. Diseño y usos del núcleo de metadatos documentales de los recursos de información
estadística del ISTAC
6. BIBLIOGRAFÍA BÁSICA DE REFERENCIA
DATA DOCUMENTATION INICIATIVE (2008), Technical Specification – Version 3.0. Part I:
Overview.
http://www.ddialliance.org/dtd/#a01
DATA DOCUMENTATION INICIATIVE (2008), Technical Specification – Version 3.0. Part II:
User Guide.
http://www.ddialliance.org/dtd/#a01
DATA DOCUMENTATION INICIATIVE, Technical Information -Version 2.1: Information on the
DTD Elements.
http://www.ddialliance.org/DDI/dtd/version2-1-tree.html
DATA DOCUMENTATION INICIATIVE, Mapping DDI 2.1 – Dublin Core.
http://www.ddialliance.org/related/dc.html
DATA DOCUMENTATION INICIATIVE, Mapping DDI 2.1 – DDI 3.0.
http://www.ddialliance.org/DDI/ddi3/mapping-spreadsheet.pdf
DATA INFORMATION SPECIALISTS COMMITTEE – UK (2009), Policy-making for Research
Data in Repositories: A Guide.
DUBLIN CORE METADATA INICIATIVE, DCMI Type Vocabulary.
http://dublincore.org/documents/dcmi-type-vocabulary/
INSTITUTO CANARIO DE ESTADÍSTICA (2009), Manual de metadatos PC-Axis.
INSTITUTO CANARIO DE ESTADÍSTICA (2009), Normas básicas de premigración de tablas a
PC-Axis.
THE LONDON SCHOOL OF ECONOMICS AND POLITICAL SCIENCE (2008), Version Toolkit
for authors, researchers and repository staff.
http://www2.lse.ac.uk/library/versions/VERSIONS_Toolkit_v1_final.pdf
W3C (1997), Date and Time Formats
http://www.w3.org/TR/NOTE-datetime.
González Yanes, Jesús Alberto 17