SlideShare uma empresa Scribd logo
1 de 29
Cerrando el círculo: requisitos de los datos
abiertos como recursos para la
investigación abierta
PKP Scholarly Publishing Conference 2013
Universidad Nacional Autónoma de México
20 Agosto 2013

Nancy Diana Gómez
Gema Bueno de La Fuente
Universidad Carlos III de Madrid
Contenido
 Preguntas de investigación

 Objetivos
 Contexto
 Propuesta de metodología
 Datos de los repositorios de Ciencias Sociales
 Observaciones preliminares.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Preguntas de investigación
Métricas de datos abiertos:
 ¿Cuáles son las condiciones técnico/legales que se
deben cumplir para saber si un dato es abierto?
 ¿Es posible establecer métricas para medir el nivel de
apertura de los datos?

Set de datos en repositorios de Ciencias Sociales:
 ¿Qué datos se están publicando en los repositorios de
Ciencias Sociales como open data?
 ¿Qué nivel de apertura legal y técnico tienen los datos
de los repositorios de Ciencias Sociales?
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Objetivos
 Diseño de la metodología para evaluar el
grado de apertura de datos en repositorios de
Ciencias Sociales de acuerdo a sus
condiciones legales y técnicas.
 Comprobación de la validez de la
metodología con un conjunto seleccionado de
datos abiertos del área de Ciencias Sociales.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
CONTEXTO
¿Porqué Ciencia Abierta?
(Stodden, 2011)

Facilita
Reproductibilidad
Innovación académica e industria
Acceso al conocimiento

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Razones para compartir datos
(Borgman, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Ciclo del dato (ICPSR, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Incentivos que influencian la
publicación y difusión de los datos
(Stodden, 2011)

Fondos de investigación (NSF, NIH, etc.)

Editoriales de revistas (PLOSone)
Promociones institucionales
(premios, promociones, etc.)
Integridad científica

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Motivos que disuaden a los científicos
en la publicación de datos abiertos
(Stodden, 2010)

 Tiempo en documentar y limpiar datos para publicar (54%)

 Lidiar con preguntas de los usuarios de los datos (34%)
 No recibir atribución o citación como autores de los datos
(42%)
 Barreras legales –copyright (41%)
 Perdida potencial de futuras publicaciones (35%)
 Ventaja que pueden obtener los competidores en el campo
(33%)
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Las revistas y los datos
(Stodden, 2013)

 Estudio realizado sobre 170 revistas de
computación ISI.





62% no menciona política de datos
79% no menciona política sobre el código/programa
66% tiene política para material suplementario
Las revistas que incrementan demandas a sus
autores, como datos son aquellas que tienen alto
factor de impacto.

 La proporción de revistas de AA con política de datos
abiertos es levemente superior a las de suscripción
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formas de simplificar la reutilización
de los datos (White et al., 2013)
 Proveer metadatos

 Usar formatos de datos estándar
 Proveer el dato de forma no procesada o
cruda

 Uso de un repositorio establecido
 Uso de una licencia abierta y establecida (usar
la licencia más abierta posible) como CC0
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Recomendaciones
(White et al. 2013)
 Datos bien documentados son más fáciles de
comprender para reutilizar
 Datos con formatos apropiados son más fáciles
de usar en una variedad de software.
 Datos que han sido depositado en repositorios
establecidos, más durables y citables.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Datos abiertos y procesamiento
 Estándares y buenas prácticas de citación para los
datos (Datacite.org).
 Uso de identificadores únicos de conjuntos de datos
(DOI) y productores (ORCID).
 Metadatos de calidad para la descripción de datasets
en catálogos de datos (DCAT).
 Integración de catálogos Open Data con otras
herramientas (metabúsqueda).
 Dataverse Network – 2006 - IQCSS (Guía para gestión
de los datos-2012 5th edición) Permite a los autores subir
código y datos con sus propios términos de uso.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
PROPUESTA
METODOLÓGICA
Combinación de métodos
1. Medición del nivel de apertura de datos a
nivel legal y técnico:
 Diseño de matriz de priorización
 Convalidación de los pesos de la matriz:
crowdsourcing. 

2. Recogida y tratamiento de datos abiertos.
3. Caracterización de los datos de repositorios
en CCSS.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Matriz de evaluación (BETA)
Matriz de priorización

Variables consideradas:
1. Instrumento legal (copyright, licencias, aviso
legal).
 Korn y Oppenheim (2011).

2. Formatos de ficheros de datos:
 Norma ISO 2145/2010.
 Clasificación de cinco estrellas LOD de T. Berners
Lee.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Asignación de pesos a las variables

¿80%?

4th Int. PKP Conference, México

¿20%?

N. D. Gómez, G. Bueno (2013)
Variable 1: Instrumento legal
(Korn & Oppenheim, 2011)

Quién y bajo que términos se puede utilizar el dato
Cualquiera

10

Restricción para usos comerciales

5

Posibilidad de modificación del dato
Sin restricciones de ningún tipo

10

Sin restricciones pero con atribución

7

Compartir igual

3

No se modifican

0

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Escala LOD 5 estrellas (Berners Lee, 2010)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formula
Valor licencia

Valor formato

Grado
apertura

(U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1
Términos de uso: U
Posibilidad de modificación del dato: M
Valor promedio de formato: pF
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Selección de la muestra
 Conjuntos de datos en
CCSS.
 Criterios de selección:
 Data Citation
Index:http://wokinfo.com//products
_tools/multidisciplinary/dci/

 Categoría CCSS.
 >100 datasets

Repositorio

Organismo

Archaeological Data Service

University of York

National Archives

U.S. National Archives and
Records Administration

IQSS
The Dataweb
Eurostat
Australian Data Archive
UK Data Archive
Finnish Social Science Data
Archive
Inter University Consortium for
Political and Social Research

Harvard University
US Census Bureau
European Union
Australian National
University
University of Essex
University of Tampere
University of Michigan
Odum Insitute, University of
North Carolina

Office for National Statistics

UK Statistics Authority

Roper Center

 Volumen muestra: 13
repositorios

Odum Institute

Roper Center, University of
Connecticut

National Research
N. D. Gómez, G. Bueno (2013)
Foundation

South African Data Archive

4th Int. PKP Conference, México
Datos en Ciencias Sociales
 Investigación en CCSS: diseño-recolección-análisis. Los
datos son la materia prima.
 Métodos de obtención de datos: observación, encuestas,
documentación, experimentación.
 Tipos de métodos tipos de datos  formatos
 Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado
 Datos estructurados.
 Cualitativos: amplio rango de contenidos y formatos (texto, imagen,
video, audio y otra documentación).

 Retos para su publicación como datos abiertos:
 Normalización, integración, redundancia…

 Aspectos éticos y legales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Características de la muestra
 Repositorios de organismos de la administración pública
principalmente.
 Datos estadísticos, censales y otros estudios.
 Dataverse Network.
 Registros metadatos datasets: DDI XML

 Opciones descarga datos: API, FTP y descarga en
lotes, exportar en XLS y otros formatos.
 Niveles de acceso a los datos: abierto, especial y
restringido.  Licencias de descarga, solicitudes
formales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
OBSERVACIONES
PRELIMINARES
Variable 1: Instrumento legal
 Escasez de licencias explícitas asociadas a los datasets 
Términos/condiciones generales de acceso y uso.
 Repositorios admin. pública: los más abiertos, dominio
público (Eurostat, US. Census Bureau, US NARA, US NASA…)
 Repositorios de investigación (auto-depósito): condiciones
establecidas por autores/propietarios
datasets, financiadores (Australian Data Archive, UK Data
Archive, ICPSR, IQSS, )
 Licencias en relación con el nivel de acceso a los datasets.
 Limitaciones de uso y reutilización (no comercial, sólo
investigación y académicos), restricciones
(confidencialidad, intimidad), condiciones (citación).
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Formatos más comunes de los datos
cuantitativos en CCSS :
★★ SPSS, SAS, Stata…
Sistemas propietarios, posibilidad de exportar en
otros formatos.

★★ .xls (MS Excel)
★★★ R (open source)
★★★ .csv, .tsv, xml
★★★★ .sdmx-ml
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Próximos pasos…
 Reformulación de la matriz teniendo en cuenta otras
variables, como nivel de accesibilidad,
interoperabilidad, documentación adicional o material
explicativo.
 Convalidación de la nueva matriz a través de
crowdsourcing con infomediarios
 Obtención de un grupo de datos en Ciencias Sociales
para aplicar la nueva matriz.
 Dimensiones de los datos: Grado de apertura. Grado de
interoperabilidad. Grado de reutilización.
Bibliografía


Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from
http://www.w3.org/DesignIssues/GovData.html



Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the
American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.



Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to
social science data preparation and archiving: Best practice throughout the data life
cycle (5th ed.). Ann Arbor, M:



Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0
Retrieved from
http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf



Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge
dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496



Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An
empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.



White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine
simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from
https://peerj.com/preprints/7/

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)

Mais conteúdo relacionado

Mais procurados

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Universidad de Guadalajara
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoLEARN Project
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosSocialBiblio
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datosKaty Tumpi
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasJavier Hernández San Miguel
 

Mais procurados (6)

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
 
Modulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de moduloModulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de modulo
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y Bibliotecarios
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datos
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativas
 

Semelhante a PKP datos abiertos Gómez - Bueno-De-La-Fuente

Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2maredata
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosnancydianagomez
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcmaredata
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16datos.ua.es
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López LEARN Project
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación DigitalEspacio Público
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓNhttp://bvsalud.org/
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Pedro Príncipe
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónFernando-Ariel Lopez
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primariosAprender 3C
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Fernando-Ariel Lopez
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?datos.ua.es
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digitalEspacio Público
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octmaredata
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxhanssebastiandelgado
 

Semelhante a PKP datos abiertos Gómez - Bueno-De-La-Fuente (20)

Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2
 
Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principios
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodc
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación Digital
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigación
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digital
 
Dades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme MeleroDades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme Melero
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 oct
 
Aspectos éticos de la Open Science
Aspectos éticos de la Open ScienceAspectos éticos de la Open Science
Aspectos éticos de la Open Science
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
 

Último

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSYadi Campos
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptAlberto Rubio
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOBRIGIDATELLOLEONARDO
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 

Último (20)

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 

PKP datos abiertos Gómez - Bueno-De-La-Fuente

  • 1. Cerrando el círculo: requisitos de los datos abiertos como recursos para la investigación abierta PKP Scholarly Publishing Conference 2013 Universidad Nacional Autónoma de México 20 Agosto 2013 Nancy Diana Gómez Gema Bueno de La Fuente Universidad Carlos III de Madrid
  • 2. Contenido  Preguntas de investigación  Objetivos  Contexto  Propuesta de metodología  Datos de los repositorios de Ciencias Sociales  Observaciones preliminares. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 3. Preguntas de investigación Métricas de datos abiertos:  ¿Cuáles son las condiciones técnico/legales que se deben cumplir para saber si un dato es abierto?  ¿Es posible establecer métricas para medir el nivel de apertura de los datos? Set de datos en repositorios de Ciencias Sociales:  ¿Qué datos se están publicando en los repositorios de Ciencias Sociales como open data?  ¿Qué nivel de apertura legal y técnico tienen los datos de los repositorios de Ciencias Sociales? 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 4. Objetivos  Diseño de la metodología para evaluar el grado de apertura de datos en repositorios de Ciencias Sociales de acuerdo a sus condiciones legales y técnicas.  Comprobación de la validez de la metodología con un conjunto seleccionado de datos abiertos del área de Ciencias Sociales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 6. ¿Porqué Ciencia Abierta? (Stodden, 2011) Facilita Reproductibilidad Innovación académica e industria Acceso al conocimiento 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 7. Razones para compartir datos (Borgman, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 8. Ciclo del dato (ICPSR, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 9. Incentivos que influencian la publicación y difusión de los datos (Stodden, 2011) Fondos de investigación (NSF, NIH, etc.) Editoriales de revistas (PLOSone) Promociones institucionales (premios, promociones, etc.) Integridad científica 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 10. Motivos que disuaden a los científicos en la publicación de datos abiertos (Stodden, 2010)  Tiempo en documentar y limpiar datos para publicar (54%)  Lidiar con preguntas de los usuarios de los datos (34%)  No recibir atribución o citación como autores de los datos (42%)  Barreras legales –copyright (41%)  Perdida potencial de futuras publicaciones (35%)  Ventaja que pueden obtener los competidores en el campo (33%) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 11. Las revistas y los datos (Stodden, 2013)  Estudio realizado sobre 170 revistas de computación ISI.     62% no menciona política de datos 79% no menciona política sobre el código/programa 66% tiene política para material suplementario Las revistas que incrementan demandas a sus autores, como datos son aquellas que tienen alto factor de impacto.  La proporción de revistas de AA con política de datos abiertos es levemente superior a las de suscripción 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 12. Formas de simplificar la reutilización de los datos (White et al., 2013)  Proveer metadatos  Usar formatos de datos estándar  Proveer el dato de forma no procesada o cruda  Uso de un repositorio establecido  Uso de una licencia abierta y establecida (usar la licencia más abierta posible) como CC0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 13. Recomendaciones (White et al. 2013)  Datos bien documentados son más fáciles de comprender para reutilizar  Datos con formatos apropiados son más fáciles de usar en una variedad de software.  Datos que han sido depositado en repositorios establecidos, más durables y citables. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 14. Datos abiertos y procesamiento  Estándares y buenas prácticas de citación para los datos (Datacite.org).  Uso de identificadores únicos de conjuntos de datos (DOI) y productores (ORCID).  Metadatos de calidad para la descripción de datasets en catálogos de datos (DCAT).  Integración de catálogos Open Data con otras herramientas (metabúsqueda).  Dataverse Network – 2006 - IQCSS (Guía para gestión de los datos-2012 5th edición) Permite a los autores subir código y datos con sus propios términos de uso. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 16. Combinación de métodos 1. Medición del nivel de apertura de datos a nivel legal y técnico:  Diseño de matriz de priorización  Convalidación de los pesos de la matriz: crowdsourcing.  2. Recogida y tratamiento de datos abiertos. 3. Caracterización de los datos de repositorios en CCSS. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 17. Matriz de evaluación (BETA) Matriz de priorización Variables consideradas: 1. Instrumento legal (copyright, licencias, aviso legal).  Korn y Oppenheim (2011). 2. Formatos de ficheros de datos:  Norma ISO 2145/2010.  Clasificación de cinco estrellas LOD de T. Berners Lee. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 18. Asignación de pesos a las variables ¿80%? 4th Int. PKP Conference, México ¿20%? N. D. Gómez, G. Bueno (2013)
  • 19. Variable 1: Instrumento legal (Korn & Oppenheim, 2011) Quién y bajo que términos se puede utilizar el dato Cualquiera 10 Restricción para usos comerciales 5 Posibilidad de modificación del dato Sin restricciones de ningún tipo 10 Sin restricciones pero con atribución 7 Compartir igual 3 No se modifican 0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 20. Variable 2: Formatos Escala LOD 5 estrellas (Berners Lee, 2010) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 21. Formula Valor licencia Valor formato Grado apertura (U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1 Términos de uso: U Posibilidad de modificación del dato: M Valor promedio de formato: pF 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 22. Selección de la muestra  Conjuntos de datos en CCSS.  Criterios de selección:  Data Citation Index:http://wokinfo.com//products _tools/multidisciplinary/dci/  Categoría CCSS.  >100 datasets Repositorio Organismo Archaeological Data Service University of York National Archives U.S. National Archives and Records Administration IQSS The Dataweb Eurostat Australian Data Archive UK Data Archive Finnish Social Science Data Archive Inter University Consortium for Political and Social Research Harvard University US Census Bureau European Union Australian National University University of Essex University of Tampere University of Michigan Odum Insitute, University of North Carolina Office for National Statistics UK Statistics Authority Roper Center  Volumen muestra: 13 repositorios Odum Institute Roper Center, University of Connecticut National Research N. D. Gómez, G. Bueno (2013) Foundation South African Data Archive 4th Int. PKP Conference, México
  • 23. Datos en Ciencias Sociales  Investigación en CCSS: diseño-recolección-análisis. Los datos son la materia prima.  Métodos de obtención de datos: observación, encuestas, documentación, experimentación.  Tipos de métodos tipos de datos  formatos  Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado  Datos estructurados.  Cualitativos: amplio rango de contenidos y formatos (texto, imagen, video, audio y otra documentación).  Retos para su publicación como datos abiertos:  Normalización, integración, redundancia…  Aspectos éticos y legales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 24. Características de la muestra  Repositorios de organismos de la administración pública principalmente.  Datos estadísticos, censales y otros estudios.  Dataverse Network.  Registros metadatos datasets: DDI XML  Opciones descarga datos: API, FTP y descarga en lotes, exportar en XLS y otros formatos.  Niveles de acceso a los datos: abierto, especial y restringido.  Licencias de descarga, solicitudes formales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 26. Variable 1: Instrumento legal  Escasez de licencias explícitas asociadas a los datasets  Términos/condiciones generales de acceso y uso.  Repositorios admin. pública: los más abiertos, dominio público (Eurostat, US. Census Bureau, US NARA, US NASA…)  Repositorios de investigación (auto-depósito): condiciones establecidas por autores/propietarios datasets, financiadores (Australian Data Archive, UK Data Archive, ICPSR, IQSS, )  Licencias en relación con el nivel de acceso a los datasets.  Limitaciones de uso y reutilización (no comercial, sólo investigación y académicos), restricciones (confidencialidad, intimidad), condiciones (citación). 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 27. Variable 2: Formatos Formatos más comunes de los datos cuantitativos en CCSS : ★★ SPSS, SAS, Stata… Sistemas propietarios, posibilidad de exportar en otros formatos. ★★ .xls (MS Excel) ★★★ R (open source) ★★★ .csv, .tsv, xml ★★★★ .sdmx-ml 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 28. Próximos pasos…  Reformulación de la matriz teniendo en cuenta otras variables, como nivel de accesibilidad, interoperabilidad, documentación adicional o material explicativo.  Convalidación de la nueva matriz a través de crowdsourcing con infomediarios  Obtención de un grupo de datos en Ciencias Sociales para aplicar la nueva matriz.  Dimensiones de los datos: Grado de apertura. Grado de interoperabilidad. Grado de reutilización.
  • 29. Bibliografía  Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from http://www.w3.org/DesignIssues/GovData.html  Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.  Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to social science data preparation and archiving: Best practice throughout the data life cycle (5th ed.). Ann Arbor, M:  Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0 Retrieved from http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf  Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496  Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.  White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from https://peerj.com/preprints/7/ 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)