SlideShare uma empresa Scribd logo
1 de 29
Cerrando el círculo: requisitos de los datos
abiertos como recursos para la
investigación abierta
PKP Scholarly Publishing Conference 2013
Universidad Nacional Autónoma de México
20 Agosto 2013

Nancy Diana Gómez
Gema Bueno de La Fuente
Universidad Carlos III de Madrid
Contenido
 Preguntas de investigación

 Objetivos
 Contexto
 Propuesta de metodología
 Datos de los repositorios de Ciencias Sociales
 Observaciones preliminares.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Preguntas de investigación
Métricas de datos abiertos:
 ¿Cuáles son las condiciones técnico/legales que se
deben cumplir para saber si un dato es abierto?
 ¿Es posible establecer métricas para medir el nivel de
apertura de los datos?

Set de datos en repositorios de Ciencias Sociales:
 ¿Qué datos se están publicando en los repositorios de
Ciencias Sociales como open data?
 ¿Qué nivel de apertura legal y técnico tienen los datos
de los repositorios de Ciencias Sociales?
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Objetivos
 Diseño de la metodología para evaluar el
grado de apertura de datos en repositorios de
Ciencias Sociales de acuerdo a sus
condiciones legales y técnicas.
 Comprobación de la validez de la
metodología con un conjunto seleccionado de
datos abiertos del área de Ciencias Sociales.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
CONTEXTO
¿Porqué Ciencia Abierta?
(Stodden, 2011)

Facilita
Reproductibilidad
Innovación académica e industria
Acceso al conocimiento

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Razones para compartir datos
(Borgman, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Ciclo del dato (ICPSR, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Incentivos que influencian la
publicación y difusión de los datos
(Stodden, 2011)

Fondos de investigación (NSF, NIH, etc.)

Editoriales de revistas (PLOSone)
Promociones institucionales
(premios, promociones, etc.)
Integridad científica

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Motivos que disuaden a los científicos
en la publicación de datos abiertos
(Stodden, 2010)

 Tiempo en documentar y limpiar datos para publicar (54%)

 Lidiar con preguntas de los usuarios de los datos (34%)
 No recibir atribución o citación como autores de los datos
(42%)
 Barreras legales –copyright (41%)
 Perdida potencial de futuras publicaciones (35%)
 Ventaja que pueden obtener los competidores en el campo
(33%)
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Las revistas y los datos
(Stodden, 2013)

 Estudio realizado sobre 170 revistas de
computación ISI.





62% no menciona política de datos
79% no menciona política sobre el código/programa
66% tiene política para material suplementario
Las revistas que incrementan demandas a sus
autores, como datos son aquellas que tienen alto
factor de impacto.

 La proporción de revistas de AA con política de datos
abiertos es levemente superior a las de suscripción
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formas de simplificar la reutilización
de los datos (White et al., 2013)
 Proveer metadatos

 Usar formatos de datos estándar
 Proveer el dato de forma no procesada o
cruda

 Uso de un repositorio establecido
 Uso de una licencia abierta y establecida (usar
la licencia más abierta posible) como CC0
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Recomendaciones
(White et al. 2013)
 Datos bien documentados son más fáciles de
comprender para reutilizar
 Datos con formatos apropiados son más fáciles
de usar en una variedad de software.
 Datos que han sido depositado en repositorios
establecidos, más durables y citables.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Datos abiertos y procesamiento
 Estándares y buenas prácticas de citación para los
datos (Datacite.org).
 Uso de identificadores únicos de conjuntos de datos
(DOI) y productores (ORCID).
 Metadatos de calidad para la descripción de datasets
en catálogos de datos (DCAT).
 Integración de catálogos Open Data con otras
herramientas (metabúsqueda).
 Dataverse Network – 2006 - IQCSS (Guía para gestión
de los datos-2012 5th edición) Permite a los autores subir
código y datos con sus propios términos de uso.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
PROPUESTA
METODOLÓGICA
Combinación de métodos
1. Medición del nivel de apertura de datos a
nivel legal y técnico:
 Diseño de matriz de priorización
 Convalidación de los pesos de la matriz:
crowdsourcing. 

2. Recogida y tratamiento de datos abiertos.
3. Caracterización de los datos de repositorios
en CCSS.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Matriz de evaluación (BETA)
Matriz de priorización

Variables consideradas:
1. Instrumento legal (copyright, licencias, aviso
legal).
 Korn y Oppenheim (2011).

2. Formatos de ficheros de datos:
 Norma ISO 2145/2010.
 Clasificación de cinco estrellas LOD de T. Berners
Lee.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Asignación de pesos a las variables

¿80%?

4th Int. PKP Conference, México

¿20%?

N. D. Gómez, G. Bueno (2013)
Variable 1: Instrumento legal
(Korn & Oppenheim, 2011)

Quién y bajo que términos se puede utilizar el dato
Cualquiera

10

Restricción para usos comerciales

5

Posibilidad de modificación del dato
Sin restricciones de ningún tipo

10

Sin restricciones pero con atribución

7

Compartir igual

3

No se modifican

0

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Escala LOD 5 estrellas (Berners Lee, 2010)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formula
Valor licencia

Valor formato

Grado
apertura

(U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1
Términos de uso: U
Posibilidad de modificación del dato: M
Valor promedio de formato: pF
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Selección de la muestra
 Conjuntos de datos en
CCSS.
 Criterios de selección:
 Data Citation
Index:http://wokinfo.com//products
_tools/multidisciplinary/dci/

 Categoría CCSS.
 >100 datasets

Repositorio

Organismo

Archaeological Data Service

University of York

National Archives

U.S. National Archives and
Records Administration

IQSS
The Dataweb
Eurostat
Australian Data Archive
UK Data Archive
Finnish Social Science Data
Archive
Inter University Consortium for
Political and Social Research

Harvard University
US Census Bureau
European Union
Australian National
University
University of Essex
University of Tampere
University of Michigan
Odum Insitute, University of
North Carolina

Office for National Statistics

UK Statistics Authority

Roper Center

 Volumen muestra: 13
repositorios

Odum Institute

Roper Center, University of
Connecticut

National Research
N. D. Gómez, G. Bueno (2013)
Foundation

South African Data Archive

4th Int. PKP Conference, México
Datos en Ciencias Sociales
 Investigación en CCSS: diseño-recolección-análisis. Los
datos son la materia prima.
 Métodos de obtención de datos: observación, encuestas,
documentación, experimentación.
 Tipos de métodos tipos de datos  formatos
 Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado
 Datos estructurados.
 Cualitativos: amplio rango de contenidos y formatos (texto, imagen,
video, audio y otra documentación).

 Retos para su publicación como datos abiertos:
 Normalización, integración, redundancia…

 Aspectos éticos y legales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Características de la muestra
 Repositorios de organismos de la administración pública
principalmente.
 Datos estadísticos, censales y otros estudios.
 Dataverse Network.
 Registros metadatos datasets: DDI XML

 Opciones descarga datos: API, FTP y descarga en
lotes, exportar en XLS y otros formatos.
 Niveles de acceso a los datos: abierto, especial y
restringido.  Licencias de descarga, solicitudes
formales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
OBSERVACIONES
PRELIMINARES
Variable 1: Instrumento legal
 Escasez de licencias explícitas asociadas a los datasets 
Términos/condiciones generales de acceso y uso.
 Repositorios admin. pública: los más abiertos, dominio
público (Eurostat, US. Census Bureau, US NARA, US NASA…)
 Repositorios de investigación (auto-depósito): condiciones
establecidas por autores/propietarios
datasets, financiadores (Australian Data Archive, UK Data
Archive, ICPSR, IQSS, )
 Licencias en relación con el nivel de acceso a los datasets.
 Limitaciones de uso y reutilización (no comercial, sólo
investigación y académicos), restricciones
(confidencialidad, intimidad), condiciones (citación).
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Formatos más comunes de los datos
cuantitativos en CCSS :
★★ SPSS, SAS, Stata…
Sistemas propietarios, posibilidad de exportar en
otros formatos.

★★ .xls (MS Excel)
★★★ R (open source)
★★★ .csv, .tsv, xml
★★★★ .sdmx-ml
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Próximos pasos…
 Reformulación de la matriz teniendo en cuenta otras
variables, como nivel de accesibilidad,
interoperabilidad, documentación adicional o material
explicativo.
 Convalidación de la nueva matriz a través de
crowdsourcing con infomediarios
 Obtención de un grupo de datos en Ciencias Sociales
para aplicar la nueva matriz.
 Dimensiones de los datos: Grado de apertura. Grado de
interoperabilidad. Grado de reutilización.
Bibliografía


Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from
http://www.w3.org/DesignIssues/GovData.html



Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the
American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.



Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to
social science data preparation and archiving: Best practice throughout the data life
cycle (5th ed.). Ann Arbor, M:



Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0
Retrieved from
http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf



Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge
dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496



Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An
empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.



White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine
simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from
https://peerj.com/preprints/7/

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)

Mais conteúdo relacionado

Mais procurados

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Universidad de Guadalajara
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoLEARN Project
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosSocialBiblio
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datosKaty Tumpi
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasJavier Hernández San Miguel
 

Mais procurados (6)

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
 
Modulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de moduloModulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de modulo
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y Bibliotecarios
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datos
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativas
 

Semelhante a PKP datos abiertos Gómez - Bueno-De-La-Fuente

Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2maredata
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosnancydianagomez
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcmaredata
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16datos.ua.es
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López LEARN Project
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación DigitalEspacio Público
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓNhttp://bvsalud.org/
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Pedro Príncipe
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónFernando-Ariel Lopez
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primariosAprender 3C
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Fernando-Ariel Lopez
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?datos.ua.es
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digitalEspacio Público
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octmaredata
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxhanssebastiandelgado
 

Semelhante a PKP datos abiertos Gómez - Bueno-De-La-Fuente (20)

Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2
 
Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principios
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodc
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación Digital
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigación
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digital
 
Dades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme MeleroDades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme Melero
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 oct
 
Aspectos éticos de la Open Science
Aspectos éticos de la Open ScienceAspectos éticos de la Open Science
Aspectos éticos de la Open Science
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
 

Último

CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfpatriciavsquezbecerr
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Rosabel UA
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesRaquel Martín Contreras
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadJonathanCovena1
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxNataliaGonzalez619348
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicialLorenaSanchez350426
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 

Último (20)

CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdf
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
recursos naturales america cuarto basico
recursos naturales america cuarto basicorecursos naturales america cuarto basico
recursos naturales america cuarto basico
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materiales
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la Sostenibilidad
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicial
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 

PKP datos abiertos Gómez - Bueno-De-La-Fuente

  • 1. Cerrando el círculo: requisitos de los datos abiertos como recursos para la investigación abierta PKP Scholarly Publishing Conference 2013 Universidad Nacional Autónoma de México 20 Agosto 2013 Nancy Diana Gómez Gema Bueno de La Fuente Universidad Carlos III de Madrid
  • 2. Contenido  Preguntas de investigación  Objetivos  Contexto  Propuesta de metodología  Datos de los repositorios de Ciencias Sociales  Observaciones preliminares. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 3. Preguntas de investigación Métricas de datos abiertos:  ¿Cuáles son las condiciones técnico/legales que se deben cumplir para saber si un dato es abierto?  ¿Es posible establecer métricas para medir el nivel de apertura de los datos? Set de datos en repositorios de Ciencias Sociales:  ¿Qué datos se están publicando en los repositorios de Ciencias Sociales como open data?  ¿Qué nivel de apertura legal y técnico tienen los datos de los repositorios de Ciencias Sociales? 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 4. Objetivos  Diseño de la metodología para evaluar el grado de apertura de datos en repositorios de Ciencias Sociales de acuerdo a sus condiciones legales y técnicas.  Comprobación de la validez de la metodología con un conjunto seleccionado de datos abiertos del área de Ciencias Sociales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 6. ¿Porqué Ciencia Abierta? (Stodden, 2011) Facilita Reproductibilidad Innovación académica e industria Acceso al conocimiento 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 7. Razones para compartir datos (Borgman, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 8. Ciclo del dato (ICPSR, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 9. Incentivos que influencian la publicación y difusión de los datos (Stodden, 2011) Fondos de investigación (NSF, NIH, etc.) Editoriales de revistas (PLOSone) Promociones institucionales (premios, promociones, etc.) Integridad científica 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 10. Motivos que disuaden a los científicos en la publicación de datos abiertos (Stodden, 2010)  Tiempo en documentar y limpiar datos para publicar (54%)  Lidiar con preguntas de los usuarios de los datos (34%)  No recibir atribución o citación como autores de los datos (42%)  Barreras legales –copyright (41%)  Perdida potencial de futuras publicaciones (35%)  Ventaja que pueden obtener los competidores en el campo (33%) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 11. Las revistas y los datos (Stodden, 2013)  Estudio realizado sobre 170 revistas de computación ISI.     62% no menciona política de datos 79% no menciona política sobre el código/programa 66% tiene política para material suplementario Las revistas que incrementan demandas a sus autores, como datos son aquellas que tienen alto factor de impacto.  La proporción de revistas de AA con política de datos abiertos es levemente superior a las de suscripción 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 12. Formas de simplificar la reutilización de los datos (White et al., 2013)  Proveer metadatos  Usar formatos de datos estándar  Proveer el dato de forma no procesada o cruda  Uso de un repositorio establecido  Uso de una licencia abierta y establecida (usar la licencia más abierta posible) como CC0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 13. Recomendaciones (White et al. 2013)  Datos bien documentados son más fáciles de comprender para reutilizar  Datos con formatos apropiados son más fáciles de usar en una variedad de software.  Datos que han sido depositado en repositorios establecidos, más durables y citables. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 14. Datos abiertos y procesamiento  Estándares y buenas prácticas de citación para los datos (Datacite.org).  Uso de identificadores únicos de conjuntos de datos (DOI) y productores (ORCID).  Metadatos de calidad para la descripción de datasets en catálogos de datos (DCAT).  Integración de catálogos Open Data con otras herramientas (metabúsqueda).  Dataverse Network – 2006 - IQCSS (Guía para gestión de los datos-2012 5th edición) Permite a los autores subir código y datos con sus propios términos de uso. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 16. Combinación de métodos 1. Medición del nivel de apertura de datos a nivel legal y técnico:  Diseño de matriz de priorización  Convalidación de los pesos de la matriz: crowdsourcing.  2. Recogida y tratamiento de datos abiertos. 3. Caracterización de los datos de repositorios en CCSS. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 17. Matriz de evaluación (BETA) Matriz de priorización Variables consideradas: 1. Instrumento legal (copyright, licencias, aviso legal).  Korn y Oppenheim (2011). 2. Formatos de ficheros de datos:  Norma ISO 2145/2010.  Clasificación de cinco estrellas LOD de T. Berners Lee. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 18. Asignación de pesos a las variables ¿80%? 4th Int. PKP Conference, México ¿20%? N. D. Gómez, G. Bueno (2013)
  • 19. Variable 1: Instrumento legal (Korn & Oppenheim, 2011) Quién y bajo que términos se puede utilizar el dato Cualquiera 10 Restricción para usos comerciales 5 Posibilidad de modificación del dato Sin restricciones de ningún tipo 10 Sin restricciones pero con atribución 7 Compartir igual 3 No se modifican 0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 20. Variable 2: Formatos Escala LOD 5 estrellas (Berners Lee, 2010) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 21. Formula Valor licencia Valor formato Grado apertura (U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1 Términos de uso: U Posibilidad de modificación del dato: M Valor promedio de formato: pF 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 22. Selección de la muestra  Conjuntos de datos en CCSS.  Criterios de selección:  Data Citation Index:http://wokinfo.com//products _tools/multidisciplinary/dci/  Categoría CCSS.  >100 datasets Repositorio Organismo Archaeological Data Service University of York National Archives U.S. National Archives and Records Administration IQSS The Dataweb Eurostat Australian Data Archive UK Data Archive Finnish Social Science Data Archive Inter University Consortium for Political and Social Research Harvard University US Census Bureau European Union Australian National University University of Essex University of Tampere University of Michigan Odum Insitute, University of North Carolina Office for National Statistics UK Statistics Authority Roper Center  Volumen muestra: 13 repositorios Odum Institute Roper Center, University of Connecticut National Research N. D. Gómez, G. Bueno (2013) Foundation South African Data Archive 4th Int. PKP Conference, México
  • 23. Datos en Ciencias Sociales  Investigación en CCSS: diseño-recolección-análisis. Los datos son la materia prima.  Métodos de obtención de datos: observación, encuestas, documentación, experimentación.  Tipos de métodos tipos de datos  formatos  Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado  Datos estructurados.  Cualitativos: amplio rango de contenidos y formatos (texto, imagen, video, audio y otra documentación).  Retos para su publicación como datos abiertos:  Normalización, integración, redundancia…  Aspectos éticos y legales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 24. Características de la muestra  Repositorios de organismos de la administración pública principalmente.  Datos estadísticos, censales y otros estudios.  Dataverse Network.  Registros metadatos datasets: DDI XML  Opciones descarga datos: API, FTP y descarga en lotes, exportar en XLS y otros formatos.  Niveles de acceso a los datos: abierto, especial y restringido.  Licencias de descarga, solicitudes formales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 26. Variable 1: Instrumento legal  Escasez de licencias explícitas asociadas a los datasets  Términos/condiciones generales de acceso y uso.  Repositorios admin. pública: los más abiertos, dominio público (Eurostat, US. Census Bureau, US NARA, US NASA…)  Repositorios de investigación (auto-depósito): condiciones establecidas por autores/propietarios datasets, financiadores (Australian Data Archive, UK Data Archive, ICPSR, IQSS, )  Licencias en relación con el nivel de acceso a los datasets.  Limitaciones de uso y reutilización (no comercial, sólo investigación y académicos), restricciones (confidencialidad, intimidad), condiciones (citación). 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 27. Variable 2: Formatos Formatos más comunes de los datos cuantitativos en CCSS : ★★ SPSS, SAS, Stata… Sistemas propietarios, posibilidad de exportar en otros formatos. ★★ .xls (MS Excel) ★★★ R (open source) ★★★ .csv, .tsv, xml ★★★★ .sdmx-ml 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 28. Próximos pasos…  Reformulación de la matriz teniendo en cuenta otras variables, como nivel de accesibilidad, interoperabilidad, documentación adicional o material explicativo.  Convalidación de la nueva matriz a través de crowdsourcing con infomediarios  Obtención de un grupo de datos en Ciencias Sociales para aplicar la nueva matriz.  Dimensiones de los datos: Grado de apertura. Grado de interoperabilidad. Grado de reutilización.
  • 29. Bibliografía  Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from http://www.w3.org/DesignIssues/GovData.html  Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.  Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to social science data preparation and archiving: Best practice throughout the data life cycle (5th ed.). Ann Arbor, M:  Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0 Retrieved from http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf  Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496  Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.  White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from https://peerj.com/preprints/7/ 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)