por Fernando Ariel López (CAICYT - CONICET).
En: Quién es quién 2016 "Creando futuro: tecnologías e innovación en las bibliotecas universitarias” de ABUC, viernes 7 de octubre de 2016.
http://abuc.org.ar/portal/?not=50
Viernes 7 de octubre
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
Estado de situación del acceso abierto en Argentina: gestión de datos científicos
1.
Estado
de
situación
del
Acceso
Abierto
en
Argen3na:
Ges3ón
de
Datos
Cien8ficos
Fernando
Ariel
López
@fernando__lopez
|
flopez@caicyt.gov.ar
Quién
es
Quién
2016
“Creando
futuro:
tecnologías
e
innovación
en
las
bibliotecas
universitarias”
7
de
octubre
de
2016
2. ¿Qué
es
el
Acceso
Abierto?
El
acceso
libre,
gratuito,
inmediato
y
sin
restricciones
a
la
literatura
cienMfica,
a
través
de
Internet.
Cualquier
persona
puede
leer,
descargar,
copiar,
distribuir,
imprimir,
comparQr
y
enlazar
los
textos
completos
de
producción
cienMfica,
sin
barreras
financieras,
legales
o
técnicas.
La
única
limitación
es
citar
al
autor
y
respetar
la
integridad
de
la
obra.
3. Caminos
para
lograr
el
Acceso
Abierto
vía
DORADA
REVISTAS
CIENTÍFICAS
• Portales
de
Revistas
CienMficas:
– Regionales
– TemáQcos
– InsQtucionales
vía
VERDE
REPOSITORIOS
• InsQtucionales
• TemáQcos
• Cosechadores
• de
Datos
…
4. vía
DORADA
• LaQndex
=
3774
revistas
en
Directorio
=
670
revistas
en
Catálogo
• SciELO
=
126
revistas
(118
vigentes)
• NBR
=
217
revistas
• Redalyc
=
75
revistas
(22.640
arMculos
y
1872
fascículos)
• DOAJ
=
128
revistas
(en
proceso
de
reevaluación)
Portales
de
Facultades
y
Universitarios
5. vía
VERDE
SNRD
(MINCYT):
*
Datos
al
14/06/2016
-‐ 40
repositorios
digitales
adheridos
al
SNRD
(proyectos,
en
desarrollo
e
implementados)
-‐ 18
repositorios
digitales
adheridos
e
integrados
al
Portal
SNRD.
-‐ 74.391
objetos
digitales
disponibles
en
Acceso
Abierto
a
través
del
Portal
SNRD.
-‐ 9
proyectos
financiados
por
el
SNRD.
-‐ $
2.310.626
es
el
monto
total
aprobado
para
los
proyectos
de
financiamiento.
Ley
26.899
Creación
de
Repositorios
Digitales
Ins3tucionales
de
Acceso
Abierto,
Propios
o
Compar3dos
(noviembre
de
2013)
• producción
cienMfico-‐tecnológica:
arMculos
de
revistas,
trabajos
técnico-‐cienMficos,
tesis
académicas,
entre
otros.
• 6
meses
después
de
la
fecha
de
su
publicación
oficial
o
de
su
aprobación.
• DATOS
PRIMARIOS:
5
años
del
momento
de
su
recolección.
6. Los
DATOS
son
el
petróleo…
…
pero
si
no
se
ges3onan
NO
SIRVEN
9. LEGISLACIÓN
• LEY
26.899
(2013)
Creación
de
Repositorios
Digitales
InsQtucionales
de
Acceso
Abierto,
Propios
o
ComparQdos
• RESOLUCIÓN
538
de
JFG
(2013)
Sistema
Nacional
de
Datos
Públicos
• DECRETO
117
(2016)
Plan
de
Apertura
de
Datos
• Ley
Acceso
a
la
Información
Pública
(2016)
Acceso
a
la
Información
Pública
10. ¿De
qué
DATOS
me
hablas?
LEY
26.899
(2013)
• Datos
Primarios
(data
set)
• Plan
de
Ges3ón
de
Datos
(DMP)
• Deposito
“data
set”
en
Repositorio
de
Datos
• Fecha:
Diciembre
de
2018
DECRETO
117
(2016)
• Datos
Públicos
(organigramas
del
EjecuQvo;
declaraciones
juradas
de
funcionarios;
personal
contratado;
escalafones
y
escalas
salariales;
contrataciones
públicas;
y
las
solicitudes
de
AIP).
• Relanzamiento
del
“Portal
Nacional
de
Datos
Públicos”
• Fecha:
11
de
Julio
de
2016
11. → hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado,
→ pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué
son
los
datos
de
invesQgación?
¿Qué son los datos de investigación?
12. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo,
datos de investigación primaria (incluidos los datos en papel o en soporte
informático), cuestionarios, cintas de audio, videos, desarrollo de
modelos, fotografías, películas, y las comprobaciones y las respuestas de
la prueba.
Las colecciones datos para la investigación pueden incluir diapositivas;
diseños y muestras.
En la información sobre la procedencia de los datos también se podría
incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo,
instrumentos). El código de software utilizado para generar, comentar o
analizar los datos también pueden ser considerados datos.”
¿Qué
son
los
datos
de
invesQgación?
¿Qué son los datos de investigación?
13. Observacionales: datos capturados en tiempo real, comúnmente únicos e
Experimentales: datos provenientes de resultados experimentales
Ej: Aquellos que provienen de aparatos de medición en laboratorios, comúnmente
reproducibles, pero caros.
Simulación: datos generados de modelos de prueba donde el modelo y los
metadatos pueden ser mas importantes que los datos de salida del modelo.
Ej: Modelos económicos o climáticos.
Desarrollados o compilados: resultado de procesar y/o combinar datos “crudos”,
comúnmente reproducibles pero caros.
Ej. Bases de datos compiladas,Resultados de text mining, Datos de censos
consolidados.
Reference or canonical: Una (estática u orgánica) conglomeración o colección de
datasets mas pequeños (revisados por pares), la mayor parte de ellos publicados y
“curados”
Ej. Bancos de datos genéticos, bases de datos cristalográficas.
¿Qué
son
los
datos
de
invesQgación?
Tipos de Datos Científicos
14. ● Es
una
colección
de
datos
reunidos
durante
la
ejecución
de
un
proyecto
de
invesQgación.
● Son
objetos
digitales
compuestos
y
heterogéneos.
● ConsQtuye
la
base
de
la
invesQgación
y
va
asociado
a
una
publicación
cienMfica
(resultado
de
la
invesQgación).
● Se
almacena
y
gesQona
en
Repositorios
Interoperables
conforme
a
estándares
internacionales.
Es el objeto específico de
control, organización,
descripción y preservación
de datos científicos
DATASET
15. BENEFICIOS
#DatosAbiertos
● Ayuda
a
verificar
los
resultados.
● Evitar
la
fabricación
y
falsificación
de
datos.
● Diferentes
interpretaciones
o
enfoques
aplicados
a
datos
existentes
contribuyen
a
los
avances
cienMficos.
● OpQmización
en
el
uso
de
recursos.
● Preservación
a
largo
plazo
bien
gesQonada,
permite
mantener
la
integridad
de
los
datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and
Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101
http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
17. CIENCIA
Líneas
de
Trabajo:
1. POLÍTICA
DE
DATOS
CIENTÍFICOS
2. CICLO
DE
VIDA
DE
LOS
DATOS
CIENTÍFICOS
3. PLAN
DE
GESTIÓN
DE
DATOS
CIENTÍFICOS
4. E-‐INFRAESTRUCTURAS
18.
19. 1. Diseño
y
planificación
de
la
creación/extracción
de
datos
2. Creación/Extracción
de
Datos
3. Limpieza,
Normalización
y
Descripción
de
Datos
4. Almacenamiento
y
Preservación
de
Datos
5. Exploración,
Explotación
y
Visualización
de
Datos
6. DataMining
&
Knowledge
Discovery
CICLO
DE
VIDA
DE
LOS
DATOS
CIENTÍFICOS
20.
21.
22. ¿Qué
es
un
PGD?
Un
plan
de
ges3ón
de
datos
cien8ficos
(Data
Management
Plan
-‐
DMP)
es
un
documento
elaborado
por
el
invesQgador
o
grupo
de
invesQgación
donde
se
define:
• qué
datos
van
a
ser
creados
y
cómo,
• cómo
se
van
a
describir,
organizar,
almacenar
y
gesQonar
los
datos
• de
qué
forma
van
a
ser
comparQdos,
explicando
cualquier
restricción
de
uso
• que
pueda
ser
aplicada.
• Quién
o
quiénes
serán
los
responsables
de
realizar
cada
una
de
estas
• acQvidades.
• de
qué
forma
van
a
ser
comparQdos,
explicando
cualquier
restricción
de
uso
• que
pueda
ser
aplicada.
23. DMP
ArgenQna
(CAICYT-‐CONICET)
Propuesta
para
Proyecto
de
InvesQgación:
• Bloque
de
Datos
administraQvos
• Bloque
de
Recolección
de
datos
• Bloque
de
Documentación
y
metadatos
• Bloque
de
Almacenamiento
y
copias
de
seguridad
• Bloque
de
Selección
y
preservación
• Bloque
de
Re-‐uso
de
Datos
24. e-‐INFRAESTRUCTURAS
Repositorio Interoperable de Datos
• Datos Públicos Argentina (CKAN, OKF),
• Zenodo (Invenio, CERN)
• DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),
• Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores
• OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
26. La
profesión
del
futuro.
Es
el
encargado
en
extraer
el
conocimiento
de
los
datos.
Para
ello
deber
tener
sólidos
conocimientos
estadísQcos,
poseer
destrezas
para
resolver
problemas,
hacer
preguntas
y
explicar
los
resultados
obtenidos.
Data
Scien3st
/
Cien8ficos
de
Datos
27. Bibliotecari@
de
Datos
/
Data
Librarian
Es un término ad-hoc, es la aplicación de los principios
y las prácticas tradicionales de los bibliotecarios a los
datos.
El perfil del bibliotecario de datos requiere:
• Competencias informáticas
• Conocimiento de la disciplina (corpus, prácticas de
investigación y flujos de trabajo)
• Gestión de datos:
q adquisición (desarrollo de la colección),
q organización (catalogación y metadatos),
q preservación y conservación a largo plazo
q implementación de servicios adecuados para los
usuarios.
29. COMPETENCIAS
• Estadística, Algebra y Programación
• Tecnologías y Formatos Abiertos
• XML, PYTHON, R, etc.
• Herramientas de normalización, procesamiento
y visualización.
• Comunicación (visual y audiovisual)
• Diseño Centrado en el Usuario (UX)
30.
31.
32. OPORTUNIDADES
Comunidad
Cien8fica:
• Acordar
estándares
de
trabajo,
normalización
y
ges3ón
de
datos
• Empoderar
en
Ges3ón
de
Datos
Cien8ficos
• Contribuir
al
avance
de
la
ciencia,
maximizando
la
visibilidad
y
el
impacto
de
la
inversión
en
Inves3gación
• Financiamiento
y
Desarrollo
de
e-‐infraestructuras
para
el
aprovechamiento
de
la
Big
Data
Cien8fica
• Encuentro
con
otras
comunidades
de
Gobierno
Abierto,
Periodismo
de
Datos,
HackAcQvismo
Cívico,
IoT,
etc.
• Repensar
formas
de
producción,
medición
e
impacto
cien8fico