Docente en la Maestría en Ciencias de la Información em Aprender 3C
9 de Apr de 2018•0 gostou•609 visualizações
1 de 26
#Conversatorio - Datos, datos abiertos y big data: después del proyecto LEARN. (CEPAL Wouter Schallier)
9 de Apr de 2018•0 gostou•609 visualizações
Baixar para ler offline
Denunciar
Ciências
Conversatorio sobre Big Data y Datos Abiertos (28/03/2018)
Más información en #APRENDER3C http://aprender3c.org/conversatorio-sobre-big-data-y-datos-abiertos/
2. Datos, datos abiertos y big
data:
después del proyecto LEARN
Wouter Schallier
Jefe, Biblioteca Hernán Santa Cruz
Buenos Aires, 28 de marzo 2018
3. Contenido
1. Listos para BIG data?
2. Listos para no tan BIG data?
3. Resultados del proyecto LEARN
(http://www.learn-rdm.eu/)
4. Listos para datos de investigación? GDI en
LAC
2
4. Listos para BIG data?
3
https://retina.elpais.com/retina/2017/11/17/tendencias/1510920126_844738.html
5. Listos para BIG data? (2)
1 autonomous car = 1 Gigabyte/sec.
2 billion cars in the world (by 2035)
average hours driven per car per year: 300-500h
assuming that only 1% of the cars are autonomous, and
that each of them drives 300h per year
then these produce, per year:
21,600,000,000 Terabyte
= 21,600,000 Zettabyte
= 21,600 Yottabyte
4
6. Listos para no tan BIG data?
selección (“we keep everything”)
análisis (“oil extraction and refining”)
monetizar
metadatos, linking with other data (social networks
etc.), data mining, re-use, machine actionable
centralized vs. de-centralized data storage (“edge
computing”)
(instant) access and availability
5
7. Listos para no tan BIG data? (2)
back up
preservación a largo plazo
estandarización de publicación de datos
autenticidad, integridad (blockchain)
procedencia
privacidad, seguridad y ética
visualización
6
8. La CEPAL y (Big) Data
7
https://www.cepal.org/es/organos-subsidiarios/conferencia-estadistica-americas
9. Leaders Activating Research Networks
Líderes Activando Redes de Investigación
EU funded project under Horizon 2020
Research and Innovation Programme
24 months (1/06/2015-31/05/2017)
Grant agreement 654139
EU funding: 496,582 €
Coordinación: UCL (UK)
Otros socios: CEPAL, UVI, UB, LIBER
8
10. Qué son Datos de Investigación?
Research data, from the point of view of the institution with a
responsibility for managing the data, includes:
➢All data which is created by researchers in the course of
their work, and for which the institution has a curational
responsibility for at least as long as the code and relevant
archives/ record keeping acts require, and
➢ Third-party data which have originated within the
institution or come from elsewhere.
*LERU Research Data Working Group, Roadmap - Advice
Paper No. 14 – December 2014
9
11. Datos Primarios (Raw Data):
datos directos de la medición o
recoleción, derivados del
proceso de investigación.
Datos procesados (Processed
Data): Datos derivados que han
sido objeto de análisis e
interpretación (limpieza o
extración de grandes set de
datos). Incluye los resultados
negativos e inconclusos
producto del proceso de
análisis.
Datos compartidos (Shared Data):
datos que serán compartidos
con otros
Datos publicados (Published
Data): datos disponibles
publicamente
Datos publicados de acceso
abierto (Open Access Published
Data): datos publicados bajo
modalidad de acceso abierto.
Data from Research Processes: from raw data to
open access published data by Raman Ganguly
10
12. Abertura de los Datos
Open whenever possible,
closed whenever needed...
11
13. Abertura de los Datos
12
https://www.europeandataportal.eu/en/highlights/creating-value-through-open-data
14. Productos finales del proyecto LEARN
http://learn-rdm.eu/en/dissemination/
13
Modelo de Política de GDI
Toolkitcon 25 estudios de caso de buenas
prácticas
Resumen ejecutivo de la
Hoja de Ruta LERU en 5 idiomas
15. Comunidad LEARN en LAC
Argentina, Bolivia, Brazil, Chile, Uruguay, Paraguay, Peru, Ecuador, Colombia, Venezuela,
Guyana, Costa Rica, Panama, Honduras, El Salvador, Mexico, Cuba, Jamaica, Dominican
Republic, Trinidad and Tobago, Barbados, Curaçao and Saint Lucia
14
17. Ejemplo de una política de GDI
16
Jurisdicción (3-4)
Preámbulo (1 - 2)
Anexos - Definiciones
Alcance y cobertura
(roles) (4)
Manejo de los datos
(5)
18. Ejemplo de una política de GDI (2)
17
Validez - Revisiones y
actualización (11)
Roles y responsabilidades
(9-10)
Manejo de los datos
y responsabilidades
(7-8)
Anexos (12)
22. GDI en ALyC
• Se necesitan políticas al nivel institucional
• Se necesita un cambio cultural
• Grandes cantidades de datos, pero dudas
sobre accesibilidad (Caribe) y usabilidad (AL)
• Muchas barreras (o pocos incentivos) para
compartir datos
21
23. GDI en ALyC (2)
• Se necesita capacitación en data science
• Se necesita diálogo entre bibliotecas,
investigadores, vicerrectores, TIC, agencias
de financiamiento, ministerios, sector
privado
• Bibliotecas pueden jugar un papel
importante en GDI
22