SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
RESEARCH DATA ALLIANCE (RDA):
E o Desafio de Compartilhar Dados Científicos
Daniela Brauner – ForumRNP - Ago/2015: dani@inf.ufpel.edu.br
1
2
FONTE: Qmee.
Online in 60 seconds, 2014.
http://blog.qmee.com/online-
in-60-seconds-infographic-a-
year-later/
60 segundos
ONLINE
16.6K transações
138.8 milhões de
e-mails
1.1K photos
adicionadas
15K músicas
baixadas
…
Manyika, J. et al. Big data: The next frontier for
innovation, competition, and productivity
May, 2011.
McKinsey Global Institute Report.
http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
3
Motivação
"Carro vai gerar 25 GB de dados
por hora”- http://bit.ly/1IKNT0W
“Uma família preenche com
informações 65 smartphones de
32GB por ano; daqui a seis anos,
preencherá 318.” -
http://glo.bo/1gwWE0D
•  Milhares de sensores capturando
dados por aí (Internet of Things - IoT).
4
•  Existem milhares de coleções de dados
abertos disponíveis na Web (open data)
•  LSST - Large Synoptic Survey Telescope: telescópio que fará uma
espécie de “filme” do céu. Coletará cerca de 2.5 milhões de visitas (filmes).
•  Estimativa em 10 anos: ~100 PB de dados coletados Referências:
http://www.on.br
http://bravo.iag.usp.br
http://www.lsst.org
Astronomia
•  LHC (Large Hadron Colider): acelerador de partículas. Coleta ~700
megabytes de dados por segundo (MB/s).
•  Estimativa em 10 anos: ~150 PB de dados coletados.
Física de Partículas
Referências:
http://home.web.cern.ch/topics/large-hadron-collider
http://opendata.cern.ch
Biodiversidade
•  Grandes coleções de dados com informação sobre
biodiversidade:
•  Rede speciesLink : ~7,7 milhões de registros com informações sobre
espécimes da biodiversidade brasileira reunindo coleções de
diversos herbários. Fornece ferramentas e serviços online para
estimular e facilitar a publicação, acesso e uso de toda informação
disponibilizada.
•  SiBBr: ~2,9 milhões de registros. Fornece uma plataforma online
para estimular e facilitar a publicação, acesso e uso da informação
sobre a biodiversidade brasileira.
Referências:
http://splink.cria.org.br
http://www.sibbr.gov.br
Impacto na rede: tráfego da Internet
(em volume de dados)
Ano Tráfego da Internet Global
1992 100 GB por dia
1997 100 GB por hora
2002 100 GB por segundo (GB ps)
2007 2000 GBps
2013 28.875 GBps
2018 50.000 GBps
FONTE: Cisco VNI, 2014
http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/
VNI_Hyperconnectivity_WP.html
…e afinal, cadê o compartilhamento
destes dados coletados no mundo?
8
Monitoramento Hidrossedimentológico
9
Sensores de pressão (nível d'água) e de turbidez.
Estação de coleta e transmissão de dados.
10
11
Motivação
•  Reprodutibilidade e repetibilidade
•  Os princípios fundamentais dos métodos científicos;
•  Reprodutibilidade: a capacidade de reproduzir um experimento;
•  Repetibilidade: a capacidade de repetir um experimento;
•  A dificuldade no acesso aos dados, dificulta a reprodutibilidade da
ciência (Van Noorden, 2015):
•  Tentativa de reproduzir os 50 trabalhos mais citados sobre câncer;
•  De revistas que exigem o compartilhamento de dados sob demanda;
•  Em média, a disponibilização dos dados de 31 trabalhos levou 2 meses;
12
FONTE: Van Noorden, R. Sluggish data sharing hampers reproducibility effort. June, 2015. In NATURE.
http://www.nature.com/news/sluggish-data-sharing-hampers-reproducibility-effort-1.17694
Desafios
•  Os acadêmicos mudam de emprego (e domicílio);
•  Alguns não mantém registros de onde seus dados estão;
•  Eles precisam buscar em publicações antigas como foi
realizada a pesquisa;
•  Eles precisam re-analisar os arquivos, que estão em
formatos antigos;
Argumentos fortes indicam que os pesquisadores precisam
compartilhar seus dados no momento que eles submetem
um artigo (Van Noorden, 2015).
13
FONTE: Van Noorden, R. Sluggish data sharing hampers reproducibility effort. June, 2015. In NATURE.
http://www.nature.com/news/sluggish-data-sharing-hampers-reproducibility-effort-1.17694
Desafios
•  Os 5 V’s da Big Data
14
FONTE: Inspirado nos 4 V’s da Big Data criado pela IBM:
http://www.ibmbigdatahub.com/sites/default/files/infographic_file/4-Vs-of-big-data.jpg
Veracidade
Variedade
VelocidadeValor
Volume
A quantidade de
dados que está sendo
produzido no mundo
é enorme. Como
armazenar e organizar
esse volume de dados
para torná-lo
pesquisável.
Como garantir a proveniência,
acurácia, confiança e
qualidade dos dados.
Diferentes tipos de
dados: sensores,
vídeos,
texto,
fotos,…
dados
temporais,
metadados,
e outros
de produção
e de processamento
Qual dado tem valor?
Qual merece ser
guardado e analisado?
Desafios no compartilhamento de dados
•  Metadados
•  Identificadores persistentes
•  e-Infraestrutura de
compartilhamento
•  e-Infraestrutura de preservação
•  Certificação de repositórios
•  Proveniência de dados
•  Vocabulários
•  Gerenciamento de dados
•  Serviços de dados nacionais
•  Big Data Analytics
•  Disponibilidade de rede
•  Garantia de citação;
•  Proteção de propriedade
intelectual;
•  Questões de confidencialidade;
•  Sustentabilidade das
e-infraestruturas
15
Desafios
16
•  Enquanto a velocidade média
da Internet comercial no Brasil
está abaixo da média global;
FONTE: Akamai State of The Internet Report- 2014.
https://www.stateoftheinternet.com/downloads/pdfs/2014-q3-state-of-the-internet-report-infographic-americas.pdf
AMERICAS HIGHLIGHTS
Desafios
17
•  Podemos afirmar que temos esse mesmo problema na
rede acadêmica?
FONTE: http://memoria.rnp.br/ceo/trafego/panorama.php
shdajsdjkashd
shdajsdjkashd
Ações que promovem o
compartilhamento de dados
•  Serviços Nacionais de Dados
•  Sociedades (científicas) internacionais
•  Research Data Alliance
Ações que promovem o
compartilhamento de dados
•  Serviços Nacionais de Dados
•  Sociedades (científicas) internacionais
•  Research Data Alliance
Serviços Nacionais de Dados
Oferecem serviços para armazenamento de dados e metadados de
coleções de dados de pesquisa, para promover e facilitar a descoberta
e reuso das informações. Além disso, fornecem treinamento e
assessoria em gerenciamento de dados científicos.
•  Austrália: http://ands.org.au
•  Holanda: http://dans.knaw.nl
•  Suécia: http://snd.gu.se/en
•  Reino Unido: http://www.data-archive.ac.uk
•  ...
Serviços Nacionais de Dados
•  Redes de compartilhamento de dados
•  Nodos podem ser gerenciados pelas instituições participantes;
•  São necessários serviços complementares:
•  Identificadores persistentes;
•  Catálogos de metadados/vocabulários;
•  Capacitação em gerenciamento de dados;
•  Assessoria em gerenciamento de dados;
Exemplos:
•  Australian Research Data Commons1
•  Dataverse2
1 h"p://ands.org.au/ardc.html	
  	
  
2	
  h"p://dataverse.org	
  	
  
21
Ações que promovem o
compartilhamento de dados
•  Serviços Nacionais de Dados
•  Sociedades (científicas) internacionais
•  Research Data Alliance
Research Data Alliance (RDA)
https://rd-alliance.org
•  Objetivo: construir conexões técnicas e sociais para viabilizar o
compartilhamento aberto de dados entre diferentes tecnologias,
disciplinas e países, de forma a endereçar grandes desafios da
sociedade em escala global.
•  Criada em 2013 por um grupo de agências interessadas no tema:
•  Comissão Europeia
•  National Science Foundation
•  National Institute of Standards and Technology (NIST)
•  Australian Government’s Department of Innovation
•  Sem fins lucrativos
•  Composição:
+ de 3140 indivíduos de + de 103 países
A participação é aberta
Get involved: https://rd-alliance.org/about/get-involved.html
Research Data Alliance (RDA)
•  Governança:
•  Através de um Conselho:
•  Formado por indicações governamentais de diferentes países;
•  Possui atuação estratégica:
•  aconselhar os caminhos da RDA;
•  influenciar os governos locais e as agências de fomento a incluirem ações em
seus planos que promovam os temas discutidos na RDA;
•  aprovar grupos de trabalhos candidatos, alinhados aos objetivos da RDA;
•  A RNP faz parte do conselho, por indicação do MCTI:
•  Michael Stanton, Diretor de Pesquisa e Desenvolvimento.
Research Data Alliance (RDA)
•  Technical Advisory Board (TAB): É responsável pela Estratégia
Técnica do RDA, provendo o expertise técnico para o Conselho.
Além disso auxilia no desenvolvimento e acompanhamento de
Grupos de Interesse e de Trabalho:
•  Grupos de Trabalho:
•  Testar tecnologias, metodologias e elaborar recomendações
•  de curto prazo (de 12 - 18 meses)
•  Grupos de Interesse
•  Discutir e estruturar temas de interesse comum
•  de mais longo prazo
Research Data Alliance (RDA)
•  Metadados
•  Identificadores persistentes
•  e-Infraestrutura de preservação
•  Certificação de repositórios
•  Proveniência de dados
•  Vocabulários
•  Gerenciamento de dados
•  Serviços de dados nacionais
•  Big Data Analytics
•  Propriedade intelectual;
…e outros.
27
Research Data Alliance (RDA)
Temas dos grupos
Considerações finais
•  Porque compartilhar dados?
•  Reusar dados para pesquisas;
•  Otimizar gastos com armazenamento e gestão de dados;
•  Expandir o escopo das pesquisas através de novos exploradores e
oportunidades de colaborações;
•  Disseminar as pesquisas, permitindo a reprodutibilidade;
•  Preservar dados, afinal não ficam só com quem os capturou;
•  Aumentar a confiabilidade dos resultados;
28
Considerações finais
•  Quem são os interessados em repositórios de dados e
gerenciamento de dados?
•  Pesquisadores
•  Instituições
•  Indústria
•  Governo e agências de fomento
•  Editoras
29
Considerações finais
•  O que fazer para promover o compartilhamento de dados:
•  Promover discussões sobre os desafios para
o compartilhamento de dados;
•  Desenvolver a política de propriedade intelectual sobre os dados
produzidos na instituição/departamento/grupo de pesquisa;
•  Requerer o depósito dos dados produzidos na instituição;
•  Requerer o depósito dos dados das publicações;
•  Requerer ações de gerenciamento de dados em
chamadas de projetos;
•  Promover a adoção de ferramentas;
•  Prover e promover serviços de suporte ao compartilhamento de
dados.
30
Obrigada!
Daniela Brauner
UFPel
dani@inf.ufpel.edu.br
31

Mais conteúdo relacionado

Mais procurados

Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?Ambiente Livre
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasElaine Naomi
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus ImpactosAlex Silva
 
Data analysis open data
Data analysis open dataData analysis open data
Data analysis open dataLiber UFPE
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 

Mais procurados (20)

Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidas
 
Big Data
Big DataBig Data
Big Data
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus Impactos
 
Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
Data analysis open data
Data analysis open dataData analysis open data
Data analysis open data
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
BigData
BigDataBigData
BigData
 
Big Data e NoSQL
Big Data e NoSQLBig Data e NoSQL
Big Data e NoSQL
 
Big Data - uma visão executiva
Big Data - uma visão executivaBig Data - uma visão executiva
Big Data - uma visão executiva
 
Big Data
Big DataBig Data
Big Data
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Big data apresentacao
Big data apresentacaoBig data apresentacao
Big data apresentacao
 

Destaque

Apresentação 2013 GRUPO RDA português
Apresentação 2013 GRUPO RDA portuguêsApresentação 2013 GRUPO RDA português
Apresentação 2013 GRUPO RDA portuguêsJesús
 
RDA como novo código de catalogação
RDA como novo código de catalogaçãoRDA como novo código de catalogação
RDA como novo código de catalogaçãoMarcelo Votto
 
Arte na pré história - Pinturas Rupestres
Arte na pré história - Pinturas Rupestres Arte na pré história - Pinturas Rupestres
Arte na pré história - Pinturas Rupestres TaiFilosofa
 

Destaque (9)

Apresentação 2013 GRUPO RDA português
Apresentação 2013 GRUPO RDA portuguêsApresentação 2013 GRUPO RDA português
Apresentação 2013 GRUPO RDA português
 
Rda
RdaRda
Rda
 
RDA
RDARDA
RDA
 
RDA como novo código de catalogação
RDA como novo código de catalogaçãoRDA como novo código de catalogação
RDA como novo código de catalogação
 
Historia do papel
Historia do papelHistoria do papel
Historia do papel
 
História do papel
História do papelHistória do papel
História do papel
 
O papel
O papel O papel
O papel
 
Papel
PapelPapel
Papel
 
Arte na pré história - Pinturas Rupestres
Arte na pré história - Pinturas Rupestres Arte na pré história - Pinturas Rupestres
Arte na pré história - Pinturas Rupestres
 

Semelhante a Apresentacao ForumRNP 2015 - Daniela Brauner

Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Luísa Alvim
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
Preservação da informação na biblioteca digital
Preservação da informação na biblioteca digitalPreservação da informação na biblioteca digital
Preservação da informação na biblioteca digitalCariniana Rede
 
Dataverse cariniana 2017
Dataverse cariniana 2017Dataverse cariniana 2017
Dataverse cariniana 2017Cariniana Rede
 
Situação e tendências da gestão de dados de investigação
Situação e tendências da gestão de dados de investigaçãoSituação e tendências da gestão de dados de investigação
Situação e tendências da gestão de dados de investigaçãoPedro Príncipe
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - BrazilMarcos Vinicius Fidelis
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosCentro Web
 
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...Denodo
 

Semelhante a Apresentacao ForumRNP 2015 - Daniela Brauner (20)

Dados de pesquisa: compartilhamento e publicação
Dados de pesquisa: compartilhamento e publicaçãoDados de pesquisa: compartilhamento e publicação
Dados de pesquisa: compartilhamento e publicação
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Curadoria de dados de pesquisa
Curadoria de dados de pesquisaCuradoria de dados de pesquisa
Curadoria de dados de pesquisa
 
Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais
 
Data Mining
Data Mining Data Mining
Data Mining
 
Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...Perfil e competências do profissional de informação para a gestão de dados (B...
Perfil e competências do profissional de informação para a gestão de dados (B...
 
Aula BigData.pptx
Aula BigData.pptxAula BigData.pptx
Aula BigData.pptx
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
Grids computacionais
Grids computacionaisGrids computacionais
Grids computacionais
 
Preservação da informação na biblioteca digital
Preservação da informação na biblioteca digitalPreservação da informação na biblioteca digital
Preservação da informação na biblioteca digital
 
Dataverse cariniana 2017
Dataverse cariniana 2017Dataverse cariniana 2017
Dataverse cariniana 2017
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Situação e tendências da gestão de dados de investigação
Situação e tendências da gestão de dados de investigaçãoSituação e tendências da gestão de dados de investigação
Situação e tendências da gestão de dados de investigação
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
Data science
Data scienceData science
Data science
 
Organizações virtuais
Organizações virtuaisOrganizações virtuais
Organizações virtuais
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e Benefícios
 
Pesquisa Reproduzivel
Pesquisa ReproduzivelPesquisa Reproduzivel
Pesquisa Reproduzivel
 
QUESTÕES PRÁTICAS SOBRE PRESERVAÇÃO DIGITAL
QUESTÕES PRÁTICAS SOBRE PRESERVAÇÃO DIGITALQUESTÕES PRÁTICAS SOBRE PRESERVAÇÃO DIGITAL
QUESTÕES PRÁTICAS SOBRE PRESERVAÇÃO DIGITAL
 
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
 

Mais de Daniela Brauner

Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Daniela Brauner
 
Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenDaniela Brauner
 
Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Daniela Brauner
 
Validando a proposta de valor com MVP
Validando a proposta de valor com MVPValidando a proposta de valor com MVP
Validando a proposta de valor com MVPDaniela Brauner
 
Aula 02 introducao adm da produção - db
Aula 02   introducao adm da produção - dbAula 02   introducao adm da produção - db
Aula 02 introducao adm da produção - dbDaniela Brauner
 
Aula 04 introducao processos de transformação - db
Aula 04   introducao processos de transformação - dbAula 04   introducao processos de transformação - db
Aula 04 introducao processos de transformação - dbDaniela Brauner
 
Aula 07 evolução histórica da função produção - db
Aula 07   evolução histórica da função produção - dbAula 07   evolução histórica da função produção - db
Aula 07 evolução histórica da função produção - dbDaniela Brauner
 
Aula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisAula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisDaniela Brauner
 
Aula04 - EAP e Cronograma
Aula04 - EAP e CronogramaAula04 - EAP e Cronograma
Aula04 - EAP e CronogramaDaniela Brauner
 
Aula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoAula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoDaniela Brauner
 
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...Daniela Brauner
 
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasProposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasDaniela Brauner
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e OntologiasDaniela Brauner
 
Aula - Sistemas de Informação
Aula - Sistemas de InformaçãoAula - Sistemas de Informação
Aula - Sistemas de InformaçãoDaniela Brauner
 
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKAula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKDaniela Brauner
 
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasAula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasDaniela Brauner
 
AULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIAULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIDaniela Brauner
 

Mais de Daniela Brauner (17)

Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
 
Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data Driven
 
Business Analytics - Data Science Processes
Business Analytics - Data Science Processes Business Analytics - Data Science Processes
Business Analytics - Data Science Processes
 
Validando a proposta de valor com MVP
Validando a proposta de valor com MVPValidando a proposta de valor com MVP
Validando a proposta de valor com MVP
 
Aula 02 introducao adm da produção - db
Aula 02   introducao adm da produção - dbAula 02   introducao adm da produção - db
Aula 02 introducao adm da produção - db
 
Aula 04 introducao processos de transformação - db
Aula 04   introducao processos de transformação - dbAula 04   introducao processos de transformação - db
Aula 04 introducao processos de transformação - db
 
Aula 07 evolução histórica da função produção - db
Aula 07   evolução histórica da função produção - dbAula 07   evolução histórica da função produção - db
Aula 07 evolução histórica da função produção - db
 
Aula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisAula05 - Metodologias Ágeis
Aula05 - Metodologias Ágeis
 
Aula04 - EAP e Cronograma
Aula04 - EAP e CronogramaAula04 - EAP e Cronograma
Aula04 - EAP e Cronograma
 
Aula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoAula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de Projeto
 
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
 
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasProposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e Ontologias
 
Aula - Sistemas de Informação
Aula - Sistemas de InformaçãoAula - Sistemas de Informação
Aula - Sistemas de Informação
 
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKAula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
 
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasAula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
 
AULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIAULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMI
 

Apresentacao ForumRNP 2015 - Daniela Brauner

  • 1. RESEARCH DATA ALLIANCE (RDA): E o Desafio de Compartilhar Dados Científicos Daniela Brauner – ForumRNP - Ago/2015: dani@inf.ufpel.edu.br 1
  • 2. 2 FONTE: Qmee. Online in 60 seconds, 2014. http://blog.qmee.com/online- in-60-seconds-infographic-a- year-later/ 60 segundos ONLINE 16.6K transações 138.8 milhões de e-mails 1.1K photos adicionadas 15K músicas baixadas …
  • 3. Manyika, J. et al. Big data: The next frontier for innovation, competition, and productivity May, 2011. McKinsey Global Institute Report. http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation 3
  • 4. Motivação "Carro vai gerar 25 GB de dados por hora”- http://bit.ly/1IKNT0W “Uma família preenche com informações 65 smartphones de 32GB por ano; daqui a seis anos, preencherá 318.” - http://glo.bo/1gwWE0D •  Milhares de sensores capturando dados por aí (Internet of Things - IoT). 4 •  Existem milhares de coleções de dados abertos disponíveis na Web (open data)
  • 5. •  LSST - Large Synoptic Survey Telescope: telescópio que fará uma espécie de “filme” do céu. Coletará cerca de 2.5 milhões de visitas (filmes). •  Estimativa em 10 anos: ~100 PB de dados coletados Referências: http://www.on.br http://bravo.iag.usp.br http://www.lsst.org Astronomia •  LHC (Large Hadron Colider): acelerador de partículas. Coleta ~700 megabytes de dados por segundo (MB/s). •  Estimativa em 10 anos: ~150 PB de dados coletados. Física de Partículas Referências: http://home.web.cern.ch/topics/large-hadron-collider http://opendata.cern.ch
  • 6. Biodiversidade •  Grandes coleções de dados com informação sobre biodiversidade: •  Rede speciesLink : ~7,7 milhões de registros com informações sobre espécimes da biodiversidade brasileira reunindo coleções de diversos herbários. Fornece ferramentas e serviços online para estimular e facilitar a publicação, acesso e uso de toda informação disponibilizada. •  SiBBr: ~2,9 milhões de registros. Fornece uma plataforma online para estimular e facilitar a publicação, acesso e uso da informação sobre a biodiversidade brasileira. Referências: http://splink.cria.org.br http://www.sibbr.gov.br
  • 7. Impacto na rede: tráfego da Internet (em volume de dados) Ano Tráfego da Internet Global 1992 100 GB por dia 1997 100 GB por hora 2002 100 GB por segundo (GB ps) 2007 2000 GBps 2013 28.875 GBps 2018 50.000 GBps FONTE: Cisco VNI, 2014 http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/ VNI_Hyperconnectivity_WP.html
  • 8. …e afinal, cadê o compartilhamento destes dados coletados no mundo? 8
  • 9. Monitoramento Hidrossedimentológico 9 Sensores de pressão (nível d'água) e de turbidez. Estação de coleta e transmissão de dados.
  • 10. 10
  • 11. 11
  • 12. Motivação •  Reprodutibilidade e repetibilidade •  Os princípios fundamentais dos métodos científicos; •  Reprodutibilidade: a capacidade de reproduzir um experimento; •  Repetibilidade: a capacidade de repetir um experimento; •  A dificuldade no acesso aos dados, dificulta a reprodutibilidade da ciência (Van Noorden, 2015): •  Tentativa de reproduzir os 50 trabalhos mais citados sobre câncer; •  De revistas que exigem o compartilhamento de dados sob demanda; •  Em média, a disponibilização dos dados de 31 trabalhos levou 2 meses; 12 FONTE: Van Noorden, R. Sluggish data sharing hampers reproducibility effort. June, 2015. In NATURE. http://www.nature.com/news/sluggish-data-sharing-hampers-reproducibility-effort-1.17694
  • 13. Desafios •  Os acadêmicos mudam de emprego (e domicílio); •  Alguns não mantém registros de onde seus dados estão; •  Eles precisam buscar em publicações antigas como foi realizada a pesquisa; •  Eles precisam re-analisar os arquivos, que estão em formatos antigos; Argumentos fortes indicam que os pesquisadores precisam compartilhar seus dados no momento que eles submetem um artigo (Van Noorden, 2015). 13 FONTE: Van Noorden, R. Sluggish data sharing hampers reproducibility effort. June, 2015. In NATURE. http://www.nature.com/news/sluggish-data-sharing-hampers-reproducibility-effort-1.17694
  • 14. Desafios •  Os 5 V’s da Big Data 14 FONTE: Inspirado nos 4 V’s da Big Data criado pela IBM: http://www.ibmbigdatahub.com/sites/default/files/infographic_file/4-Vs-of-big-data.jpg Veracidade Variedade VelocidadeValor Volume A quantidade de dados que está sendo produzido no mundo é enorme. Como armazenar e organizar esse volume de dados para torná-lo pesquisável. Como garantir a proveniência, acurácia, confiança e qualidade dos dados. Diferentes tipos de dados: sensores, vídeos, texto, fotos,… dados temporais, metadados, e outros de produção e de processamento Qual dado tem valor? Qual merece ser guardado e analisado?
  • 15. Desafios no compartilhamento de dados •  Metadados •  Identificadores persistentes •  e-Infraestrutura de compartilhamento •  e-Infraestrutura de preservação •  Certificação de repositórios •  Proveniência de dados •  Vocabulários •  Gerenciamento de dados •  Serviços de dados nacionais •  Big Data Analytics •  Disponibilidade de rede •  Garantia de citação; •  Proteção de propriedade intelectual; •  Questões de confidencialidade; •  Sustentabilidade das e-infraestruturas 15
  • 16. Desafios 16 •  Enquanto a velocidade média da Internet comercial no Brasil está abaixo da média global; FONTE: Akamai State of The Internet Report- 2014. https://www.stateoftheinternet.com/downloads/pdfs/2014-q3-state-of-the-internet-report-infographic-americas.pdf AMERICAS HIGHLIGHTS
  • 17. Desafios 17 •  Podemos afirmar que temos esse mesmo problema na rede acadêmica? FONTE: http://memoria.rnp.br/ceo/trafego/panorama.php shdajsdjkashd shdajsdjkashd
  • 18. Ações que promovem o compartilhamento de dados •  Serviços Nacionais de Dados •  Sociedades (científicas) internacionais •  Research Data Alliance
  • 19. Ações que promovem o compartilhamento de dados •  Serviços Nacionais de Dados •  Sociedades (científicas) internacionais •  Research Data Alliance
  • 20. Serviços Nacionais de Dados Oferecem serviços para armazenamento de dados e metadados de coleções de dados de pesquisa, para promover e facilitar a descoberta e reuso das informações. Além disso, fornecem treinamento e assessoria em gerenciamento de dados científicos. •  Austrália: http://ands.org.au •  Holanda: http://dans.knaw.nl •  Suécia: http://snd.gu.se/en •  Reino Unido: http://www.data-archive.ac.uk •  ...
  • 21. Serviços Nacionais de Dados •  Redes de compartilhamento de dados •  Nodos podem ser gerenciados pelas instituições participantes; •  São necessários serviços complementares: •  Identificadores persistentes; •  Catálogos de metadados/vocabulários; •  Capacitação em gerenciamento de dados; •  Assessoria em gerenciamento de dados; Exemplos: •  Australian Research Data Commons1 •  Dataverse2 1 h"p://ands.org.au/ardc.html     2  h"p://dataverse.org     21
  • 22. Ações que promovem o compartilhamento de dados •  Serviços Nacionais de Dados •  Sociedades (científicas) internacionais •  Research Data Alliance
  • 23. Research Data Alliance (RDA) https://rd-alliance.org •  Objetivo: construir conexões técnicas e sociais para viabilizar o compartilhamento aberto de dados entre diferentes tecnologias, disciplinas e países, de forma a endereçar grandes desafios da sociedade em escala global. •  Criada em 2013 por um grupo de agências interessadas no tema: •  Comissão Europeia •  National Science Foundation •  National Institute of Standards and Technology (NIST) •  Australian Government’s Department of Innovation
  • 24. •  Sem fins lucrativos •  Composição: + de 3140 indivíduos de + de 103 países A participação é aberta Get involved: https://rd-alliance.org/about/get-involved.html Research Data Alliance (RDA)
  • 25. •  Governança: •  Através de um Conselho: •  Formado por indicações governamentais de diferentes países; •  Possui atuação estratégica: •  aconselhar os caminhos da RDA; •  influenciar os governos locais e as agências de fomento a incluirem ações em seus planos que promovam os temas discutidos na RDA; •  aprovar grupos de trabalhos candidatos, alinhados aos objetivos da RDA; •  A RNP faz parte do conselho, por indicação do MCTI: •  Michael Stanton, Diretor de Pesquisa e Desenvolvimento. Research Data Alliance (RDA)
  • 26. •  Technical Advisory Board (TAB): É responsável pela Estratégia Técnica do RDA, provendo o expertise técnico para o Conselho. Além disso auxilia no desenvolvimento e acompanhamento de Grupos de Interesse e de Trabalho: •  Grupos de Trabalho: •  Testar tecnologias, metodologias e elaborar recomendações •  de curto prazo (de 12 - 18 meses) •  Grupos de Interesse •  Discutir e estruturar temas de interesse comum •  de mais longo prazo Research Data Alliance (RDA)
  • 27. •  Metadados •  Identificadores persistentes •  e-Infraestrutura de preservação •  Certificação de repositórios •  Proveniência de dados •  Vocabulários •  Gerenciamento de dados •  Serviços de dados nacionais •  Big Data Analytics •  Propriedade intelectual; …e outros. 27 Research Data Alliance (RDA) Temas dos grupos
  • 28. Considerações finais •  Porque compartilhar dados? •  Reusar dados para pesquisas; •  Otimizar gastos com armazenamento e gestão de dados; •  Expandir o escopo das pesquisas através de novos exploradores e oportunidades de colaborações; •  Disseminar as pesquisas, permitindo a reprodutibilidade; •  Preservar dados, afinal não ficam só com quem os capturou; •  Aumentar a confiabilidade dos resultados; 28
  • 29. Considerações finais •  Quem são os interessados em repositórios de dados e gerenciamento de dados? •  Pesquisadores •  Instituições •  Indústria •  Governo e agências de fomento •  Editoras 29
  • 30. Considerações finais •  O que fazer para promover o compartilhamento de dados: •  Promover discussões sobre os desafios para o compartilhamento de dados; •  Desenvolver a política de propriedade intelectual sobre os dados produzidos na instituição/departamento/grupo de pesquisa; •  Requerer o depósito dos dados produzidos na instituição; •  Requerer o depósito dos dados das publicações; •  Requerer ações de gerenciamento de dados em chamadas de projetos; •  Promover a adoção de ferramentas; •  Prover e promover serviços de suporte ao compartilhamento de dados. 30