Gestão de dados de pesquisa
Dra. Ana Carolina Simionato
acsimionato@ufscar.br
Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018
#contexto
Fonte:http://agencia.fapesp.br/fapesp-anuncia-novas-normas-para-submissao-de-projetos-tematicos/26274/
https://www.nature.com/articles/d41586-018-03071-1?utm_source=briefing-dy&utm_medium=email&utm_campaign=briefing&utm_content=20180316%22
Agenda
 Conceitos principais
 Produção de dados de pesquisa
 Gestão de dados
 Plano de gestão de dados de
pesquisa
#dado
Dado de pesquisa
Dados são sempre registrados tomando como base
de algum interesse, perspectiva, tecnologia e
prática que determinam seus significados e
utilidades em diferentes contextos. (NIELSEN;
HJORLAND, 2014, p.225).
O que é um
dado?
#dado bruto
#dado secundário
Johnstone(2011)
Tipos de
dados
Os dados de pesquisa em diferentes
momentos, podem ser também
identificados como dados brutos (raw
data) ou preliminares, dados derivados,
dados referenciais ou canônicos.
Tipos de dados:
observacionais, experimentais, simulações,
dados
compilados.
#pesquisa
#diversidade em:
##campos e métodos de pesquisa
##tipos de dados de pesquisa
Os dados
científicos são
registros
realizados durante
uma pesquisa.
#coleta de pesquisa
#métodos de pesquisa
#diversos fins
Visível pelas
publicações
Invisível
?
#revisão por pares
#preprints
#validação da pesquisa
#publicação ampliada
#visibilidade científica
#colaboração pesquisa
Todos os esforços
de uma pesquisa?
#reprodutibilidade
#validação
#autocorreção
#avaliação por pares
#interpretação
#novas pesquisas
REUSO
# criação de inúmeros dados de pesquisa
# big data
Paradigmas
da Ciência
1. Ciência experimental ou
empírica estuda a relação
entre fenômenos por meio
de experimentos;
2. Ciência teórica ou
descritiva formula modelos
para descrição e
explicação dos fenômenos
naturais;
SAYÃO; SALES, 2015
Paradigmas
da Ciência
3. Ciência baseada em
simulação uso de software e
grande geração de dados;
4. Ciência com o auxílio de
ferramentas avançadas de
software e de mineração da
dados ajudam a interpretar e
transformar dados brutos em
configurações ilimitadas de
informação e conhecimento.
SAYÃO; SALES, 2015
#como promover o acesso ao
conhecimento?
# open science
# progresso científico
Demoiselle (1907) – patentepública
PUBLIQUEM E COMPARTILHEM SEUS DADOS!
Mandatória de:
• Agências financiadoras de pesquisa;
• Periódicos científicos;
• Instituições de pesquisa;
• Pesquisadores.
Como publicar?
? políticas institucionais
? responsabilidades
? armazenamento
? manutenção
? recursos humanos e
financeiros
? entre outras questões
?
Encontrável Acessível
Interoperável Reutilizável
Princípios
FAIR
É importante ressaltar que o dado precisa ser fornecido em
condições que permitam a sua reutilização e redistribuição,
incluindo o vínculo com outros conjuntos de dados.
Os princípios FAIR (Findable, Accessible, Interoperable,
Reusable) definem orientações para que os dados científicos
sejam localizáveis, acessíveis, interoperáveis e reusáveis.
FORCE11 (2016)
ações essenciais do ciclo de vida dos dados:
IDENTIFICAÇÃO, DIGITALIZAÇÃO,
HIGIENIZAÇÃO, DESCRIÇÃO,
ARMAZENAMENTO E PRESERVAÇÃO,
COMPARTILHAMENTO, e AVALIAÇÃO.
#plano de gestão de dados
#planejamento
Sant’Ana (2016)
DCC Curation Lifecycle Model (2013)
(2013)
Qin; Ball; Greenberg (2012)
entre outros...
#diversidade de
modelos de ciclo
de vida dos dados
de pesquisa
Para o Plano de Gestão de
Dados, o Digital Curation
Centre (2013) orienta ao
pesquisador a refletir sobre 13
questões:
Plano de gestão de dados
1. Quais dados você coletará ou criará?
2. Como os dados serão coletados ou criados?
3. Que documentação e metadados acompanharão os dados?
4. Como você administrará qualquer questão ética?
5. Como você vai gerenciar os direitos autorais e os direitos de
propriedade intelectual?
6. Como os dados serão armazenados e armazenados durante a
pesquisa?
DCC (2013)
Plano de gestão de dados
7. Como você vai gerenciar o acesso e a segurança?
8. Quais dados devem ser mantidos, compartilhados e / ou
preservados?
9. Qual é o plano de preservação a longo prazo para o conjunto de
dados?
10.Como você vai compartilhar os dados?
11.São necessárias restrições ao compartilhamento de dados?
12.Quem será responsável pelo gerenciamento de dados?
13.Quais recursos você precisará para implementar seu plano?
DCC (2013)
Conteúdo do PGD Fapesp
 Um Plano de Gestão de Dados é um texto que deve responder a duas
perguntas básicas:
 1. Quais dados serão gerados pelo projeto
 2. Como serão preservados e disponibilizados, considerando questões éticas, legais,
de confidencialidade e outras
 O texto de um Plano varia conforme a disciplina, os tipos de dados considerados
e como os responsáveis pelo projeto pretendemdisponibilizá-los. Algumas
chamadas FAPESP poderão especificar o formato desejado do Plano. Para
todos os demais casos, o Plano submetido como anexo de uma proposta à
FAPESP deveseguir as seguintes diretivas:
Conteúdo do PGD Fapesp
 Texto de até duas páginas, contendo as seguintes informações
 a) Descrição dos dados e metadados produzidos pelo projeto - por exemplo, amostras,
registros de coleta, formulários, modelos,resultados experimentais, software, gráficos, mapas,
vídeos, planilhas,gravações de áudio, bancos de dados, material didático e outros.
 b) Quando aplicável, restrições legais ou éticas para compartilhamento de tais dados,
políticas para garantir a privacidade, confidencialidade, segurança, propriedade intelectual
e outros.
 c) Políticade preservação e compartilhamento (por exemplo,compartilhamento imediato
ou apenas após a aceitação da publicação associada). Período de carência(antes do
compartilhamento) e período durante o qual os dados serão preservados e disponibilizados.
 d) Descrição de mecanismos,formatos e padrões para armazenar tais itens de forma a
torná-los acessíveis por terceiros. Esta descrição pode incluir o uso de repositórios e serviços
de outras instituições.
templates de auxílio a construção do plano de
gestão de dados, sugestão:
- DMP Tool
- DMP Online
[Cuidado: cada agência ou instituição de fomento possui
um escopo, é necessário verificar]
https://dmptool.org/
https://dmponline.dcc.ac.uk/
Onde
depositar
seus dados?
 Repositórios
institucionais;
 Repositórios
multidisciplinares:
https://datadryad.org/
https://zenodo.org/
https://figshare.com/
Buscar repositórios temáticos:
https://www.re3data.org/
Referências
A. Goben e R. Raszewski, “The data life cycle applied to our own data”, J. Med. Libr. Assoc. JMLA, vol. 103, no 1, p. 40–44, jan. 2015.
C. Borgman, “Research Data: Who will share what, with whom, when, and why?”, 2010.
C. Lee, S. Allard, N. McGovern, e A. Bishop, “Open Data meets Digital Curation: an investigation of practices and needs”, Int. J. Digit. Curation, vol. 11, no
2, p. 115–125, jul. 2017.
D. R. Harvey, Digital curation: a how-to-do-it manual. New York: Neal-Schuman Publishers, 2010.
Digital Curation Centre, “Digital Curation Centre: because good research needs good data”, 2016. [Online]. Disponível em: http://www.dcc.ac.uk/.
[Acessado: 02-ago-2016].
Editorial Nature, “Everyone needs a data-management plan”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-
03065-z. [Acessado: 10-ago-2018].
FORCE11, “Guiding Principles for Findable, Accessible, Interoperable and Re-usable Data Publishing version b1.0”, FORCE11, 10-set-2014. [Online].
Disponível em: https://www.force11.org/fairprinciples. [Acessado: 13-ago-2017].
H. Chen, Y. Lin, e C. Chen, “Approaches to building metadata for data curation”, Int. Conf. Dublin Core Metadata Appl., p. 4, 2013.
H. J. Nielsen e B. Hjørland, “Curating research data: the potential roles of libraries and information professionals”, J. Doc., vol. 70, no 2, p. 221–240, 2014.
L. F. Sayão e L. F. Sales, “Algumas considerações sobreos repositórios digitais de dados de pesquisa”, Informação Informação, vol. 21, no 2, p. 90, dez.
2016.
Referências
L. F. Sayão e L. F. Sales, “Curadoria digital e dados de pesquisa”, AtoZ Novas PráticasEmInformação E Conhecimento, vol. 5, no 2, p. 67, jan. 2017.
L. F. Sayão e L. F. Sales, “Dados de pesquisa: contribuição para o estabelecimento de ummodelo de curadoria digital para o país”, 2013.
L. F. Sayão e L. F. Sales, Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN/IEN, 2015.
M. D. Wilkinson et al., “The FAIR Guiding Principles for scientific data management and stewardship”, Sci. Data, vol. 3, p. 160018, mar. 2016.
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information
Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-
requirements/nsf/. [Acessado: 13-ago-2017].
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information
Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-
requirements/nsf/. [Acessado: 13-ago-2017].
Q. Schiermeier, “Data management made simple”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-03071-1.
[Acessado: 10-ago-2018].
R. C. G. Sant’Ana, “Ciclo de vida dos dados: uma perspectiva a partir da ciência da informação”, Informação Amp Informação, vol. 21, no 2, p. 27,
2016.
R. G. Curty e J. Qin, “Towards a model for research data reuse behavior”, Proc. Am. Soc. Inf. Sci. Technol., vol. 51, no 1, p. 1–4, 2014.
R. G. Curty, K. Crowston, A. Specht, B. W. Grant, e E. D. Dalton, “Attitudes and norms affecting scientists’ data reuse”, PloS One, vol. 12, no 12, p.
e0189288, 2017.
Obrigada!
Dra. Ana Carolina Simionato - acsimionato@ufscar.br
Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018

Gestão de dados de pesquisa

  • 1.
    Gestão de dadosde pesquisa Dra. Ana Carolina Simionato acsimionato@ufscar.br Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018
  • 2.
  • 3.
  • 4.
    Agenda  Conceitos principais Produção de dados de pesquisa  Gestão de dados  Plano de gestão de dados de pesquisa
  • 5.
  • 6.
    Dado de pesquisa Dadossão sempre registrados tomando como base de algum interesse, perspectiva, tecnologia e prática que determinam seus significados e utilidades em diferentes contextos. (NIELSEN; HJORLAND, 2014, p.225).
  • 7.
    O que éum dado? #dado bruto #dado secundário Johnstone(2011)
  • 8.
    Tipos de dados Os dadosde pesquisa em diferentes momentos, podem ser também identificados como dados brutos (raw data) ou preliminares, dados derivados, dados referenciais ou canônicos. Tipos de dados: observacionais, experimentais, simulações, dados compilados.
  • 9.
    #pesquisa #diversidade em: ##campos emétodos de pesquisa ##tipos de dados de pesquisa
  • 10.
    Os dados científicos são registros realizadosdurante uma pesquisa. #coleta de pesquisa #métodos de pesquisa #diversos fins
  • 11.
    Visível pelas publicações Invisível ? #revisão porpares #preprints #validação da pesquisa #publicação ampliada #visibilidade científica #colaboração pesquisa Todos os esforços de uma pesquisa?
  • 12.
  • 13.
    # criação deinúmeros dados de pesquisa # big data
  • 14.
    Paradigmas da Ciência 1. Ciênciaexperimental ou empírica estuda a relação entre fenômenos por meio de experimentos; 2. Ciência teórica ou descritiva formula modelos para descrição e explicação dos fenômenos naturais; SAYÃO; SALES, 2015
  • 15.
    Paradigmas da Ciência 3. Ciênciabaseada em simulação uso de software e grande geração de dados; 4. Ciência com o auxílio de ferramentas avançadas de software e de mineração da dados ajudam a interpretar e transformar dados brutos em configurações ilimitadas de informação e conhecimento. SAYÃO; SALES, 2015
  • 16.
    #como promover oacesso ao conhecimento?
  • 17.
    # open science #progresso científico Demoiselle (1907) – patentepública
  • 18.
    PUBLIQUEM E COMPARTILHEMSEUS DADOS! Mandatória de: • Agências financiadoras de pesquisa; • Periódicos científicos; • Instituições de pesquisa; • Pesquisadores.
  • 19.
  • 20.
    ? políticas institucionais ?responsabilidades ? armazenamento ? manutenção ? recursos humanos e financeiros ? entre outras questões ?
  • 21.
  • 22.
    É importante ressaltarque o dado precisa ser fornecido em condições que permitam a sua reutilização e redistribuição, incluindo o vínculo com outros conjuntos de dados. Os princípios FAIR (Findable, Accessible, Interoperable, Reusable) definem orientações para que os dados científicos sejam localizáveis, acessíveis, interoperáveis e reusáveis. FORCE11 (2016)
  • 23.
    ações essenciais dociclo de vida dos dados: IDENTIFICAÇÃO, DIGITALIZAÇÃO, HIGIENIZAÇÃO, DESCRIÇÃO, ARMAZENAMENTO E PRESERVAÇÃO, COMPARTILHAMENTO, e AVALIAÇÃO. #plano de gestão de dados #planejamento
  • 24.
    Sant’Ana (2016) DCC CurationLifecycle Model (2013) (2013) Qin; Ball; Greenberg (2012) entre outros... #diversidade de modelos de ciclo de vida dos dados de pesquisa
  • 25.
    Para o Planode Gestão de Dados, o Digital Curation Centre (2013) orienta ao pesquisador a refletir sobre 13 questões:
  • 26.
    Plano de gestãode dados 1. Quais dados você coletará ou criará? 2. Como os dados serão coletados ou criados? 3. Que documentação e metadados acompanharão os dados? 4. Como você administrará qualquer questão ética? 5. Como você vai gerenciar os direitos autorais e os direitos de propriedade intelectual? 6. Como os dados serão armazenados e armazenados durante a pesquisa? DCC (2013)
  • 27.
    Plano de gestãode dados 7. Como você vai gerenciar o acesso e a segurança? 8. Quais dados devem ser mantidos, compartilhados e / ou preservados? 9. Qual é o plano de preservação a longo prazo para o conjunto de dados? 10.Como você vai compartilhar os dados? 11.São necessárias restrições ao compartilhamento de dados? 12.Quem será responsável pelo gerenciamento de dados? 13.Quais recursos você precisará para implementar seu plano? DCC (2013)
  • 28.
    Conteúdo do PGDFapesp  Um Plano de Gestão de Dados é um texto que deve responder a duas perguntas básicas:  1. Quais dados serão gerados pelo projeto  2. Como serão preservados e disponibilizados, considerando questões éticas, legais, de confidencialidade e outras  O texto de um Plano varia conforme a disciplina, os tipos de dados considerados e como os responsáveis pelo projeto pretendemdisponibilizá-los. Algumas chamadas FAPESP poderão especificar o formato desejado do Plano. Para todos os demais casos, o Plano submetido como anexo de uma proposta à FAPESP deveseguir as seguintes diretivas:
  • 29.
    Conteúdo do PGDFapesp  Texto de até duas páginas, contendo as seguintes informações  a) Descrição dos dados e metadados produzidos pelo projeto - por exemplo, amostras, registros de coleta, formulários, modelos,resultados experimentais, software, gráficos, mapas, vídeos, planilhas,gravações de áudio, bancos de dados, material didático e outros.  b) Quando aplicável, restrições legais ou éticas para compartilhamento de tais dados, políticas para garantir a privacidade, confidencialidade, segurança, propriedade intelectual e outros.  c) Políticade preservação e compartilhamento (por exemplo,compartilhamento imediato ou apenas após a aceitação da publicação associada). Período de carência(antes do compartilhamento) e período durante o qual os dados serão preservados e disponibilizados.  d) Descrição de mecanismos,formatos e padrões para armazenar tais itens de forma a torná-los acessíveis por terceiros. Esta descrição pode incluir o uso de repositórios e serviços de outras instituições.
  • 30.
    templates de auxílioa construção do plano de gestão de dados, sugestão: - DMP Tool - DMP Online [Cuidado: cada agência ou instituição de fomento possui um escopo, é necessário verificar]
  • 31.
  • 32.
  • 33.
    Onde depositar seus dados?  Repositórios institucionais; Repositórios multidisciplinares: https://datadryad.org/ https://zenodo.org/ https://figshare.com/
  • 34.
  • 35.
    Referências A. Goben eR. Raszewski, “The data life cycle applied to our own data”, J. Med. Libr. Assoc. JMLA, vol. 103, no 1, p. 40–44, jan. 2015. C. Borgman, “Research Data: Who will share what, with whom, when, and why?”, 2010. C. Lee, S. Allard, N. McGovern, e A. Bishop, “Open Data meets Digital Curation: an investigation of practices and needs”, Int. J. Digit. Curation, vol. 11, no 2, p. 115–125, jul. 2017. D. R. Harvey, Digital curation: a how-to-do-it manual. New York: Neal-Schuman Publishers, 2010. Digital Curation Centre, “Digital Curation Centre: because good research needs good data”, 2016. [Online]. Disponível em: http://www.dcc.ac.uk/. [Acessado: 02-ago-2016]. Editorial Nature, “Everyone needs a data-management plan”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018- 03065-z. [Acessado: 10-ago-2018]. FORCE11, “Guiding Principles for Findable, Accessible, Interoperable and Re-usable Data Publishing version b1.0”, FORCE11, 10-set-2014. [Online]. Disponível em: https://www.force11.org/fairprinciples. [Acessado: 13-ago-2017]. H. Chen, Y. Lin, e C. Chen, “Approaches to building metadata for data curation”, Int. Conf. Dublin Core Metadata Appl., p. 4, 2013. H. J. Nielsen e B. Hjørland, “Curating research data: the potential roles of libraries and information professionals”, J. Doc., vol. 70, no 2, p. 221–240, 2014. L. F. Sayão e L. F. Sales, “Algumas considerações sobreos repositórios digitais de dados de pesquisa”, Informação Informação, vol. 21, no 2, p. 90, dez. 2016.
  • 36.
    Referências L. F. Sayãoe L. F. Sales, “Curadoria digital e dados de pesquisa”, AtoZ Novas PráticasEmInformação E Conhecimento, vol. 5, no 2, p. 67, jan. 2017. L. F. Sayão e L. F. Sales, “Dados de pesquisa: contribuição para o estabelecimento de ummodelo de curadoria digital para o país”, 2013. L. F. Sayão e L. F. Sales, Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN/IEN, 2015. M. D. Wilkinson et al., “The FAIR Guiding Principles for scientific data management and stewardship”, Sci. Data, vol. 3, p. 160018, mar. 2016. National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder- requirements/nsf/. [Acessado: 13-ago-2017]. National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder- requirements/nsf/. [Acessado: 13-ago-2017]. Q. Schiermeier, “Data management made simple”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-03071-1. [Acessado: 10-ago-2018]. R. C. G. Sant’Ana, “Ciclo de vida dos dados: uma perspectiva a partir da ciência da informação”, Informação Amp Informação, vol. 21, no 2, p. 27, 2016. R. G. Curty e J. Qin, “Towards a model for research data reuse behavior”, Proc. Am. Soc. Inf. Sci. Technol., vol. 51, no 1, p. 1–4, 2014. R. G. Curty, K. Crowston, A. Specht, B. W. Grant, e E. D. Dalton, “Attitudes and norms affecting scientists’ data reuse”, PloS One, vol. 12, no 12, p. e0189288, 2017.
  • 37.
    Obrigada! Dra. Ana CarolinaSimionato - acsimionato@ufscar.br Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018