[ServiceNow] Upgrade de versão - 2ª edição (Revisada, atualizada e ampliada)
Gestão de dados de pesquisa
1. Gestão de dados de pesquisa
Dra. Ana Carolina Simionato
acsimionato@ufscar.br
Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018
6. Dado de pesquisa
Dados são sempre registrados tomando como base
de algum interesse, perspectiva, tecnologia e
prática que determinam seus significados e
utilidades em diferentes contextos. (NIELSEN;
HJORLAND, 2014, p.225).
7. O que é um
dado?
#dado bruto
#dado secundário
Johnstone(2011)
8. Tipos de
dados
Os dados de pesquisa em diferentes
momentos, podem ser também
identificados como dados brutos (raw
data) ou preliminares, dados derivados,
dados referenciais ou canônicos.
Tipos de dados:
observacionais, experimentais, simulações,
dados
compilados.
13. # criação de inúmeros dados de pesquisa
# big data
14. Paradigmas
da Ciência
1. Ciência experimental ou
empírica estuda a relação
entre fenômenos por meio
de experimentos;
2. Ciência teórica ou
descritiva formula modelos
para descrição e
explicação dos fenômenos
naturais;
SAYÃO; SALES, 2015
15. Paradigmas
da Ciência
3. Ciência baseada em
simulação uso de software e
grande geração de dados;
4. Ciência com o auxílio de
ferramentas avançadas de
software e de mineração da
dados ajudam a interpretar e
transformar dados brutos em
configurações ilimitadas de
informação e conhecimento.
SAYÃO; SALES, 2015
18. PUBLIQUEM E COMPARTILHEM SEUS DADOS!
Mandatória de:
• Agências financiadoras de pesquisa;
• Periódicos científicos;
• Instituições de pesquisa;
• Pesquisadores.
22. É importante ressaltar que o dado precisa ser fornecido em
condições que permitam a sua reutilização e redistribuição,
incluindo o vínculo com outros conjuntos de dados.
Os princípios FAIR (Findable, Accessible, Interoperable,
Reusable) definem orientações para que os dados científicos
sejam localizáveis, acessíveis, interoperáveis e reusáveis.
FORCE11 (2016)
23. ações essenciais do ciclo de vida dos dados:
IDENTIFICAÇÃO, DIGITALIZAÇÃO,
HIGIENIZAÇÃO, DESCRIÇÃO,
ARMAZENAMENTO E PRESERVAÇÃO,
COMPARTILHAMENTO, e AVALIAÇÃO.
#plano de gestão de dados
#planejamento
24. Sant’Ana (2016)
DCC Curation Lifecycle Model (2013)
(2013)
Qin; Ball; Greenberg (2012)
entre outros...
#diversidade de
modelos de ciclo
de vida dos dados
de pesquisa
25. Para o Plano de Gestão de
Dados, o Digital Curation
Centre (2013) orienta ao
pesquisador a refletir sobre 13
questões:
26. Plano de gestão de dados
1. Quais dados você coletará ou criará?
2. Como os dados serão coletados ou criados?
3. Que documentação e metadados acompanharão os dados?
4. Como você administrará qualquer questão ética?
5. Como você vai gerenciar os direitos autorais e os direitos de
propriedade intelectual?
6. Como os dados serão armazenados e armazenados durante a
pesquisa?
DCC (2013)
27. Plano de gestão de dados
7. Como você vai gerenciar o acesso e a segurança?
8. Quais dados devem ser mantidos, compartilhados e / ou
preservados?
9. Qual é o plano de preservação a longo prazo para o conjunto de
dados?
10.Como você vai compartilhar os dados?
11.São necessárias restrições ao compartilhamento de dados?
12.Quem será responsável pelo gerenciamento de dados?
13.Quais recursos você precisará para implementar seu plano?
DCC (2013)
28. Conteúdo do PGD Fapesp
Um Plano de Gestão de Dados é um texto que deve responder a duas
perguntas básicas:
1. Quais dados serão gerados pelo projeto
2. Como serão preservados e disponibilizados, considerando questões éticas, legais,
de confidencialidade e outras
O texto de um Plano varia conforme a disciplina, os tipos de dados considerados
e como os responsáveis pelo projeto pretendemdisponibilizá-los. Algumas
chamadas FAPESP poderão especificar o formato desejado do Plano. Para
todos os demais casos, o Plano submetido como anexo de uma proposta à
FAPESP deveseguir as seguintes diretivas:
29. Conteúdo do PGD Fapesp
Texto de até duas páginas, contendo as seguintes informações
a) Descrição dos dados e metadados produzidos pelo projeto - por exemplo, amostras,
registros de coleta, formulários, modelos,resultados experimentais, software, gráficos, mapas,
vídeos, planilhas,gravações de áudio, bancos de dados, material didático e outros.
b) Quando aplicável, restrições legais ou éticas para compartilhamento de tais dados,
políticas para garantir a privacidade, confidencialidade, segurança, propriedade intelectual
e outros.
c) Políticade preservação e compartilhamento (por exemplo,compartilhamento imediato
ou apenas após a aceitação da publicação associada). Período de carência(antes do
compartilhamento) e período durante o qual os dados serão preservados e disponibilizados.
d) Descrição de mecanismos,formatos e padrões para armazenar tais itens de forma a
torná-los acessíveis por terceiros. Esta descrição pode incluir o uso de repositórios e serviços
de outras instituições.
30. templates de auxílio a construção do plano de
gestão de dados, sugestão:
- DMP Tool
- DMP Online
[Cuidado: cada agência ou instituição de fomento possui
um escopo, é necessário verificar]
35. Referências
A. Goben e R. Raszewski, “The data life cycle applied to our own data”, J. Med. Libr. Assoc. JMLA, vol. 103, no 1, p. 40–44, jan. 2015.
C. Borgman, “Research Data: Who will share what, with whom, when, and why?”, 2010.
C. Lee, S. Allard, N. McGovern, e A. Bishop, “Open Data meets Digital Curation: an investigation of practices and needs”, Int. J. Digit. Curation, vol. 11, no
2, p. 115–125, jul. 2017.
D. R. Harvey, Digital curation: a how-to-do-it manual. New York: Neal-Schuman Publishers, 2010.
Digital Curation Centre, “Digital Curation Centre: because good research needs good data”, 2016. [Online]. Disponível em: http://www.dcc.ac.uk/.
[Acessado: 02-ago-2016].
Editorial Nature, “Everyone needs a data-management plan”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-
03065-z. [Acessado: 10-ago-2018].
FORCE11, “Guiding Principles for Findable, Accessible, Interoperable and Re-usable Data Publishing version b1.0”, FORCE11, 10-set-2014. [Online].
Disponível em: https://www.force11.org/fairprinciples. [Acessado: 13-ago-2017].
H. Chen, Y. Lin, e C. Chen, “Approaches to building metadata for data curation”, Int. Conf. Dublin Core Metadata Appl., p. 4, 2013.
H. J. Nielsen e B. Hjørland, “Curating research data: the potential roles of libraries and information professionals”, J. Doc., vol. 70, no 2, p. 221–240, 2014.
L. F. Sayão e L. F. Sales, “Algumas considerações sobreos repositórios digitais de dados de pesquisa”, Informação Informação, vol. 21, no 2, p. 90, dez.
2016.
36. Referências
L. F. Sayão e L. F. Sales, “Curadoria digital e dados de pesquisa”, AtoZ Novas PráticasEmInformação E Conhecimento, vol. 5, no 2, p. 67, jan. 2017.
L. F. Sayão e L. F. Sales, “Dados de pesquisa: contribuição para o estabelecimento de ummodelo de curadoria digital para o país”, 2013.
L. F. Sayão e L. F. Sales, Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN/IEN, 2015.
M. D. Wilkinson et al., “The FAIR Guiding Principles for scientific data management and stewardship”, Sci. Data, vol. 3, p. 160018, mar. 2016.
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information
Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-
requirements/nsf/. [Acessado: 13-ago-2017].
National Science Foundation, “Planning data for researchers: information on writing a data management paragraph for NSF”, Research Information
Services baseline, 2015. [Online]. Disponível em: http://www.ru.nl/research-information-services/data-management/planning-research/funder-
requirements/nsf/. [Acessado: 13-ago-2017].
Q. Schiermeier, “Data management made simple”, Nature, 13-mar-2018. [Online]. Disponível em: http://www.nature.com/articles/d41586-018-03071-1.
[Acessado: 10-ago-2018].
R. C. G. Sant’Ana, “Ciclo de vida dos dados: uma perspectiva a partir da ciência da informação”, Informação Amp Informação, vol. 21, no 2, p. 27,
2016.
R. G. Curty e J. Qin, “Towards a model for research data reuse behavior”, Proc. Am. Soc. Inf. Sci. Technol., vol. 51, no 1, p. 1–4, 2014.
R. G. Curty, K. Crowston, A. Specht, B. W. Grant, e E. D. Dalton, “Attitudes and norms affecting scientists’ data reuse”, PloS One, vol. 12, no 12, p.
e0189288, 2017.
37. Obrigada!
Dra. Ana Carolina Simionato - acsimionato@ufscar.br
Série de Seminários de Pesquisa do Departamento de Computação da UFSCar – ago/2018