1. O documento discute estruturas de apoio para promover o acesso aberto a dados de pesquisa, como os Princípios FAIR para tornar dados localizáveis, acessíveis, interoperáveis e reutilizáveis.
2. É destacada a perda frequente de dados de pesquisa devido à falta de padronização e infraestrutura de apoio, limitando o avanço do conhecimento.
3. São apresentadas ferramentas para gestão de dados segundo os Princípios FAIR, como repositórios confiáveis e
Apresentação na mesa de conversa com pesquisadores sobre acesso aberto, diretrizes e elaboração de planos de gestão de dados da UNIRIO no dia 14 de junho de 2018.
Dados Abertos e planos de gestão de dados no Horizonte 2020 - webinar OpenAIR...Pedro Príncipe
Apresentação de Pedro Príncipe e Antónia Correia no webinar OpenAIRE Portugal para investigadores e coordenadores de projetos do H2020 e outro staff de apoio à gestão de ciência nas instituições de investigação. Webinar sobre "Dados Abertos e planos de gestão de dados no Horizonte 2020" realizado no dia 3 de maio de 2018
Abertura: Gestão de dados de pesquisa: desafios e perspectivas USPSIBiUSP
Slides da Apresentação realizada no Seminário de Gestão de Dados de Pesquisa e Boas Práticas para o Desenvolvimento da Ciência, 9 de março de 2018, São Paulo - SP, Universidade de São Paulo (USP), evento em Comemoração ao Dia do Bibliotecário. A Apresentação do Prof. Dr. João Eduardo Ferreira - Superintendência de Tecnologia da Informação - Representando o Magnífico Reitor da USP Prof. Dr. Vahan Agopyan - Universidade de São Paulo - STI - USP, abordou os desafios e perspectiva da gestão de dados de pesquisa na universidade do ponto de vista da Tecnologia de Informação da USP.
Apresentação na mesa de conversa com pesquisadores sobre acesso aberto, diretrizes e elaboração de planos de gestão de dados da UNIRIO no dia 14 de junho de 2018.
Dados Abertos e planos de gestão de dados no Horizonte 2020 - webinar OpenAIR...Pedro Príncipe
Apresentação de Pedro Príncipe e Antónia Correia no webinar OpenAIRE Portugal para investigadores e coordenadores de projetos do H2020 e outro staff de apoio à gestão de ciência nas instituições de investigação. Webinar sobre "Dados Abertos e planos de gestão de dados no Horizonte 2020" realizado no dia 3 de maio de 2018
Abertura: Gestão de dados de pesquisa: desafios e perspectivas USPSIBiUSP
Slides da Apresentação realizada no Seminário de Gestão de Dados de Pesquisa e Boas Práticas para o Desenvolvimento da Ciência, 9 de março de 2018, São Paulo - SP, Universidade de São Paulo (USP), evento em Comemoração ao Dia do Bibliotecário. A Apresentação do Prof. Dr. João Eduardo Ferreira - Superintendência de Tecnologia da Informação - Representando o Magnífico Reitor da USP Prof. Dr. Vahan Agopyan - Universidade de São Paulo - STI - USP, abordou os desafios e perspectiva da gestão de dados de pesquisa na universidade do ponto de vista da Tecnologia de Informação da USP.
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuária
Debora Pignatari Drucker, Daniela Maciel Pinto, Elaine Fidalgo, Davi Oliveira Custódio, Daniel de Castro Victoria, Bibiana Teixeira Almeida
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...CarlosMarcondes17
Discutir os impacto da grande disponibilidade de dados de pesquisa sobre o trabalho dos profissionais de informação; levantar diretrizes práticas para a gestão de dados de pesquisa no ambiente das bibliotecas universitárias; sugerir novos espaços para atuação do profissional de informação
Palestra proferida no XXIIII EREBD que aconteceu na cidade São Luís (MA) em 2020. A palestra fala como o bibliotecário está inserido no contexto do big data e da indústria 4.0.
Workshop APDIS sobre Gestão de Dados CientíficosPedro Príncipe
Apresentação com os conteúdos do workshop realizado nas Jornadas da APDIS 2016 sobre Gestão de Dados Científicos: o papel dos profissionais de informação
An approach for managing and semantically enriching the publication of Linked...greco_ufrj
With the growth of e-government programs, the available data to citizens is growing in volume every day. However, to make these data a useful source of information, to be referenced and integrated more easily by different applications, they should be published according to the best practices of
Linked Open Data, using standards for description (RDF) and identification
(URI) of data resources on the web. The main goal of this work is to propose a
platform and approach to support the exposure, sharing and association of
data resources in the form of Linked Open Data, offering a user-friendly environment to stimulate the publication of data and their association to other
existing data. Central functionalities to be included are data cleaning, transformation, linking, annotation and referencing to terminology mechanisms.
http://andrefreitas.org/papers/SBBD-Workshop-eGov-preprint.pdf
Kelli de Faria Cordeiro, Fabricio Firmino de Faria, Bianca de Oliveira Pereira, André Freitas, João Vitor Villas Boas Freitas, Ana Christina Bringuente, Lucas de Oliveira Arantes, Rodrigo Calhau, Veruska Zamborlini, Maria Luiza Machado Campos, Giancarlo Guizzardi, An Approach for Managing and Semantically Enriching the Publication of Linked Open Governmental Data, 3rd Workshop of Applied Computing in Electronic Government (WCGE), In WEBMEDIA/SBBD, 2011
Além disso, este módulo irá também introduzir alguns conceitos chave de
softwares livres e de código aberto (Free and Open Source Software, ou FOSS)
e softwares livres e de código aberto para aplicações geoespaciais (FOSS4G)
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuária
Debora Pignatari Drucker, Daniela Maciel Pinto, Elaine Fidalgo, Davi Oliveira Custódio, Daniel de Castro Victoria, Bibiana Teixeira Almeida
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...CarlosMarcondes17
Discutir os impacto da grande disponibilidade de dados de pesquisa sobre o trabalho dos profissionais de informação; levantar diretrizes práticas para a gestão de dados de pesquisa no ambiente das bibliotecas universitárias; sugerir novos espaços para atuação do profissional de informação
Palestra proferida no XXIIII EREBD que aconteceu na cidade São Luís (MA) em 2020. A palestra fala como o bibliotecário está inserido no contexto do big data e da indústria 4.0.
Workshop APDIS sobre Gestão de Dados CientíficosPedro Príncipe
Apresentação com os conteúdos do workshop realizado nas Jornadas da APDIS 2016 sobre Gestão de Dados Científicos: o papel dos profissionais de informação
An approach for managing and semantically enriching the publication of Linked...greco_ufrj
With the growth of e-government programs, the available data to citizens is growing in volume every day. However, to make these data a useful source of information, to be referenced and integrated more easily by different applications, they should be published according to the best practices of
Linked Open Data, using standards for description (RDF) and identification
(URI) of data resources on the web. The main goal of this work is to propose a
platform and approach to support the exposure, sharing and association of
data resources in the form of Linked Open Data, offering a user-friendly environment to stimulate the publication of data and their association to other
existing data. Central functionalities to be included are data cleaning, transformation, linking, annotation and referencing to terminology mechanisms.
http://andrefreitas.org/papers/SBBD-Workshop-eGov-preprint.pdf
Kelli de Faria Cordeiro, Fabricio Firmino de Faria, Bianca de Oliveira Pereira, André Freitas, João Vitor Villas Boas Freitas, Ana Christina Bringuente, Lucas de Oliveira Arantes, Rodrigo Calhau, Veruska Zamborlini, Maria Luiza Machado Campos, Giancarlo Guizzardi, An Approach for Managing and Semantically Enriching the Publication of Linked Open Governmental Data, 3rd Workshop of Applied Computing in Electronic Government (WCGE), In WEBMEDIA/SBBD, 2011
Além disso, este módulo irá também introduzir alguns conceitos chave de
softwares livres e de código aberto (Free and Open Source Software, ou FOSS)
e softwares livres e de código aberto para aplicações geoespaciais (FOSS4G)
A presentation of the Dutch Techcentre for Life Sciences FAIR Data ecosystem given at the BlueBridge workshop, a pre-event of the Research Data Alliance's 9th Plenary
Presentation by Luiz Olavo Bonino about the current state of the developments on FAIR Data supporting tools at the Dutch Techcentre for Life Sciences Partners Event on November 3-4 2016.
An overview on FAIR Data and FAIR Data stewardship, and the roadmap for FAIR Data solutions coordinated by the Dutch Techcentre for Life Sciences. This presentation was given at the Netherlands eScience Center's "Essential skills in data-intensive research" course week.
5. REALIDADE – HETEROGENEIDADE - DESAFIOS
Integração organizacional
Technologies
Providers
Platforms
Como saber o que está disponível?
Onde conseguir?
Como conseguir?
Como integrar?
Como facilitar o reuso?
6. PERDA DE DADOS É REAL
Nature news, 19 December 2013
• Velocidade e capacidade de
armazenamento dos computadores
dobram a cada 18 meses e o ritmo é
estável
• Dados de sequenciamento de DNA
dobram a cada 6-8 meses e devem
acelerar na próxima década
Science1.0
7. Maioria dos dados não se falam
Dados são perdidos e/ou são difíceis de achar
Limita a ampliação da efetiva descoberta de conhecimentos
20% dos links de dados suplementares se “degradam”anualmente
80% dos dados são perdidos
60% dos dados em literatura não podem ser encontrados por máquinas
Aproximadamente 50% das pesquisas não são reproduzíveis
O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO
8. O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO
O crescente tsunami de dados requer habilidades além das
ensinadas em cursos de ciência da computação
Necessidade de programas educacionais para gestores de dados
profissionais
CE: 1,7M de cientistas e 70-100M de profissionais em C&I precisam
de 500.000 especialistas de dados (estimativa conservadora assumindo 10M de
geradores de dados e 1 especialista em dados para cada 20 geradores)
EUA: “Os Estados Unidos encaram um deficit 1,5M de gestores e
analistas com habilidades para entender e tomar decisões
baseadas em análise de dados” (Fonte: McKinsey Global Institute,
2011)
9. ESFORÇO EM REUSO DE DADOS
Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
10. ESFORÇO EM REUSO DE DADOS
Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
12. PRINCÍPIOS FAIR
Findable (localizáveis):
F1. (meta)dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. (meta)dados são registrados e indexados em mecanismos
de busca;
Acessíveis:
A1. (meta)dados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. (meta)dados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. (meta)dados usam vocabulários que seguem os princípios
FAIR;
I3. (meta)dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. (meta)dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. (meta)data are released with a clear and accessible data
usage license;
R1.2. (meta)data are associated with detailed provenance;
R1.3. (meta)data meet domain-relevant community
standards;
https://www.nature.com/articles/sdata201618
13. PRINCÍPIOS FAIR - METADADOS
Findable (localizáveis):
F1. metadados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. metadados são registrados e indexados em mecanismos de
busca;
Acessíveis:
A1. metadados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. metadados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. metadados usam vocabulários que seguem os princípios
FAIR;
I3. metadados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. metadados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. metadados possuem licenças de uso claras e acessíveis;
R1.2. metadados são associados a procedências detalhadas;
R1.3. metadados seguem padrões das comunidades
relevantes aos domínios;
https://www.nature.com/articles/sdata201618
14. PRINCÍPIOS FAIR – DADOS/OBJETOS DIGITAIS
Findable (localizáveis):
F1. dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. dados são registrados e indexados em mecanismos de
busca;
Acessíveis:
A1. dados são recuperáveis através de seus identificados utilizando
um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. dados usam linguagens de representação de conhecimentos
formais, acessíveis, compartilháveis e amplamente aplicáveis.
I2. dados usam vocabulários que seguem os princípios FAIR;
I3. dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. dados possuem licenças de uso claras e acessíveis;
R1.2. dados são associados a procedências detalhadas;
R1.3. dados seguem padrões das comunidados relevantes aos
domínios;
https://www.nature.com/articles/sdata201618
15. PRINCÍPIOS FAIR – INFRAESTRUTURA DE APOIO
Findable (localizáveis):
F1. (meta)dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. (meta)dados são registrados e indexados em mecanismos
de busca;
Acessíveis:
A1. (meta)dados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. (meta)dados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. (meta)dados usam vocabulários que seguem os princípios
FAIR;
I3. (meta)dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. (meta)dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. (meta)dados possuem licenças de uso claras e
acessíveis;
R1.2. (meta)dados são associados a procedências detalhadas;
R1.3. (meta)dados seguem padrões das comunidados
relevantes aos domínios;
https://www.nature.com/articles/sdata201618
18. FERRAMENTA PARA ELABORAÇÃO DE PLANO DE GESTÃO DE DADOS
• DMPOnline desenvolvido pelo Digital Curation Centre – DCC. Utilizado pela
Comissão Europeia.
https://dmponline.dcc.ac.uk/ Fonte: Patricia Henning – UNIRIO/Fiocruz
28. REPOSITÓRIOS CONFIÁVEIS
Um repositório confiável é aquele que pode
demonstrar conformidade com padrões e melhores
práticas através de políticas e procedimentos
transparentes e bem documentados.
• Deve oferecer políticas de:
• preservação digital,
• políticas de acesso e de uso,
• políticas de segurança de dados,
• políticas de metadados claras e compreensíveis
Fonte: Patricia Henning – UNIRIO/Fiocruz
29. GESTÃO DE DADOS DE PESQUISA
29
Apoio
Infra-
estrutura
Políticas
entendimento:
Pesquisadores entendem o que é
importante, quando, porque e quem
clareza:
Pesquisadores sabem o que se esperam
deles
habilidade:
Pesquisadores tem os recursos necessários
para satisfazerem as expectativas
30. ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS
• Bem integrado (portanto acessível e respeitado) à
organização
• Bem gerido e organizado de forma supra-
departamental (modelo hub and spokes)
• Responsável por formular a política de gestão de
dados da organização
• Organiza e supervisiona os recursos necessários para a
gestão de dados
• O lugar para encontrar especialistas em gestão de
dados que podem apoiar os pesquisadores durante
todo o ciclo de gestão
Desenvolver
idéia
Busca/
descoberta
Escrever
relatório
Projetar
estudo
Armazenar
dados
Publicar
relatório
Coletar
dados
Análise de
dados
31. ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS (2)
Considere o Gestor de Dados:
Parte integrante da organização
com plano de carreira dedicado
Parceiro real do pesquisador
não somente um ‘tratador de dados’
Envolvido
no desenho do projeto de pesquisa
ao longo do ciclo de pesquisa completo
32. PAPÉIS NO DEPARTAMENTO DE GESTÃO DE DADOS FAIR
O Gestor de Dados FAIR
Subervisiona os ciclos de vida dos dados e de casos
de uso/projetos
O Gerente de Serviços de Dados FAIR
Coordena a infraestrutura/ferramentas de suporte
O Especialista em Dados FAIR
Trata e transforma dados em FAIR
O Especialista em Ontologias
Define os modelos semânticos
Planejamento FAIRificação Análise
1.
Definir
objetivos/
perguntas
2.
Inventório
de recursos
existentes
3.
Análise de
pré-
FAIRificação
4a.
Definir modelo
semântico dos
dados
4b.
Definir modelo
semântico dos
metadados
5.
Criar dados
linkáveis
6.
Publicar
dados e
metadados
7.
Responder pergunta
- Busca
- Interoperabilidade
- análise
Biblioteconomista?
Especialista em infra IT
IT + biblio?
Engenheiro em ontologia?
40. FAIR DATA POINT
Fornece acesso a metadados e dados de uma forma FAIR
Dados podem ser internos ou externos ao FAIR Data Point.
Dados podem ser FAIR ou não-FAIR.
FAIR metadados
44. FAIR DATA POINT - GUI – PARA PESSOAS “NORMAIS”
}
}
Metadados do
repositório
Resumo dos
metadados dos
catálogos
45. FAIR DATA POINT - GUI
}
}
Metadados do
repositório
Resumo dos
metadados dos
catálogos
}Resumo dos
metadados dos
conjuntos de dados
/ distribuições
}Metadados do
catálogo
51. Permite anotações (novas afirmações) em bases de conhecimento existentes
Captura a proveniência do anotador e a afirmação original
Open RDF
Knowledge AnnotatorORKA
57. Q&A – CONTACT INFO
Luiz Bonino
International Technology Coordinator – GO FAIR
Associate Professor BioSemantics – LUMC
E-mail: luiz.bonino@go-fair.org
Skype: luizolavobonino
Web: www.go-fair.org
Notas do Editor
Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.
Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.
Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.