SlideShare uma empresa Scribd logo
ESTRUTURAS DE APOIO AO ACESSO ABERTO
15 DE JUNHO, 2018 – UNIRIO – RIO DE JANEIRO-BR
Luiz Bonino
luiz.bonino@go-fair.org
CIÊNCIA ABERTA E DADOS FAIR
https://vimeo.com/162062013
O PROBLEMA DE FUNDO
Fragmentação de…
• Dados
• Modelos
• Ferarmentas de software
• Plataformas
• Regras
• …
REALIDADE - HETEROGENEIDADE
Integração organizacional
Technologies
Providers
Platforms
REALIDADE – HETEROGENEIDADE - DESAFIOS
Integração organizacional
Technologies
Providers
Platforms
Como saber o que está disponível?
Onde conseguir?
Como conseguir?
Como integrar?
Como facilitar o reuso?
PERDA DE DADOS É REAL
Nature news, 19 December 2013
• Velocidade e capacidade de
armazenamento dos computadores
dobram a cada 18 meses e o ritmo é
estável
• Dados de sequenciamento de DNA
dobram a cada 6-8 meses e devem
acelerar na próxima década
Science1.0
Maioria dos dados não se falam
Dados são perdidos e/ou são difíceis de achar
Limita a ampliação da efetiva descoberta de conhecimentos
20% dos links de dados suplementares se “degradam”anualmente
80% dos dados são perdidos
60% dos dados em literatura não podem ser encontrados por máquinas
Aproximadamente 50% das pesquisas não são reproduzíveis
O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO
O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO
O crescente tsunami de dados requer habilidades além das
ensinadas em cursos de ciência da computação
Necessidade de programas educacionais para gestores de dados
profissionais
CE: 1,7M de cientistas e 70-100M de profissionais em C&I precisam
de 500.000 especialistas de dados (estimativa conservadora assumindo 10M de
geradores de dados e 1 especialista em dados para cada 20 geradores)
EUA: “Os Estados Unidos encaram um deficit 1,5M de gestores e
analistas com habilidades para entender e tomar decisões
baseadas em análise de dados” (Fonte: McKinsey Global Institute,
2011)
ESFORÇO EM REUSO DE DADOS
Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
ESFORÇO EM REUSO DE DADOS
Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
OS PRINCÍPIOS FAIR
PRINCÍPIOS FAIR
Findable (localizáveis):
F1. (meta)dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. (meta)dados são registrados e indexados em mecanismos
de busca;
Acessíveis:
A1. (meta)dados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. (meta)dados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. (meta)dados usam vocabulários que seguem os princípios
FAIR;
I3. (meta)dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. (meta)dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. (meta)data are released with a clear and accessible data
usage license;
R1.2. (meta)data are associated with detailed provenance;
R1.3. (meta)data meet domain-relevant community
standards;
https://www.nature.com/articles/sdata201618
PRINCÍPIOS FAIR - METADADOS
Findable (localizáveis):
F1. metadados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. metadados são registrados e indexados em mecanismos de
busca;
Acessíveis:
A1. metadados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. metadados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. metadados usam vocabulários que seguem os princípios
FAIR;
I3. metadados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. metadados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. metadados possuem licenças de uso claras e acessíveis;
R1.2. metadados são associados a procedências detalhadas;
R1.3. metadados seguem padrões das comunidades
relevantes aos domínios;
https://www.nature.com/articles/sdata201618
PRINCÍPIOS FAIR – DADOS/OBJETOS DIGITAIS
Findable (localizáveis):
F1. dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. dados são registrados e indexados em mecanismos de
busca;
Acessíveis:
A1. dados são recuperáveis através de seus identificados utilizando
um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. dados usam linguagens de representação de conhecimentos
formais, acessíveis, compartilháveis e amplamente aplicáveis.
I2. dados usam vocabulários que seguem os princípios FAIR;
I3. dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. dados possuem licenças de uso claras e acessíveis;
R1.2. dados são associados a procedências detalhadas;
R1.3. dados seguem padrões das comunidados relevantes aos
domínios;
https://www.nature.com/articles/sdata201618
PRINCÍPIOS FAIR – INFRAESTRUTURA DE APOIO
Findable (localizáveis):
F1. (meta)dados possuem identificadores persistentes e únicos
globalmente;
F2. dados são descritos por metadados ricos;
F3. metadados clara e explicitamente incluem os
identificadores dos dados que descrevem;
F4. (meta)dados são registrados e indexados em mecanismos
de busca;
Acessíveis:
A1. (meta)dados são recuperáveis através de seus identificados
utilizando um protocol de comunicação padronizado;
A1.1 o protocoloé aberto, gratis e universalmente
implementável;
A1.2. o protocolo possibilidade procedimentos de
autenticação e autorização, quando necessários;
A2. metadados são acessíveis mesmo quando os dados não estão
mais disponíveis;
Interoperáveis:
I1. (meta)dados usam linguagens de representação de
conhecimentos formais, acessíveis, compartilháveis e
amplamente aplicáveis.
I2. (meta)dados usam vocabulários que seguem os princípios
FAIR;
I3. (meta)dados incluem referências qualificadas para outros
(meta)dados.
Reusáveis:
R1. (meta)dados são ricamente descritos com uma pluralidades de
atributos relevantes e precisos;
R1.1. (meta)dados possuem licenças de uso claras e
acessíveis;
R1.2. (meta)dados são associados a procedências detalhadas;
R1.3. (meta)dados seguem padrões das comunidados
relevantes aos domínios;
https://www.nature.com/articles/sdata201618
GESTÃO DE DADOS FAIR
Fonte: Patricia Henning – UNIRIO/Fiocruz
FERRAMENTA PARA ELABORAÇÃO DE PLANO DE GESTÃO DE DADOS
• DMPOnline desenvolvido pelo Digital Curation Centre – DCC. Utilizado pela
Comissão Europeia.
https://dmponline.dcc.ac.uk/ Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
REPOSITÓRIOS DE DADOS
Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
https://www.eudat.eu/news/charting-the-course-towards-a-concrete-european-open-science-
cloud-outcomes-of-the-eudat Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
Fonte: Patricia Henning – UNIRIO/Fiocruz
http://dendro.fe.up.pt/blog/wp-content/uploads/2016/11/UAIS2016posprint.pdf
Fonte: Patricia Henning – UNIRIO/Fiocruz
REPOSITÓRIOS CONFIÁVEIS
Um repositório confiável é aquele que pode
demonstrar conformidade com padrões e melhores
práticas através de políticas e procedimentos
transparentes e bem documentados.
• Deve oferecer políticas de:
• preservação digital,
• políticas de acesso e de uso,
• políticas de segurança de dados,
• políticas de metadados claras e compreensíveis
Fonte: Patricia Henning – UNIRIO/Fiocruz
GESTÃO DE DADOS DE PESQUISA
29
Apoio
Infra-
estrutura
Políticas
entendimento:
Pesquisadores entendem o que é
importante, quando, porque e quem
clareza:
Pesquisadores sabem o que se esperam
deles
habilidade:
Pesquisadores tem os recursos necessários
para satisfazerem as expectativas
ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS
• Bem integrado (portanto acessível e respeitado) à
organização
• Bem gerido e organizado de forma supra-
departamental (modelo hub and spokes)
• Responsável por formular a política de gestão de
dados da organização
• Organiza e supervisiona os recursos necessários para a
gestão de dados
• O lugar para encontrar especialistas em gestão de
dados que podem apoiar os pesquisadores durante
todo o ciclo de gestão
Desenvolver
idéia
Busca/
descoberta
Escrever
relatório
Projetar
estudo
Armazenar
dados
Publicar
relatório
Coletar
dados
Análise de
dados
ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS (2)
Considere o Gestor de Dados:
Parte integrante da organização
com plano de carreira dedicado
Parceiro real do pesquisador
não somente um ‘tratador de dados’
Envolvido
no desenho do projeto de pesquisa
ao longo do ciclo de pesquisa completo
PAPÉIS NO DEPARTAMENTO DE GESTÃO DE DADOS FAIR
O Gestor de Dados FAIR
Subervisiona os ciclos de vida dos dados e de casos
de uso/projetos
O Gerente de Serviços de Dados FAIR
Coordena a infraestrutura/ferramentas de suporte
O Especialista em Dados FAIR
Trata e transforma dados em FAIR
O Especialista em Ontologias
Define os modelos semânticos
Planejamento FAIRificação Análise
1.
Definir
objetivos/
perguntas
2.
Inventório
de recursos
existentes
3.
Análise de
pré-
FAIRificação
4a.
Definir modelo
semântico dos
dados
4b.
Definir modelo
semântico dos
metadados
5.
Criar dados
linkáveis
6.
Publicar
dados e
metadados
7.
Responder pergunta
- Busca
- Interoperabilidade
- análise
Biblioteconomista?
Especialista em infra IT
IT + biblio?
Engenheiro em ontologia?
ECOSSISTEMA FAIR
ECOSSISTEMA FAIR
Criar PublicarPlanejar Achar
011001
1
110010
1
100110
0
BYOD FAIR Hackathon
Treinar
Anotar
https://github.com/DTL-FAIRData
ECOSISTEMA FAIR
Criar Publicar AnotarAchar
0110011
1100101
1001100
Baseado no OpenRefine
FAIR Data Resource
submeter gerar
Modelo
semântico
genérico
FAIRIFIER
FAIRIFIER
FAIR DATA POINT
 Fornece acesso a metadados e dados de uma forma FAIR
 Dados podem ser internos ou externos ao FAIR Data Point.
 Dados podem ser FAIR ou não-FAIR.
 FAIR metadados
CAMADAS DE METADADOS
Repositório de dados (FDP)
(Dataset) Catálogo(s)
Coleção de dados
Distribuição
Registro dos Dados
FAIR DATA POINT - ARCHITETURA
FAIR DATA POINT - GUI – PARA TÉCNICOS
FAIR DATA POINT - GUI – PARA PESSOAS “NORMAIS”
}
}
Metadados do
repositório
Resumo dos
metadados dos
catálogos
FAIR DATA POINT - GUI
}
}
Metadados do
repositório
Resumo dos
metadados dos
catálogos
}Resumo dos
metadados dos
conjuntos de dados
/ distribuições
}Metadados do
catálogo
FAIR DATA POINT - GUI – CONJUNTO DE DADOS
SOLUÇÕES COMPATÍVEIS COM O FAIR DATA POINT
RDRF
0110011
1100101
1001100
0110011
1100101
1001100
metadata
index
retrieves
metadata
search
interfaces
(GUI and API)
FERRAMENTA DE BUSCA DE DADOS FAIR
 Permite anotações (novas afirmações) em bases de conhecimento existentes
 Captura a proveniência do anotador e a afirmação original
Open RDF
Knowledge AnnotatorORKA
ANOTAÇÕES ARMAZENADAS EM UMA
NANOPUB STORE
DATA FAIRPORT
F A I
R
ECOSSISTEMA FAIR
Retrieve
non-FAIR
data
Analyse
datasets
Define
semantic
model
Make
data
linkable
Assign
license
Define
metadata
Deploy
FAIR data
resource
Combine with
other FAIR data
Query combined
data
011001
1
110010
1
100110
0
FAIR Hackathon
BYOD
Q&A – CONTACT INFO
Luiz Bonino
International Technology Coordinator – GO FAIR
Associate Professor BioSemantics – LUMC
E-mail: luiz.bonino@go-fair.org
Skype: luizolavobonino
Web: www.go-fair.org

Mais conteúdo relacionado

Semelhante a Estruturas de apoio ao acesso aberto

Workshop - Abertura e gestão de dados, planos de gestão de dados de investigação
Workshop - Abertura e gestão de dados, planos de gestão de dados de investigaçãoWorkshop - Abertura e gestão de dados, planos de gestão de dados de investigação
Workshop - Abertura e gestão de dados, planos de gestão de dados de investigação
Pedro Príncipe
 
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
Ciência Aberta na prática - processos e políticas, serviços e ferramentasCiência Aberta na prática - processos e políticas, serviços e ferramentas
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
Pedro Príncipe
 
Acesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no BrasilAcesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no Brasil
Projeto RCAAP
 
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
Pedro Príncipe
 
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
Conferência Luso-Brasileira de Ciência Aberta
 
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
CarlosMarcondes17
 
Preservação da informação na biblioteca digital
Preservação da informação na biblioteca digitalPreservação da informação na biblioteca digital
Preservação da informação na biblioteca digital
Cariniana Rede
 
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
Projeto RCAAP
 
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecasGestão de dados de pesquisa em tempos de pandemia e as bibliotecas
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
Pedro Príncipe
 
Erebd suenia bigdata
Erebd suenia bigdataErebd suenia bigdata
Erebd suenia bigdata
Suenia Mendes
 
A preservação digital num repositório de Dados de Pesquisa: o caso do IRD
A preservação digital num repositório de Dados de Pesquisa: o caso do IRDA preservação digital num repositório de Dados de Pesquisa: o caso do IRD
A preservação digital num repositório de Dados de Pesquisa: o caso do IRD
pascal aventurier
 
Workshop APDIS sobre Gestão de Dados Científicos
Workshop APDIS sobre Gestão de Dados CientíficosWorkshop APDIS sobre Gestão de Dados Científicos
Workshop APDIS sobre Gestão de Dados Científicos
Pedro Príncipe
 
An approach for managing and semantically enriching the publication of Linked...
An approach for managing and semantically enriching the publication of Linked...An approach for managing and semantically enriching the publication of Linked...
An approach for managing and semantically enriching the publication of Linked...
greco_ufrj
 
TCC - UFSC - Rafael Cobbe Dias
 TCC - UFSC - Rafael Cobbe Dias TCC - UFSC - Rafael Cobbe Dias
TCC - UFSC - Rafael Cobbe Dias
Rafael Cobbe
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendata
Ricardo Poppi
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo Sociedade
Thiago Avila, Msc
 
Dmp h2020 v6
Dmp h2020 v6Dmp h2020 v6
Dmp h2020 v6
Nuno Charneca
 
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Pedro Príncipe
 
PublicadoresDeDados2.pdf
PublicadoresDeDados2.pdfPublicadoresDeDados2.pdf
PublicadoresDeDados2.pdf
ssuserb174cd
 
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICASACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
Simposio Internacional Network Science
 

Semelhante a Estruturas de apoio ao acesso aberto (20)

Workshop - Abertura e gestão de dados, planos de gestão de dados de investigação
Workshop - Abertura e gestão de dados, planos de gestão de dados de investigaçãoWorkshop - Abertura e gestão de dados, planos de gestão de dados de investigação
Workshop - Abertura e gestão de dados, planos de gestão de dados de investigação
 
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
Ciência Aberta na prática - processos e políticas, serviços e ferramentasCiência Aberta na prática - processos e políticas, serviços e ferramentas
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
 
Acesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no BrasilAcesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no Brasil
 
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
 
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
GeoInfo – Infraestrutura de Dados Espaciais Abertos para a Pesquisa Agropecuá...
 
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
 
Preservação da informação na biblioteca digital
Preservação da informação na biblioteca digitalPreservação da informação na biblioteca digital
Preservação da informação na biblioteca digital
 
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
Contributos do projeto FAIRsFAIR para a implementação das políticas de dados ...
 
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecasGestão de dados de pesquisa em tempos de pandemia e as bibliotecas
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
 
Erebd suenia bigdata
Erebd suenia bigdataErebd suenia bigdata
Erebd suenia bigdata
 
A preservação digital num repositório de Dados de Pesquisa: o caso do IRD
A preservação digital num repositório de Dados de Pesquisa: o caso do IRDA preservação digital num repositório de Dados de Pesquisa: o caso do IRD
A preservação digital num repositório de Dados de Pesquisa: o caso do IRD
 
Workshop APDIS sobre Gestão de Dados Científicos
Workshop APDIS sobre Gestão de Dados CientíficosWorkshop APDIS sobre Gestão de Dados Científicos
Workshop APDIS sobre Gestão de Dados Científicos
 
An approach for managing and semantically enriching the publication of Linked...
An approach for managing and semantically enriching the publication of Linked...An approach for managing and semantically enriching the publication of Linked...
An approach for managing and semantically enriching the publication of Linked...
 
TCC - UFSC - Rafael Cobbe Dias
 TCC - UFSC - Rafael Cobbe Dias TCC - UFSC - Rafael Cobbe Dias
TCC - UFSC - Rafael Cobbe Dias
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendata
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo Sociedade
 
Dmp h2020 v6
Dmp h2020 v6Dmp h2020 v6
Dmp h2020 v6
 
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
 
PublicadoresDeDados2.pdf
PublicadoresDeDados2.pdfPublicadoresDeDados2.pdf
PublicadoresDeDados2.pdf
 
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICASACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
 

Mais de Luiz Olavo Bonino da Silva Santos

FDOF and DDI-CDI
FDOF and DDI-CDIFDOF and DDI-CDI
My repository is FAIR!!! What does it mean?
My repository is FAIR!!! What does it mean?My repository is FAIR!!! What does it mean?
My repository is FAIR!!! What does it mean?
Luiz Olavo Bonino da Silva Santos
 
Making FAIR easy
Making FAIR easyMaking FAIR easy
FAIR Explained
FAIR ExplainedFAIR Explained
Achieving FAIR from a repository perspective
Achieving FAIR from a repository perspectiveAchieving FAIR from a repository perspective
Achieving FAIR from a repository perspective
Luiz Olavo Bonino da Silva Santos
 
Towards cross-domain interoperation in the internet of FAIR data and services
Towards cross-domain interoperation in the internet of FAIR data and servicesTowards cross-domain interoperation in the internet of FAIR data and services
Towards cross-domain interoperation in the internet of FAIR data and services
Luiz Olavo Bonino da Silva Santos
 
FAIR Ecosystem - Health RI 2017
FAIR Ecosystem - Health RI 2017FAIR Ecosystem - Health RI 2017
FAIR Ecosystem - Health RI 2017
Luiz Olavo Bonino da Silva Santos
 
DTL Integrator's meeting
DTL Integrator's meetingDTL Integrator's meeting
DTL Integrator's meeting
Luiz Olavo Bonino da Silva Santos
 
FAIR Data ecosystem
FAIR Data ecosystemFAIR Data ecosystem
Mendeley Data FAIR hackathon
Mendeley Data FAIR hackathonMendeley Data FAIR hackathon
Mendeley Data FAIR hackathon
Luiz Olavo Bonino da Silva Santos
 
DTL Partners Event - FAIR Data Tech overview - Day 1
DTL Partners Event - FAIR Data Tech overview - Day 1DTL Partners Event - FAIR Data Tech overview - Day 1
DTL Partners Event - FAIR Data Tech overview - Day 1
Luiz Olavo Bonino da Silva Santos
 
FAIR data overview
FAIR data overviewFAIR data overview

Mais de Luiz Olavo Bonino da Silva Santos (12)

FDOF and DDI-CDI
FDOF and DDI-CDIFDOF and DDI-CDI
FDOF and DDI-CDI
 
My repository is FAIR!!! What does it mean?
My repository is FAIR!!! What does it mean?My repository is FAIR!!! What does it mean?
My repository is FAIR!!! What does it mean?
 
Making FAIR easy
Making FAIR easyMaking FAIR easy
Making FAIR easy
 
FAIR Explained
FAIR ExplainedFAIR Explained
FAIR Explained
 
Achieving FAIR from a repository perspective
Achieving FAIR from a repository perspectiveAchieving FAIR from a repository perspective
Achieving FAIR from a repository perspective
 
Towards cross-domain interoperation in the internet of FAIR data and services
Towards cross-domain interoperation in the internet of FAIR data and servicesTowards cross-domain interoperation in the internet of FAIR data and services
Towards cross-domain interoperation in the internet of FAIR data and services
 
FAIR Ecosystem - Health RI 2017
FAIR Ecosystem - Health RI 2017FAIR Ecosystem - Health RI 2017
FAIR Ecosystem - Health RI 2017
 
DTL Integrator's meeting
DTL Integrator's meetingDTL Integrator's meeting
DTL Integrator's meeting
 
FAIR Data ecosystem
FAIR Data ecosystemFAIR Data ecosystem
FAIR Data ecosystem
 
Mendeley Data FAIR hackathon
Mendeley Data FAIR hackathonMendeley Data FAIR hackathon
Mendeley Data FAIR hackathon
 
DTL Partners Event - FAIR Data Tech overview - Day 1
DTL Partners Event - FAIR Data Tech overview - Day 1DTL Partners Event - FAIR Data Tech overview - Day 1
DTL Partners Event - FAIR Data Tech overview - Day 1
 
FAIR data overview
FAIR data overviewFAIR data overview
FAIR data overview
 

Estruturas de apoio ao acesso aberto

  • 1. ESTRUTURAS DE APOIO AO ACESSO ABERTO 15 DE JUNHO, 2018 – UNIRIO – RIO DE JANEIRO-BR Luiz Bonino luiz.bonino@go-fair.org
  • 2. CIÊNCIA ABERTA E DADOS FAIR https://vimeo.com/162062013
  • 3. O PROBLEMA DE FUNDO Fragmentação de… • Dados • Modelos • Ferarmentas de software • Plataformas • Regras • …
  • 4. REALIDADE - HETEROGENEIDADE Integração organizacional Technologies Providers Platforms
  • 5. REALIDADE – HETEROGENEIDADE - DESAFIOS Integração organizacional Technologies Providers Platforms Como saber o que está disponível? Onde conseguir? Como conseguir? Como integrar? Como facilitar o reuso?
  • 6. PERDA DE DADOS É REAL Nature news, 19 December 2013 • Velocidade e capacidade de armazenamento dos computadores dobram a cada 18 meses e o ritmo é estável • Dados de sequenciamento de DNA dobram a cada 6-8 meses e devem acelerar na próxima década Science1.0
  • 7. Maioria dos dados não se falam Dados são perdidos e/ou são difíceis de achar Limita a ampliação da efetiva descoberta de conhecimentos 20% dos links de dados suplementares se “degradam”anualmente 80% dos dados são perdidos 60% dos dados em literatura não podem ser encontrados por máquinas Aproximadamente 50% das pesquisas não são reproduzíveis O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO
  • 8. O PROBLEMA DE DADOS EM PESQUISA E INOVAÇÃO O crescente tsunami de dados requer habilidades além das ensinadas em cursos de ciência da computação Necessidade de programas educacionais para gestores de dados profissionais CE: 1,7M de cientistas e 70-100M de profissionais em C&I precisam de 500.000 especialistas de dados (estimativa conservadora assumindo 10M de geradores de dados e 1 especialista em dados para cada 20 geradores) EUA: “Os Estados Unidos encaram um deficit 1,5M de gestores e analistas com habilidades para entender e tomar decisões baseadas em análise de dados” (Fonte: McKinsey Global Institute, 2011)
  • 9. ESFORÇO EM REUSO DE DADOS Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
  • 10. ESFORÇO EM REUSO DE DADOS Fonte: Data Science Report 2016, CrowdFlower, 2016: http://visit.crowdflower.com/rs/416-ZBE-142/images/CrowdFlower_DataScienceReport_2016.pdf
  • 12. PRINCÍPIOS FAIR Findable (localizáveis): F1. (meta)dados possuem identificadores persistentes e únicos globalmente; F2. dados são descritos por metadados ricos; F3. metadados clara e explicitamente incluem os identificadores dos dados que descrevem; F4. (meta)dados são registrados e indexados em mecanismos de busca; Acessíveis: A1. (meta)dados são recuperáveis através de seus identificados utilizando um protocol de comunicação padronizado; A1.1 o protocoloé aberto, gratis e universalmente implementável; A1.2. o protocolo possibilidade procedimentos de autenticação e autorização, quando necessários; A2. metadados são acessíveis mesmo quando os dados não estão mais disponíveis; Interoperáveis: I1. (meta)dados usam linguagens de representação de conhecimentos formais, acessíveis, compartilháveis e amplamente aplicáveis. I2. (meta)dados usam vocabulários que seguem os princípios FAIR; I3. (meta)dados incluem referências qualificadas para outros (meta)dados. Reusáveis: R1. (meta)dados são ricamente descritos com uma pluralidades de atributos relevantes e precisos; R1.1. (meta)data are released with a clear and accessible data usage license; R1.2. (meta)data are associated with detailed provenance; R1.3. (meta)data meet domain-relevant community standards; https://www.nature.com/articles/sdata201618
  • 13. PRINCÍPIOS FAIR - METADADOS Findable (localizáveis): F1. metadados possuem identificadores persistentes e únicos globalmente; F2. dados são descritos por metadados ricos; F3. metadados clara e explicitamente incluem os identificadores dos dados que descrevem; F4. metadados são registrados e indexados em mecanismos de busca; Acessíveis: A1. metadados são recuperáveis através de seus identificados utilizando um protocol de comunicação padronizado; A1.1 o protocoloé aberto, gratis e universalmente implementável; A1.2. o protocolo possibilidade procedimentos de autenticação e autorização, quando necessários; A2. metadados são acessíveis mesmo quando os dados não estão mais disponíveis; Interoperáveis: I1. metadados usam linguagens de representação de conhecimentos formais, acessíveis, compartilháveis e amplamente aplicáveis. I2. metadados usam vocabulários que seguem os princípios FAIR; I3. metadados incluem referências qualificadas para outros (meta)dados. Reusáveis: R1. metadados são ricamente descritos com uma pluralidades de atributos relevantes e precisos; R1.1. metadados possuem licenças de uso claras e acessíveis; R1.2. metadados são associados a procedências detalhadas; R1.3. metadados seguem padrões das comunidades relevantes aos domínios; https://www.nature.com/articles/sdata201618
  • 14. PRINCÍPIOS FAIR – DADOS/OBJETOS DIGITAIS Findable (localizáveis): F1. dados possuem identificadores persistentes e únicos globalmente; F2. dados são descritos por metadados ricos; F3. metadados clara e explicitamente incluem os identificadores dos dados que descrevem; F4. dados são registrados e indexados em mecanismos de busca; Acessíveis: A1. dados são recuperáveis através de seus identificados utilizando um protocol de comunicação padronizado; A1.1 o protocoloé aberto, gratis e universalmente implementável; A1.2. o protocolo possibilidade procedimentos de autenticação e autorização, quando necessários; A2. metadados são acessíveis mesmo quando os dados não estão mais disponíveis; Interoperáveis: I1. dados usam linguagens de representação de conhecimentos formais, acessíveis, compartilháveis e amplamente aplicáveis. I2. dados usam vocabulários que seguem os princípios FAIR; I3. dados incluem referências qualificadas para outros (meta)dados. Reusáveis: R1. dados são ricamente descritos com uma pluralidades de atributos relevantes e precisos; R1.1. dados possuem licenças de uso claras e acessíveis; R1.2. dados são associados a procedências detalhadas; R1.3. dados seguem padrões das comunidados relevantes aos domínios; https://www.nature.com/articles/sdata201618
  • 15. PRINCÍPIOS FAIR – INFRAESTRUTURA DE APOIO Findable (localizáveis): F1. (meta)dados possuem identificadores persistentes e únicos globalmente; F2. dados são descritos por metadados ricos; F3. metadados clara e explicitamente incluem os identificadores dos dados que descrevem; F4. (meta)dados são registrados e indexados em mecanismos de busca; Acessíveis: A1. (meta)dados são recuperáveis através de seus identificados utilizando um protocol de comunicação padronizado; A1.1 o protocoloé aberto, gratis e universalmente implementável; A1.2. o protocolo possibilidade procedimentos de autenticação e autorização, quando necessários; A2. metadados são acessíveis mesmo quando os dados não estão mais disponíveis; Interoperáveis: I1. (meta)dados usam linguagens de representação de conhecimentos formais, acessíveis, compartilháveis e amplamente aplicáveis. I2. (meta)dados usam vocabulários que seguem os princípios FAIR; I3. (meta)dados incluem referências qualificadas para outros (meta)dados. Reusáveis: R1. (meta)dados são ricamente descritos com uma pluralidades de atributos relevantes e precisos; R1.1. (meta)dados possuem licenças de uso claras e acessíveis; R1.2. (meta)dados são associados a procedências detalhadas; R1.3. (meta)dados seguem padrões das comunidados relevantes aos domínios; https://www.nature.com/articles/sdata201618
  • 17. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 18. FERRAMENTA PARA ELABORAÇÃO DE PLANO DE GESTÃO DE DADOS • DMPOnline desenvolvido pelo Digital Curation Centre – DCC. Utilizado pela Comissão Europeia. https://dmponline.dcc.ac.uk/ Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 19. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 20. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 21. REPOSITÓRIOS DE DADOS Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 22. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 24. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 25. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 26. Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 28. REPOSITÓRIOS CONFIÁVEIS Um repositório confiável é aquele que pode demonstrar conformidade com padrões e melhores práticas através de políticas e procedimentos transparentes e bem documentados. • Deve oferecer políticas de: • preservação digital, • políticas de acesso e de uso, • políticas de segurança de dados, • políticas de metadados claras e compreensíveis Fonte: Patricia Henning – UNIRIO/Fiocruz
  • 29. GESTÃO DE DADOS DE PESQUISA 29 Apoio Infra- estrutura Políticas entendimento: Pesquisadores entendem o que é importante, quando, porque e quem clareza: Pesquisadores sabem o que se esperam deles habilidade: Pesquisadores tem os recursos necessários para satisfazerem as expectativas
  • 30. ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS • Bem integrado (portanto acessível e respeitado) à organização • Bem gerido e organizado de forma supra- departamental (modelo hub and spokes) • Responsável por formular a política de gestão de dados da organização • Organiza e supervisiona os recursos necessários para a gestão de dados • O lugar para encontrar especialistas em gestão de dados que podem apoiar os pesquisadores durante todo o ciclo de gestão Desenvolver idéia Busca/ descoberta Escrever relatório Projetar estudo Armazenar dados Publicar relatório Coletar dados Análise de dados
  • 31. ELEMENTOS DE UM DEPARTAMENTO DE GESTÃO DE DADOS (2) Considere o Gestor de Dados: Parte integrante da organização com plano de carreira dedicado Parceiro real do pesquisador não somente um ‘tratador de dados’ Envolvido no desenho do projeto de pesquisa ao longo do ciclo de pesquisa completo
  • 32. PAPÉIS NO DEPARTAMENTO DE GESTÃO DE DADOS FAIR O Gestor de Dados FAIR Subervisiona os ciclos de vida dos dados e de casos de uso/projetos O Gerente de Serviços de Dados FAIR Coordena a infraestrutura/ferramentas de suporte O Especialista em Dados FAIR Trata e transforma dados em FAIR O Especialista em Ontologias Define os modelos semânticos Planejamento FAIRificação Análise 1. Definir objetivos/ perguntas 2. Inventório de recursos existentes 3. Análise de pré- FAIRificação 4a. Definir modelo semântico dos dados 4b. Definir modelo semântico dos metadados 5. Criar dados linkáveis 6. Publicar dados e metadados 7. Responder pergunta - Busca - Interoperabilidade - análise Biblioteconomista? Especialista em infra IT IT + biblio? Engenheiro em ontologia?
  • 34. ECOSSISTEMA FAIR Criar PublicarPlanejar Achar 011001 1 110010 1 100110 0 BYOD FAIR Hackathon Treinar Anotar https://github.com/DTL-FAIRData
  • 35. ECOSISTEMA FAIR Criar Publicar AnotarAchar 0110011 1100101 1001100
  • 37. FAIR Data Resource submeter gerar Modelo semântico genérico FAIRIFIER
  • 39.
  • 40. FAIR DATA POINT  Fornece acesso a metadados e dados de uma forma FAIR  Dados podem ser internos ou externos ao FAIR Data Point.  Dados podem ser FAIR ou não-FAIR.  FAIR metadados
  • 41. CAMADAS DE METADADOS Repositório de dados (FDP) (Dataset) Catálogo(s) Coleção de dados Distribuição Registro dos Dados
  • 42. FAIR DATA POINT - ARCHITETURA
  • 43. FAIR DATA POINT - GUI – PARA TÉCNICOS
  • 44. FAIR DATA POINT - GUI – PARA PESSOAS “NORMAIS” } } Metadados do repositório Resumo dos metadados dos catálogos
  • 45. FAIR DATA POINT - GUI } } Metadados do repositório Resumo dos metadados dos catálogos }Resumo dos metadados dos conjuntos de dados / distribuições }Metadados do catálogo
  • 46. FAIR DATA POINT - GUI – CONJUNTO DE DADOS
  • 47. SOLUÇÕES COMPATÍVEIS COM O FAIR DATA POINT RDRF
  • 50.
  • 51.  Permite anotações (novas afirmações) em bases de conhecimento existentes  Captura a proveniência do anotador e a afirmação original Open RDF Knowledge AnnotatorORKA
  • 52.
  • 53.
  • 54. ANOTAÇÕES ARMAZENADAS EM UMA NANOPUB STORE
  • 57. Q&A – CONTACT INFO Luiz Bonino International Technology Coordinator – GO FAIR Associate Professor BioSemantics – LUMC E-mail: luiz.bonino@go-fair.org Skype: luizolavobonino Web: www.go-fair.org

Notas do Editor

  1. Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.
  2. Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.
  3. Het onderliggende probleem is “fragmentatie”. De stukjes van de puzzel hebben we wel beschikbaar, maar die zijn verspreid over heel veel partijen in dit land. Deze versplintering zie je op alle vlakken die op deze dia genoemd worden: data, sample collecties, etc. Om onderzoek goed te laten renderen met toepassingen die de zorg bereiken zijn faciliteiten nodig die nu nog verspreid zijn over veel onderzoeksgroepen en instellingen. Het organiseren hiervan tot een goed geoliede machine die het ons helpt personalised medicine & health research effectief te implementeren vergt een gezamenlijke inspanning. We hebben kortom nationale actie nodig om tot een gezamenlijke infrastructuur hiervoor te komen : Health-RI.