Esta é uma tradução do documento elaborado para The Latin America and the Caribbean Scientific Data Management Workshop. Original em: https://www.slideshare.net/RobertodePinho/towards-a-scientific-data-policy
1. Rumo a uma política de dados científicos ,1 2
@ Painel 4: Infraestrutura, treinamento e financiamento de iniciativas de dados
científicos
Workshop de Gerenciamento de Dados Científicos da América Latina e Caribe
Roberto de Pinho (Analista em C&T, Ministério de Ciência, Tecnologia, Inovações
e Comunicações, Brasil)
Acredito e muitas pessoas acreditam que estamos em tempos difíceis para a ciência. Nós
observamos os movimentos antivacina no,
século XXI, algo que não deveríamos mais ter.
Vemos também a Ciência das Mudanças Climáticas sendo desacreditada. Alguns falam de uma
crise de confiança na Ciência, algo que pode estar relacionado a todo o fenômeno das notícias
falsas (Fake News). Estes também são tempos desafiadores para a ciência brasileira em
particular, sem mencionar a crise de financiamento pela qual estamos passando.
3
A digitalização, que é a maneira como alguns chamam o processo pelo qual as tecnologias de
TIC e as abordagens orientadas a dados estão transformando quase todos os aspectos das
atividades humanas, incluindo a Ciência, apresentam grandes oportunidades, mas também
muitos riscos. Gosto muito de um site sobre correlações espúrias. Possui várias séries
temporais e permite encontrar correlações entre as coisas mais distintas 2
. Podemos encontrar
coisas como o fato de o orçamento dos Estados Unidos para Pesquisa e Desenvolvimento nas
Ciências da Saúde estar correlacionado com o número de filmes de Al pacino por ano ou algo
assim. Como alguém apontou, isso dá substância ao dito “com dados suficientes, pode-se
provar qualquer coisa” e isso pode se tornar um problema. Também estamos no meio do
1
Esta é uma tradução do documento elaborado para The Latin America and the Caribbean Scientific
Data Management Workshop. Original em:
https://www.slideshare.net/RobertodePinho/towards-a-scientific-data-policy
2
Ceci n'est pas un PowerPoint. Esta é uma recontagem por escrito da apresentação, com base na minha
lembrança - ou talvez como eu gostaria de ter dito. O fraseado é adaptado. ☺ O vídeo está online em
https://www.facebook.com/abciencias/videos/1860817650616995/ As
correções são bem-vindas.
3
http://www.tylervigen.com/spurious-correlations
1
2. escândalo da Cambridge Analytica / Facebook, que traz à nossa mente e à mente do público
em geral preocupações relacionadas ao processo de digitalização da ciência.
4
No entanto, neste momento, a Ciência é extremamente necessária para enfrentarmos os
grandes desafios que são elegantemente apresentados pelos Objetivos de Desenvolvimento
Sustentável das Nações Unidas (ODS). Para isso, muitos especialistas diriam que há
necessidade de ciência transdisciplinar, algo que o Prof. Barreto, da Fiocruz, apontou de
alguma forma hoje.
Talvez haja a necessidade e seja a hora de trazer a ciência para o século XXI. E uma
observação tangente aqui, não acredito que precisamos esperar a atual geração de cientistas
se aposentar para fazer isso. A Ciência é cada vez mais um esforço de grupo, assim, podemos
focar em grupos de pesquisa e depois confiar em suas capacidades internas de difusão de
conhecimento. Mas o mais importante é que não devemos subestimar a adaptabilidade do
atual grupo de cientistas, os professores seniores presentes nesta sala. Eles precisavam ir até a
biblioteca para ler um artigo científico! Eles já presenciaram alguma mudança durante as
suas carreiras em Ciência. Eu acho que eles conseguem lidar muito bem com essa nova
mudança. Podemos confiar neles.
4
https://xkcd.com/552/
2
3. 5
Também vemos um terreno em movimento na publicação científica. É claro que existe todo o
movimento de acesso aberto e a ciência aberta em geral, mas também estamos
testemunhando aumentos de preços no acesso a publicações científicas e, com razão,
questionamentos feitos pelos países que acham difícil justificar o aumento do preço das
assinaturas. O impasse entre a França e a SpringerNature é um exemplo recente . Algo difícil
6
de justificar é que a abertura do acesso a vários periódicos não se traduz em preços mais
baixos de pacotes de assinaturas.
Talvez seja necessário repensar a difusão do conhecimento para a ciência como um todo. Bret
Victor, um pesquisador da Califórnia, aponta que o livro como o conhecemos atualmente não
foi uma conseqüência imediata da invenção da prensa móvel por Gutenberg. Talvez a mesma
coisa aconteça hoje com a ciência. Temos agora todas essas ferramentas fornecidas pela
digitalização, mas talvez ainda não tenhamos chegado à ferramenta que teremos no futuro
para difusão do conhecimento científico.
“Victor está convencido de que os cientistas ainda não aproveitaram ao máximo o
computador. "Não é tão diferente do que olhar para a prensa móvel e a evolução do
livro", disse ele. Depois de Gutenberg, a prensa móvel foi usada principalmente para
imitar a caligrafia nas Bíblias. Foram necessários quase 100 anos de aprimoramentos
técnicos e conceituais para se inventar o livro moderno. "Houve todo esse período em
5
https://www.eui.eu/ServicesAndAdmin/LanguageCentre/LanguageCourses/English/Writing-your-Journa
l-Article-Draft-to-Submission
6
https://www.the-scientist.com/?articles.view/articleNo/52208/title/French-Universities-Cancel-Subscrip
tions-to-Springer-Journals/
3
4. que eles tinham a nova tecnologia de impressão, mas estavam apenas usando-a para
emular a mídia antiga"."7
Existem algumas iniciativas interessantes, como o Jupyter Notebook ou o Mathematica . E,
8 9
como com o livro depois de Gutenberg, ainda não estamos lá.
O que está claro é que precisamos hoje de um meio de comunicação acadêmica que vá além
do texto escrito. Precisamos de dados, mas também de procedimentos metodológicos e de
código que sejam compartilhados de maneira clara, precisa e aberta, se quisermos reproduzir
a Ciência de hoje e abordar a chamada crise de reprodutibilidade.
Talvez seja hora de repensar todo o esforço científico.
Mas tudo isso está um pouco além do que estamos tratando aqui. Vamos falar mais
especificamente sobre o Brasil. Entendemos que os Dados de Pesquisa financiados com
dinheiro público se enquadram no contexto da Lei de Acesso a Dados do Governo.
Temos uma Lei de Acesso a Dados Governamentais (LAI) desde 2012 e temos uma Política
Nacional de Dados Governamentais. Existem também iniciativas como a Infraestrutura
Nacional de Dados Abertos (INDA). Desde antes da Lei de Dados Abertos, tivemos também a
Infraestrutura Nacional de Dados Espaciais (INDE).
Portanto, entendemos que os Dados de Pesquisa Abertos devem fazer parte desse contexto,
mas também entendemos que há necessidades muito específicas que precisam ser atendidas
para que possamos propor uma Política Nacional de Dados de Pesquisa.
Portanto, temos várias perguntas e poucas respostas. Isso faz parte de estar aqui no Rio com
todos vocês. Essas perguntas estão relacionadas aos dados de pesquisa abertos e à ciência
aberta em geral.
1 - Qual é o nosso papel? Qual é o papel do Ministério em tudo isso? Quais são os papéis de
nossos parceiros e de nossas instituições afiliadas? Então, vemos aqui as palestras da Rede
Nacional de Pesquisa (RNP) trabalhando em conjunto com o IBICT - Instituto Brasileiro de
Informação em Ciência e Tecnologia. Conversamos com a Fiocruz e o CIDACS. Acreditamos que
qualquer desafio possível que eles enfrentam na busca pela Ciência Aberta é provavelmente
tão difícil quanto qualquer outro. Seus requisitos de privacidade são os mais altos; seu volume
de dados é muito grande, e assim por diante. Há também um papel para os financiadores.
Estou ansioso para ouvir a apresentação da Prof. Bauzer Medeiros sobre o trabalho da FAPESP;
2 - Quais são os papéis institucionais necessários para apoiar os esforços em dados de
pesquisa e os esforços em dados abertos de pesquisa? Quais são as unidades de intervenção a
serem tratadas por nossas ações?
7
tradução própria de
https://www.theatlantic.com/science/archive/2018/04/the-scientific-paper-is-obsolete/556676/?utm_s
ource=atltw
8
http://jupyter.org/
9
https://www.wolfram.com/mathematica/
4
5. 3 - Existem obviamente dúvidas sobre a combinação de repositórios de domínio específico e
de uso geral que melhor atende a comunidade científica. Devemos ter repositórios
institucionais, nacionais ou globais? Tudo as opções acima?
4 - Existe uma necessidade evidente de coordenação e de fóruns como este. Vimos ontem, em
tempo real, os benefícios de ter algo parecido com essa reunião durante a sessão sobre
iniciativas relacionadas a solo, quando os grupos que apresentaram se familiarizaram-se com
os esforços uns dos outros;
10
5 - Existe todo um conjunto de habilidades, equipes e serviços que precisam ser fornecidos.
Quem os vai fornecer? Como? Onde eles devem estar localizados? Como isso se relaciona com
os serviços fornecidos pelas bibliotecas existentes?
6 - Tudo isso leva a financiamento e incentivos. Temos que garantir que a maneira como
fornecemos financiamento e incentivos não seja uma barreira para abrir a ciência e abrir
dados de pesquisa. Temos que olhar como estamos contratando, algo que Prof. Nicolai da
Costa, do Observatório Nacional mencionou anteriormente. Se contratamos pessoas apenas
com base em contagem de artigos, isso pode ser uma barreira para a ciência aberta e para a
disponibilidade de dados científicos abertos;
7 - Isso nos leva à avaliação. E, para o Brasil, há também a questão da burocracia, auditoria
externa e preocupações legais, que estão na mesa e, infelizmente, na mente da maioria dos
pesquisadores;
8 - Há também a não pequena tarefa de fornecer infraestrutura e os meios para que isso
aconteça. Existem papéis a serem desempenhados pela RNP e pelo IBICT. Em termos gerais,
precisamos pensar em nossas capacidades não apenas para produzir dados de pesquisa
abertos, mas também para consumir dados de pesquisa abertos. Como exemplo, existem
dados de geleiras. Ontem, na apresentação da iniciativa sobre dados de geleiras, não
encontramos o Brasil como produtor de dados. Eu acho que nós não encontramos ainda o
10
Open Science Umbrella. Crédito de imagem: usuário Flikr 지우 BY CC BY 2.0
5
6. Glaciar brasileiro, mas esses dados não deixam de ser muito valiosos para os nossos cientistas
do clima e que devem ser capazes de consumi-los;
Há algo que vi em uma apresentação de Luis Fernando Sayão, da Comissão Nacional de Energia
Atômica, salientando que da mesma forma que fazemos a análise de DNA em amostras que
foram mantidos desde o século XIX, temos que pensar de dados com o mesmo potencial de
serem analisados no futuro com técnicas que ainda não conhecemos. E isso é algo que
precisamos pensar quando estamos financiando esses empreendimentos e que não estamos
fazendo somente para nós mesmos. Também estamos fazendo isso para o futuro;
11
9 - Portanto, ao considerar tudo isso, devemos pensar em novos meios de difusão do
conhecimento, na revisão por pares etc. assegurando abertura e excelência;
Agradeço a todos por este fórum. Foram 2 dias excelentes. Acredito que esse seja um papel
central para o nosso anfitrião, a Academia Brasileira de Ciências. Nada do que fazemos no
Ministério funcionará se não for adotado pela comunidade científica. Muito obrigado.
11
http://acsi.acnatsci.org/base/getthumbnail.php?mode=original&target=128597 “amostra seccionada
em lâminas; 1 das 6 amostras totais coletadas em 1903 (n = 2) e 1905 (4). Somente dois dos espécimes
coletados em 1903 foram mencionados na descrição original por Goeldi (1905) e podem ser
considerados como syntypes; no entanto, qual dos 6 espécimes (agora na FMNH e MHNG) foram
coletados em 1903 permanece desconhecido (Muriel-Cunha e de Pinna, 2005). ”
6