Rumo a uma política de dados científicos ,1 2
@ Painel 4: Infraestrutura, treinamento e financiamento de iniciativas de dados
científicos
Workshop de Gerenciamento de Dados Científicos da América Latina e Caribe
Roberto de Pinho (Analista em C&T, Ministério de Ciência, Tecnologia, Inovações
e Comunicações, Brasil)
Acredito e muitas pessoas acreditam que estamos em tempos difíceis para a ciência. Nós
observamos os movimentos antivacina no​,
século XXI, algo que não deveríamos mais ter.
Vemos também a Ciência das Mudanças Climáticas sendo desacreditada. Alguns falam de uma
crise de confiança na Ciência, algo que pode estar relacionado a todo o fenômeno das notícias
falsas (​Fake News​). Estes também são tempos desafiadores para a ciência brasileira em
particular, sem mencionar a crise de financiamento pela qual estamos passando.
3
A digitalização​, que é a maneira como alguns chamam o processo pelo qual as tecnologias de
TIC e as abordagens orientadas a dados estão transformando quase todos os aspectos das
atividades humanas, incluindo a Ciência, apresentam ​grandes oportunidades, mas também
muitos riscos​. Gosto muito de um site sobre correlações espúrias. Possui várias séries
temporais e permite encontrar correlações entre as coisas mais distintas ​2​
. Podemos encontrar
coisas como o fato de o orçamento dos Estados Unidos para Pesquisa e Desenvolvimento nas
Ciências da Saúde estar correlacionado com o número de filmes de Al pacino por ano ou algo
assim. Como alguém apontou, isso dá substância ao dito “com dados suficientes, pode-se
provar qualquer coisa” e isso pode se tornar um problema. Também estamos no meio do
1
Esta é uma tradução do documento elaborado para The Latin America and the Caribbean Scientific
Data Management Workshop. Original em:
https://www.slideshare.net/RobertodePinho/towards-a-scientific-data-policy
2
Ceci n'est pas un PowerPoint. Esta é uma recontagem por escrito da apresentação, com base na minha
lembrança - ou talvez como eu gostaria de ter dito. O fraseado é adaptado. ​☺​ O vídeo está online em
https://www.facebook.com/abciencias/videos/1860817650616995/ As
correções são bem-vindas.
3
http://www.tylervigen.com/spurious-correlations
1
escândalo da Cambridge Analytica / Facebook, que traz à nossa mente e à mente do público
em geral preocupações relacionadas ao processo de digitalização da ciência.
4
No entanto, neste momento, a ​Ciência é extremamente necessária para ​enfrentarmos os
grandes desafios que são elegantemente apresentados pelos ​Objetivos de Desenvolvimento
Sustentável das Nações Unidas (ODS). Para isso, muitos especialistas diriam que há
necessidade de ​ciência transdisciplinar​, algo que o Prof. Barreto, da Fiocruz, apontou de
alguma forma hoje.
Talvez haja a necessidade e seja a hora de ​trazer a ciência para o século XXI. ​E uma
observação tangente aqui, ​não acredito que precisamos esperar a atual geração de cientistas
se aposentar para fazer isso. A Ciência é cada vez mais um esforço de grupo, assim, podemos
focar em grupos de pesquisa e depois confiar em suas capacidades internas de difusão de
conhecimento. Mas o mais importante é que não devemos subestimar a adaptabilidade do
atual grupo de cientistas, os professores seniores presentes nesta sala. ​Eles precisavam ir até a
biblioteca para ler um artigo científico! ​Eles já presenciaram alguma mudança durante as
suas carreiras ​em Ciência. Eu acho que eles conseguem lidar muito bem com essa nova
mudança. Podemos confiar neles.
4
https://xkcd.com/552/
2
5
Também vemos um terreno em movimento na publicação científica. É claro que existe todo o
movimento de acesso aberto e a ciência aberta em geral, mas também estamos
testemunhando aumentos de preços no acesso a publicações científicas e, com razão,
questionamentos feitos pelos países que acham difícil justificar o aumento do preço das
assinaturas. O impasse entre a França e a SpringerNature é um exemplo recente . Algo difícil
6
de justificar é que a abertura do acesso a vários periódicos não se traduz em preços mais
baixos de pacotes de assinaturas.
Talvez seja necessário repensar a difusão do conhecimento para a ciência como um todo. Bret
Victor, um pesquisador da Califórnia, aponta que o livro como o conhecemos atualmente não
foi uma conseqüência imediata da invenção da prensa móvel por Gutenberg. Talvez a mesma
coisa aconteça hoje com a ciência. Temos agora todas essas ferramentas fornecidas pela
digitalização, mas talvez ainda não tenhamos chegado à ferramenta que teremos no futuro
para difusão do conhecimento científico.
“​Victor está convencido de que os cientistas ainda não aproveitaram ao máximo o
computador. "Não é tão diferente do que olhar para a prensa móvel e a evolução do
livro", disse ele. Depois de Gutenberg, a prensa móvel foi usada principalmente para
imitar a caligrafia nas Bíblias. Foram necessários quase 100 anos de aprimoramentos
técnicos e conceituais para se inventar o livro moderno. "Houve todo esse período em
5
https://www.eui.eu/ServicesAndAdmin/LanguageCentre/LanguageCourses/English/Writing-your-Journa
l-Article-Draft-to-Submission
6
https://www.the-scientist.com/?articles.view/articleNo/52208/title/French-Universities-Cancel-Subscrip
tions-to-Springer-Journals/
3
que eles tinham a nova tecnologia de impressão, mas estavam apenas usando-a para
emular a mídia antiga".​"​7
Existem algumas iniciativas interessantes, como o Jupyter Notebook ou o Mathematica . E,
8 9
como com o livro depois de Gutenberg, ainda não estamos lá.
O que está claro é que ​precisamos hoje de um meio de comunicação acadêmica que vá além
do texto escrito. Precisamos de dados, mas também de procedimentos metodológicos e de
código que sejam compartilhados de maneira clara, precisa e aberta, ​se quisermos reproduzir
a Ciência de hoje e abordar a chamada crise de reprodutibilidade.
Talvez seja hora de repensar todo o esforço científico.
Mas tudo isso está um pouco além do que estamos tratando aqui. Vamos falar mais
especificamente sobre o ​Brasil​. Entendemos que os Dados de Pesquisa financiados com
dinheiro público se enquadram no contexto da Lei de Acesso a Dados do Governo.
Temos uma ​Lei de Acesso a Dados Governamentais (LAI) desde 2012 e temos uma ​Política
Nacional de Dados Governamentais. Existem também iniciativas como a ​Infraestrutura
Nacional de Dados Abertos (INDA). Desde antes da Lei de Dados Abertos, tivemos também a
Infraestrutura Nacional de Dados Espaciais​ (INDE).
Portanto, entendemos que os Dados de Pesquisa Abertos devem fazer parte desse contexto,
mas também entendemos que há ​necessidades muito específicas que precisam ser atendidas
para que possamos propor uma ​Política Nacional de Dados de Pesquisa​.
Portanto, ​temos várias perguntas e poucas respostas. Isso faz parte de estar aqui no Rio com
todos vocês. Essas perguntas estão relacionadas aos dados de pesquisa abertos e à ciência
aberta em geral.
1 - ​Qual é o nosso papel? ​Qual é o papel do Ministério em tudo isso? Quais são os papéis de
nossos parceiros e de nossas instituições afiliadas? Então, vemos aqui as palestras da Rede
Nacional de Pesquisa (RNP) trabalhando em conjunto com o IBICT - Instituto Brasileiro de
Informação em Ciência e Tecnologia. Conversamos com a Fiocruz e o CIDACS. Acreditamos que
qualquer desafio possível que eles enfrentam na busca pela Ciência Aberta é provavelmente
tão difícil quanto qualquer outro. Seus requisitos de privacidade são os mais altos; seu volume
de dados é muito grande, e assim por diante. Há também um papel para os financiadores.
Estou ansioso para ouvir a apresentação da Prof. Bauzer Medeiros sobre o trabalho da FAPESP;
2 - ​Quais são os papéis institucionais necessários para apoiar os esforços em dados de
pesquisa e os esforços em dados abertos de pesquisa? Quais são as unidades de intervenção a
serem tratadas por nossas ações?
7
tradução própria de
https://www.theatlantic.com/science/archive/2018/04/the-scientific-paper-is-obsolete/556676/?utm_s
ource=atltw
8
http://jupyter.org/
9
https://www.wolfram.com/mathematica/
4
3 - Existem obviamente ​dúvidas sobre a combinação de repositórios de domínio específico e
de uso geral que melhor atende a comunidade científica. Devemos ter repositórios
institucionais, nacionais ou globais? Tudo as opções acima?
4 - Existe uma ​necessidade evidente de coordenação e de fóruns como este. Vimos ontem, em
tempo real, os benefícios de ter algo parecido com essa reunião durante a sessão sobre
iniciativas relacionadas a solo, quando os grupos que apresentaram se familiarizaram-se com
os esforços uns dos outros;
10
5 - Existe todo um conjunto de habilidades, equipes e serviços que precisam ser fornecidos​.
Quem os vai fornecer? Como? Onde eles devem estar localizados? Como isso se relaciona com
os serviços fornecidos pelas bibliotecas existentes?
6 - Tudo isso leva a financiamento e incentivos. Temos que garantir que ​a maneira como
fornecemos financiamento e incentivos não seja uma barreira para abrir a ciência e abrir
dados de pesquisa​. Temos que olhar como estamos contratando, algo que ​Prof. Nicolai da
Costa, do Observatório Nacional mencionou anteriormente. Se contratamos pessoas apenas
com base em contagem de artigos, isso pode ser uma barreira para a ciência aberta e para a
disponibilidade de dados científicos abertos;
7 - Isso nos leva à ​avaliação​. E, para o Brasil, há também a questão da ​burocracia, auditoria
externa e preocupações legais​, que estão na mesa e, infelizmente, na mente da maioria dos
pesquisadores;
8 - Há também a ​não pequena tarefa de fornecer infraestrutura e os meios para que isso
aconteça. Existem papéis a serem desempenhados pela RNP e pelo IBICT. Em termos gerais,
precisamos pensar em nossas capacidades não apenas para ​produzir dados de pesquisa
abertos, mas também para consumir dados de pesquisa abertos​. Como exemplo, existem
dados de geleiras. Ontem, na apresentação da iniciativa sobre dados de geleiras, não
encontramos o Brasil como produtor de dados. Eu acho que nós não encontramos ​ainda o
10
Open Science Umbrella. Crédito de imagem: usuário Flikr ​지우​ ​BY​ CC BY 2.0
5
Glaciar brasileiro, mas esses dados não deixam de ser muito valiosos para os nossos cientistas
do clima e que devem ser capazes de consumi-los;
Há algo que vi em uma apresentação de Luis Fernando Sayão, da Comissão Nacional de Energia
Atômica, salientando que ​da mesma forma que fazemos a análise de DNA em amostras que
foram mantidos desde o século XIX, temos que pensar de dados com o mesmo potencial de
serem analisados no futuro com técnicas que ainda não conhecemos. E isso é algo que
precisamos pensar quando estamos financiando esses empreendimentos e que não estamos
fazendo somente para nós mesmos. Também estamos fazendo isso para o futuro;
11
9 - Portanto, ao considerar tudo isso, devemos ​pensar em novos meios de difusão do
conhecimento​, na ​revisão por pares etc.​ ​assegurando abertura e excelência;
Agradeço a todos por este fórum. Foram 2 dias excelentes. Acredito que esse seja um papel
central para o nosso anfitrião, a Academia Brasileira de Ciências. ​Nada do que fazemos no
Ministério funcionará se não for adotado pela comunidade científica.​ Muito obrigado.
11
http://acsi.acnatsci.org/base/getthumbnail.php?mode=original&target=128597 “amostra seccionada
em lâminas; 1 das 6 amostras totais coletadas em 1903 (n = 2) e 1905 (4). Somente dois dos espécimes
coletados em 1903 foram mencionados na descrição original por Goeldi (1905) e podem ser
considerados como ​syntypes​; no entanto, qual dos 6 espécimes (agora na FMNH e MHNG) foram
coletados em 1903 permanece desconhecido (Muriel-Cunha e de Pinna, 2005). ”
6

Rumo a uma política de dados científicos

  • 1.
    Rumo a umapolítica de dados científicos ,1 2 @ Painel 4: Infraestrutura, treinamento e financiamento de iniciativas de dados científicos Workshop de Gerenciamento de Dados Científicos da América Latina e Caribe Roberto de Pinho (Analista em C&T, Ministério de Ciência, Tecnologia, Inovações e Comunicações, Brasil) Acredito e muitas pessoas acreditam que estamos em tempos difíceis para a ciência. Nós observamos os movimentos antivacina no​, século XXI, algo que não deveríamos mais ter. Vemos também a Ciência das Mudanças Climáticas sendo desacreditada. Alguns falam de uma crise de confiança na Ciência, algo que pode estar relacionado a todo o fenômeno das notícias falsas (​Fake News​). Estes também são tempos desafiadores para a ciência brasileira em particular, sem mencionar a crise de financiamento pela qual estamos passando. 3 A digitalização​, que é a maneira como alguns chamam o processo pelo qual as tecnologias de TIC e as abordagens orientadas a dados estão transformando quase todos os aspectos das atividades humanas, incluindo a Ciência, apresentam ​grandes oportunidades, mas também muitos riscos​. Gosto muito de um site sobre correlações espúrias. Possui várias séries temporais e permite encontrar correlações entre as coisas mais distintas ​2​ . Podemos encontrar coisas como o fato de o orçamento dos Estados Unidos para Pesquisa e Desenvolvimento nas Ciências da Saúde estar correlacionado com o número de filmes de Al pacino por ano ou algo assim. Como alguém apontou, isso dá substância ao dito “com dados suficientes, pode-se provar qualquer coisa” e isso pode se tornar um problema. Também estamos no meio do 1 Esta é uma tradução do documento elaborado para The Latin America and the Caribbean Scientific Data Management Workshop. Original em: https://www.slideshare.net/RobertodePinho/towards-a-scientific-data-policy 2 Ceci n'est pas un PowerPoint. Esta é uma recontagem por escrito da apresentação, com base na minha lembrança - ou talvez como eu gostaria de ter dito. O fraseado é adaptado. ​☺​ O vídeo está online em https://www.facebook.com/abciencias/videos/1860817650616995/ As correções são bem-vindas. 3 http://www.tylervigen.com/spurious-correlations 1
  • 2.
    escândalo da CambridgeAnalytica / Facebook, que traz à nossa mente e à mente do público em geral preocupações relacionadas ao processo de digitalização da ciência. 4 No entanto, neste momento, a ​Ciência é extremamente necessária para ​enfrentarmos os grandes desafios que são elegantemente apresentados pelos ​Objetivos de Desenvolvimento Sustentável das Nações Unidas (ODS). Para isso, muitos especialistas diriam que há necessidade de ​ciência transdisciplinar​, algo que o Prof. Barreto, da Fiocruz, apontou de alguma forma hoje. Talvez haja a necessidade e seja a hora de ​trazer a ciência para o século XXI. ​E uma observação tangente aqui, ​não acredito que precisamos esperar a atual geração de cientistas se aposentar para fazer isso. A Ciência é cada vez mais um esforço de grupo, assim, podemos focar em grupos de pesquisa e depois confiar em suas capacidades internas de difusão de conhecimento. Mas o mais importante é que não devemos subestimar a adaptabilidade do atual grupo de cientistas, os professores seniores presentes nesta sala. ​Eles precisavam ir até a biblioteca para ler um artigo científico! ​Eles já presenciaram alguma mudança durante as suas carreiras ​em Ciência. Eu acho que eles conseguem lidar muito bem com essa nova mudança. Podemos confiar neles. 4 https://xkcd.com/552/ 2
  • 3.
    5 Também vemos umterreno em movimento na publicação científica. É claro que existe todo o movimento de acesso aberto e a ciência aberta em geral, mas também estamos testemunhando aumentos de preços no acesso a publicações científicas e, com razão, questionamentos feitos pelos países que acham difícil justificar o aumento do preço das assinaturas. O impasse entre a França e a SpringerNature é um exemplo recente . Algo difícil 6 de justificar é que a abertura do acesso a vários periódicos não se traduz em preços mais baixos de pacotes de assinaturas. Talvez seja necessário repensar a difusão do conhecimento para a ciência como um todo. Bret Victor, um pesquisador da Califórnia, aponta que o livro como o conhecemos atualmente não foi uma conseqüência imediata da invenção da prensa móvel por Gutenberg. Talvez a mesma coisa aconteça hoje com a ciência. Temos agora todas essas ferramentas fornecidas pela digitalização, mas talvez ainda não tenhamos chegado à ferramenta que teremos no futuro para difusão do conhecimento científico. “​Victor está convencido de que os cientistas ainda não aproveitaram ao máximo o computador. "Não é tão diferente do que olhar para a prensa móvel e a evolução do livro", disse ele. Depois de Gutenberg, a prensa móvel foi usada principalmente para imitar a caligrafia nas Bíblias. Foram necessários quase 100 anos de aprimoramentos técnicos e conceituais para se inventar o livro moderno. "Houve todo esse período em 5 https://www.eui.eu/ServicesAndAdmin/LanguageCentre/LanguageCourses/English/Writing-your-Journa l-Article-Draft-to-Submission 6 https://www.the-scientist.com/?articles.view/articleNo/52208/title/French-Universities-Cancel-Subscrip tions-to-Springer-Journals/ 3
  • 4.
    que eles tinhama nova tecnologia de impressão, mas estavam apenas usando-a para emular a mídia antiga".​"​7 Existem algumas iniciativas interessantes, como o Jupyter Notebook ou o Mathematica . E, 8 9 como com o livro depois de Gutenberg, ainda não estamos lá. O que está claro é que ​precisamos hoje de um meio de comunicação acadêmica que vá além do texto escrito. Precisamos de dados, mas também de procedimentos metodológicos e de código que sejam compartilhados de maneira clara, precisa e aberta, ​se quisermos reproduzir a Ciência de hoje e abordar a chamada crise de reprodutibilidade. Talvez seja hora de repensar todo o esforço científico. Mas tudo isso está um pouco além do que estamos tratando aqui. Vamos falar mais especificamente sobre o ​Brasil​. Entendemos que os Dados de Pesquisa financiados com dinheiro público se enquadram no contexto da Lei de Acesso a Dados do Governo. Temos uma ​Lei de Acesso a Dados Governamentais (LAI) desde 2012 e temos uma ​Política Nacional de Dados Governamentais. Existem também iniciativas como a ​Infraestrutura Nacional de Dados Abertos (INDA). Desde antes da Lei de Dados Abertos, tivemos também a Infraestrutura Nacional de Dados Espaciais​ (INDE). Portanto, entendemos que os Dados de Pesquisa Abertos devem fazer parte desse contexto, mas também entendemos que há ​necessidades muito específicas que precisam ser atendidas para que possamos propor uma ​Política Nacional de Dados de Pesquisa​. Portanto, ​temos várias perguntas e poucas respostas. Isso faz parte de estar aqui no Rio com todos vocês. Essas perguntas estão relacionadas aos dados de pesquisa abertos e à ciência aberta em geral. 1 - ​Qual é o nosso papel? ​Qual é o papel do Ministério em tudo isso? Quais são os papéis de nossos parceiros e de nossas instituições afiliadas? Então, vemos aqui as palestras da Rede Nacional de Pesquisa (RNP) trabalhando em conjunto com o IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Conversamos com a Fiocruz e o CIDACS. Acreditamos que qualquer desafio possível que eles enfrentam na busca pela Ciência Aberta é provavelmente tão difícil quanto qualquer outro. Seus requisitos de privacidade são os mais altos; seu volume de dados é muito grande, e assim por diante. Há também um papel para os financiadores. Estou ansioso para ouvir a apresentação da Prof. Bauzer Medeiros sobre o trabalho da FAPESP; 2 - ​Quais são os papéis institucionais necessários para apoiar os esforços em dados de pesquisa e os esforços em dados abertos de pesquisa? Quais são as unidades de intervenção a serem tratadas por nossas ações? 7 tradução própria de https://www.theatlantic.com/science/archive/2018/04/the-scientific-paper-is-obsolete/556676/?utm_s ource=atltw 8 http://jupyter.org/ 9 https://www.wolfram.com/mathematica/ 4
  • 5.
    3 - Existemobviamente ​dúvidas sobre a combinação de repositórios de domínio específico e de uso geral que melhor atende a comunidade científica. Devemos ter repositórios institucionais, nacionais ou globais? Tudo as opções acima? 4 - Existe uma ​necessidade evidente de coordenação e de fóruns como este. Vimos ontem, em tempo real, os benefícios de ter algo parecido com essa reunião durante a sessão sobre iniciativas relacionadas a solo, quando os grupos que apresentaram se familiarizaram-se com os esforços uns dos outros; 10 5 - Existe todo um conjunto de habilidades, equipes e serviços que precisam ser fornecidos​. Quem os vai fornecer? Como? Onde eles devem estar localizados? Como isso se relaciona com os serviços fornecidos pelas bibliotecas existentes? 6 - Tudo isso leva a financiamento e incentivos. Temos que garantir que ​a maneira como fornecemos financiamento e incentivos não seja uma barreira para abrir a ciência e abrir dados de pesquisa​. Temos que olhar como estamos contratando, algo que ​Prof. Nicolai da Costa, do Observatório Nacional mencionou anteriormente. Se contratamos pessoas apenas com base em contagem de artigos, isso pode ser uma barreira para a ciência aberta e para a disponibilidade de dados científicos abertos; 7 - Isso nos leva à ​avaliação​. E, para o Brasil, há também a questão da ​burocracia, auditoria externa e preocupações legais​, que estão na mesa e, infelizmente, na mente da maioria dos pesquisadores; 8 - Há também a ​não pequena tarefa de fornecer infraestrutura e os meios para que isso aconteça. Existem papéis a serem desempenhados pela RNP e pelo IBICT. Em termos gerais, precisamos pensar em nossas capacidades não apenas para ​produzir dados de pesquisa abertos, mas também para consumir dados de pesquisa abertos​. Como exemplo, existem dados de geleiras. Ontem, na apresentação da iniciativa sobre dados de geleiras, não encontramos o Brasil como produtor de dados. Eu acho que nós não encontramos ​ainda o 10 Open Science Umbrella. Crédito de imagem: usuário Flikr ​지우​ ​BY​ CC BY 2.0 5
  • 6.
    Glaciar brasileiro, masesses dados não deixam de ser muito valiosos para os nossos cientistas do clima e que devem ser capazes de consumi-los; Há algo que vi em uma apresentação de Luis Fernando Sayão, da Comissão Nacional de Energia Atômica, salientando que ​da mesma forma que fazemos a análise de DNA em amostras que foram mantidos desde o século XIX, temos que pensar de dados com o mesmo potencial de serem analisados no futuro com técnicas que ainda não conhecemos. E isso é algo que precisamos pensar quando estamos financiando esses empreendimentos e que não estamos fazendo somente para nós mesmos. Também estamos fazendo isso para o futuro; 11 9 - Portanto, ao considerar tudo isso, devemos ​pensar em novos meios de difusão do conhecimento​, na ​revisão por pares etc.​ ​assegurando abertura e excelência; Agradeço a todos por este fórum. Foram 2 dias excelentes. Acredito que esse seja um papel central para o nosso anfitrião, a Academia Brasileira de Ciências. ​Nada do que fazemos no Ministério funcionará se não for adotado pela comunidade científica.​ Muito obrigado. 11 http://acsi.acnatsci.org/base/getthumbnail.php?mode=original&target=128597 “amostra seccionada em lâminas; 1 das 6 amostras totais coletadas em 1903 (n = 2) e 1905 (4). Somente dois dos espécimes coletados em 1903 foram mencionados na descrição original por Goeldi (1905) e podem ser considerados como ​syntypes​; no entanto, qual dos 6 espécimes (agora na FMNH e MHNG) foram coletados em 1903 permanece desconhecido (Muriel-Cunha e de Pinna, 2005). ” 6