Curso de cienciometria. Aula 2, As bases de dados e a cienciometria

311 visualizações

Publicada em

As bases de dados e a cienciometria

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
311
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
17
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Curso de cienciometria. Aula 2, As bases de dados e a cienciometria

  1. 1. Curso de cienciometria Aula 2 L. Strehl Asbasesdedadose acienciometria
  2. 2.  Bases de dados  Cobertura  Indexação do conteúdo  Qualidade do registro  Recursos de entrada  Recursos de análise  Recursos de saída Web of Science e InCites Socups e Scival Google Scholar e Publish or Perish
  3. 3. GLÄNZEL, W. Bibliometrics as a research field: A course on theory and application of bibliometric indicators. [s.l: s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17 set. 2015.
  4. 4. GLÄNZEL, W. Bibliometrics as a research field: A course on theory and application of bibliometric indicators. [s.l: s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17 set. 2015. Para saber o significado e as limitações dos indicadores, você precisa conhecer : O Universo informacional da base de dados e qualidade de seus dados A metodologia de cálculo e sua representatividade em termos de desempenho científico
  5. 5. Bases de dados • Cobertura • Indexação do conteúdo • Qualidade do registro • Recursos de entrada • Recursos de análise • Recursos de saída Indicadores • Fórmulas adequadas • Dados representativos Rankings • Pesos adequados atribuídos aos diferentes indicadores
  6. 6.  Permitir que um pesquisador revise a literatura de modo a conhecer as pesquisas já realizadas relacionadas com sua investigação  Depois, somente depois, os estudos cienciométricos se desenvolveram a partir da coleta e da análise de dados permitida por essas ferramentas de recuperação
  7. 7. Alguns componentes básicos de um sistema de recuperação da informação 0 Cobertura 0 Critério de seleção 0Seletivo 0Exaustivo 0 Abrangência temática 0Multidisciplinar 0Especializada 0 Recursos de indexação 0 Referências 0 Terminologia por controle de vocabulário
  8. 8. Bases de dados: cobertura e indexação Mais importantes Exemplos
  9. 9. Ulrich (70.323 periódicos*) Scopus (22.245 periódicos) Web of Science (12.679 periódicos) * O Ulrich apresenta algumas repetições pelo suporte... O número não é exatamente preciso.
  10. 10. 133 200 129 62 30 424 310 266 208 147 0 50 100 150 200 250 300 350 400 450 2015 2010 2009 2008 2007 Web of Science Scopus
  11. 11. 133 200 129 62 30 424 310 266 208 147 0 50 100 150 200 250 300 350 400 450 Web of Science Scopus 0 50,000 100,000 150,000 200,000 Ciências Agrárias Ciências Biológicas Ciências da Saúde Ciências Exatas e da Terra Ciências Humanas Ciências Sociais Aplicadas Engenharias e Ciência da Computação Linguística, Artes e Letras
  12. 12. LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.
  13. 13.  Adoção de terminologia semelhante  Citação de referências comuns
  14. 14. Um artigo, duas bases de dados: Web of Science
  15. 15. Um artigo, duas bases de dados: Pubmed
  16. 16. Indexação de citações
  17. 17.  Os índices de citações foram desenvolvidos a partir do princípio de que as referências citadas por um autor identificam de maneira mais precisa o relacionamento entre documentos que tratam do mesmo assunto. Fonte: GARFIELD, Eugene. Citation indexes for science: a new dimension in documentation through association of ideas. Science, Washington, v. 122, n. 3159, p. 108-111, July 1955.
  18. 18. “Há alguns anos a revista Nature recebeu, simultaneamente, mas de modo independente, dois originais para avaliação (um dos EUA e outro do Reino Unido) sobre um tema idêntico: a identificação de certos organismos veiculados pelo ar. Nos artigos, 7 das 8 referências citadas eram idênticas. Fonte: MEADOWS, A.J. A comunicação científica. Brasília: Briquet de Lemos, 1999. viii, 268p
  19. 19. Os índices de citações passaram a ser usados para avaliar a atividade científica:  Trabalhos importantes são freqüentemente citados na literatura
  20. 20. Relações entre cobertura e recursos de indexação Requisito para a análise de impacto
  21. 21.  Existência de bases de dados que indexem:  uma quantidade representativa de documentos;  as referências citadas nas publicações. Atualmente, as principais bases de dados para o cumprimento desta finalidade são aWeb of Science, a Scopus e o Google Acadêmico
  22. 22. Cobertura: 0 Em teoria: tudo que está disponível na internet que o Google consegue classificar como sendo acadêmico 0 Na prática: alguns editores limitam o acesso aos motores do Google, principalmente a Elsevier por causa da concorrência com a Scopus 0 Resultado: a cobertura é extensa, mas indefinida Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  23. 23. A qualidade do registro de uma base de dados é medida pelo nível de precisão de sua recuperação, identificando inequivocamente cada informação que constitui um registro:  Autor  Afiliação  Assunto (bases que fazem controle de vocabulário)  Citação
  24. 24. Exemplos de imprecisão
  25. 25.  Busca de nomes de autores e instituições em Web of Science e Scopus
  26. 26.  Agrupamento das variações indevidas dos nomes de autores e instituições segundo instruções do contratante (uma espécie de correção do dado)  Criação de grupos que identificam as estruturas organizacionais que não são corretamente expressas na indicação das afiliações (departamentos, ppgs, laboratórios) (dado novo, não está na publicação, o contratante que informa)
  27. 27.  A solução parcial são os identificadores digitais para:  Autores (ORCID, Research ID, etc...)  Instituições (ORCID)  Artigos (DOI)
  28. 28. Ao invés disso, um número: 0000-0001-9723- 9576 Variações do nome do autor
  29. 29. ORCID (Open Reseacher & Contributor ID) www.orcid.org Vinculado à Scopus e ao Researcher ID Integração com diversas bases de dados Apresenta lista de publicações e classifica por data, tipo e título. Código numérico não proprietário
  30. 30. ORCID (perfil) Publicações Dados do autor
  31. 31. ORCID (cadastro)
  32. 32. Researcher ID www.researcherid.com Vinculado ao ORCID Integração somente com Web of Science e Endnote Acompanha citações e índice H Código numérico proprietário Identifica colaboradores
  33. 33. Identificadores digitais de autores em diferentes bases de dados Integrados com a
  34. 34. Digital object identifier (DOI) é um código usado para identificar inequivocamente o conteúdo de vários tipos de redes eletrônicas. O sistema DOI é particularmente usado para documentos eletrônicos tais como artigos de periódicos.
  35. 35. A Plataforma Lattes agora usa e abusa do DOI, felizmente Preenchimento Visualização: DOI permite a integração com várias bases
  36. 36. Os formulários de avaliação das agências de fomento possuem uma estrutra relacional e prevêm a identificação digital dos pesquisadores (ORCID) e da produção (DOI)?
  37. 37. Qualidade do registro: 0 Mecanismo: robôs recompilam as informações disponíveis nos domínios institucionais, com permissão dos produtores, na filosofia dos Arquivos Abertos 0 Resultado: não utiliza os metadados dos editores das publicações: 0evita problemas de qualidade dos metadados dos editores 0cria novos problemas Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  38. 38. Tipos de inconsistências na forma do GA coletar os metadados Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  39. 39. “Duplicação” de artigos 1 em 4
  40. 40. Duplicação de citações 3 em 7
  41. 41. Autores? 0 Autor fantasma: P Login ou seja Please Login (2.340 artigos) 0 Autores perdidos
  42. 42. Autores? 0 Autor fantasma: P Login ou seja Please Login (2.340 artigos) 0 Autores perdidos O P Login já está resolvido! 
  43. 43. Inconsistências incapacitantes 0 TODAS as bases possuem inconsistências! TODO o levantamento bibliométrico exige limpeza de dados! 0 Todavia, para Peter Jácso, as inconsistências do GA são tantas que inviabilizam por completo o uso dos dados para cálculo de índices bibliométricos Mas, para a revisão de literatura, o GA é uma excelente ferramenta Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  44. 44.  Os recursos de entrada são identificados basicamente pelos campos e pelos operadores disponibilizados na base de dados para a realização de uma busca  A forma de escrever a expressão de busca nos campos disponíveis define o resultado a ser obtido na base de dados.  Operadores booleanos, de proximidade e truncagem! A seção “Help” das bases de dados é sua grande aliada!
  45. 45. Montes e montes de opções
  46. 46. INCITES SCIVAL
  47. 47.  Os recursos de análise são as ferramentas disponibilizadas na própria interface da base de dados que permitem obter respostas a partir dos dados recuperados a partir de uma expressão de busca
  48. 48.  Quantas publicações foram produzidas por um determinado autor ou instituição?  Quantas publicações foram produzidas sobre determinado assunto? [Aqui, as bases de dados que usam controle de vocabulário são mais precisas]
  49. 49.  Faça um gráfico que represente a produção de uma instituição com as ferramentas da Web of Science e da Scopus
  50. 50.  Quantas citações foram feitas a determinado autor, instituição ou tema?  Em média, quantas citações foram recebidas por cada um dos artigos?  Qual é o Índice H do pesquisador?
  51. 51.  Faça um gráfico de citações recebidas com as ferramentas daWeb of Science e da Scopus
  52. 52. INCITES SCIVAL
  53. 53. INCITES SCIVAL Essas ferramentas no quesito “recursos de análise” dão um show: tem perguntas mais elaboradas e recursos de comparação que suas respectivas bases de dados não respondem
  54. 54. Qualidade do registro: 0 Não possui ferramenta bibliométrica própria para sistematização de informações das citações e para o cálculo dos indicadores 0 Publish or Perish é uma ferramenta desenvolvida para tal Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  55. 55. FORMAS DE BUSCA  Autores  Periódicos  Palavras-chave ÍNDICES PRINCIPAIS  Número total:  trabalhos  Citações  Número médio de:  citações por artigo  citações por autor  citações por ano  trabalhos por autor  Índice H e indicadores relacionados
  56. 56.  Os recursos de saída são todas as possibilidades de salvamento dos registros obtidos em uma busca  Fora da base de dados, os arquivos salvos podem ser analisados com recursos de outros softwares, permitindo novas visões e a produção de novos indicadores

×