Curso de cienciometria
Aula 2
L. Strehl
Asbasesdedadose
acienciometria
 Bases de dados
 Cobertura
 Indexação do conteúdo
 Qualidade do registro
 Recursos de entrada
 Recursos de análise
 Recursos de saída
Web of Science e InCites
Socups e Scival
Google Scholar e Publish or
Perish
GLÄNZEL, W. Bibliometrics as a research field: A course on theory and application of bibliometric indicators. [s.l:
s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17
set. 2015.
GLÄNZEL, W. Bibliometrics as a research field: A course on theory and application of bibliometric indicators. [s.l:
s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17
set. 2015.
Para saber o significado e as limitações dos indicadores, você precisa
conhecer :
O Universo
informacional da base de
dados e qualidade de
seus dados
A metodologia de cálculo e
sua representatividade em
termos de desempenho
científico
Bases de dados
• Cobertura
• Indexação do
conteúdo
• Qualidade do
registro
• Recursos de
entrada
• Recursos de
análise
• Recursos de
saída
Indicadores
• Fórmulas
adequadas
• Dados
representativos
Rankings
• Pesos
adequados
atribuídos aos
diferentes
indicadores
 Permitir que um pesquisador revise a
literatura de modo a conhecer as pesquisas já
realizadas relacionadas com sua investigação
 Depois, somente depois, os estudos
cienciométricos se desenvolveram a partir da
coleta e da análise de dados permitida por
essas ferramentas de recuperação
Alguns componentes básicos de um
sistema de recuperação da informação
0 Cobertura
0 Critério de seleção
0Seletivo
0Exaustivo
0 Abrangência temática
0Multidisciplinar
0Especializada
0 Recursos de indexação
0 Referências
0 Terminologia por controle de vocabulário
Bases de dados: cobertura e indexação
Mais importantes
Exemplos
Ulrich
(70.323 periódicos*)
Scopus (22.245
periódicos)
Web of Science
(12.679 periódicos)
* O Ulrich apresenta
algumas repetições
pelo suporte...
O número não é
exatamente preciso.
133
200
129
62
30
424
310
266
208
147
0
50
100
150
200
250
300
350
400
450
2015 2010 2009 2008 2007
Web of Science
Scopus
133
200
129
62
30
424
310
266
208
147
0
50
100
150
200
250
300
350
400
450
Web of Science
Scopus
0 50,000 100,000 150,000 200,000
Ciências Agrárias
Ciências Biológicas
Ciências da Saúde
Ciências Exatas e da Terra
Ciências Humanas
Ciências Sociais Aplicadas
Engenharias e Ciência da
Computação
Linguística, Artes e Letras
LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific
literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on
Scientometrics and Informetrics, 2007, Madrid.
 Adoção de terminologia semelhante
 Citação de referências comuns
Um artigo, duas bases de dados:
Web of Science
Um artigo, duas bases de dados:
Pubmed
Indexação de citações
 Os índices de citações foram desenvolvidos a
partir do princípio de que as referências
citadas por um autor identificam de maneira
mais precisa o relacionamento entre
documentos que tratam do mesmo assunto.
Fonte: GARFIELD, Eugene. Citation indexes for science: a new dimension in documentation through
association of ideas.
Science, Washington, v. 122, n. 3159, p. 108-111, July 1955.
“Há alguns anos a revista Nature recebeu,
simultaneamente, mas de modo
independente, dois originais para avaliação
(um dos EUA e outro do Reino Unido) sobre
um tema idêntico: a identificação de certos
organismos veiculados pelo ar. Nos artigos, 7
das 8 referências citadas eram idênticas.
Fonte: MEADOWS, A.J. A comunicação científica. Brasília: Briquet de Lemos, 1999. viii, 268p
Os índices de citações passaram a ser usados
para avaliar a atividade científica:
 Trabalhos importantes são freqüentemente
citados na literatura
Relações entre cobertura e
recursos de indexação
Requisito para a análise
de impacto
 Existência de bases de dados que indexem:
 uma quantidade representativa de documentos;
 as referências citadas nas publicações.
Atualmente, as principais bases de dados para o
cumprimento desta finalidade são aWeb of
Science, a Scopus e o Google Acadêmico
Cobertura:
0 Em teoria: tudo que está disponível na internet que o
Google consegue classificar como sendo acadêmico
0 Na prática: alguns editores limitam o acesso aos motores
do Google, principalmente a Elsevier por causa da
concorrência com a Scopus
0 Resultado: a cobertura é extensa, mas indefinida
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
A qualidade do registro de uma base de dados é
medida pelo nível de precisão de sua
recuperação, identificando inequivocamente
cada informação que constitui um registro:
 Autor
 Afiliação
 Assunto (bases que fazem controle de
vocabulário)
 Citação
Exemplos de imprecisão
 Busca de nomes de autores e instituições em
Web of Science e Scopus
 Agrupamento das variações indevidas dos
nomes de autores e instituições segundo
instruções do contratante (uma espécie de
correção do dado)
 Criação de grupos que identificam as
estruturas organizacionais que não são
corretamente expressas na indicação das
afiliações (departamentos, ppgs,
laboratórios) (dado novo, não está na
publicação, o contratante que informa)
 A solução parcial são os identificadores
digitais para:
 Autores (ORCID, Research ID, etc...)
 Instituições (ORCID)
 Artigos (DOI)
Ao invés disso, um
número:
0000-0001-9723-
9576
Variações do
nome do
autor
ORCID (Open Reseacher & Contributor
ID)
www.orcid.org
Vinculado à Scopus e ao
Researcher ID
Integração com diversas
bases de dados
Apresenta lista de
publicações e classifica
por data, tipo e título.
Código numérico não
proprietário
ORCID (perfil)
Publicações
Dados do autor
ORCID (cadastro)
Researcher ID
www.researcherid.com
Vinculado ao ORCID
Integração somente com
Web of Science e Endnote
Acompanha citações e
índice H
Código numérico
proprietário
Identifica colaboradores
Identificadores digitais de autores em
diferentes bases de dados Integrados com a
Digital object
identifier (DOI) é um
código usado para
identificar inequivocamente
o conteúdo de vários tipos
de redes eletrônicas. O
sistema DOI é
particularmente usado para
documentos eletrônicos
tais como artigos de
periódicos.
A Plataforma Lattes agora
usa e abusa do DOI,
felizmente
Preenchimento
Visualização: DOI permite a integração com várias bases
Os formulários de avaliação
das agências de fomento
possuem uma estrutra
relacional e prevêm a
identificação digital dos
pesquisadores (ORCID) e da
produção (DOI)?
Qualidade do registro:
0 Mecanismo: robôs recompilam as informações disponíveis
nos domínios institucionais, com permissão dos
produtores, na filosofia dos Arquivos Abertos
0 Resultado: não utiliza os metadados dos editores das
publicações:
0evita problemas de qualidade dos metadados dos editores
0cria novos problemas
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
Tipos de inconsistências na
forma do GA coletar os
metadados
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
“Duplicação” de artigos
1 em
4
Duplicação de citações
3 em
7
Autores?
0 Autor fantasma: P Login ou seja Please Login (2.340 artigos)
0 Autores perdidos
Autores?
0 Autor fantasma: P Login ou seja Please Login (2.340 artigos)
0 Autores perdidos
O P Login já
está
resolvido! 
Inconsistências
incapacitantes
0 TODAS as bases possuem inconsistências!
TODO o levantamento bibliométrico exige limpeza de
dados!
0 Todavia, para Peter Jácso, as inconsistências do GA são
tantas que inviabilizam por completo o uso dos dados
para cálculo de índices bibliométricos
Mas, para a revisão de literatura, o GA é uma excelente
ferramenta
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
 Os recursos de entrada são identificados
basicamente pelos campos e pelos
operadores disponibilizados na base de
dados para a realização de uma busca
 A forma de escrever a expressão de
busca nos campos disponíveis define o
resultado a ser obtido na base de dados.
 Operadores booleanos, de proximidade e
truncagem!
A seção
“Help”
das
bases
de
dados é
sua
grande
aliada!
Montes e
montes de
opções
INCITES SCIVAL
 Os recursos de análise são as
ferramentas disponibilizadas na
própria interface da base de dados
que permitem obter respostas a
partir dos dados recuperados a
partir de uma expressão de busca
 Quantas publicações foram
produzidas por um determinado
autor ou instituição?
 Quantas publicações foram
produzidas sobre determinado
assunto? [Aqui, as bases de dados
que usam controle de vocabulário
são mais precisas]
 Faça um gráfico que represente a produção
de uma instituição com as ferramentas da
Web of Science e da Scopus
 Quantas citações foram feitas a determinado autor,
instituição ou tema?
 Em média, quantas citações foram recebidas por
cada um dos artigos?
 Qual é o Índice H do pesquisador?
 Faça um gráfico de citações recebidas com as
ferramentas daWeb of Science e da Scopus
INCITES SCIVAL
INCITES SCIVAL
Essas ferramentas no quesito
“recursos de análise” dão um
show: tem perguntas mais
elaboradas e recursos de
comparação que suas respectivas
bases de dados não respondem
Qualidade do registro:
0 Não possui ferramenta bibliométrica própria para
sistematização de informações das citações e para o
cálculo dos indicadores
0 Publish or Perish é uma ferramenta desenvolvida para tal
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
FORMAS DE BUSCA
 Autores
 Periódicos
 Palavras-chave
ÍNDICES PRINCIPAIS
 Número total:
 trabalhos
 Citações
 Número médio de:
 citações por artigo
 citações por autor
 citações por ano
 trabalhos por autor
 Índice H e indicadores
relacionados
 Os recursos de saída são todas as
possibilidades de salvamento dos registros
obtidos em uma busca
 Fora da base de dados, os arquivos salvos
podem ser analisados com recursos de outros
softwares, permitindo novas visões e a
produção de novos indicadores

Curso de cienciometria. Aula 2, As bases de dados e a cienciometria

  • 1.
    Curso de cienciometria Aula2 L. Strehl Asbasesdedadose acienciometria
  • 2.
     Bases dedados  Cobertura  Indexação do conteúdo  Qualidade do registro  Recursos de entrada  Recursos de análise  Recursos de saída Web of Science e InCites Socups e Scival Google Scholar e Publish or Perish
  • 3.
    GLÄNZEL, W. Bibliometricsas a research field: A course on theory and application of bibliometric indicators. [s.l: s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17 set. 2015.
  • 4.
    GLÄNZEL, W. Bibliometricsas a research field: A course on theory and application of bibliometric indicators. [s.l: s.n.]. Disponível em: <http://nsdl.niscair.res.in/jspui/bitstream/123456789/968/1/Bib_Module_KUL.pdf>. Acesso em: 17 set. 2015. Para saber o significado e as limitações dos indicadores, você precisa conhecer : O Universo informacional da base de dados e qualidade de seus dados A metodologia de cálculo e sua representatividade em termos de desempenho científico
  • 5.
    Bases de dados •Cobertura • Indexação do conteúdo • Qualidade do registro • Recursos de entrada • Recursos de análise • Recursos de saída Indicadores • Fórmulas adequadas • Dados representativos Rankings • Pesos adequados atribuídos aos diferentes indicadores
  • 7.
     Permitir queum pesquisador revise a literatura de modo a conhecer as pesquisas já realizadas relacionadas com sua investigação  Depois, somente depois, os estudos cienciométricos se desenvolveram a partir da coleta e da análise de dados permitida por essas ferramentas de recuperação
  • 9.
    Alguns componentes básicosde um sistema de recuperação da informação 0 Cobertura 0 Critério de seleção 0Seletivo 0Exaustivo 0 Abrangência temática 0Multidisciplinar 0Especializada 0 Recursos de indexação 0 Referências 0 Terminologia por controle de vocabulário
  • 10.
    Bases de dados:cobertura e indexação Mais importantes Exemplos
  • 11.
    Ulrich (70.323 periódicos*) Scopus (22.245 periódicos) Webof Science (12.679 periódicos) * O Ulrich apresenta algumas repetições pelo suporte... O número não é exatamente preciso.
  • 12.
  • 13.
    133 200 129 62 30 424 310 266 208 147 0 50 100 150 200 250 300 350 400 450 Web of Science Scopus 050,000 100,000 150,000 200,000 Ciências Agrárias Ciências Biológicas Ciências da Saúde Ciências Exatas e da Terra Ciências Humanas Ciências Sociais Aplicadas Engenharias e Ciência da Computação Linguística, Artes e Letras
  • 14.
    LARIVIERE, V.; ARCHAMBAULT,E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.
  • 16.
     Adoção determinologia semelhante  Citação de referências comuns
  • 17.
    Um artigo, duasbases de dados: Web of Science
  • 18.
    Um artigo, duasbases de dados: Pubmed
  • 19.
  • 20.
     Os índicesde citações foram desenvolvidos a partir do princípio de que as referências citadas por um autor identificam de maneira mais precisa o relacionamento entre documentos que tratam do mesmo assunto. Fonte: GARFIELD, Eugene. Citation indexes for science: a new dimension in documentation through association of ideas. Science, Washington, v. 122, n. 3159, p. 108-111, July 1955.
  • 21.
    “Há alguns anosa revista Nature recebeu, simultaneamente, mas de modo independente, dois originais para avaliação (um dos EUA e outro do Reino Unido) sobre um tema idêntico: a identificação de certos organismos veiculados pelo ar. Nos artigos, 7 das 8 referências citadas eram idênticas. Fonte: MEADOWS, A.J. A comunicação científica. Brasília: Briquet de Lemos, 1999. viii, 268p
  • 24.
    Os índices decitações passaram a ser usados para avaliar a atividade científica:  Trabalhos importantes são freqüentemente citados na literatura
  • 25.
    Relações entre coberturae recursos de indexação Requisito para a análise de impacto
  • 26.
     Existência debases de dados que indexem:  uma quantidade representativa de documentos;  as referências citadas nas publicações. Atualmente, as principais bases de dados para o cumprimento desta finalidade são aWeb of Science, a Scopus e o Google Acadêmico
  • 27.
    Cobertura: 0 Em teoria:tudo que está disponível na internet que o Google consegue classificar como sendo acadêmico 0 Na prática: alguns editores limitam o acesso aos motores do Google, principalmente a Elsevier por causa da concorrência com a Scopus 0 Resultado: a cobertura é extensa, mas indefinida Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  • 29.
    A qualidade doregistro de uma base de dados é medida pelo nível de precisão de sua recuperação, identificando inequivocamente cada informação que constitui um registro:  Autor  Afiliação  Assunto (bases que fazem controle de vocabulário)  Citação
  • 30.
  • 34.
     Busca denomes de autores e instituições em Web of Science e Scopus
  • 35.
     Agrupamento dasvariações indevidas dos nomes de autores e instituições segundo instruções do contratante (uma espécie de correção do dado)  Criação de grupos que identificam as estruturas organizacionais que não são corretamente expressas na indicação das afiliações (departamentos, ppgs, laboratórios) (dado novo, não está na publicação, o contratante que informa)
  • 36.
     A soluçãoparcial são os identificadores digitais para:  Autores (ORCID, Research ID, etc...)  Instituições (ORCID)  Artigos (DOI)
  • 37.
    Ao invés disso,um número: 0000-0001-9723- 9576 Variações do nome do autor
  • 38.
    ORCID (Open Reseacher& Contributor ID) www.orcid.org Vinculado à Scopus e ao Researcher ID Integração com diversas bases de dados Apresenta lista de publicações e classifica por data, tipo e título. Código numérico não proprietário
  • 39.
  • 40.
  • 41.
    Researcher ID www.researcherid.com Vinculado aoORCID Integração somente com Web of Science e Endnote Acompanha citações e índice H Código numérico proprietário Identifica colaboradores
  • 43.
    Identificadores digitais deautores em diferentes bases de dados Integrados com a
  • 44.
    Digital object identifier (DOI)é um código usado para identificar inequivocamente o conteúdo de vários tipos de redes eletrônicas. O sistema DOI é particularmente usado para documentos eletrônicos tais como artigos de periódicos.
  • 45.
    A Plataforma Lattesagora usa e abusa do DOI, felizmente Preenchimento Visualização: DOI permite a integração com várias bases
  • 46.
    Os formulários deavaliação das agências de fomento possuem uma estrutra relacional e prevêm a identificação digital dos pesquisadores (ORCID) e da produção (DOI)?
  • 47.
    Qualidade do registro: 0Mecanismo: robôs recompilam as informações disponíveis nos domínios institucionais, com permissão dos produtores, na filosofia dos Arquivos Abertos 0 Resultado: não utiliza os metadados dos editores das publicações: 0evita problemas de qualidade dos metadados dos editores 0cria novos problemas Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  • 48.
    Tipos de inconsistênciasna forma do GA coletar os metadados Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  • 49.
  • 50.
  • 51.
    Autores? 0 Autor fantasma:P Login ou seja Please Login (2.340 artigos) 0 Autores perdidos
  • 52.
    Autores? 0 Autor fantasma:P Login ou seja Please Login (2.340 artigos) 0 Autores perdidos O P Login já está resolvido! 
  • 53.
    Inconsistências incapacitantes 0 TODAS asbases possuem inconsistências! TODO o levantamento bibliométrico exige limpeza de dados! 0 Todavia, para Peter Jácso, as inconsistências do GA são tantas que inviabilizam por completo o uso dos dados para cálculo de índices bibliométricos Mas, para a revisão de literatura, o GA é uma excelente ferramenta Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  • 55.
     Os recursosde entrada são identificados basicamente pelos campos e pelos operadores disponibilizados na base de dados para a realização de uma busca  A forma de escrever a expressão de busca nos campos disponíveis define o resultado a ser obtido na base de dados.  Operadores booleanos, de proximidade e truncagem! A seção “Help” das bases de dados é sua grande aliada!
  • 57.
  • 58.
  • 60.
     Os recursosde análise são as ferramentas disponibilizadas na própria interface da base de dados que permitem obter respostas a partir dos dados recuperados a partir de uma expressão de busca
  • 61.
     Quantas publicaçõesforam produzidas por um determinado autor ou instituição?  Quantas publicações foram produzidas sobre determinado assunto? [Aqui, as bases de dados que usam controle de vocabulário são mais precisas]
  • 62.
     Faça umgráfico que represente a produção de uma instituição com as ferramentas da Web of Science e da Scopus
  • 63.
     Quantas citaçõesforam feitas a determinado autor, instituição ou tema?  Em média, quantas citações foram recebidas por cada um dos artigos?  Qual é o Índice H do pesquisador?
  • 64.
     Faça umgráfico de citações recebidas com as ferramentas daWeb of Science e da Scopus
  • 65.
  • 66.
    INCITES SCIVAL Essas ferramentasno quesito “recursos de análise” dão um show: tem perguntas mais elaboradas e recursos de comparação que suas respectivas bases de dados não respondem
  • 67.
    Qualidade do registro: 0Não possui ferramenta bibliométrica própria para sistematização de informações das citações e para o cálculo dos indicadores 0 Publish or Perish é uma ferramenta desenvolvida para tal Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
  • 69.
    FORMAS DE BUSCA Autores  Periódicos  Palavras-chave ÍNDICES PRINCIPAIS  Número total:  trabalhos  Citações  Número médio de:  citações por artigo  citações por autor  citações por ano  trabalhos por autor  Índice H e indicadores relacionados
  • 71.
     Os recursosde saída são todas as possibilidades de salvamento dos registros obtidos em uma busca  Fora da base de dados, os arquivos salvos podem ser analisados com recursos de outros softwares, permitindo novas visões e a produção de novos indicadores