Funções e disfunções das bases de    dados em levantamentos         bibliométricos                        Letícia Strehl  ...
Sumário• Bases de dados e levantamentos bibliométricos  – Componentes das bases de dados:     •   cobertura     •   indexa...
Componentes das bases de dados     1. Cobertura: o conjunto de registros ou        documentos (conjunto de documentos)    ...
Requisitos das bases de dados para estudos           de produção e impacto• Indexação de:  – uma quantidade representativa...
Componente das bases de dados (1)COBERTURA
Definição da cobertura• Identificação:  – da produção ONDE  – do impacto DO que NO que
Cobertura:         O conjunto de registros ou documentos           – Número de registros:                • Total          ...
Análise quantitativa da composição de             bases de dados: um exemplo                                              ...
A importância da cobertura                             retrospectiva                                                      ...
A cobertura:                  seletiva versus exaustiva                   bom e ruim em ambasO seletivo bom e o seletivo r...
Todavia, a busca                             retrospectiva                             continua um                        ...
A cobertura:                  seletiva versus exaustiva                   bom e ruim em ambasO exaustivo bom e o exaustivo...
Componente das bases de dados (2)INDEXAÇÃO
Indexação• A forma de representação que dá acesso ao  conjunto de dados• Recursos cada vez mais sofisticados• Todavia, em ...
A qualidade dos dados e a precisão das    informações dos próprios autoresAutor          InstituiçãoReferência
A precisa identificação dos autores e instituições:             recursos atenuantes (1)                     Researcher ID:...
A precisa identificação dos autores einstituições: recursos atenuantes (2)
A precisa identificação dos autores einstituições: recursos atenuantes (3)                         O usuário informa à bas...
A precisa identificação das referências:             situações agravantes Disponibilidade dos artigos nos sites publishers...
As inconsistências particulares do
Multiplicação de produção1 em 4
Multiplicação de impacto3 em 7
Autores?• Autor fantasma: P Login ou seja Please Login (2.340 artigos)• Autores perdidos
A precisa identificação da produção:        recursos atenuantes                      Perfil do pesquisador no GA:         ...
Algumas ressalvas para o uso do         Google Acadêmico• Nem todos os periódicos importantes indexados  pelas bases de da...
TODAS AS BASES POSSUEMINCONSISTÊNCIAS!TODO O LEVANTAMENTOBILIOMÉTRICO EXIGE LIMPEZA DEDADOS!
Todavia, para PeterJácso as inconsistências do     GA são tantas que inviabilizam por completo o         uso dos dados par...
Componente das bases de dados (3)BUSCA
A busca• Limitação do universo de documentos a ser  estudado por sua representação em  expressões de busca• As inconsistên...
Recursos das bases de dados para areunião de registros dispersos pelas          inconsistências
Depois de identificar “todas” as formas      possíveis de representação:use e abuse dos operadores booleanos, de proximida...
Um exemplo de expressão de busca para recuperar a produção da UFRGSOG=(Univ Fed Rio Grande Sul OR UFRGS OR FederalUniversi...
leticia.strehl@ufrgs.brMUITO OBRIGADA!
Próximos SlideShares
Carregando em…5
×

Funções e disfunções das bases de dados em levantamentos bibliométricos

877 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
877
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
17
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Funções e disfunções das bases de dados em levantamentos bibliométricos

  1. 1. Funções e disfunções das bases de dados em levantamentos bibliométricos Letícia Strehl Biblioteca Central Universidade Federal do Rio Grande do Sul Seminário “Citações: usos e limitações”, Rio de Janeiro, 23 de agosto de 2012.
  2. 2. Sumário• Bases de dados e levantamentos bibliométricos – Componentes das bases de dados: • cobertura • indexação • busca • resultado – A produção e o impacto como dado: • autores • instituições • referências
  3. 3. Componentes das bases de dados 1. Cobertura: o conjunto de registros ou documentos (conjunto de documentos) 2. Indexação: o método de indexação ou acesso ao conjunto de documentos (método de acesso) 3. Busca: a verbalização desta necessidade em uma seqüência de expressões de busca (estratégia de busca) 4. Resultado: a seqüência dos itens apresentados como um resultado da estratégia de busca (conjunto de itens recuperados ou seqüência)Quatro do 6 componentes enumerados por: TAGUE-SUTCLIFFE, J. M. Em: Some perspectives on the evaluation ofinformation retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.
  4. 4. Requisitos das bases de dados para estudos de produção e impacto• Indexação de: – uma quantidade representativa de documentos (cobertura); – identificação consiste de autores, instituições e as referências citadas nas publicações. Atualmente, as principais bases de dados para o cumprimento desta finalidade são a Web of Science (WoS), a Scopus e o Google Acadêmico (GA)
  5. 5. Componente das bases de dados (1)COBERTURA
  6. 6. Definição da cobertura• Identificação: – da produção ONDE – do impacto DO que NO que
  7. 7. Cobertura: O conjunto de registros ou documentos – Número de registros: • Total • Por tipo de documento (artigos de revistas, trabalhos em eventos, teses, livros, etc.) • Por tipo de fonte (instituições públicas e privadas, associações nacionais e estrangeiras, etc.) • Por idioma • Por país responsável pela publicação das fontes – Período de cobertura das fontes – Periodicidade de atualizaçãoJACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p.231-267, 1997.
  8. 8. Análise quantitativa da composição de bases de dados: um exemplo Periódicos arbitrados ≈30 mil Scopus ≈18 mil Web os Science ≈10 milBustos-González, Atilio. Edición de revistas científicas con visibilidad ficas internacional: criterios para ser incluidos en bases de datos comprensivas.Apresentação realizada no "Seminário de Comunicação Científica, São Paulo, 13 de junho de 2008".ELSEVIER. About Scopus. 2011.THOMSON REUTERS. Web of Science. 2011.
  9. 9. A importância da cobertura retrospectiva WoS: 1945-, 1956- e 1975- -- Scopus: 1996 -- GA ?????LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007.Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.
  10. 10. A cobertura: seletiva versus exaustiva bom e ruim em ambasO seletivo bom e o seletivo ruim Produção em Destes, periódicos que apenas os que adotam tratam de criteriosa interesse avaliação por internacional pares
  11. 11. Todavia, a busca retrospectiva continua um problema.A competição instaurada em 2005 entre WoS eScopus alterou o quadro em 2009.
  12. 12. A cobertura: seletiva versus exaustiva bom e ruim em ambasO exaustivo bom e o exaustivo ruim Produção em Produção em periódicos que periódicos que adotam adotam criteriosa duvidosa avaliação por avaliação por pares ? pares da produção ONDE do impacto DO que NO que
  13. 13. Componente das bases de dados (2)INDEXAÇÃO
  14. 14. Indexação• A forma de representação que dá acesso ao conjunto de dados• Recursos cada vez mais sofisticados• Todavia, em regra, os dados tem a qualidade limitada à própria informação dada pelos autores
  15. 15. A qualidade dos dados e a precisão das informações dos próprios autoresAutor InstituiçãoReferência
  16. 16. A precisa identificação dos autores e instituições: recursos atenuantes (1) Researcher ID: o pesquisador reune consistentemente a informação sobre sua produção com dados da WoS
  17. 17. A precisa identificação dos autores einstituições: recursos atenuantes (2)
  18. 18. A precisa identificação dos autores einstituições: recursos atenuantes (3) O usuário informa à base que os diferentes registros identificam um único autor ou instituição
  19. 19. A precisa identificação das referências: situações agravantes Disponibilidade dos artigos nos sites publishers antes da publicação A identificação do DOI nas referências é um atenuante.Disponibilidade dos manuscritos nos repositórios sem identificação dos dados de publicação
  20. 20. As inconsistências particulares do
  21. 21. Multiplicação de produção1 em 4
  22. 22. Multiplicação de impacto3 em 7
  23. 23. Autores?• Autor fantasma: P Login ou seja Please Login (2.340 artigos)• Autores perdidos
  24. 24. A precisa identificação da produção: recursos atenuantes Perfil do pesquisador no GA: o pesquisador reune as diferentes versões que correspondem a uma única produção
  25. 25. Algumas ressalvas para o uso do Google Acadêmico• Nem todos os periódicos importantes indexados pelas bases de dados tradicionais estão indexados pelo GA;• as citação a documentos recentes são mais comuns no GA uma vez que documentos mais antigos estão disponíveis em menor quantidade na Web;• algumas áreas estão melhor representadas por contarem tradicionalmente com repositórios mais antigos e exaustivos, um exemplo é a física como a pioneira base de pré-prints arXiv.org.
  26. 26. TODAS AS BASES POSSUEMINCONSISTÊNCIAS!TODO O LEVANTAMENTOBILIOMÉTRICO EXIGE LIMPEZA DEDADOS!
  27. 27. Todavia, para PeterJácso as inconsistências do GA são tantas que inviabilizam por completo o uso dos dados para cálculo de índices bibliométricos Mas, para a recuperação, o GA é uma excelente ferramentaJacsó, P. Google Scholars Ghost Authors. Library Journal. 2009.
  28. 28. Componente das bases de dados (3)BUSCA
  29. 29. A busca• Limitação do universo de documentos a ser estudado por sua representação em expressões de busca• As inconsistências na indexação requerem a realização de uma série buscas intermediárias para contemplar todas as diferentes formas de representação do objeto de estudo
  30. 30. Recursos das bases de dados para areunião de registros dispersos pelas inconsistências
  31. 31. Depois de identificar “todas” as formas possíveis de representação:use e abuse dos operadores booleanos, de proximidade e truncagem: o “help” das bases de dados será o seu único amigo
  32. 32. Um exemplo de expressão de busca para recuperar a produção da UFRGSOG=(Univ Fed Rio Grande Sul OR UFRGS OR FederalUniversity Rio Grande do Sul OR Fed Univ Rio Grande doSul OR Fed Univ Rio Grande Sul OR Rio Grande do Sul FedUniv OR Rio Grande Sul Fed Univ OR Agron Univ Fed RioGrande do Sul OR Fed Univ RS OR Univ Fed Rio Grande doSul OR Fdn Univ Fed Rio Grande Sul OR URFGS OR UFGRSOR Univ Fed Rio Do Sul OR Fed Univ Rio Grande SulUFRGS OR Fdn Univ Fed Rio Grande Sul OR Fed Univ HospRio Grande Sul OR Fed Univ Rio Grande Sul State OR FedUniv Fed Rio Grande Sul OR IF UFRGS)
  33. 33. leticia.strehl@ufrgs.brMUITO OBRIGADA!

×