1ª aula indexacao 2013

5.373 visualizações

Publicada em

1ª Aula para o curso de Biblioteconomia da Universidade Federal do Rio Grande (FURG), Rio Grande, RS, Brasil.

Publicada em: Educação
0 comentários
6 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
5.373
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2.343
Ações
Compartilhamentos
0
Downloads
126
Comentários
0
Gostaram
6
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

1ª aula indexacao 2013

  1. 1. Relembrando fundamentosda representação temáticaUniversidade Federal do Rio Grande (FURG) DisciplinaIndexação: T & P (2013)Profa. Gisele Dziekaniakgiseledziekaniak@yahoo.com.brhttp://indexacaoteoriaepraticafurg.blogspot.com.br/
  2. 2. Classificação Para James Duff Brown a classificação é umPara James Duff Brown a classificação é um“processo mental” constantemente executado de“processo mental” constantemente executado deforma consciente e inconsciente por qualquer serforma consciente e inconsciente por qualquer serhumano, ainda que não reconhecido como tal.humano, ainda que não reconhecido como tal. Para Piedade (1983, p. 16) “Classificar é dividir emgrupos ou classes, segundo as semelhanças ediferenças.” Para Ranganathan classificar era traduzir o nomedos assuntos dos documentos da linguagem naturalpara a linguagem artificial adotada pelos sistemas declassificação bibliográfica. (PIEDADE, 1983)
  3. 3. Característica, classe e categoria Característica Qualidade ou atributo escolhido para servir de base àclassificação ou à divisão. Pode-se classificar adotando características distintaspara o mesmo objeto. Exemplos: Livros- Tamanho- Cor- Língua- Assunto“Há tantas possibilidades de classificar quantas forem assemelhanças e diferenças existentes entre os objetosou ideias a classificar.” (PIEDADE, 1983, p. 17)■ Literatura- Lugar- Língua- Período
  4. 4. Classificação cruzada Pode-se classificar adotando váriascaracterísticas, mas empregando uma decada vez e aplicando-a a todos os membrosda classe. Ex.: característica Sexo paradividir animais racionais, não poderemosempregar, ao mesmo tempo, a característicafaixa etária. O emprego simultâneo de mais de umacaracterística se chama Classificaçãocruzada, quando as classes não sãomutuamente excludentes, gerando confusão.
  5. 5. Classificação cruzadaExemplo correto:Animais Racionais_________________________Homens Mulheres____________ _____________Crianças Adolescentes Adultos Crianças Adolescentes Adultos
  6. 6. Classificação cruzadaExemplo incorreto: Se empregássemos, aomesmo tempo duas características (Língua elugar)Literatura____________________________________Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.portuguesa espanhola
  7. 7. Característica, classe, categoria ClasseÉ o conjunto de coisas ou ideias que possuemum ou vários atributos, predicados ouqualidades em comum. Ex.: Mamíferos,Vertebrados, Canários, Animais. CategoriaSão as maiores classes de fenômenos, asclasses mais gerais que podem ser formadas.São as grandes classes. Ex: na categoria Lugar,pode-se distinguir as facetas: Lugar físico,Lugar político, Orientação (norte, sul etc.).
  8. 8. Aristóteles e a classificação Aristóteles dividiu o conhecimento com baseem três critérios (NUNES, 2007): Critério de ausência ou presença do homemnos seres investigados; critério de imutabilidade e critério de modalidade prática. Trata-se de uma hierarquização conceitualque divide um tema geral em espécies apartir de uma característica classificatória.
  9. 9. Aristóteles e a classificação Aristóteles desenvolveu um sistema filosóficobaseado em uma concepção rigorosa do Universo.Em seus tratados biológicos, apresentou o sistemade classificação dos animais que não se encontravacompleto e que, originariamente em número dequatro, foram os seguintes: Gênero Espécie Diferença Propriedade, e Acidente.
  10. 10. Aristóteles e a classificação Metafísica
  11. 11. Porfírio e a classificação A partir de Aristóteles, Porfírio descreve como asqualidades atribuídas às coisaspodem ser classificadas,quebrando o conceito filosóficoda substância como umgenus/espécie dorelacionamento:
  12. 12. Bacon e a classificação Na classificação baconiana, apesar dealgumas de suas classes e divisões setornarem imbricadas, este sistema foiconsiderado um dos mais influentes nasdiversas tentativas feitas para classificar oconhecimento. A classificação de Bacon estábaseada na figura abaixo:
  13. 13. Bacon e sua classificação MIR (Memória, Imaginação e Razão)Foi a basepara a criaçãoda CDD
  14. 14. Indexação - conceito
  15. 15. Etapas do tratamento temático Análise de assunto Processo de ler um documento para extrairconceitos que traduzam a essência do seuconteúdo. (DIAS, NAVES, 2007, p. 9) Envolve cultura do indexador, experiência,conhecimento linguístico, cognitivo e lógico. Também chamada de análise conceitual,análise documentária, análise da informação esubject analysis.
  16. 16. Etapas do tratamento temático1) Fases da Análise de assunto Leitura técnica do documento (leituradocumental) Extração de conceitos que representam a obra Atinência - termos em LN (do que trata a obra?)Sugestão de leitura: Dias e Naves (2007)
  17. 17. Etapas do tratamento temático2) Tradução Passagem dos termos de linguagem natural(LN) para linguagem artificial/documentária(LA/LD). Eleição descritores autorizados pela LD(cabeçalhos de assunto, palavras-chave,termos de indexação).Sugestão de leitura: Lancaster (2004)
  18. 18. Análise documentária “A análise documentária é definida como umconjunto de procedimentos efetuados com ofim de expressar o conteúdo dosdocumentos, sob formas destinadas afacilitar a recuperação da informação.” (DIAS,NAVES, 2007, p. 11) Metainformação (informação da informação)
  19. 19. Leitura do bibliotecário (LUCAS, 2000) Questões ideológicas Equívoco da neutralidade Ilusão da completude Sujeitos leitores Organizam arquivos Autorizados a ler, escrever e interpretar Tipos de leitura Como apreensão do documento (literal) Como leitura interpretativaDica de leitura:Lucas (2000)
  20. 20. Subordinação, superordenação ecoordenaçãoMeio de transporteAéreo AquáticoTerrestreCarro MotoSuperordenação SubordinaçãoCoordenação
  21. 21. Recuperação da Informação - RI Information Retrieval: Termo cunhado por CalvinMooers (década de 1950) que engloba aspectosintelectuais da descrição de informações e suasespecificidades para a busca, além de quaisquersistemas, técnicas ou máquinas empregados para odesempenho da operação. É a responsável pela criação e desenvolvimento daCiência da Informação. (SARACEVIC, 1996) O objetivo é recuperar informações através da buscapor alguma entrada catalogada a priori.
  22. 22. Sistema de Recuperação daInformação - SRI Um sistema de informação coleta, processa,armazena, analisa e dissemina informações e éconstituído por um conjunto de componentesrelacionados entre si. (GROSSI, 2008). São sistemas de operações interligadas paraidentificar dentre um grande conjunto deinformações, aquelas que sejam úteis, de acordocom a demanda expressa pelo usuário. (LOPES,2002) Objetivo de um SRI é permitir que um usuáriorecupere documentos através de característicascomo: autor, título, assunto ou qualquer combinaçãodesses elementos.
  23. 23. Atividades em um SRI Representação das informações contidas nosdocumentos; Armazenamento; Gestão física e/ou lógica desses documentose de suas representações; Recuperação da informação representada edos próprios documentos armazenados(links). Disseminação da informação.
  24. 24. Sistema de Recuperação daInformação - SRI “Localização de documentos e itens deinformação que tenham sido objeto dearmazenamento.” (ROWLEY, 2002, p. 114) Para Cendón (2006) catálogos de bibliotecas,bases de dados bibliográficas, e motores debusca na internet são exemplos de SRI.(GROSSI, 2008)
  25. 25. Subsistemas dos SRIs Subsistemas de entrada:Seleção/aquisição, descrição, representação,organização de arquivos, armazenamento. Subsistemas de saída:Análise e negociação de questões, estratégia debusca/recuperação, disseminação/acesso aodocumento. Subsistema de avaliação:Não se refere especificamente nem à entrada, nem àsaída, mas a ambos, ao sistema como um todo.
  26. 26. Avaliação dos SRI Cobertura:Representa quanto o sistema contém informaçõesrelevantes. Exaustividade:Este conceito relaciona-se ao grau de profundidadecom que os assuntos dos documentos sãorepresentados. Precisão:Relaciona-se com a proporção de itens recuperadosque são relevantes.
  27. 27. Avaliação dos SRI Tempo de resposta:É o intervalo médio entre o momento da consulta e aapresentação do resultado. Esforço do usuário:É o esforço despendido para obter resultados nabusca. Formato: como os resultados são apresentados. Sãovárias as características e tipologias comuns aosdiversos sistemas de recuperação da informação,porém um módulo que todos devem possuir, por serfundamental, é o módulo de interface com o usuário.(ARAUJO, 1994).
  28. 28. Estratégias de busca em um SRI Estratégia de busca é o conjunto de decisõestomadas e de procedimentos adotados durante umabusca. É a técnica ou conjunto de regras para tornarpossível o encontro entre uma pergunta formulada ea informação armazenada em uma base de dados.(LOPES, 2002). É a técnica ou conjunto de regras para tornarpossível o encontro entre uma pergunta formulada ea informação armazenada em uma base de dados. Uma boa estratégia de busca implica em conhecer abase de dados, as fórmulas de busca, o assunto quese busca e/ou a bibliografia que é objeto de busca. Identificar a Necessidade de Informação (NI).
  29. 29. NI fórmula de busca = resultado SRIEstratégia de buscaResposta insatisfatória = RUÍDO= Usuário insatisfeito= Nova estratégia de buscaResposta satisfatória = NI satisfeita= Item recuperado= usuário satisfeito
  30. 30. Objetivos da estratégia de busca Recuperar um número suficiente de registrosrelevantes e evitar que: Sejam recuperados itens irrelevantes; Sejam recuperados um número excessivo deitens; Sejam recuperados um número insignificantede registros.
  31. 31. Problemas em recuperação dainformação Os autores nem sempre usam as mesmaspalavras que os usuários para descrever omesmo conceito. Má formulação da consulta.
  32. 32. Lógica de busca: OperadoresbooleanosAND EOR OUNOT NÃOOs operadores booleanos tem por objetivo definir como será a combinaçãofeita entre os termos ou expressões de uma pesquisa.
  33. 33. Lógica de busca: Operadoresbooleanos OR/OU Amplia a pesquisa e tem aintenção de buscar ou esse ou aqueletermo. Ou seja, qualquer uma daspalavras. Exemplo:A or BA B
  34. 34. Lógica de busca: Operadoresbooleanos AND/E Restringe a pesquisa esignifica a expressão que tenha todas aspalavras. O resultado da busca deverecuperar ambos os termos. Exemplo:A and B
  35. 35. Lógica de busca: Operadoresbooleanos NOT/NÃO Exclui um dos termos dapesquisa. Equivale dizer: sem a seguintepalavra. Exemplo:A not B
  36. 36. Lógica de busca: Operadoresbooleanos Podem ser usados em expressões maiscomplexas, onde se adotam os parênteses. Ex: (A or B) and CA pesquisa será feita 1º combinando a OR b e oresultado se combina com AND
  37. 37. Exercícios Operadores booleanosCrie buscas usando assuntos que representemos seguintes conjuntos:1. 3.2. 4.
  38. 38. Linguagem de indexação e de busca Linguagem de indexação: Termos ou códigos usados como pontos de acesso emum índice. Geralmente adota linguagem controlada (LC) Linguagem de busca: Termos que são usados por um consulente aoespecificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que ousuário tenha acesso à linguagem documentáriaadotada pelo sistema de recuperação da informação.
  39. 39. Linguagem natural e linguagemartificial ou controlada (LOPES, 2002) CONCEITUE LINGUAGEM NATURALÉ a linguagem usada habitualmente na fala e na escritarepresentadas na base de dados pelos termos do título eresumo. CONCEITUE A LINGUAGEM CONTROLADAÉ o conjunto de termos organizados de formahierarquizadas e/ou alfabética, com o objetivo depossibilitar a recuperação de informação temáticas,reduzindo substancialmente a diversidade determinologia.Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informaçãoda área. Entrega: Próxima aula. (não esquecer de referenciar as fontesadotadas).
  40. 40. Diferenças entre Linguagem natural(LN) e linguagem controlada (LC, LC)Linguagem natural ou livre(LN)Linguagem controlada (LC, LA,LD)Busca direta no texto Depende de uma LDUsa linguagem comum dousuárioDistancia-se da linguagem dousuárioOferece mais pontos deacessoOs pontos de acesso sãolimitados pelo indexadorOferece maior revocação Oferece menor revocaçãoOferece menos precisão Oferece maior precisãoTarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em basesde dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 eCRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
  41. 41. Revocação e Relevância (Lancaster, 2004) Revocação (recall) Capacidade de um SRI em recuperar itensexistentes na base de dados. Precisão mede quantos documentosrelevantes foram recuperados Relevância (Precisão) Capacidade de um SRI em recuperar itensúteis ao usuário e minimizar a recuperação dedocumentos inúteis.
  42. 42. Fórmulas para avaliar um SRI(Revocação e Relevância)Itens nãorecuperadosRelevantes (D)Itens nãorecuperadosRelevantes (D)Itens nãorecuperados nãoRelevantes (C)ItensrecuperadosRelevantes (A)Itensrecuperados nãoRelevantes (B)Revocação = relevantes recuperados/ total de itens relevantesque existem no sistemaPrecisão = relevantes recuperados/ total de itens recuperadosRevocação R= A / (A+D)Relevância P = A / (A+B)
  43. 43. Revocação e Relevância Esses dois parâmetros são inversamenterelacionados, significando que a melhoria de umimplica na piora do outro. Tradicionalmente, existem dois fatores muitoimportantes que governam a eficiência da indexaçãode um documento e consequentemente, influenciamna revocação e na precisão: Exaustividade: Define o número de diferentesconceitos (tópicos) que estão indexados. Especificidade: Define o grau de precisão dalinguagem de indexação em descrever um dadodocumento.
  44. 44. Referências ARAUJO JUNIOR, R. H. Precisão no processo de busca erecuperação da informação. Brasília: Thesaurus, 2004. DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria eprática. Brasília: Briquet de Lemos, 2007. GROSSI, M.G. R. Estudo das características de software eimplantação de um software livre para gerenciamento debibliotecas universitárias federais brasileiras. 2008. Tese(Doutorado em Ciência da Informação) – UFMG, BeloHorizonte, 2008. LANCASTER, F. W. Indexação e resumos: teoria e prática.2.ed. Brasília: Briquet de Lemos, 2004. LOPES, I. L. Uso das linguagens controlada e natural em basesde dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002.
  45. 45. Referências NUNES, L. Da Classificação das Ciências àclassificação da Informação: uma análise do acessoao conhecimento. 2007. Dissertação (Mestrado emCiência da Informação) - PUC de Campinas, 2007.Disponível em <http://www.bibliotecadigital.puc-campinas.edu.br/tde_buscphp?codArquivo=340 > Acesso em 22 nov. 2009 PIEDADE, M. A. R. Introdução à teoria daclassificação. Rio de Janeiro: Interciência, 1977. ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília:Briquet de Lemos, 2002. SARACEVIC, T. Ciência da informação: origem,evolução e relações. Perspec. Ci. Inf., BeloHorizonte, v. 1, n.1, p.41-62, jan./jun. 1996.

×