Tratamento Documental



          Indexação / Classificação

            Margarida Custódio Fróis
                      2011
Indexação
   principal objectivo da indexação é assegurar a recuperação
   de qualquer documento ou informação no momento em que
   o utilizador procura um assunto num catálogo bibliográfico.

   A indexação de assuntos envolve duas etapas principais: a
     análise do documento para definir que assuntos são
      tratados e fazer a transposição desses assuntos para
    conceitos e em seguida transformar estes conceitos em
        linguagem documental de termos controlados.
Linguagem natural

   Comunicação imediata
   Ambígua
   Equívoca
   Arbitrária
   Livre
Linguagem documental

•   Comunicação diferida
•   Precisa
•   Unívoca
•   Controlada
Processo de Indexação
       Fazer a abordagem do documento,
       determinar o seu assunto principal,
    reconhecer os elementos essenciais que
  devem ser realçados e descritos, extrair os
 conceitos, estabelecer a sua correspondência
     em linguagem documental e verificar a
    pertinência dessa representação, são as
  etapas sucessivas para transmitir, de forma
 inequívoca, o conteúdo do documento com o
      objectivo final da difusão correcta da
                   informação.
Normalização

   As normas em que nos apoiamos: NP 3715, de 1989, e a NP
4036, de 1992 são pouco claras.


         Estas normas são mais um corpo metodológico de
            acompanhamento no processo de indexação.
Tipos de Linguagens
            Linguagem Categorial          Linguagem Combinatória

1 - Utiliza notações                 1 - Utiliza palavras

2 - As notações integram-se num      2 - Os termos podem não estar
     plano pré-estabelecido (pré-         dependentes de uma estrutura
     coordenação)                         hierárquica previamente
                                          estabelecida
3 - Ordenação sistemática
                                     3 - Ordenação alfabética dos termos
4 - As notações estão localizadas
     num ponto especifico do plano   4 - Os termos podem ser usados
    (tabela)                              “soltos”, combinando-se
                                          livremente entre si. (pós
                                          coordenação)
Linguagem Categorial


A linguagem categorial estrutura-se no que vulgarmente se designa
                            por classificações.
    As classificações não utilizam termos da linguagem natural, mas
     um código (notação), que pode ser composto por algarismos,
                  letras e outros símbolos gramaticais.
    Elaborada no início do século XX, a CDU apresenta-se como um
      plano destinado à classificação do conjunto do conhecimento
                                 humano.
  Permite reagrupar todas as referências relativas a um determinado
          assunto e, posteriormente, localizar rapidamente essa
                             documentação.
 Graças à sua notação normalizada facilmente utilizável é aplicada
        universalmente, embora com maior relevância na Europa.
Classificação Decimal Universal

Partindo do conceito considerado o mais geral, considera que lhe
       estão subordinados outros conceitos mais restritivos e
  específicos. O conceito mais geral determina a classe principal
   à qual pertence o documento, podendo-se acrescentar tantas
  subclasses quantas o documento assim o permitir e o perfil do
                   utilizador assim o determinar.
Linguagem Combinatória
É uma linguagem pós-coordenada, expressa em thesaurus
ou listas estruturadas de termos, cujo princípio repousa na
                combinação entre os termos.

     As palavras (conceitos) não estão dependentes de uma
   estrutura hierárquica previamente estabelecida, podendo ser
        combinados livremente entre si (pós coordenação).

   Dentro deste grupo de linguagens documentais encontram-se:
       · Listas de encabeçamentos de assuntos;
            · Thesaurus (no plural Thesauri)
Thesaurus
Numa definição sucinta, poder-se-ia dizer que o thesaurus é composto por
     uma lista alfabética de descritores que evidenciam as diferentes
                        relações existentes entre si.
  Para além dos descritores o thesaurus contém também identificadores,
  na sua maior parte constituídos por nomes próprios, nomes de lugares
                               e instituições.
Listas de termos

 A lista de termos controlados constrói-se à medida que os
 conceitos vão sendo transformados em pontos de acesso para
                 a recuperação da informação.
Vocabulário controlado
o vocabulário controlado estabelece a forma de representar os assuntos
   que compõem uma área limitada do conhecimento, tornando possível
                maior coerência entre os termos indexados.

  A partir do conteúdo real do documento o indexador deverá decidir:

 – a parte desse conteúdo que será susceptível de responder realmente
 às necessidades dos utilizadores;
 – os conceitos importantes que devem ser conservados para
 representar este conteúdo;
 – os descritores definidos para representar esses conceitos
Regras de Indexação
 a) Número de palavras por descritor

  Os descritores podem ser formados por uma ou mais palavras,
  sendo importante que expressem adequadamente o conceito.

 Entretanto, recomenda-se que esse número de palavras seja o
                        menor possível.
Regras de Indexação
  b) Uso de singular e do plural
  Os termos do vocabulário controlado devem ser usados no
  singular, mas o plural é admitido em determinadas
  circunstâncias.

A norma NP 4036 determina:
   Quando os termos são enumeráveis (quantos) aplica-se o
   plural.
   Quando os termos não são enumeráveis (quanto) aplica-se o
   singular
Regras de Indexação
  c) Sinónimos
  Quando um conceito pode ser expresso por dois ou
  mais termos diferentes, escolhe-se um deles como
  descritor, fazendo-se remissiva dos demais. O
  descritor mais conhecido pelo utilizador deve ser
  escolhido como termo indexador.
   Ex.: arte sacra
e não
   arte religiosa
Regras de Indexação
  d) Descritores compostos
  Nos descritores compostos as palavras são apresentadas na
  sua ordem natural.

   Ex.: ensino em grupo
e não
   grupo, ensino em
Regras de Indexação

e) Termos homógrafos ou inconsistentes

  Os termos homógrafos ou inconsistentes podem ser definidos
  pelo acréscimo de palavras elucidativas. Esse acréscimo pode
  ser feito colocando-se palavras elucidativas após o termo
  principal, que identifica o assunto de um documento separando
  os descritores por dois pontos ( : )

  Ex.: surrealismo : arte
  surrealismo : literatura
Regras de Indexação
  f) Identificadores geográficos
  Os descritores geográficos associados a um outro assunto
  devem ser representados em ordem indirecta, excepto no caso
  de estarem relacionados com a literatura.

  Ex.: filosofia : ocidente
  pintura renascentista : Itália
mas
  literatura alemã

Indexacao margarida frois

  • 1.
    Tratamento Documental Indexação / Classificação Margarida Custódio Fróis 2011
  • 2.
    Indexação principal objectivo da indexação é assegurar a recuperação de qualquer documento ou informação no momento em que o utilizador procura um assunto num catálogo bibliográfico. A indexação de assuntos envolve duas etapas principais: a análise do documento para definir que assuntos são tratados e fazer a transposição desses assuntos para conceitos e em seguida transformar estes conceitos em linguagem documental de termos controlados.
  • 3.
    Linguagem natural Comunicação imediata Ambígua Equívoca Arbitrária Livre
  • 4.
    Linguagem documental • Comunicação diferida • Precisa • Unívoca • Controlada
  • 5.
    Processo de Indexação Fazer a abordagem do documento, determinar o seu assunto principal, reconhecer os elementos essenciais que devem ser realçados e descritos, extrair os conceitos, estabelecer a sua correspondência em linguagem documental e verificar a pertinência dessa representação, são as etapas sucessivas para transmitir, de forma inequívoca, o conteúdo do documento com o objectivo final da difusão correcta da informação.
  • 6.
    Normalização As normas em que nos apoiamos: NP 3715, de 1989, e a NP 4036, de 1992 são pouco claras. Estas normas são mais um corpo metodológico de acompanhamento no processo de indexação.
  • 7.
    Tipos de Linguagens Linguagem Categorial Linguagem Combinatória 1 - Utiliza notações 1 - Utiliza palavras 2 - As notações integram-se num 2 - Os termos podem não estar plano pré-estabelecido (pré- dependentes de uma estrutura coordenação) hierárquica previamente estabelecida 3 - Ordenação sistemática 3 - Ordenação alfabética dos termos 4 - As notações estão localizadas num ponto especifico do plano 4 - Os termos podem ser usados (tabela) “soltos”, combinando-se livremente entre si. (pós coordenação)
  • 8.
    Linguagem Categorial A linguagemcategorial estrutura-se no que vulgarmente se designa por classificações. As classificações não utilizam termos da linguagem natural, mas um código (notação), que pode ser composto por algarismos, letras e outros símbolos gramaticais. Elaborada no início do século XX, a CDU apresenta-se como um plano destinado à classificação do conjunto do conhecimento humano. Permite reagrupar todas as referências relativas a um determinado assunto e, posteriormente, localizar rapidamente essa documentação. Graças à sua notação normalizada facilmente utilizável é aplicada universalmente, embora com maior relevância na Europa.
  • 9.
    Classificação Decimal Universal Partindodo conceito considerado o mais geral, considera que lhe estão subordinados outros conceitos mais restritivos e específicos. O conceito mais geral determina a classe principal à qual pertence o documento, podendo-se acrescentar tantas subclasses quantas o documento assim o permitir e o perfil do utilizador assim o determinar.
  • 10.
    Linguagem Combinatória É umalinguagem pós-coordenada, expressa em thesaurus ou listas estruturadas de termos, cujo princípio repousa na combinação entre os termos. As palavras (conceitos) não estão dependentes de uma estrutura hierárquica previamente estabelecida, podendo ser combinados livremente entre si (pós coordenação). Dentro deste grupo de linguagens documentais encontram-se: · Listas de encabeçamentos de assuntos; · Thesaurus (no plural Thesauri)
  • 11.
    Thesaurus Numa definição sucinta,poder-se-ia dizer que o thesaurus é composto por uma lista alfabética de descritores que evidenciam as diferentes relações existentes entre si. Para além dos descritores o thesaurus contém também identificadores, na sua maior parte constituídos por nomes próprios, nomes de lugares e instituições.
  • 12.
    Listas de termos A lista de termos controlados constrói-se à medida que os conceitos vão sendo transformados em pontos de acesso para a recuperação da informação.
  • 13.
    Vocabulário controlado o vocabuláriocontrolado estabelece a forma de representar os assuntos que compõem uma área limitada do conhecimento, tornando possível maior coerência entre os termos indexados. A partir do conteúdo real do documento o indexador deverá decidir: – a parte desse conteúdo que será susceptível de responder realmente às necessidades dos utilizadores; – os conceitos importantes que devem ser conservados para representar este conteúdo; – os descritores definidos para representar esses conceitos
  • 14.
    Regras de Indexação a) Número de palavras por descritor Os descritores podem ser formados por uma ou mais palavras, sendo importante que expressem adequadamente o conceito. Entretanto, recomenda-se que esse número de palavras seja o menor possível.
  • 15.
    Regras de Indexação b) Uso de singular e do plural Os termos do vocabulário controlado devem ser usados no singular, mas o plural é admitido em determinadas circunstâncias. A norma NP 4036 determina: Quando os termos são enumeráveis (quantos) aplica-se o plural. Quando os termos não são enumeráveis (quanto) aplica-se o singular
  • 16.
    Regras de Indexação c) Sinónimos Quando um conceito pode ser expresso por dois ou mais termos diferentes, escolhe-se um deles como descritor, fazendo-se remissiva dos demais. O descritor mais conhecido pelo utilizador deve ser escolhido como termo indexador. Ex.: arte sacra e não arte religiosa
  • 17.
    Regras de Indexação d) Descritores compostos Nos descritores compostos as palavras são apresentadas na sua ordem natural. Ex.: ensino em grupo e não grupo, ensino em
  • 18.
    Regras de Indexação e)Termos homógrafos ou inconsistentes Os termos homógrafos ou inconsistentes podem ser definidos pelo acréscimo de palavras elucidativas. Esse acréscimo pode ser feito colocando-se palavras elucidativas após o termo principal, que identifica o assunto de um documento separando os descritores por dois pontos ( : ) Ex.: surrealismo : arte surrealismo : literatura
  • 19.
    Regras de Indexação f) Identificadores geográficos Os descritores geográficos associados a um outro assunto devem ser representados em ordem indirecta, excepto no caso de estarem relacionados com a literatura. Ex.: filosofia : ocidente pintura renascentista : Itália mas literatura alemã