Elin K. Jacob - Classificação e Categorização

3.366 visualizações

Publicada em

Publicada em: Educação
0 comentários
4 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
3.366
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4
Ações
Compartilhamentos
0
Downloads
84
Comentários
0
Gostaram
4
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Elin K. Jacob - Classificação e Categorização

  1. 1. Classificação e Categorização:Uma diferença que faz a diferençaELIN K. JACOB* Traduzido por Isadora Garrido, 27.05.2011 [isadoragarrido@gmail.com]RESUMOO EXAME DAS PROPRIEDADES SISTÊMICAS E MODOS de interação que caracterizam aclassificação e categorização revelam diferenças sintáticas fundamentais entre as estruturas desistemas de classificação e categorização. Essas distinções levam à diferenças significantes noscontextos os quais a informação pode ser apreendida e pode influenciar a informação semânticadisponível para as pessoas. Diferenças estruturais e semânticas entre a classificação ecategorização são diferenças que fazem a diferença no ambiente informacional influenciando asatividades funcionais de um sistema de informação e contribuindo para sua constituição comoambiente informacional.INTRODUÇÃO Várias respostas diferentes e às vezes conflitantes podem ser feitas à pergunta "Oque é informação?" Floridi (impresso) identifica três categorias amplas que pretendem elucidaras abordagens predominantes à compreensão do ambíguo fenômeno chamado informação:informação como realidade (ou informação ecológica), informação para realidade (ouinformação instrucional), e informação sobre a realidade (ou informação semântica). AElin K. Jacob, Escola de Biblioteconomia e Ciência da Informação, Indiana University-Bloomington, 1320 E.10th St., Bloomington, IN 47405-1801LIBRARY TRENDS, Vol. 52, N. 3, Winter 2004, p. 515-540© 2004 The Board of Trustees, University of Illinois
  2. 2. abordagem adotada aqui é que a informação é "a diferença que faz a diferença" (Bateson, 1979,p. 99). É uma propriedade emergente - o resultado de diferenças significantes – inerentementesemântica e portanto sobre a realidade. Uma análise das diferenças sintáticas que distinguem sistemas de classificação ecategorização podem contribuir para uma filosofia da informação (FI) por que essas distinçõespredizem conseqüências significantes para os processos que contribuem com o que Floridi(2002) descreve como as "dinâmicas da informação": "(i) a constituição e modelação deambientes de informação, incluindo suas propriedades sistêmicas, formas de interação,desenvolvimentos interiores, etc.; (ii) os ciclos de vida da informação, por exemplo, as séries devárias etapas em forma e atividades funcionais através das quais a informação pode passar... e(iii) computação, tanto no sentido Turing-machine de processamento de algoritmos e nosentido mais amplo de processamento de informação" (p. 15. ênfase no original). Um exame daspropriedades sistêmicas e modos de interação que caracterizam a classificação e categorizaçãorevelam diferenças fundamentais em suas respectivas estruturas organizacionais – diferençasque influenciam as atividades funcionais de um sistema de informação e contribuem para suaconstituição enquanto ambiente informacional. O argumento elaborado aqui é que existem distinções sintáticas fundamentais entrea estrutura de sistemas de classificação e categorização; que essas distinções nos levam adiferenças significantes nos contextos dentro dos quais a informação pode ser apreendida; eque essas diferenças, por sua vez, influenciam a informação semântica - a informação sobre arealidade - que está disponível para as pessoas.SISTEMAS DE INFORMAÇÃO Shera (1960/1965) observou que a recuperação da informação deve ser o foco deuma teoria da biblioteconomia e Ciência da Informação (CI) e ainda "o fim para qual todos osnossos esforços são direcionados" (p. 136). Infelizmente, a recuperação geralmente também évista não como um componente em um sistema de informação, mas como um processoautônomo e independente. Essa ênfase no produto final – a recuperação de fontes – tende a serobscura ao fato de que a recuperação efetiva depende tanto da representação e organização deuma coleção de fontes de informação. Soergel (1985) aponta que, uma vez que a informação é usada para a solução deproblemas, os sistemas de informação são desenvolvidos e estendidos em resposta aosproblemas que a sociedade confronta. Embora essa definição de informação não sejauniversalmente aceita, é útil na compreensão do complexo conjunto de processos quecontribuem para a eficácia máxima de um sistema de informação. Tal sistema identifica fontesde informação que podem ser úteis na solução de um problema específico; representa osatributos de fontes que são relevantes a área do problema; organiza essas representações defontes ou as próprias fontes para um acesso eficiente; e finalmente recupera um conjunto derecursos em resposta a questões apresentadas ao sistema pelas pessoas. Parece-nos que, então,uma abordagem mais produtiva ao problema de recuperação seria enxergar um sistema de
  3. 3. informação como um todo multidimensional composto de vários processos inter-relacionados,incluindo, no mínimo, desenvolvimento de coleção, representação, organização e recuperação. A recuperação é o processo final e entretanto o mais óbvio dos processos quecontribuem para um sistema de informação. Uma vez que ele é o único processo no qual umapessoa participa ativamente, é frequentemente o único processo ao qual ela dá uma maiorconsideração. Quando o indivíduo está buscando informação sobre um assunto específico, suaatenção está focada no conjunto de fontes recuperadas pelo sistema de informação. Se essasfontes parecem ser pertinentes ao problema imediato, ela pode não ter um segundopensamento quanto à propriedade dos termos usados para questionar o sistema de informação.Não obstante, são os processos de seleção, representação e organização que fornecem afundação sem a qual a recuperação da informação (RI) é menos efetiva, se não for impossível. Omodo que as fontes são representadas restringe as estruturas organizacionais que podem serimpostas a uma coleção de fontes de informação; a estrutura organizacional de uma coleçãodita as estratégias de busca que podem ser usadas para recuperação; e a representações por sisó determinam o conjunto de fontes que serão recuperadas pelo sistema. Shera (1956/1965) afirma os papéis críticos da representação e organização quandoobserva que a recuperação efetiva requere um acordo entre a organização cognitiva impostasobre a informação pelos indivíduos e a organização formal imposta sobre as representaçõespelo sistema. O argumento de Shera para acordo entre o indivíduo e o sistema de recuperaçãoapóia-se em três premissas básicas: que existem certas estruturas cognitivas que podem seridentificadas e descritas; que pode ser demonstrado que essas estruturas são compartilhadasentre indivíduos; e que a identificação dessas estruturas partilhadas proverão a base para umateoria de organização. Que um acordo cognitivo pode ser alcançado entre indivíduos é uma premissafundamental da restrição de shareability (compartibilidade) proposta por Freyd (1983). Elaargumentou que a intenção de comunicar sem perda de informação faz com que o indivíduomodifique suas representações conceituais internas para refletir a organização cognitivaassumida pelos outros participantes no processo comunicativo. Se a participação em um atointencional de comunicação promove a normalização de representações conceituais entreindivíduos, como Freyd (1983) argumenta, segue-se que um ato intencional de comunicaçãoentre indivíduos como inteligência natural e o sistema de informação estariam sujeitos arestrições de compartilhamento similares. Assumindo que os processos de representação,organização e recuperação são necessariamente interdependentes, o fracasso em solucionar acomunicação entre o indivíduo e o sistema de informação, da perspectiva do sistema é umaomissão significante. Assim, uma prestação de contas sobre a dinâmica da informação deveriaabordar o papel da representação e organização na criação e comunicação de informaçãosignificante. Mais importante, ela deve contabilizar as implicações semânticas ocasionadas pordiferenças nos modos de organização que podem ser usados para estruturar um sistema deinformação. A necessidade de comunicação efetiva entre o sistema de informação e o indivíduoaponta para cinco áreas de pesquisa: (i) A comunicação entre o sistema de informação e oindivíduo é influenciada pela representação de fontes? (ii) A estrutura organizacional do sistemade informação faz com que o indivíduo ajuste suas estruturas cognitivas internas? (iii) A
  4. 4. organização de fontes contribui para a criação de um contexto significativo para a informação?(iv) O significado da informação é influenciado pela estrutura organizacional do sistema deinformação? e (v) Quais serão as conseqüências das diferentes estruturas organizacionais quepodem ser aplicadas a um conjunto de recursos de informação? Uma compreensão dos diferentes modos de estruturas organizacionais e asimplicações que cada uma possui para a criação de um contexto significativo para informação éprimordial e deve, entretanto preceder qualquer discussão do papel que a representação eorganização têm na dinâmica da informação. Assim, o foco aqui está nas ramificações daestrutura organizacional para comunicação entre o sistema de informação e o indivíduo,enquanto inteligência natural. Mais especificamente, o argumento apresentado aqui aborda asdiferenças estruturais e semânticas fundamentais entre a classificação e categorização e emcomo essas diferenças fazem uma diferença no ambiente informacional.CATEGORIZAÇÃO Categorização é o processo de dividir o mundo em grupos de entidades onde osmembros são de algum modo similares uns aos outros. Reconhecimento de semelhança entreentidades e a agregação subseqüente de entidades parecidas em categorias levam o indivíduo adescobrir a ordem em um ambiente complexo. Sem a habilidade de agrupar entidades baseadasem similaridades percebidas, a experiência do indivíduo de qualquer entidade seria totalmenteúnica e não poderia estender-se para encontros subseqüentes com entidades similares noambiente. Considere uma situação na qual cada entidade separada – cada árvore, cada flor, oucada gota de chuva – fosse distinta de todas as outras entidades e carregasse seu próprioconjunto único de características de definição. Como Markman (1989) observa, o indivíduo nãoseria capaz de lidar com a variedade e complexidade de suas interações do dia a dia com oambiente. Reduzindo a carga na memória e facilitando o armazenamento eficiente e arecuperação da informação, a categorização serve como um mecanismo cognitivo fundamentalque simplifica a experiência do ambiente do indivíduo. A categorização divide o mundo da experiência em grupos ou categorias nos quaisos membros compartilham algumas similaridades perceptíveis dentro de um contexto. Que essecontexto pode variar e com ele a composição de categoria é a própria base tanto para aflexibilidade e o poder da categorização cognitiva. Zerubavel (1993) sustenta que o indivíduoencontra ordem e o significado no ambiente impondo fronteiras - por dividir e agregar objetosde experiência, bem como para criar distintas "ilhas de significado" (p. 5). A forma que umaentidade é categorizada cria um contexto ou quadro conceitual que não apenas provêinformação sobre a entidade mas também dá forma à interação do indivíduo com ela. Porexemplo, o período histórico conhecido como a Renascença Inglesa (1500-1650) é percebidocomo fundamentalmente diferente da Idade Média Inglesa mesmo que a Inglaterra no séculoXVI estivesse, em vários aspectos, muito similar à Inglaterra no século XV. Separar o século XVIdo século XV por rotulá-los como pertencendo a dois períodos históricos distintos foca aatenção nas diferenças entre eles ao invés de suas similaridades e fornece a informação de que,
  5. 5. na Inglaterra, essas diferenças eram de maior importância do que as diferenças entre os séculosXIV e XV. Barsalou (1987) aponta que essa habilidade de manipular o ambiente através dacriação de categorias permite que o indivíduo crie novos relacionamentos e ainda crie novainformação onde os valores excedem o simples agrupamento de objetos no ambiente. Elepropõe que, uma vez que características diferentes ou propriedades são usadas para representara mesma categoria em tempos diferentes e em diferentes contextos, a informação associadacom uma categoria particular varia de acordo com indivíduos e contextos. Assim, o conjunto decaracterísticas associadas com uma categoria em qualquer dada ocasião é composta deinformação dependente e independente de contexto. Informação dependente de contexto érelevante apenas dentro de um contexto particular. Por exemplo, uma alta temperatura de 50graus Fahrenheit pode ser descrita como fria num dia de verão na Indiana do sul, mas morna ouaté mesmo quente em um dia de inverno no mesmo local. Dizer que está frio lá fora transmiteinformação dependente de contexto que é significante apenas em relação ao contexto sazonal.Ao contrário disso, informação independente de contexto provê informação sobre umacategoria que é relevante em vários contextos. Mesmo quando usada metaforicamente, porexemplo, a palavra "fogo" conota calor, luz e energia. A aparente instabilidade de categorias éentretanto uma reflexão da flexibilidade e plasticidade que são o poder do processo cognitivode categorização e da habilidade individual de criar e modificar o conteúdo informacional deuma categoria como uma função de contexto imediato, objetivos pessoais ou experiência dopassado. A aquisição e transmissão de informação são dependentes não apenas na habilidadecognitiva de criar novas categorias – e ainda nova informação – através da descoberta de novospadrões de similaridade entre entidades, mas também na habilidade de capturar informaçãosobre esses padrões através do meio da linguagem. Com o acúmulo de conhecimento maisespecializado e a criação de domínios disciplinares, entretanto, essas categorias e as relaçõesentre elas tem uma tendência a se formalizarem (Jacob, 1994). A necessidade de assegurar que oconhecimento disciplinar é consistente entre indivíduos e através do tempo privilegia aestabilidade da referência fornecida por classes bem-definidas. Uma vez que categoriasbaseadas experimentalmente evoluem para classes bem-definidas de domínio específico quefacilitam o compartilhamento de conhecimento sem perda de informação, eles perdem suaflexibilidade original e plasticidade bem como a habilidade de responder a novos padrões desimilaridade.A TEORIA CLÁSSICA DAS CATEGORIAS Até a publicação de Rosch nos anos 70 de seu trabalho principal sobre categorias ecategorização (Rosch, 1973, 1975), a pesquisa na área de categorização se focou no conceito deformação não como processo de criação mas como processo de reconhecimento. Assumiu-seque o mundo da experiência consistia de um conjunto de categorias pré-determinadas, cadauma definida por um conjunto de características essenciais representadas por um rótulo decategoria; e assumiu-se que todos os membros de uma determinada categoria compartilhavam
  6. 6. um conjunto de características essenciais que foi identificado pelo rótulo da categoria e poderiaser apreendido por todos os membros da comunidade lingüística. Assim Hull (1920) escreveusobre a descoberta da criança do significado da palavra "cão" como o reconhecimento gradualde um conceito pré-existente e invariável: "As experiências cão aparecem em intervalosregulares. ... Finalmente chega o momento em que a criança tem um significado para a palavracão. Após exame descobre-se que este significado é na verdade uma característica mais oumenos comum a todos os cachorros e não é comum a gatos, bonecas e ursos de pelúcia" (Hull,1920, p. 5-6; citado por Brown, 1979, p. 188). A premissa de que uma categoria é determinada por um conjunto de critériosdefinidos é conhecido como "a teoria clássica de categorias". Essa é uma teoria simples maspoderosa que se apóia em três proposições básicas (Smith & Medin, 1981; ver também Taylor,1989): 1. A intenção de uma categoria é uma representação resumida de uma categoria inteira de entidades. 2. As características essenciais que incluem a intenção de uma categoria são individualmente necessárias e conjuntamente suficientes para determinar a associação dentro da categoria. 3. Se uma categoria (A) é colocada dentro de uma categoria supra-ordenada (B), as características que definem a categoria (B) estão contidas dentro do conjunto de características que definem a categoria (A). A proposição I afirma que a definição (intenção) de uma categoria é a união dascaracterísticas essenciais que identificam a associação (extensão) daquela categoria. Além disso,uma vez que todos os membros de uma única categoria podem compartilhar esse conjunto decaracterísticas essenciais, cada membro é igualmente representativo da categoria como umtodo. Por esse motivo, a estrutura interna de uma categoria é considerada não-seriada, ou semranking, porque nenhum membro pode ser mais típico ou mais representativo de uma categoriaque qualquer outro membro. A proposição II afirma que, uma vez que cada membro da categoria deve exibir todasas características essenciais que incluem a intenção de categoria, a posse do conjunto decaracterísticas que define a categoria é suficiente para determinar a associação na categoria. E,uma vez que existe um relacionamento binário e/ou que existe entre uma entidade e umacategoria de modo que uma entidade ou é ou não é membro de uma categoria particular, oslimites de uma categoria são considerados fixos e rígidos. A proposição III identifica o relacionamento de herança que existe entre categoriasem estrutura hierárquica: qualquer membro de uma categoria que é um subconjunto de umacategoria super-ordenada deve exibir não apenas o conjunto de características essenciais quedeterminam associação no subconjunto mas também o conjunto de características essenciaisque determinam associação em qualquer categoria supra-ordenada dentro do qual osubconjunto está retido. Em sua forma mais rudimentar, a categorização pode ser definida como a atribuiçãode entidades em grupos os quais os membros portam alguma similaridade com os outros.
  7. 7. Dentro do quadro da teoria clássica de categorias, entretanto, a categorização é o processo dedividir sistematicamente o mundo da experiência em uma estrutura formalizada epotencialmente hierárquica de categorias, cada qual definida por um conjunto único decaracterísticas essenciais. Uma vez que a intenção de uma categoria define o conjunto decaracterísticas essenciais que cada membro deve exibir, a teoria clássica mantém que a intençãoé igual a extensão - que a associação dentro de uma categoria particular (extensão) implica aposse de características essenciais e definidoras (intenção) da categoria. Por exemplo, se aintenção da categoria "pássaro" consiste de características "bota ovos", "tem asas", "voa" e "crianinhos em lugares altos", cada membro da categoria deve exemplificar o conjunto completo decaracterísticas de definição. Se uma entidade não voa, não pode se associar na categoria"pássaro", mesmo que ponha ovos, tenha asas e crie ninhos em lugares altos. E, por que todos osmembros da categoria são definidos pelo mesmo conjunto de características, nenhum pássaropode ser mais típico ou mais representativo da categoria do que nenhum outro pássaro. Assim,de acordo com a teoria clássica, um papagaio, uma pomba e uma gaivota seriam igualmenterepresentativos da categoria "pássaro". Brown (1979) observa que dentro da organização formalizada e rigidamente restritada realidade estabelecida pela teoria clássica, a associação de categoria é absoluta: "... qualquercoisa está dentro ou fora do conjunto" (p. 189). É esta estipulação que é a fonte do poderexplicativo da teoria clássica: uma vez que requere que a intenção seja igual a extensão - que aassociação de uma categoria demonstra posse de um conjunto de características essenciais quedefinam a categoria - a teoria clássica de categorias proveria uma explicação simples porémelegante para a estrutura interna de representações cognitivas e para o significado semânticodas palavras. Até recentemente, a teoria clássica das categorias exemplificava "o jeito certo depensar sobre categorias, conceitos, e classificações" (Gardner, 1987, p. 340). Mas pesquisasempíricas conduzidas nos últimos trinta anos desafiaram a validade das afirmações nas quaisesta teoria é fundamentada. Críticos da teoria clássica argumentam que a incapacidade deassuntos identificarem características de definição de uma entidade (Hampton, 1979; Rosch &Mervis, 1975) não apenas acaba com a afirmação de que o conjunto de características essenciaisque determinam a associação de categoria é absoluto, mas também traz em questão a noção deque essas características estão disponíveis para e podem ser especificadas por todos osmembros de uma comunidade lingüística. Demonstração de efeitos seriados de tipicidade – aobservação de que assuntos julgam de fato certos membros a serem mais representativos deuma categoria que outros (McCloskey & Glucksberg, 1978; Rips, Shoben & Smith, 1973; Rosch,1973, 1975) – contesta a afirmação de que a estrutura de categoria é não-seriada porque todosos membros são igualmente representativos da categoria. Há evidência também que assuntossão capazes tanto de fazer um ranking tanto os membros quanto de não-membros de umacategoria, num único continuum de representatividade. Por exemplo, Barsalou (1987)demonstrou que assuntos poderiam fazer o ranking de um rouxinol, uma pomba, uma ema,uma borboleta e uma cadeira em um único continuum de representatividade para a categoria"pássaro" - um continuum estendendo-se do membro mais típico da categoria (rouxinol) ao seumembro mais atípico (cadeira). A evidência para uma estrutura seriada de categorias apontapara a falta de limites fixados e determinados separando membros de uma categoria dos não-
  8. 8. membros; e, sustentada como é por demonstrações de associação de categoria com base nasemelhança de família (Rosch & Mervis, 1975), a estrutura em série nos deixa dúvida sobre aafirmação clássica de que há um relacionamento explícito de inclusão/exclusão entre umaentidade e uma categoria.CLASSIFICAÇÃO Na Biblioteconomia e Ciência da Informação, o termo "classificação" é usado parareferir-se a três conceitos distintos e relacionados: um sistema de classes, ordenado de acordocom um conjunto pré-determinado de princípios e utilizado para organizar um conjunto deentidades; um grupo ou classe em um sistema de classificação; e o processo de atribuição deentidades em classes de um sistema de classificação. O foco aqui está no primeiro destes – nosistema de classificação como uma ferramenta representacional usada para organizar umacoleção de fontes de informação – mas uma ampla apreciação das implicações de classificaçãopara ambientes de informação requere uma compreensão básica do processo de classificaçãoem si. A classificação como processo envolve a atribuição ordenada e sistemática de cadaentidade a uma e apenas uma classe dentro de um sistema de classes mutuamente exclusivas enão-sobrepostas. Esse processo é legítimo e sistemático: legítimo porque é realizado de acordocom um conjunto estabelecido de princípios que governam a estrutura de classes erelacionamento de classes; e sistemático porque requere aplicação consistente destes princípiosno âmbito de uma determinada ordenação da realidade. O esquema em si é artificial e arbitrário:artificial porque é uma ferramenta criada para expressar o propósito de estabelecer umaorganização significante; e arbitrária porque os critérios utilizados para definir as classes noesquema refletem uma única perspectiva do domínio em detrimento de todas outrasperspectivas.Classificação Taxonômica A classificação seja talvez melhor exemplificada pela disciplina de taxonomia.Amplamente definida, a taxonomia é a ciência da classificação, ou, como Mayr (1982) define "ateoria e prática de delimitar tipos de organismos" (p. 146). Os objetivos da investigaçãotaxonômica devem prover uma organização ordenada e sistemática do conhecimento sobre omundo biológico; identificar e definir características que distinguem uma entidade biológica; e,baseado nessas características, colocar a entidade dentro de um ordenamento hierárquico declasses super-ordenadas e subordinadas mutuamente exclusivas de acordo com um conjunto deprincípios estabelecidos e amplamente aceitos. A classificação taxonômica fornece estabilidade de nomenclatura através daproteção de uma linguagem formalizada e universalmente aceita que facilita a transmissão deconhecimento ao longo do tempo e barreiras de linguagem natural. A cada classe no esquema
  9. 9. taxonômico é dado um nome único que é usado para referir-se a todas as entidades que exibemo conjunto completo de características definindo a classe. E, por que é universalmenteempregado para identificar todos os membros de uma determinada classe, esse rótulo forneceacesso ao conhecimento acumulado sobre essas entidades, não enquanto indivíduos, mas comomembros de uma classe particular. O nome taxonômico estabelece um relacionamento deequivalência entre o conjunto de características que definem a classe (sua intenção) e oconjunto de entidades que são membros da classe (sua extensão). Usando o nome taxonômico,um membro de uma classe biológica é reconhecível onde quer que ocorra, independente dalinguagem natural ou dos nomes locais por quais pode ser conhecido. Através da herança de critérios de definição possíveis que impõem uma estrutura deprincípios de classes super-ordenadas e subordinadas, a classificação taxonômica também servecomo um andaime cognitivo (Clark, 1997; Jacob 2001, 2002) que provê o armazenamentoeconômico e recuperação da informação sobre uma classe de entidades. Por exemplo, aobservação de que Bleu é um poodle fornece informação sobre Bleu que é associado à classe"poodle". Mais importantemente, no entanto, também provê informação sobre Bleu que édisponível a partir da estrutura hierárquica onde a classe "poodle" reside - informação associadacom as classes super-ordenadas cão, mamífero, vertebrado, etc. A observação essencial, entretanto, é que a prática de taxonomia é realizada dentrodo quadro arbitrário estabelecido por um conjunto de princípios universais. Por exemplo,enquanto o naturalista Adanson, um contemporâneo de Lineu, propôs um método deorganização de fenômenos botânicos baseados na identificação de diferenças entre espéciesindividuais (Foucault, 1970), Lineu advogou uma abordagem sistemática baseada nasimilaridade da estrutura reprodutiva. Para o naturalista seguindo a ideia de Lineu, qualquerdiferença física entre duas espécies não relacionadas diretamente ao processo de reproduçãoseria irrelevante: por exemplo, diferenças de folha, caule ou estrutura de raiz que podem serusadas para distinguir entre duas plantas seriam ignoradas se as plantas exibissem estruturasreprodutivas similares. A classificação taxonômica apóia o armazenamento eficiente e recuperação dainformação sobre uma classe de entidades, mas a confiança em uma abordagem sistemática talcomo a advogada por Lineu restringe o contexto de informação por limitar a identificação deassociações portadoras de conhecimento a relacionamentos hierárquicos entre classes. Alémdisso, as definições de classe baseadas em uma única característica tal como estruturareprodutiva efetivamente reduz a quantidade de informação significante que pode serrepresentada sobre cada classe na taxonomia.Esquemas de Classificação Um esquema de classificação é um conjunto de classes mutuamente exclusivas e nãosobrepostas organizadas dentro de uma estrutura hierárquica que refletem uma ordenação pré-determinada da realidade. Uma vez que um esquema de classificação ordena que uma entidadepode ser um membro de uma e apenas uma classe, ela fornece para a comunicação deinformação relevante através da sistemática e ordenação de classes baseada em princípios. Além
  10. 10. disso, estabelece e reforça a estabilidade de referência fornecendo a cada classe uma etiquetaúnica que liga membros individuais da classe à definição da classe. Shera (1951/1965) observa que, ao longo da história, tentativas de classificar oconhecimento basearam-se em quatro premissas básicas: ordem universal, unidade deconhecimento, similaridade de membros de classe e essência intrínseca. A premissa de ordemuniversal postula uma concepção imutável de realidade que serve como um quadro unificadorpara todo o conhecimento. A premissa de unidade de conhecimento pressupõe queconhecimento passado, presente e futuro podem ser representados dentro de uma únicahierarquia inclusiva de classes super-ordenadas e subordinadas. A premissa de similaridade demembros de classe assegura que uma classe pode ser definida por um conjunto decaracterísticas essenciais e que essas características são compartilhadas por todos os membrosda classe e distinguem esta classe de todas as outras classes na estrutura. E a premissa deessência intrínseca mantém que há um conjunto de características individualmente necessáriase conjuntamente suficientes que são intrínsecas a todos os membros de uma classe e que estascaracterísticas constituem a essência da classe. Com a possível exceção da ordem universal, a exposição de Shera das premissas queapóiam esforços para organização do conhecimento podem ser interpretadas em termos de trêsproposições que constituem a teoria clássica de categorias: a afirmação de que uma categoria édefinida por uma representação sumária (Proposição I) é uma declaração da similaridadeessencial de membros de uma classe; a afirmação de que uma categoria é definida por umconjunto de características essenciais (Proposição II) é uma declaração da essência intrínseca deuma classe; e a afirmação de que características definitórias são herdadas em uma estruturahierárquica de categorias (Proposição III) é uma declaração da unidade de todo o conhecimento.É instrutivo que, embora a teoria clássica de categorias seja incapaz de explicar a variabilidade eflexibilidade da categorização cognitiva, ela provê uma explicação elegante para ospressupostos fundamentais nos quais os esquemas de classificação tem sido historicamenteconstruídos.Esquemas de Classificação Bibliográfica Tradicionalmente, as classificações bibliográficas tem sido dedutivas, esquemas top-down (hierárquicos) que enumeram um conjunto de classes que se excluem mutuamente. Umesquema de classificação enumerativo inicia com um universo de conhecimento e uma teoria deorganização ou conjunto de princípios que estabelecem a estrutura conceitual do esquema. Se ouniverso abrange todos os conhecimentos ou é limitado a um domínio específico, a construçãodo esquema envolve o processo lógico de divisão e subdivisão do universo original tal que cadaclasse, ou cada nível de classes na estrutura, é diferenciado por uma característica oupropriedade particular (por exemplo, a propriedade "cor" ou "forma"). O resultado é umaestrutura hierárquica de relacionamentos genéricos (gênero/espécie) em que cada classesubordinada é, teoricamente, uma espécie verdadeira da super-ordenada na qual ela estáaninhada. Sistemas de classificação facetada (analítico-sintética) são esquemas bottom-up(descentralizados) indutivos gerados através de um processo de análise e síntese. A construção
  11. 11. da estrutura facetada começa com a análise de um universo de conhecimento para identificar oselementos individuais - propriedades e características - do universo. Esses elementos são entãoorganizados em grupos mutuamente exclusivos na base da similaridade conceitual, e essesgrupos são, por sua vez, organizados em agrupamentos sucessivamente maiores para formaremfacetas (aspectos) que podem ser usados para representar entidades no universo. Deste modo,relacionamentos significantes são estabelecidos não apenas entre os elementos em um grupomas entre os grupos em si. O resultado não é um esquema de classificação mas um controle devocabulário de conceitos e suas etiquetas associadas que podem ser usadas, em associação comuma notação e uma ordem de citação prescrita, para sintetizar as classes que irão popular oesquema de classificação. Um vocabulário facetado para a classificação de carros pode incluirfacetas mutuamente exclusivas para "cor" (vermelho, azul, preto), "forma" (sedan, conversível,minivan) e "transmissão" (manual, automático). Seguindo a ordem de citação forma -transmissão - cor, as classes seriam construídas selecionando um único valor, ou isolado, de cadafaceta. Exemplos das classes que poderiam ser construídas neste esquema facetado seriammutáveis - manual - vermelho e minivan - automático-azul. Uma vez que o esquema de classificação facetada adere a uma ordem de citaçãofixadas durante a construção de classes individuais, a estrutura resultante, como um esquemaenumerativo, é necessariamente hierárquica. Na verdade, é a natureza hierárquica dosesquemas de classificação bibliográfica que permite que o arranjo de fontes físicas nas estantesda biblioteca. "Ler" um esquema de classificação envolve mover-se para baixo da hierarquia, dosuper-ordenado para o subordinado e da esquerda para a direita, para gerar uma série derelacionamentos entre as classes que podem ser traduzidas na própria ordem linear da estanteda biblioteca. É apenas esta estrutura linear que Ranganathan capturou na noção de APUPA (ouAlien – Penumbral – Umbral – Penumbral – Alien). A classe umbral (U) representa o tópicocentral; as classes penumbra (P) são as mais próximas relacionadas com o tópico central; e asclasses estrangeiras (A) são aquelas removidas do tópico central e no entanto, não relacionadasa ele. Quando o indivíduo revisa uma coleção de fontes arranjadas na ordem classificada, elageralmente começa com a classe mais relevante de tópico central (U); movendo-se seja para adireita ou esquerda, ela progride de fontes no tópico central através de materiais relacionados(P) a estas fontes que não são relacionadas (A). Desta forma, a linearidade inerente na estruturahierárquica de um esquema de classificação é usada par criar um contexto significativo portrazer para proximidade essas classes dentro da estrutura hierárquica que são teoricamente maisproximamente relacionadas.Classificação como Linguagem Disciplinaria Uma estrutura classificatória frequentemente inerente em uma linguagemdisciplinaria quando é usada para estabelecer um contexto conceitual específico que tantodefine e organiza o domínio de investigação (Foucault, 1970; Jacob, 1994). A linguagem servepara prescrever os limites do domínio; para determinar tanto o assunto do domínio e osrelacionamentos que obtém entre fenômeno de investigação; para legitimizar conceitosespecíficos e metodologias; para assegurar transmissão efetiva de conhecimento por estabilizaro vocabulário; e para promover uma perspectiva específica de domínio ou episteme
  12. 12. disciplinaria. Uma vez que uma linguagem disciplinaria reflete a estrutura classificatóriasubjacente do domínio, o significado de qualquer termo da classe pode ser apenas apreendidodentro do contexto conceitual estabelecido pela estrutura classificatória.A DIFERENÇA ENTRE CLASSIFICAÇÃO E CATEGORIZAÇÃO Embora não existam similaridades óbvias entre classificação e categorização, asdiferenças entre elas têm implicações significantes para a constituição de um ambiente deinformação. O fracasso em distinguir entre esses dois sistemas de organização parece resultar doequívoco de que eles são, na verdade, sinônimos - um equívoco que pode ser reforçado pelofato de que ambos são mecanismos de organização da informação. A literatura em categorização é crivada com passagens onde os termos"classificação" e "categorização" são usados indiscriminadamente para referirem-se ao mesmoprocesso. Rosch et al (1976) fornecem um exemplo ilustrativo de como esses dois termos sãousados indiscriminadamente: ... um propósito da categorização é reduzir as infinitas diferenças entre estímulos para proporções comportamentalmente e cognitivamente utilizáveis. É vantagem para o organismo não diferenciar um estímulo de outros quando essa diferenciação é irrelevante para os propósitos em questão. O nível básico de classificação, o nível primário no qual cortes são feitos no ambiente, parece resultar da combinação desses dois princípios; a categorização básica é o nível mais geral e inclusivo nos quais categorias podem delinear estruturas correlacionais do mundo real (Rosch et al, 1976, p. 384. Grifo nosso) Esta falta de distinção entre categoria/categorização e classe/classificação éfrequentemente composta pelo uso de conceito como ainda um outro sinônimo para categoria(por exemplo, Gardner, 1987, p. 340). Infelizmente, essa imprecisão terminológica obscurece ofato de que pesquisadores estão de fato lidando com duas abordagens de organização similaresmas não obstante distintas. Embora sistemas de classificação e categorização sejam tantos mecanismos paraestabelecer ordem através do agrupamento de fenômenos relacionados, diferençasfundamentais entre eles influenciam em como esta ordem é efetuada - diferenças que fazemuma diferença no contexto de informação estabelecido por cada um desses sistemas. Enquantoa classificação tradicional é rigorosa na medida em que determina que uma entidade é ou não éum membro de uma classe particular, o processo de categorização é flexível e criativo e desenhaassociações não-vinculantes entre entidades - associações que são baseadas não em umconjunto de princípios pré-determinados mas no simples reconhecimento de similaridades queexistem através de um conjunto de entidades. Classificação divide um universo de entidades emum sistema arbitrário de classes mutuamente exclusivas e não-sobrepostas que são arranjadasdentro do contexto conceitual estabelecido por um conjunto de princípios estabelecidos. O fatode que nem o contexto nem a composição dessas classes varia é a base para a estabilidade de
  13. 13. referência fornecida por um sistema de classificação. Ao contrário, categorização divide omundo da experiência em grupos de categorias nos quais os membros portam algumasimilaridade imediata dentro de um dado contexto. Que este contexto pode variar - e com ele acomposição da categoria - é a base tanto para a flexibilidade e o poder de categorizaçãocognitiva (Jacob, 1992). A Figura 1 identifica seis propriedades sistêmicas que servem como um ponto departida para comparar sistemas de classificação e categorização: (i) processo, (ii) limites, (iii)associação, (iv) critérios de atribuição, (v) tipologia e (vi) estrutura. (i) O processo de classificação envolve um arranjo sistemático de classes deentidades baseados na análise do conjunto de características individualmente necessárias econjuntamente suficientes que definem cada classe. Em contraste, o processo de categorizaçãoé geralmente não-sistemático mas inerentemente criativo para que então não precise basear-seem definições pré-determinadas, sendo capaz de responder a avaliações de similaridadebaseadas em contexto imediato, objetivos pessoais ou experiência individual. Figura 1. Comparação de Categorização e Classificação Categorização Classificação Processo Síntese criativa de entidades Arranjos sistemáticos de baseadas em contexto ou entidades baseados na análise similaridade percebida de características suficientes e necessárias Fronteiras Uma vez que a associação em Uma vez que classes são qualquer grupo é não- mutuamente exclusivas e não vinculativa, as fronteiras são se sobrepõem, fronteiras são “imprecisas” fixas Associação Flexível: associação de Rigoroso: uma entidade ou é categorias é baseada em ou não é um membro de uma conhecimento generalizado classe em particular baseada e/ou contexto imediato na intenção de uma classe Critérios para Atribuição Critérios dependentes e Critérios são orientações ou independentes de contexto princípios pré-determinados Tipicidade Membros individuais podem ser Todos os membros são ordenados em ranking por igualmente representativos tipicidade (estrutura seriada) (estrutura não-seriada) Estrutura Clusters de entidades; podem Estrutura hierárquica de formar estrutura hierárquica classes fixadas (ii) Sistemas de classificação e categorização também são distinguidos pelos limitesimpostos em agrupamentos. Uma vez que as classes em um sistema de classificação sãorigidamente circunscritas pela intenção da classe e mais tarde restritas pelo requerimento quesejam mutuamente exclusivas e não sobrepostas, os limites entre classes são fixados,
  14. 14. determinados e persistentes. Em um sistema de categorização, no entanto, a associação de umaentidade em qualquer categoria é não-vinculativa e não proíbe a associação em nenhuma outracategoria. Portanto a associação de qualquer duas ou mais categorias em um sistema decategorização pode sobrepor-se ou variar ao longo do tempo em reposta à contextos mutantes.Isso é possível porque os limites da categoria não são simplesmente imprecisos mas são, naverdade, mutáveis e potencialmente fluídos. (iii) e (iv) Associação e critério para atribuição são duas características proximamenterelacionadas que distinguem sistemas de classificação de sistemas de categorização. Em umsistema de classificação, critério para atribuição de classe - o conjunto de característicasnecessárias e suficientes que constituem a intenção de uma classe - é governado por princípiosque estabelecem o quadro conceitual do sistema. Associação em uma classe é rigorosa namedida em que é determinada pela intenção da classe: uma entidade ou é ou não é um membrode qualquer classe no sistema. Mais importante, entretanto, a associação em uma classe éabsoluta simplesmente porque uma entidade pode pertencer a uma e apenas uma classe. Aocontrário, o critério para atribuição de categoria empregado por um sistema de categorização épotencialmente variável, pertencendo a associação de uma categoria para responder àsdemandas do contexto no qual é usado. Deste modo, a associação de uma categoria pode variarde acordo com o tempo baseado na combinação de informação dependente e independente decontexto que é usada para definir associação de categoria. Diferenças no critério para atribuição enfatizam uma distinção importante entreclassificação e categorização. Em sistemas de classificação, atribuição de classes se baseia emdefinições que são "idealizações" ou "abstrações teóricas" (Barsalou, 1987) para determinarassociação de classe. Em sistemas de categorização, entretanto, a atribuição de categoria éflexível e dinâmica, refletindo a habilidade do indivíduo de modificar definições de categoria emresposta à variações no ambiente imediato. Entretanto Barsalou argumenta que ... os conceitos de que teóricos "descobrem" para categorias podem nunca ser idênticos a um conceito real que alguém usa. Ao invés disso, eles podem ser ficções analíticas que são tendências centrais ou idealizações de conceitos reais. Embora tais abstrações teóricas possam ser úteis ou suficientes para certos propósitos científicos, pode ser mais frutífero e exato descrever a variedade de conceitos que pode ser construído para uma categoria e entender o processo que os gera. (Barsalou, 1987, p. 120) (v) Tipicidade é intimamente relacionada com as características de associação ecritério para atribuição. Entretanto, a tipicidade é potencialmente ambígua: por um lado, éutilizada como uma indicação de avaliação individual do quão representativo um membro é desua classe ou categoria particular; e, por outro, é usado como um reflexo das afirmações arespeito de associação e critérios de associação que governam um sistema de classificação oucategorização. Uma vez que pesquisa empírica indica que assuntos são capazes de fazerrankings de membros de acordo com a tipicidade mesmo quando se trabalha com classes bemdefinidas ou/ou tais como número ímpar ou número par (Armstrong, Gleitman, & Gleitman,1983), a tentativa de distinguir entre classificação e categorização tendo por base julgamentos
  15. 15. de tipicidade individuais seria um exercício de futilidade. Ao contrário disso, pressupostossistêmicos que governam a associação fornecem de fato um importante ponto de distinçãoentre classificação e categorização. Em um sistema de classificação, todos os membros de uma classe devem exibir oconjunto completo de características essenciais prescritas pela definição da classe (veja aProposição I da teoria clássica). Segue-se então, que todos os membros são considerados iguaise entretanto igualmente representativos da classe. Por essa razão, a estrutura interna de umaclasse é considerada não-seriada porque nenhuma entidade pode ser um membro "melhor" daclasse do que qualquer outro membro. Entretanto, em um sistema de categorização, não hápressuposto de igualdade de associação. O fato de que indivíduos possam identificar membrosem particular como mais típicos de uma categoria reflete a natureza dinâmica de definições decategorias e a variabilidade correspondente de associação de categoria como uma reflexão decontexto imediato. A estrutura interna de uma categoria é considerada não-seriada porque épossível fazer o ranking de membros da categoria como em quão típicos e representativos sãoda categoria como um todo. (vi) A estrutura é talvez a única característica mais importante que pode ser usadapara discriminar entre sistemas de classificação e categorização porque é influenciada pordistinções baseadas em processo, limites, associação e critério de atribuição. Um sistema declassificação é geralmente uma estrutura hierárquica de classes bem definidas, mutuamenteexclusivas e não sobrepostas aninhadas em uma série de relacionamentos super-ordenados -subordinados ou gênero-espécie. A estrutura de um sistema de classificação fornece umapoderosa ferramenta cognitiva - uma armação externa (Clark, 1997; Jacob, 2001, 2002) - queminimiza a carga cognitiva no indivíduo por incorporar informação sobre a realidade através daorganização de classes dentro do sistema. Por exemplo, porque uma entidade é ou não é ummembro de uma classe particular num sistema de classificação, ela fornece para a determinaçãode uma associação de classe como uma atividade relativamente simples de combinação oucomplemento de padrão. Em um nível mais complexo, a estrutura do sistema de classificação estabelecerelacionamentos portadores de informação entre classes: relacionamentos verticais entre classessuper-ordenadas e subordinadas que são sujeitas ao mecanismo de herança ilustrado acima noexemplo do poodle Bleu; e relacionamentos laterais entre classes coordenadas que ocorre nomesmo nível de hierarquia e, quando tomadas em conjunto, constituem a classe imediatamentesuper-ordenada dentro da qual elas estão aninhadas. Desta forma, a estrutura de um sistema declassificação serve como um meio para acúmulo, armazenamento e comunicação da informaçãoassociada com cada classe na estrutura; e, por capitalizar nos relacionamentos hierárquicos elaterais entre classes, ele minimiza a informação que pode ser armazenada com cada classe ereduz a carga na memória. Ao contrário disso, a estrutura de um sistema de categorizaçãoconsiste de clusters variáveis de entidades que podem ou não ser organizados em estruturahierárquica. Uma vez que categorias não são restritas por um requerimento de exclusividademútua, associação em uma categoria não proíbe associação em qualquer outra categoria. Maisimportante, entretanto, a própria plasticidade que é o poder criativo de categorias pode naverdade proibir o uso de categorização como uma estrutura persistente de informação. A
  16. 16. natureza potencialmente transitória e sobreposta das categorias fornece que quaisquerrelacionamentos estabelecidos entre categorias são em si mesmo mutáveis. Ainda, um sistemade categorização cria um quadro conceitual do qual significado pode ser de vida curta e efêmera- um quadro conceitual que não pode funcionar como armação cognitiva e do qual a habilidadepara servir como meio para a acumulação, armazenamento e comunicação de informação élimitada.ORDENAÇÃO, AGRUPAMENTO E ORGANIZAÇÃO Um sistema para ordenação (Jacob & Loehrlein, 2003) fornece acesso a fontes porarranjá-las de algum modo reconhecível. Tipicamente, esses sistemas empregarão seqüênciasalfanuméricas ou cronológicas porque esses arranjos geram padrões sintáticos que sãofamiliares a uma maioria de indivíduos. Embora tal sistema se destine a apoiar acesso a itensconhecidos, ele pode parecer criar agrupamentos de fontes similares (por exemplo, todos osindivíduos com o sobrenome Smith ou alunos que se graduaram no ano 2000), mas a imposiçãode ordem seqüencial é não obstante um dispositivo que não pode criar relacionamentossignificantes seja entre entidades individuais ou entre grupos de entidades. Ao contrário disso, um sistema de organização (Jacob & Loehrlein, 2003) é umaestrutura unificada que estabelece uma rede de relacionamentos entre as classes ou categoriasque compõem o sistema. Esses relacionamentos são significantes e portadores de informaçãoporque especificam conexões baseadas em princípios entre dois ou mais grupos dentro domesmo sistema. Deste modo, com uma única exceção possível, sistemas de classificação sãosistemas de organização porque eles fornecem ao arranjo conceitual um conjunto de classesmutuamente exclusivas e não-sobrepostas dentro de uma estrutura sistemática derelacionamentos hierárquicos e de gênero-espécie. A exceção é uma classificação constitutiva (Jacob, Mostafa & Quiroga, 1997)consistindo de um conjunto de classes mutuamente exclusivas que compõem a totalidade deum dado universo mas tem falta de relacionamentos super-ordenados e subordinados. Porexemplo, as classes calouro, sophomore1, junior2 e veterano compõem o universo dos alunos degraduação na universidade. Essas classes parecem evidenciar uma ordenação hierárquica (porexemplo, de calouro a veterano), mas falham em demonstrar relacionamentos significantes eportadores de informação: embora um veterano possa ter sido junior em algum momento, aclasse junior não é uma verdadeira espécie de seu pretenso super-ordenado veterano. Aindaassim, uma classificação constitutiva não qualifica como um sistema de organização porque,mesmo que esteja composta de um conjunto de classes não sobrepostas e mutuamenteexclusivas que constituem a totalidade de um universo particular, ela fracassa em estabelecerrelacionamentos significantes entre suas classes constituintes. É interessante também que nemuma classificação hierárquica e nem constitutiva podem servir como sistema para ordenamento:uma vez que as distinções entre classes são conceituais, as classes não podem conformar-se a1 Aluno de segundo ano na universidade.2 Aluno de terceiro ano na universidade.
  17. 17. um padrão de arranjo reconhecível e sintático. Além disso, tanto sistemas hierárquicos comoconstitutivos de classificação requerem um índice ou outro mecanismo auxiliar para apoiar oacesso, seja a fontes únicas ou classes individuais na estrutura. Um sistema de categorização pode ou não ser um sistema de organização. Emboraum sistema de categorização agrupe entidades baseado na similaridade, o exemplo de umaclassificação constitutiva demonstra que a simples identificação de um conjunto de categoriassem o estabelecimento de relacionamentos significantes e portadores de informação nãoconstituem um sistema de organização. Mas, mesmo que um sistema de categorização nãoindique relacionamentos significantes, não é um sistema de ordenamento: o simples fato deagrupar entidades em categorias não apóia o acesso. Uma vez que a categorização refletedistinções conceituais entre grupos de entidade, ela também requere um mecanismo auxiliarpara prover acesso, seja a categorias individuais ou a membros únicos de categoria. Se um sistema de categorização não impõe uma ordem sistemática sintática emmembros de categorias e se não estabelece relacionamentos entre categorias, então ésimplesmente um mecanismo de agrupamento. Por exemplo, dividir os itens de uma lista decompras em categorias definidas por compras (por exemplo, mercado, posto de gasolina e lojade 1,99) é um mecanismo de agrupamento que simplifica a interação individual com o seuambiente mas não cria relacionamentos significantes entre categorias, nem impõe qualquerordem reconhecível a elas. Uma classificação constitutiva também é um exemplo de um simplesmecanismo de agrupamento: neste caso por dividir um universo de entidades em um conjuntode grupos bem definidos e mutuamente exclusivos sem a identificação de qualquerrelacionamento significante entre eles.IMPLICAÇÔES DE ESTRUTURAS O papel funcional da estrutura na criação e melhoria de contextos de informaçãopode ser abordado através da análise de quatro abordagens à organização e recuperação defontes: busca em texto livre, indexação pós-coordenada, indexação pré-coordenada eclassificação (ver Figura 2). Embora a categorização cognitiva sirva como linha de base para estaanálise, é desconsiderada enquanto sistema de organização não por sua falta de fundaçãosemântica ou estrutura relacional, mas porque, ao contrário dos argumentos proferidos porShera (1956/1965) a organização imposta em categorias cognitivas é tão dinâmica e suscetível amudanças em contexto que não pode estabelecer relacionamentos persistentes e portadores deconhecimento entre categorias. Das quatro abordagens gerais à organização, a busca em texto livre é a menosrestrita. Embora ela compartilhe com sistemas de classificação a criação de classes mutuamenteexclusivas, não sobrepostas e rigidamente delimitadas cuja adesão está condicionada por umcritério explícito de atribuição (por exemplo, a seqüência de pesquisa alfanumérica usado paraconsultar o sistema), a busca em texto livre carece de um conjunto estabelecido de princípiosque governem a estrutura de classes e seus relacionamentos. Pode ser descrita como umsistema de categorização em seu sentido mais amplo, mas é, no máximo, um mecanismo muito
  18. 18. elementar para agrupamento. Mesmo como mecanismo de agrupamento, no entanto, tem duasfalhas significativas. Em primeiro lugar, a base para agrupamento é puramente sintática: porqueo critério para atribuição de grupos envolve a simples combinação de seqüências alfanuméricas,grupos produzidos por esse processo partilham uma similaridade superficial sem implicaçõessemânticas mais profundas. Em segundo lugar, o processo de agrupamento em texto livre ébinário e nisso gera apenas dois grupos de entidades - aqueles que combinam com a seqüênciade consulta e aqueles que não combinam. Entretanto, uma vez que buscas em texto livre nãotêm base semântica, não podem apoiar distinções significantes entre essas duas classes, e,porque exemplifica a mais simples das estruturas (exemplo, duas classes antônimas), um sistemade recuperação em texto livre não pode contribuir para um ambiente de informação que iráapoiar ou melhorar o valor da saída do sistema através da criação de contexto significativo. Figura 2. Sistemas de Organização Diferente de busca em texto livre, sistemas pós-coordenados, pré-coordenados esistemas de classificação são todos sistemas de indexação onde cada um implica a atribuição auma fonte de um ou mais descritores que devem representar o conteúdo intelectual desta fonte.Esses descritores são geralmente desenhados de um vocabulário controlado ou linguagem deindexação que normaliza o vocabulário usado na representação e recuperação pela criação deuma correspondência de índice, de um para um entre um descritor e o conceito para o qual eleaponta. A linguagem de indexação também fornece para comunicação entre o sistema e oindivíduo por especificando o conjunto de termos autorizados ou seqüências de assunto que
  19. 19. podem ser usadas para colocar questões de buscas ao sistema. Embora um descritor possa serum rótulo da classe, um cabeçalho de assunto ou um único termo ou frase, dependendo danatureza do sistema, cada descritor serve para identificar ou descrever o conteúdo intelectual deum grupo de fontes. Diferente de um ponto de acesso em um sistema para organização queapóia a recuperação de uma entidade única, um descritor é um substituto para (ou umapontador para) o conteúdo intelectual compartilhado por um grupo de fontes. De fato, aindexação, assim como a categorização, seria impossível se cada fonte fosse tratada comoentidade única. Na progressão de sistemas de indexação pós-coordenados através de sistemas pré-coordenados para sistemas de classificação, estrutura organizacional se torna cada vez maisrestrita (ver Figura 2). É apropriado então, começar essa análise com classificação, o maisaltamente restrito desses três sistemas, e trabalhar de volta através dos sistemas menos restritosem direção à linha de base de categorização cognitiva. Teoricamente, uma estrutura classificatória exemplifica um sistema de organizaçãoporque cria uma estrutura de princípios de classes bem definidas que são ligadas por umsistema de relacionamentos hierárquicos de gênero-espécie. Embora a prática nem sempre iráaderir à teoria no desenvolvimento de esquemas de classificação, a classificação é não obstanteo sistema organizacional mais rígido porque sua estrutura de classes mutuamente exclusivas enão sobrepostas exigem um relacionamento absoluto entre uma fonte e sua classe: cada fontepode ser atribuída a uma e apenas uma classe na estrutura. Assim, o processo de classificação éinerentemente sistemático porque é regido por um conjunto de princípios que serve comoquadro conceitual persistente para a criação de relacionamentos estruturais significantes entreclasses. Embora a estrutura bem-definida de um sistema de classificação forneça a criação derelacionamentos significantes portadores de informação entre classes – relacionamentos quefacilitam o uso da classificação como uma estrutura cognitiva externa – coloca poderosaslimitações na comunicação entre indivíduos e o sistema de informação. Em um sistema deinformação em que as estruturas de classe são pré-determinadas, o conjunto de recuperaçãoretornado para qualquer questionamento colocado ao sistema é necessariamente limitado aassociação de uma única classe. Embora a estrutura do sistema de classificação restrinja asquestões que possam ser apresentadas ao sistema, prescrevendo o conjunto de possíveisrespostas antes que um questionamento seja realmente colocado. Dentro de uma estruturaclassificatória, então, a comunicação é apenas de um caminho – do sistema para o indivíduo – eo indivíduo deve se basear na sua compreensão ou intuições sobre os relacionamentosestruturais entre classes de modo a interagir com o sistema de modo efetivo e significativo. Sistemas de informação são identificados como pré-coordenados quando ascategorias ou classes que fazem parte do sistema são ou atribuídas ou construídas peloindexador no momento da indexação. Um sistema de classificação é obviamente um sistemapré-coordenado porque suas classes são ou estabelecidas pelo classificador durante a geraçãodo esquema ou construídas pelo classificador ao mesmo tempo da atribuição de classe usandoum vocabulário facetado e uma ordem de citação fixa. Um sistema de cabeçalhos de assuntotambém é um sistema pré-coordenado mas é geralmente menos restrito – e menos restritivo –do que um sistema de classificação. Considerando que a classificação demanda atribuição de
  20. 20. uma fonte a uma e apenas uma classe, um sistema pré-coordenado de cabeçalhos de assuntonão requere que grupos individuais sejam mutuamente exclusivos. Ao invés disso, sistemas decabeçalho de assunto permitem a atribuição de descritores múltiplos a uma única fonte,fornecendo assim múltiplos pontos de acesso para cada entidade ao invés do único ponto deacesso (o único rótulo de classe) prescrito por um sistema de classificação. Uma vez que não demanda um relacionamento bem definido e absoluto entre umafonte e um cabeçalho de assunto – porque não requere que os grupos de entidades associadascom os cabeçalhos de assunto individuais sejam necessariamente mutuamente exclusivos – umcabeçalho de assunto pré-coordenado é, na verdade, um sistema de categorização. Categoriasformadas pelo sistema de cabeçalhos de assunto não são ligados rigidamente mas geralmentesobrepõem-se, com membros individuais transbordando em categorias de penumbra e atémesmo categorias exóticas. Embora permitir que vários descritores para uma única fonteforneçam uma grande variabilidade na gama de fontes que podem ser recuperadas com umaúnica questão, as questões que podem ser colocadas para o sistema de informação no entantosão limitadas, uma vez que estão em um sistema de classificação, pelo conjunto autorizado deseqüências de cabeçalhos de assunto que fazem parte do sistema. E, como em um sistema declassificação, o conjunto recuperado gerado em resposta a uma questão é determinado peloindexador: a atribuição de cabeçalhos de assunto como descritores não apenas restringe asquestões que podem ser colocadas para o sistema mas serve para estabelecer o conjuntoespecífico de fontes que podem ser recuperadas em resposta à cada questão colocada para osistema. Diferentemente da estrutura de princípios e sistemática de um sistema declassificação, a estrutura de um cabeçalho de assunto é frequentemente sem princípios,assistemática e poli-hierárquica. E, diferente dos relacionamentos estabelecidos entre classesbem definidas e mutuamente exclusivas em uma classificação, quaisquer relacionamentoscriados entre as categorias de um sistema de cabeçalhos de assunto não pode ser consideradasignificante ou portadora de informação. Como exemplo o Cabeçalho de Assunto para Escolas eBibliotecas Públicas (Subject Headings for Schools and Public Libraries) (Fountain, 2001) ilustra afalta de relacionamentos portadores de conhecimento que caracterizam vários sistemas decabeçalho de assunto. O cabeçalho “Rats as carriers of disease” (“Ratos como carregadores dedoenças”) combina dois conceitos mais amplos: “ratos” e “doença”. Embora seja óbvio que“Ratos como carregadores de doenças” seja de alguma forma relacionado tanto a ratos quantodoenças, esse cabeçalho não é um tipo de “Rato” nem um tipo de “Doença”. Uma vez que o valorespecífico de qualquer relacionamento que pode ligar esse cabeçalho aos seus conceitos maisamplos não seja identificado, o relacionamento deve ser fornecido pelo indivíduo se ocabeçalho for ligado de modo significante a outros conceitos no sistema de cabeçalho deassunto. Embora sistemas de cabeçalho de assunto pareçam criar relacionamentos entrecabeçalhos, esses relacionamentos são geralmente descritivos, idiossincráticos, e, às vezes,potencialmente sem significado. Por exemplo o Cabeçalho de Assunto da Biblioteca doCongresso [Library of Congress Subject Headings] (Library of Congress. Cataloging Policy andSupport Office, Library Services, 2002) identifica o assunto “Humanidades” como o termo maisamplo para o cabeçalho “Filosofia”. Ele então passa a listar “Humanismo” como o termo mais
  21. 21. amplo para “Humanidades” e “Filosofia” como o termo mais amplo para “Humanismo”. Assim, asuposta estrutura aninhada é circular: “Filosofia” > “Humanidades” > “Humanismo” > “Filosofia”.Obviamente a ausência de tanto uma linguagem de indexação bem definida ou derelacionamentos significantes e de princípios entre os cabeçalhos de assunto dificulta ahabilidade do sistema de estabelecer um contexto que possa contribuir para a apreensão dainformação. Tal como acontece com a classificação, a comunicação entre o indivíduo e umcabeçalho de assunto tende a ser de apenas um caminho – do sistema para o indivíduo – mas aestrutura sem princípios de vários sistemas de cabeçalhos de assunto e a ausência geral de umaestrutura conceitual prescritiva que pode apoiar as relações portadoras de informação, dificultao potencial para comunicação com significado entre o usuário e o sistema. Essa é uma distinçãoimportante entre sistemas de cabeçalho de assunto e o mais estruturado sistema declassificação que pode ser explicado, em parte, como uma diferença entre os processos deidentificação e predicação. A classificação envolve um processo de identificação (ou definição)de modo a afirmar um relacionamento significante, de um para um entre uma entidade e suaclasse, mas um sistema pré-coordenado de cabeçalhos de assunto envolve um processo depredicação (ou descrição) que permite múltiplas afirmações atribuídas a uma única fonte.Enquanto o sistema baseado em predicação demonstra maior criatividade, flexibilidade ehospitalidade do que a estrutura bem definida de um sistema baseado em identificação, aprópria rigidez do último na verdade apóia a criação e persistência de relacionamentosportadores de informação que são simplesmente impossíveis de existir na estrutura mais soltado primeiro. Sistemas pré-coordenados restringem a comunicação entre o indivíduo e o sistemaatravés do estabelecimento de uma coleção finita de rótulos de classe ou cabeçalhos de assuntoque servem como o conjunto completo de possíveis perguntas de busca e predeterminam acomposição de conjuntos de recuperação. Ao contrário disso, sistemas pós-coordenados nãopredeterminam nem as questões nem os conjuntos recuperados mas permitem que o indivíduoconstrua suas próprias definições de categorias que podem ser apresentadas ao sistema comoquestões de busca no tempo da recuperação. Descritores representando o conteúdo intelectualde uma fonte são atribuídos pelo indexador no momento da indexação. Durante a recuperação,o indivíduo constrói suas próprias categorias de busca combinando os descritores com lógicaBooleana. Permitindo que o indivíduo crie suas próprias questões, o sistema pós-coordenadoapóia uma forma de comunicação mais interativa entre o pesquisador e o sistema. Na maioriados sistemas pós-coordenados, descritores são atribuídos a partir de vocabulários controlados.Em outros, no entanto, a comunicação entre o indivíduo e o sistema de informação écomplicada pelo fato da linguagem de indexação não existir como vocabulário controlado, masser extraída pelo indexador de termos que ocorrem na fonte que está sendo indexada.Geralmente, entretanto, a geração de definições de categoria como questões de buscas pós-coordenadas são limitadas apenas pelo conjunto de termos individuais que fazem parte dalinguagem de indexação. Embora as fontes que participem em um conjunto de recuperaçãosejam determinadas pela atribuição de descritores do indexador, a comunicação entre o sistema
  22. 22. e o indivíduo é muito maior pela sua habilidade de criar suas próprias questões que irão capturarsua necessidade de informação imediata. Infelizmente, entretanto, a flexibilidade da criação de categoria, como o processocognitivo de categorização, caminha lado a lado com a ausência de relações significativas. Comoacontece com qualquer sistema de informação em texto livre, colocar uma questão a umsistema pós-coordenado simplesmente divide a coleção em dois grupos: o conjunto de fontesno qual os descritores atribuídos que correspondem à consulta e as fontes remanescentes dosquais os descritores não correspondem à consulta. Obviamente, sistemas pós-coordenados,como sistemas de texto livre são simplesmente mecanismos para agrupamento, não sistemas deorganização. Diferentemente de sistemas de texto livre, entretanto, a base para agrupamentoem um sistema pós-coordenado é semântica, não sintática. Embora o sistema pós-coordenadoesteja simplesmente combinando seqüências, o indexador impõe certo nível de controleconceitual por atribuir simples descritores de uma linguagem de indexação que estabelecerelacionamento de índice, de um para um entre um descritor e seu referente. O indivíduo está habilitado a criar categorias de busca únicas e potencialmenteidiossincráticas precisamente porque o sistema em si não estabelece nada além das categoriasmais simples – estas definidas pelos descritores individuais atribuídos por um indexador. Umavez que o sistema não consegue estabelecer um quadro de princípios que prevê oestabelecimento de relações de portadores de informações entre as categorias, o sistema pós-coordenado pode nem criar nem contribuir para um contexto de informação exatamenteporque não há uma estrutura persistente de que poderia apoiar relações significativas entre ascategorias.CONCLUSÃO Essa revisão preliminar das propriedades e características das diferentes abordagenspara a organização, ordenamento ou simplesmente agrupamento das fontes de informação éinsuficiente no que tange a distinções estruturais entre os sistemas de classificação ecategorização e em como essas distinções afetam a interação com os sistemas como umambiente de informação. Por exemplo, em um nível muito superficial, a força da classificação é sua habilidadede estabelecer relacionamentos entre classes que são estáveis e significantes. Mas a rigidez daestrutura que suporta esses relacionamentos tem suas desvantagens correspondentes. Emparticular, sistemas de classificação tradicionais são independentes de contexto: porque osrelacionamentos estabelecidos por classificação são invariantes e persistem ao longo do tempoe espaço, esses sistemas são resilientes ao contexto de uso e restringem severamente ahabilidade individual de comunicação com o sistema de modo significativo e produtivo. Aocontrário disso, sistemas de categorização e especialmente sistemas pós-coordenados, sãoaltamente suscetíveis a - até mesmo dependentes de - contexto imediato. A utilidade dessessistemas como ambientes de informação dependem em última instância de disposições paracomunicação efetiva com o indivíduo. Mas a susceptibilidade e flexibilidade do sistema pós-
  23. 23. coordenado efetivamente proíbem o estabelecimento de relacionamentos significantes porqueas categorias são criadas pelo indivíduo, não pelo sistema, e são portanto passageiras eefêmeras. É importante para filósofos, teóricos e desenvolvedores trabalharem para umentendimento mais aprofundado e abrangente de como a estrutura de um sistema deinformação contribui para o estabelecimento de contexto semântico; como diferentes formas deorganização apóiam a comunicação entre o pesquisador e o sistema; e como estruturasorganizacionais concretas e tipos específicos de relacionamentos contribuem para a produçãode ambientes de informação significante. A busca por explicações adequadas dessas questõesirá contribuir para um entendimento mais profundo das "dinâmicas de informação" (Floridi,2002) e as implicações que a estrutura dos sistemas de informação tem para a composição einteração com os ambientes de informação.AGRADECIMENTOS Gostaria de agradecer a Aaron Loehrlein por sua leitura atenta e comentários nosrascunhos preliminares deste artigo e pelas várias conversas que contribuíram tão ricamente aeste conteúdo teórico. Eu também gostaria de agradecer a Ken Herold por sua leitura muitocuidadosa e perspicaz do rascunho final. Esta exploração do papel da estrutura na geração deum ambiente semanticamente significativo de informação está em seus estágios iniciais, e eugostaria de agradecer ao Ken pela oportunidade de desenvolver estar ideias para apresentaçãoaqui.REFERÊNCIASArmstrong, S. L., Gleitman, L. R., & Gleitman, H. (1983). What some concepts might not be.Cognition, 13, 263–308.Barsalou, L. W. (1987). The instability of graded structure: Implications for the nature ofconcepts. In U. Neisser (Ed.), Concepts and conceptual development: The ecological and intellectualfactors in categorization (pp. 101–140). Cambridge: Cambridge University Press.Bateson, G. (1979). Mind and nature: A necessary unity. New York: Dutton.Brown, R. (1979). Cognitive categories. In R. A. Kasschau & C. N. Cofer (Eds.), Psychology’ssecond century: Enduring issues (pp. 188–217). New York: Praeger.Clark, A. (1997). Being there: Putting brain, body, and world together again. Cambridge, MA: MIT Press.Floridi, L. (2002). What is the philosophy of information? Metaphilosophy, 33(1/2). RetrievedAugust 20, 2003, from http://www.wolfson.ox.ac.uk/~floridi/pdf/wipi.pdfFloridi, L. (in press). Open problems in the philosophy of information. Metaphilosophy. Retrieved August20, 2003, from http://www.wolfson.ox.ac.uk/~floridi/pdf/oppi.pdf.
  24. 24. Foucault, M. (1970). The order of things: An archaeology of the human sciences. New York: Vintage Books.Fountain, J. F. (2001). Subject headings for school and public libraries: An LCSH/Sears companion (3rded.). Englewood, CO: Libraries Unlimited.Freyd, J. J. (1983). Shareability: The social psychology of epistemology. Cognitive Science, 7, 191–210.Gardner, H. (1987). The mind’s new science: A history of the cognitive revolution. New York: Basic Books.Hampton, J. A. (1979). Polymorphous concepts in semantic memory. Journal of Verbal Learning andVerbal Behavior, 18, 441–461.Hull, C. L. (1920). Quantitative aspects of the evolution of concepts. Psychological Monographs, 28,Whole No. 123. [Cited in Brown, 1979]Jacob, E. K. (1992). Classification and categorization: Drawing the line. In B. H. Kwasnik &R. Fidel (Eds.), Advances in classification research, Vol. 2. Proceedings of the 2nd ASIS SIG/CRClassification Workshop: Held at the 54th ASIS Annual Meeting, Washington, DC, October 27–31, 1991(pp. 67–83). Medford, NJ: Learned Information.Jacob, E. K. (1994). Classification and crossdisciplinary communication: Breaching the boundariesimposed by classificatory structure. In H. Albrechtson & S. Oernager (Eds.), Knowledge organization andquality management: Advances in knowledge organization, vol. 4 (pp. 101– 108). Frankfurt/Main: IndeksVerlag.Jacob, E. K. (2001). The everyday world of work: Two approaches to the investigation of classification incontext. Journal of Documentation, 57(1), 76–99.Jacob, E. K. (2002). Augmenting human capabilities: Classification as cognitive scaffolding.In M. J. López-Huertas & F. J. Muñoz-Fernández (Eds.), Challenges in knowledge representation andorganization for the 21st century. Integration of knowledge across boundaries: Proceedings of theSeventh International ISKO Conference, 10–13 July 2002, Granada, Spain (pp. 38–44).Würzburg, Germany: Ergon Verlag. Jacob, E. K., & Loehrlein, A. (2003). What ontologies are not: A [draft]theoretical framework for the analysis of representational systems. Paper presented in the SLISColloquium 540 library trends/winter 2004 Series, School of Library and Information Science, IndianaUniversity-Bloomington. Retrieved August 20, 2003, fromhttp://ella.slis.indiana.edu/~aloehrle/repsys.ppt.Jacob, E. K., Mostafa, J., & Quiroga, L. M. (1997). An approach to the evaluation of automatically generatedclassification schemes. In P. Solomon (Ed.), Advances in classification research, Vol. 7. Proceedings of the7th ASIS SIG/CR Classification Workshop: Held at the 59th ASIS Annual Meeting, Baltimore, MD, October20, 1996 (pp. 78–98). Medford, NJ: Information Today.Library of Congress. Cataloging Policy and Support Office. (2002). Library of Congress SubjectHeadings (25th ed.). Washington, DC: Library of Congress, Cataloging Distribution Service.Markman, E. M. (1989). Categorization and naming in children: Problems of induction. Cambridge, MA:MIT Press.Mayr, E. (1982). The growth of biological thought: Diversity, evolution, and inheritance. Cambridge, MA:Harvard University Press.McCloskey, M. E., & Glucksberg, S. (1978). Natural categories: Well defined or fuzzy sets?Memory and Cognition, 6(4), 462–472.Rips, L. J., Shoben, E. J., & Smith, E. E. (1973). Semantic distance and the verification of semantic relations.Journal of Verbal Learning and Verbal Behavior, 12, 1–20.
  25. 25. Rosch, E. (1973). Natural categories. Cognitive Psychology, 4(3), 328–350.Rosch, E. (1975). Cognitive representations of semantic categories. Journal of ExperimentalPsychology: General, 104, 192–233.Rosch, E., & Mervis, C. B. (1975). Family resemblances: Studies in the internal structure ofcategories. Cognitive Psychology, 7(4), 573–605.Rosch, E., Mervis, C. B., Gray, W., Johnson, D., & Boyes-Braem, P. (1976). Basic objects innatural categories. Cognitive Psychology, 8(4), 382–439.Shera, J. H. (1951/1965). Classification as the basis of bibliographic organization. In Librariesand the organization of knowledge (pp. 77–96). Hamden, CT: Archon. (Reprinted fromBibliographic organization, pp. 72–93, 1951, Chicago, IL: University of Chicago Press)Shera, J. H. (1953/1965). Classification: Current functions and applications to the subjectanalysis of library materials. In Libraries and the organization of knowledge (pp. 97–111).Hamden, CT: Archon. (Reprinted from The subject analysis of library materials, pp. 29–42,by M. F. Tauber, Ed., 1953, New York: Columbia School of Library Science)Shera, J. H. (1956/1965). Putting knowledge to work. In Libraries and the organization of knowledge (pp.51–62). Hamden, CT: Archon. (Reprinted from Special Libraries, 47, pp. 322–326, 1956)Shera, J. H. (1960/1965). What lies ahead in classification. In Libraries and the organization ofknowledge (pp. 129–142). Hamden, CT: Archon. (Reprinted from Proceedings of the AllertonPark Institute, pp. 116–128, 1960, Champaign: University of Illinois Bookstore)Smith, E., & Medin, D. (1981). Categories and concepts. Cambridge, MA: Harvard University Press.Soergel, D. (1985). Organizing information: Principles of data base and retrieval systems. Orlando, FL:Academic Press.Taylor, J. R. (1989). Linguistic categorization: Prototypes in linguistic theory. Oxford: Clarendon Press.Zerubavel, E. (1993). The fine line: Making distinctions in everyday life. Chicago, IL: University of ChicagoPress.Referência do artigo:JACOB, E. K. Classification and Categorization: a Difference that Makes a Difference. Library Trends, V. 52,n. 3, 2004. p. 515-540.

×