Ao definir a lei “A Biblioteca é um Organismo em Crescimento”, Ranganathan procurou descrever como uma biblioteca poderia crescer fisicamente vislumbrado a possibilidade do conhecimento não mais ser transmitido apenas através de livros, ideia que veio a se tornar realidade com o surgimento das tecnologias de informação e comunicação resultando em novos paradigmas informacionais como a desmaterialização e o reconhecimento de novos suportes de informações acarretando a necessidade de domínio de ferramentas como as ontologias que auxiliem nos processos de organização e representação de grande quantidade de conhecimentos dispersos e relacionados. O trabalho apresenta os conceitos de ontologia e relaciona-os com a área de Organização e Representação do Conhecimento (ORC), em especial aos Requisitos Funcionais para Registros Bibliográficos (FRBR). O trabalho pode ser classificado da seguinte forma: quanto à sua natureza, caracteriza-se como uma pesquisa aplicada. Pela perspectiva da forma de abordagem do problema, trata-se de uma pesquisa qualitativa. Do ponto de vista de seus objetivos, classifica-se como uma pesquisa exploratória. Quanto aos aspectos técnicos, apresenta-se como uma pesquisa experimental. A pesquisa foi dividida em duas etapas: levantamento bibliográfico interdisciplinar sobre organização e representação de conhecimento e o desenvolvimento de um protótipo de ontologia inspirada no modelo conceitual dos Requisitos Funcionais para Registros Bibliográficos. Conclui-se que a construção de ontologias por profissionais da área e biblioteconomia e ciência da informação pode ser considerada natural, uma vez que as atividades por eles desempenhados são importantes para garantir a máxima expressividade na representação de um domínio do conhecimento em uma ontologia e as práticas biblioteconômicas como a Indexação contribuem para a análise do domínio escolha dos termos de interesse da ontologia, a Classificação e o conhecimento de construção de Linguagens Documentárias (LD) para a construção da estrutura da ontologia, a Representação Bibliográfica para a determinação dos atributos e relações entre as classes.
Uma Ontologia de Domínio para Biblioteconomia com Base nos FRBR
1. ONTOLIS: um protótipo de ontologia a
partir dos FRBR
Trabalho de conclusão de curso apresentado como requisito parcial
para a obtenção do título de Bacharel em Biblioteconomia e Ciência
da Informação pela Universidade Federal de São Carlos
Orientador: Prof. Dr. Rogério Ap. Sá Ramalho
Universidade Federal de São Carlos
2. Introdução
Não podemos antever quais outras
etapas de evolução ainda existem para
este ORGANISMO EM CRESCIMENTO –
a biblioteca. Quem sabe se não virá
um dia em que a disseminação do
conhecimento, que é a função
essencial da biblioteca, se fará por
meios diferentes do livro impresso?
(RANGANATHAN, 2009, p. 262) .
3. Problema de
Pesquisa
Seria possível as ontologias
serem utilizadas para o
aperfeiçoamento dos
processos de registro,
organização, armazenamento,
seleção e recuperação de
recursos bibliográficos?
4. Objetivo Geral
O objetivo geral desse trabalho foi o de construir uma
ontologia no domínio na área de biblioteconomia e Ciência
da Informação, que possa contribuir para o
aperfeiçoamento dos processos de análise, registro,
organização, armazenamento, seleção e recuperação de
recursos bibliográficos.
5. Objetivos Específicos
• Analisar as contribuições teórico-metodológicas da área de Ciência da
Informação para a atividade de desenvolvimento de ontologias.
• Identificar ferramentas, técnicas, tecnologias e metodologias utilizadas
para o desenvolvimento de ontologias;
• Descrever as etapas e conhecimentos necessários para a elaboração de
uma ontologia de domínio na área de biblioteconomia e Ciência da
Informação.
6. Justificativa
• Novos paradigmas: desmaterialização e novos suportes de
informações.
• Necessidades dos usuários. Qualquer pessoa pode ser
consumidora e produtora de enormes quantidades de
informações.
• Grande quantidade de dados na internet.
Isto acarreta a necessidade de domínio de ferramentas como as
ontologias.
7. Classificação
da Pesquisa
Quanto a Pode ser classificado
como
Pois
Natureza Pesquisa Aplicada Visa gerar conhecimentos para
aplicação prática, dirigidos à
solução de problemas
específicos.
Forma de
abordagem
do problema
Pesquisa Qualitativa Está pautada em análises e
interpretação de conteúdo.
Objetivos Pesquisa Exploratória Busca proporcionar maior
familiaridade com o problema
com vistas a torná-lo explícito
e construir hipóteses.
Aspectos
Técnicos
Pesquisa Experimental Busca estabelecer relações de
causa-efeito nas variáveis
investigadas.
8. Etapas da Pesquisa
Etapa Descrição
Levantamento
Bibliográfico
Levantamento bibliográfico
sobre Organização e
Representação de Informações e
Ontologias buscando a definição
do referencial teórico da
pesquisa
Desenvolvimento
de um Protótipo
Protótipo de ontologia de
domínio da área de
Biblioteconomia e Ciência da
Informação, baseando-se no
método proposto por Ramalho
(2010) para a construção de
ontologias no âmbito da área de
Ciência da Informação.
9. Ontologias na
Biblioteconomia e Ciência
da Informação
• Etimologicamente ontologia é o resultado da
junção de dois termos gregos: “onto” (entes) e
“logos” (teoria, discurso, palavra), ou em outras
palavras, o estudo dos entes.
• [...] um artefato tecnológico que possibilita
representar formalmente as propriedades e
relacionamentos de um determinado modelo
conceitual, favorecendo a utilização de
inferências automáticas nos processos de
organização e recuperação de recursos
informacionais (RAMALHO, 2010).
• As ontologias apresentam-se como relevante
instrumento auxiliar para a organização e
representação do conhecimento (ORC) através
da representação formal e tratamento de
grandes bases de dados processáveis por
sistemas computacionais.
10. Organização e Representação
do Conhecimento
O trabalho biblioteconômico, em termos
simples, consiste em organizar, tratar e
disseminar conhecimentos registrados para
diferentes universos de usuários, a partir dos
interesses, necessidades, demandas e
potencialidades de cada um desses universos.
(MEY; SILVEIRA, 2009).
organized
11. Requisitos Funcionais para
Registros Bibliográficos
FRBR
• […] primeiro, fornecer um quadro estruturado,
claramente definido, para relacionar dados
registrados em registros bibliográficos às
necessidades dos usuários destes registros. O
segundo objetivo é recomendar um nível básico de
funcionalidade para registros criados por entidades
bibliográficas nacionais. (IFLA, 2008).
• Utilizar os dados para encontrar materiais que
correspondem aos declarados critérios do usuário
da pesquisa.
• Utilizando os dados recuperados para identificar
uma entidade.
• Utilizar os dados para selecionar uma entidade que
é apropriado para as necessidades do usuário.
• Utilização dos dados a fim de adquirir ou obter
acesso à entidade descrita.
Segundo Tillett (2004), os FRBR reconhecem a
importância do usuário ser capaz de, entre outras
tarefas, navegar pelos recursos permitindo o uso
integral dos recursos disponíveis, de acordo com as
necessidades do usuário.
12. Indexação, Classificação e
Linguagens
Documentárias.
A representação documentária
é obtida por meio de um
processo que se inicia pela
análise do texto, com o objetivo
de identificar conteúdos
pertinentes em função das
finalidades do sistema - e da
representação desses
conteúdos - numa forma
sintética, padronizada e
unívoca. (CINTRA et al., 2002,
p. 35)
13. Indexação, Classificação e
Linguagens
Documentárias. A ontologia é obtida por meio
de um processo que se inicia
pela análise de um domínio do
conhecimento, com o objetivo
de identificar termos
representativos dos conceitos
pertinentes em função das
finalidades do sistema - e da
representação desses conceitos
- numa forma sintética,
padronizada e unívoca.
(adaptado de CINTRA et al.,
2002, p. 35)
14. RAZÕES PARA UTILIZAÇÃO
DE ONTOLOGIAS
• Compartilhar entendimento da
estrutura de informação entre as
pessoas ou agentes de software
• Para permitir a reutilização do
conhecimento de um domínio
• Para fazer suposições explícitas em
um domínio
• Para separar o conhecimento do
domínio do conhecimento
operacional
• Analisar o conhecimento de um
domínio
17. Metodologia para
construção de
Ontologias
(RAMALHO, 2010)
Identificação do domínio e
escopo da ontologia
Verificação de
possibilidades de reuso
Levantamento de termos
e conceitos
Definição dos
componentes estruturais
Formalização de axiomas e
regras
Implementação
Avaliação e
Documentação
18. Entidades FRBR
Classe Subclasse Definição
Product Engloba as classes que representam os produtos de
trabalho intelectual ou artístico. Na Ontologia proposta
representa o Grupo 1.
Work Uma entidade abstrata. Uma criação intelectual ou
artística.
Expression A realização de uma obra distinta.
Manifestation A incorporação física de uma expressão de uma obra.
Item Um exemplar único de uma manifestação.
Responsible Engloba as classes que representam os responsáveis pelos
trabalhos intelectuais ou artísticos representados no Grupo
1. Na Ontologia proposta representa o Grupo 2.
Person Pessoa responsável pelo conteúdo intelectual ou artístico,
pela produção física e disseminação ou pela guarda das
entidades do Grupo 1.
CorporateBody Organização responsável pelo conteúdo intelectual ou
artístico, pela produção física e disseminação ou pela
guarda das entidades do Grupo 1.
Subject Engloba as classes que representam assuntos. Na
Ontologia proposta representa o Grupo 3.
Concept Uma variedade de abstrações que podem ser objeto de um
Obra: áreas do conhecimento, disciplinas, escolas de
pensamento (filosofia, religiões, ideologias políticas),
teorias, processos, técnicas, práticas, etc.
Object Uma variedade de coisas materiais que podem ser objetos
de uma Obra: objetos animados e inanimados que ocorrem
na natureza, objetos fixos, móveis e objetos em
movimento.
Event Ações e ocorrências que podem ser objeto de uma Obra:
acontecimentos históricos, épocas, período de tempo.
Place Abrange uma gama completa de localidades: terrestres e
extraterrestres, históricas e contemporâneas,
características geográficas e jurisdições geopolíticas.
20. Representação da Obra
Dom Casmurro de
Machado de Assis nos
FRBR
É possível perceber
imediatamente um dos
benefícios do uso dos
FRBR: a clareza como cada
“conceito” relacionado à
obra Dom Casmurro é
organizada trazendo
maior facilidade para o
usuário na busca e
recuperação de um item
de sua necessidade.
23. Considerações Finais
Biblioteconomia Ontologia
Indexação Análise do domínio
escolha dos termos
Classificação Construção da estrutura
da ontologia
Linguagens
Documentárias
Relações Entre Classes e
Indivíduos
Representação
Bibliográfica
Determinação dos
atributos e relações entre
as classes
Pode ser utilizado para
auxiliar nas atividades
de organização de
recursos bibliográficos.
Atividade Natural para
Bibliotecários com
objetivo de prover
acesso, organizando
domínios do
conhecimento
O que falta Para quê?
Aprofundamento em
Lógica Descritiva
Axiomas e Regras
Este estudo se justifica na medida em que o surgimento das tecnologias de informação e comunicação resultam em novos paradigmas informacionais, quais sejam, a desmaterialização e o reconhecimento de novos suportes de informações. Somado a esses fatores, a internet, mais especificamente, a World Wide Web (Web), tem permitido que qualquer pessoa seja consumidora e produtora de enormes quantidades de informações. Isto acarreta a necessidade de domínio de ferramentas - como por exemplo o objeto deste estudo, as ontologias - que auxiliem os processos de organização e representação de grande quantidade de conhecimentos dispersos, porém relacionados, suprindo as novas necessidades dos usuários das bibliotecas com informações de maior relevância.
Quanto à sua natureza, caracteriza-se como uma pesquisa aplicada, pois visa gerar conhecimentos para aplicação prática, dirigidos à solução de problemas específicos.
Pela perspectiva da forma de abordagem do problema, trata-se de uma pesquisa qualitativa, pois está pautada em análises e interpretação de conteúdo.
Do ponto de vista de seus objetivos, classifica-se como uma pesquisa exploratória, pois busca proporcionar maior familiaridade com o problema com vistas a torná-lo explícito e construir hipóteses.
Quanto aos aspectos técnicos, apresenta-se como uma pesquisa experimental, pois busca estabelecer relações de causa-efeito nas variáveis investigadas, viabilizando a descoberta de novos métodos, identificando aproximações entre os instrumentos convencionais de representação de informações, tais como as linguagens documentárias e os padrões de metadados com as novas tecnologias semânticas.
A pesquisa foi dividida em duas etapas: inicialmente foi realizado um levantamento bibliográfico interdisciplinar sobre organização e representação de informações buscando a definição do referencial teórico da pesquisa. A segunda etapa teve como foco o desenvolvimento de um protótipo de ontologia de domínio da área de Biblioteconomia e Ciência da Informação, baseando-se no método proposto por Ramalho (2010) para a construção de ontologias no âmbito da área de Ciência da Informação.
Identificamos na literatura científica e em outras fontes de informações outros vocabulários ou ontologias que poderiam ser utilizados numa situação de uso profissional, como por exemplo, o MarcOnto, Jerome DL, The Semantic Publishing and Referencing Ontologies (SPAR), The Simple Knowledge Organization System (SKOS), Dublin Core entre outros. No entanto, por se tratar de um trabalho acadêmico, optamos por desenvolver uma Ontologia a partir do início para um melhor entendimento do processo de desenvolvimento e construção de ontologias.
Após o levantamento de termos e conceitos realizado, buscou-se definir as propriedades e relacionamentos da ontologia a partir da terminologia empregada tradicionalmente na área de Biblioteconomia, evitando problemas com polissemia e redundâncias. Neste momento, buscamos inserir “inteligência” na Ontologia.
Os axiomas e regras neste trabalho foram elaborados para atender às tarefas dos usuários em um ambiente que tem por base os FRBR. Neste sentido, foram definidas regras e axiomas limitados às Propriedades Restritivas e também em Domains (domínios) e Ranges (escopo) de uma propriedade “É importante perceber que Domains e Ranges não devem ser vistas como restrições a serem verificados. Eles são usados como "axiomas" no motor de inferência.” (HORRIDGE et al., 2007, tradução nossa)
Para a implementação da ontologia foi utilizada a Plataforma de Desenvolvimento de Ontologias Protégé em sua versão 4.3.0 (Build 304) pelo fato do ambiente contemplar as ferramentas necessárias para a construção, teste, manutenção e documentação da ontologia. A linguagem escolhida foi a OWL-DL/XML pela maior aderência aos padrões da W3C e para manter a completude e decidibilidade computacional. O motor de inferência escolhido foi o FaCT++ por se encontrar implementado por padrão na ferramenta Protégé.
A documentação foi elaborada à medida em que a ontologia foi sendo desenvolvida, utilizando a ferramenta OWLDoc que gera automaticamente, baseado nas informações registradas no Protégé, a documentação em formato de publicação em ambientes Web.
A ontologia desenvolvida, foi denominada inicialmente como ONTOLIS, e tem como objetivo aplicar os conceitos expostos durante o curso de graduação, mais especificamente os relacionados aos sistemas de representação temática e descritiva.
O Consórcio World Wide Web (W3C) é um consórcio internacional no qual organizações filiadas, uma equipe em tempo integral e o público trabalham juntos para desenvolver padrões para a Web. Liderado pelo inventor da web Tim Berners-Lee e o CEO Jeffrey Jaffe, o W3C tem como missão Conduzir a World Wide Web para que atinja todo seu potencial, desenvolvendo protocolos e diretrizes que garantam seu crescimento de longo prazo.
Motor de inferência é uma ferramenta computacional utilizada em sistemas especialistas de inteligência artificial. O motor de inferência contém fatos e regras conhecidos sobre uma área de especialização; ele compara as entradas com esses fatos e regras, e deriva inferências (conclusões).
FaCT++ é um motor de inferência (reasoner), desenvolvido na linguagem C++ .
As ontologias apresentam-se como relevante instrumento auxiliar para a organização e representação do conhecimento (ORC) através da representação formal e tratamento de grandes bases de dados – tarefa que levaria grande quantidade de tempo se feita por humanos permitindo aos sistemas computacionais realizarem inferências que auxiliem na recuperação e processamento de informações.
Introdução – Conhecimento Organizado em Informações Acessíveis
Falar sobre
Flar sobre importância de indexação, Classificação e LD
Um importante elemento das ontologias é a representação do conhecimento, que envolve análise semântica, em especial para a organização de sistemas de conhecimento que, nas ontologias, visam otimizar a recuperação, ou seja, prover o computador de mais inteligência. Trata-se de uma área de pesquisa estreitamente ligada à organização do conhecimento [...]
Flar sobre importância de indexação, Classificação e LD
Um importante elemento das ontologias é a representação do conhecimento, que envolve análise semântica, em especial para a organização de sistemas de conhecimento que, nas ontologias, visam otimizar a recuperação, ou seja, prover o computador de mais inteligência. Trata-se de uma área de pesquisa estreitamente ligada à organização do conhecimento [...]
Há três espécies de linguagens OWL:
OWL Lite: suporta necessidades simples de classificação de uma hierarquia. Possui baixo nível de expressividade e sua principal função é fornecer um caminho mais simples para migração rápida de Thesaurus e Taxonomias.
OWL DL: suporta máxima expressividade sem perda de completude computacional e capacidade de tomada de decisão quando utilizado em motores de inferência. OWL DL possui esta denominação por sua correspondência com a Lógica Descritiva (DL), um fragmento da lógica de primeira ordem que, por possuir sintaxe mais simples, possui propriedades desejáveis em aplicações computacionais.
OWL Full: suporta máxima expressividade e máxima liberdade sintática sem garantias computacionais. Não é possível realizar inferências quando utilizadas.
Identificação do domínio e escopo da ontologia: Nesta etapa busca-se identificar claramente o propósito da ontologia e as potencialidades oferecidas a partir de sua utilização, delineando o domínio pretendido e níveis de representação;
Verificação de possibilidades de reuso: Analisar possíveis ontologias e demais instrumentos de representação que possam ser reutilizados ou mesmo servir como substratos teóricos para a modelagem da ontologia, potencializando aspectos de interoperabilidade;
Levantamento de termos e conceitos: Identificar a terminologia utilizada para a representação dos componentes na ontologia, evitando problemas com polissemia e redundâncias;
Definição dos componentes estruturais: Definir os componentes estruturais da ontologia, categorizando a hierarquia de classes e identificando as respectivas propriedades descritivas e relacionais.
Formalização de axiomas e regras: Descrever formalmente os axiomas e regras da ontologia, possibilitando o processamento das restrições e a realização de inferências de forma automática.
Implementação: Definir as tecnologias e linguagens computacionais que serão utilizadas para implementar e dar suporte ao desenvolvimento da ontologia.
Avaliação e Documentação: Fazer julgamentos de cada uma das etapas da modelagem e dos resultados potenciais da utilização da ontologia, de acordo com os objetivos propostos, e documentar todos os componentes e tarefas desenvolvidas.
Falar sobre os grupos
As entidades do primeiro grupo representam os diferentes aspectos de interesses dos utilizadores dos produtos de esforço intelectual ou artística. As entidades definidas como “Obra” (a criação intelectual ou artística distinta) e “Expressão” (a realização intelectual ou artístico de uma obra) refletem o conteúdo intelectual ou artístico. As entidades definidas como “Manifestação” (a forma de realização física de uma expressão de um trabalho) e “Item” (um único exemplar de uma manifestação), por outro lado, refletem a forma física.
As entidades do segundo grupo representam os responsáveis pelo conteúdo intelectual ou artístico, a produção física e disseminação, ou a custódia das entidades do primeiro grupo. As entidades do segundo grupo incluem pessoa (uma pessoa) e pessoa jurídica (uma organização ou grupo de indivíduos e / ou organizações). (IFLA, 2008, p. 14, tradução nossa)
As entidades do terceiro grupo representam um conjunto adicional de entidades que servem como assuntos de obras. O grupo inclui conceito (uma noção abstrata ou idéia), objeto (uma coisa material), evento (uma ação ou ocorrência) e lugar (a localização). (IFLA, 2008, p. 17, tradução nossa)
Registro MARC de autoridade
A construção de ontologias por profissionais da área e biblioteconomia e ciência da informação de certa forma pode ser considerada natural, uma vez que as atividades por eles desempenhados são importantes para garantir a máxima expressividade na representação de um domínio do conhecimento em uma ontologia.