1. O documento define termos e conceitos relacionados a bibliotecas digitais, bases de dados e sistemas de recuperação da informação. 2. Apresenta as características e tipos de bases de dados, incluindo bases referenciais e de fontes. 3. Discutem os processos de representação, armazenamento e recuperação da informação em bases de dados, assim como operações e recursos de busca.
5. 5
1. DISPOSIÇÕES PRELIMINARES.
1.1. DEFINIÇÕES.
1.1.1. ARQUIVO: é a coleção de registros similares com relações entre
si. As relações entre os registros podem ser do tipo arquivo-
invertido ou listas enlaçadas unidirecionalmente.
1.1.2. BASES DE DADOS: são um conjunto estruturado de arquivos,
registros e metadados, e que possuem algum tipo de arquitetura
de busca da informação.
1.1.3. BIBLIOTECA DIGITAL: é a curadoria de acervos digitais feita por
bibliotecários. Também podem ser chamadas de repositórios
institucionais, mas jamais, de repositórios temáticos.
1.1.4. BIBLIOTECA VIRTUAL: é o acervo digital gerenciado por bibliote-
cários e que possui serviços informacionais que caracterizem o
espaço virtual mais importante do que o físico.
1.1.5. BIBLIOTECA ELETRÔNICA: é o conjunto de tecnologias utilizadas
para gerenciar e automatizar acervos e bibliotecas. Todas as
interfaces, padrões, requisitos, normas e protocolos utilizados
para implementar o Sistema de Gerenciamento de Bibliotecas.
1.1.6. DUBLIN CORE: é o padrão de metadados voltado para a des-
crição e descoberta de recursos na internet. Possui um vocabu-
lário controlado padronizado correspondente a 15 elementos de
dados, que servem para descrever recursos web, como páginas
HTML.
1.1.7. INTEROPERABILIDADE: são tecnologias, normas, padrões, regras
e protocolos que permitem uma organização e representação da
informação de modo que se possa ser compartilhada entre insti-
tuições cooperantes.
1.1.8. INTERFACE: Abordagem baseada em uma interface faz a media-
ção entre vários tipos de recursos de trabalho em grupo utilizan-
do a Internet como meio de comunicação.
1.1.9. METADADO: requer um contexto mais especializado de dados.
Os registros bibliográficos podem conter: campos de tamanho
fixo, variável e chaves de busca.
6. 6
1.1.10. MIDDLEWARE: É proposta a integração de sistemas de biblio-
tecas digitais, procurando integrar diversos protocolos de uso
corrente a partir de um middleware, chamado SDLIP – Simple
Digital Library Interoperability Protocol.
1.1.11. MODELO DE DADOS (FORMATO DE DADOS): especifica as
regras segundo as quais os dados são estruturados, bem como as
operações correlatas são permitidas. Pode também ser visto
como uma técnica para a descrição formal de dados, relações
entre eles e limitações de uso.
1.1.12. PADRÃO BRASILEIRO DE DESCRIÇÃO DE TESES E DISSER-
TAÇÕES MTD-BR: é o padrão criado pelo IBICT e utilizado nos
primeiros repositórios de teses e dissertações brasileiras. É
superconjunto do padrão ETD-MS.
1.1.13. PADRÃO ETD-MS: Electronic Theses and Dissertations Meta-
data Set é o superconjunto de metadados para teses e disser-
tações utilizando-se do Dublin Core.
1.1.14. REGISTRO: é a informação contida na base de dados e que diz
respeito a um item. Os registros bibliográficos podem ser um
tipo de metadados.
1.1.15. REQUISITO FUNCIONAL: é o requisito indispensável para
definição, escolha ou utilização de um sistema ou tecnologia.
1.1.16. REQUISITO NÃO-FUNCIONAL: é o requisito dispensável,
embora possa ser desejável ao sistema ou tecnologia.
1.1.17. SISTEMA DE GERENCIAMENTO DE BASES DE DADOS SGBD: é
a composição política de metadados, formatos de dados,
interoperabilidade, interface tecnológica e processos de recu-
peração da informação.
1.1.18. SISTEMA DE GERENCIAMENTO DE BIBLIOTECAS SGB: é o sis-
tema especialista em que são dispostos módulos e interfaces
para o gerenciamento das operações de uma biblioteca.
1.1.19. W3C: O World Wide Web (W3C) é um consórcio internacional
no qual organizações filiadas, uma equipe em tempo integral e o
público trabalham juntos para desenvolver padrões para a Web.
Pode ser visualizado em http://www.w3c.com.
7. 7
2. BASES DE DADOS.
2.1. DEFINIÇÃO.
2.1.1. A base de dados é uma coleção de arquivos, registros e meta-
dados sistematizados de maneira relacional e não-redundantes,
permitindo consistência. As bases de dados podem ser do tipo
referenciais ou de fontes.
2.1.1.1. As bases de dados referenciais contém dados para descrição
de acervos e outros tipos de dados que encontram-se fora da
base de dados. Elas podem ser:
Bibliográficas (índices e resumos) – muitas vezes, as bases são
versão eletrônica dos periódicos de indexação e resumo, con-
tendo citações bibliográficas e outros campos adicionais.
Catalográficas (catálogos) - outros tipos de bases de dados
bibliográficas são os catálogos de bibliotecas e as bases de dados
produzidas pelas redes de catalogação cooperativa.
Referenciais (cadastros diversos). Os diretórios são aqui conside-
rados como uma opção por Oliveira (2005), sendo bases de da-
dos que contém dados cadastrais sobre pessoas, instituições,
softwares, etc.
2.1.1.2. As bases de dados de fontes contém dados ou textos inte-
grais, e podem ser do tipo:
Numéricas - contêm dados numéricos e séries estatísticas. In-
cluem bases de dados em áreas científicas e de negócios (por
exemplo, dados e indicadores econômicos e financeiros, estatís-
ticas de censo etc.).
Texto integral - contêm textos completos de um documento (por
exemplo, leis, decisões judiciais, artigos, jornais, manuais, rela-
tórios anuais de empresas etc.).
Texto e número;
Multimídia - contêm, sob a forma gráfica, fórmulas químicas,
imagens de logotipo, desenhos, vídeos ou figuras.
Bases de Dicionários - contêm manuais, dicionários de termos,
definições, nomenclaturas químicas, propriedades físicas etc.
8. 8
2.2. RECUPERAÇÃO DA INFORMAÇÃO.
2.2.1. A Recuperação da Informação RI se dá pela comparação do que
solicitou com o que está armazenado, bem como com o conjunto
de procedimentos que o processo envolve (BELKIN; CROFT, 1987
apud ARAÚJO JÚNIOR, 2007).
2.2.2. O Processo de Busca e Recuperação da Informação PBRI pode
ser conceituado como a ação de localizar documentos e itens de
informação que tenham sido objeto de armazenamento, com a
finalidade de permitir acesso dos usuários aos itens de infor-
mação, objetos de uma solicitação.
2.2.3. As bases de dados viabilizam o Sistema de Recuperação da
Informação SRI, que possui três tarefas:
a) REPRESENTAÇÃO – por meio de descrição e indexação.
b) ARMAZENAMENTO – por meio da gestão física e lógica da
base de dados.
c) RECUPERAÇÃO – de forma a satisfazer as necessidades de
informação dos usuários por meio de uma interface de busca.
2.2.4. A forma mais rudimentar de busca em Base de Dados é per-
correr registro por registro à procura do item apropriado.
Porém, algumas bases possuem centenas de milhares de regis-
tros, o que inviabiliza essa técnica. As formas de recuperação da
informação para as bases de dados são:
a) Listas enlaçadas unidirecionalmente;
b) Busca em linha ou arquivo invertido;
c) Processamento de transações (query);
d) Buscas textuais e mineração de textos.
2.2.5. Os rudimentos da técnica de recuperação da informação foram
as listas enlaçadas unidirecionalmente (unitermo), na qual, cada
registro vincula-se a um apontador como resposta ao campo-
chave. Esta técnica possibilitou os primeiros estudos metodo-
lógicos da qualidade de um PBRI.
9. 9
2.2.6. O arquivo invertido, porém, é similar a um índice, pode haver
dois ou três arquivos separados. Cada termo é acompanhado de
informações sobre sua frequência de ocorrência na base de
dados, o arquivo onde se acha localizado, o registro no qual se
insere e outras informações de localização.
2.2.7. Para recuperar dados específicos, basta especificar as restrições
necessárias aos campos de pesquisa e codificá-las numa questão
ou query (argumento de entrada no sistema) para que se tenha a
resposta exata, em busca completa e exaustiva (SOUZA, 2006).
2.2.8. As Chaves de Recuperação em Bases de Dados podem ser:
2.2.8.1. Chaves de Recuperação Primária: são mecanismos que prio-
rizam a recuperação de autor, título, termos de indexação.
2.2.8.2. Chaves de Recuperação Secundária: especificadores na re-
cuperação de dados como idioma, descrição física, etc.
2.2.9. A estrutura lógica da integração de várias bases de dados pode
dispô-las de forma hierárquica (árvore), em rede (vínculos) ou
por arranjos relacionais.
10. 10
2.3. OPERAÇÕES DE BUSCA.
2.3.1. A lógica de busca permite a inclusão no enunciado de buscas de
todos os termos relacionados em combinação aceitável e
inaceitável de termos de buscas.
2.3.2. Combinando-se os operadores booleanos disponíveis (AND, OR e
AND NOT) podem-se criar demais operadores lógicos, como, por
exemplo, o OR EXCLUSIVO. Este operador restringe a busca em
registros que tenham o termo A ou o termo B, mas não A e B
simultaneamente.
(Rowley, 2002)
11. 11
2.3.3. São recursos de busca em uma base de dados:
RECURSO FUNÇÃO
Recursos de configuração,
p. ex., ajuda, notícias, saída
do sistema.
Configura o ambiente
Seleção dos
termos de busca.
Permite a quem faz a busca identificar
possíveis termos de busca ao examinar
listas de termos de indexação ou tesauros
Entrada de
termos de busca
Permite a quem faz a busca inserir os
termos de busca
Combinação dos
termos de busca.
Permite o desenvolvimento de estratégias
de busca com o emprego da lógica de
busca
Especificação de campos.
Permite escolher os campos nos quais
aparecem termos de busca
Truncamento.
Permite que as buscas sejam feitas em
cadeias de caracteres que não formam
palavras completas
Buscas por proximidade,
adjacências e contextos.
Requer que as palavras estejam em
determinado contexto
Buscas e limitação de
amplitude.
Realiza buscas numa faixa de amplitude
Consultas conjugadas ou
combinadas
Agrega os resultados de buscas de grandes
conjuntos de acervos dispersos de
documentos
12. 12
2.3.4. São recursos de exibição que facilitam encontrar a informação:
RECURSO FUNÇÃO
Exibição dos resultados de
busca.
Mostra ao usuário quantos documentos e
referências com os termos de busca foram
encontrados
Exibição dos registros. Mostra os registros na tela
Gerenciamento das buscas. Permite rever as buscas feitas
Opções avançadas de
exibição.
Para comportar registros em bases de
dados de texto integral
Exibição do tesauro.
Exibe os termos controlados de indexação
e as relações entre os termos
Hipervínculos
Permite aos usuários navegar entre ocor-
rências de termos em diferentes registros
ou entre conceitos interligados por víncu-
los de hipermídia
13. 13
2.4. MANIPULAÇÃO DOS REGISTROS.
2.4.1. Dentre os processos de manipulação dos registros tem-se:
a) MIGRAÇÃO: é a estratégia de preservação que consiste em copiar,
converter e/ou transferir a informação digital de uma plataforma
tecnológica que esta se tornando obsoleta para outra mais atuali-
zada e de uso corrente. O objetivo da migração é preservar a
integridade de objetos digitais enquanto mantém a capacidade do
usuário de recupera-los, exibi-los e utiliza-los face às constantes
mudanças tecnológicas. Veja o item 6.1.2.
b) CONVERSÃO RETROSPECTIVA RECON: difere de migração, pois
consiste na transformação de fichas do catálogo em registros
legíveis por máquina. O princípio do RECON é o aproveitamento de
registros existentes em outras bases na formação da base de dados
local, diminuindo o esforço de catalogar em máquina o material da
biblioteca.
14. 14
2.5. REQUISITOS FUNCIONAIS DAS BASES DE DADOS.
2.5.1. São requisitos funcionais das bases de dados:
Ser não-redundante (consistente);
Ter independência de dados (interoperabilidade);
Ser utilizável por todos os programas;
Possuir inter-relações para variados usos;
Possuir método comum de recuperação, inserção e correção.
2.5.2. São exemplos de requisitos dos sistemas:
2.5.2.1. PROTOCOLOS, MODELOS E VISUALIZAÇÕES
São níveis a serem considerados ao projetar uma solução que
objetiva interoperabilidade. Protocolos formam a infraestrutura base para
ambientes informacionais de rede. A pesquisa, em modelos conceituais,
tem lugar em áreas como recuperação da informação, bibliotecas, bancos
de dados, e trabalho cooperativo em computador e as técnicas de visua-
lização são necessários para mostrar os vários componentes de um
ambiente ao usuário.
2.5.2.2. NORMA ISO 2709
É um formato padrão de comunicação para registros bibliográficos,
utilizado para intercâmbio de registros em meio magnético de um sistema
para outro. A partir de seus padrões estabelecidos se torna possível a
transferência de um item bibliográfico de um sistema ou banco de dados
para outro, sem perda de informações, fazendo com que os dados sejam
independentes de software e hardware, tornando os registros biblio-
gráficos portáveis entre sistemas. Observe o item 5.1.3.
15. 15
2.5.2.3. Z39. 50
Pode ser implementado em qualquer plataforma. Isso significa que
permite a interoperacionalização de diferentes sistemas de computação
com diferentes sistemas operacionais, equipamentos, formas de pesquisa,
sistemas de gerenciamento de bases de dados. Uma implementação
Z39.50 habilita uma interface única para conexão com múltiplos sistemas
de infor-mação, permitindo ao usuário final um acesso quase trans-
parente para outro sistema. Observe o item 5.1.3.
2.5.2.4. OAI-PMH
O Open Archives Initiative Protocol for Metadata Harvesting (OAI-
PMH) é um protocolo desenvolvido pela Open Archives Initiative que
define um mecanismo para coleta de registros de metadados em repo-
sitórios. Este protocolo, dá uma opção simples de técnica para servidores
de dados fazer sua avaliação de serviço para metadados, baseado nas
normas abertas do Hypertext Transport Protocol(HTTP) e Extensible
Markup Language (XML). Observe o item 5.1.2.
2.5.2.5. Formato MARC
É um conjunto de códigos e designações de conteúdos definido para
codificar registros que serão inter-pretados por máquina. Sua principal
finalidade é possibilitar o intercâmbio de dados, ou seja, importar dados
de diferentes instituições ou exportar dados de sua instituição para outros
sistemas ou redes de bibliotecas. Observe o item 5.1.3.
16. 16
3. INTEROPERABILIDADE.
3.4. DEFINIÇÃO.
3.4.1. Segundo a International Standard Organization (ISO), intero-
perabilidade é a habilidade de dois ou mais sistemas, que
podem ser computadores, meios de comunicação, redes de
software e outros componentes de tecnologia da informação,
de interagir e de intercambiar dados a partir de um método
definido, objetivando obter os resultados esperados.
3.4.2. A interoperabilidade é o esforço necessário para se vincular
um sistema a outro, um fator de garantia de qualidade de
software, conjuntamente com: manutenbilidade, porta-
bilidade, integridade e confiabilidade.
3.4.3. Os acordos de cooperação podem ser em três níveis:
O nível técnico proporciona a interoperabilidade tecnológica;
O nível de conteúdo remete à interoperabilidade semântica; e,
O nível organizacional se refere a interoperabilidade política.
3.4.4. Para efeitos da interoperabilidade consideram-se os itens
5.1.1., 5.1.2., e 5.1.3., bem como seus respectivos requisitos
funcionais e não funcionais, a fim de padronização da
cooperação entre unidades de informação.
17. 17
3.5. NÍVEIS DE INTEROPERABILIDADE.
3.5.1. Nível Semântico.
Este nível permite entender o significado de cada elemento des-
critor do recurso em conjunto com as associações nele embutidas.
Segundo Moura (2002), o uso de vocabulários específicos, ontologias e/ou
padrões de metadados é essencial para assegurar esse tipo de intero-
perabilidade. Existem dois subníveis no nível semântico:
Epistemológico: relacionado ao significado dos elementos descri-
tores do formato e das relações nele existentes.
Ontológico: relacionado ao uso de ontologias, vocabulários contro-
lados e padrões de metadados para o estabelecimento dos signifi-
cados dos dados representados.
Como exemplo deste nível de interoperabilidade podem-se destacar
os campos que têm o mesmo significado entre elementos descritivos de
padrões de representação como o MARC21.
3.5.2. Nível Estrutural
Este nível estabelece cada elemento componente de um padrão de
metadados, descreve os seus tipos, a escala de valores possíveis para
esses elementos e os mecanismos utilizados para relacionar esses
elementos de modo que possam ser processados de forma automática.
Como exemplo podem-se destacar os padrões de metadados Dublin Core
(DC) e MARCXML.
3.5.3. Nível Sintático
Barreto (1999, p. 85) afirma que “a sintaxe fornece uma linguagem
comum para representar a estrutura dos metadados”. Este nível de
interoperabilidade define como os metadados devem ser codificados para
a transferência de informação. Ex.: linguagem XML.
18. 18
3.5.4. Ambiente informacional e a Websemântica
o RDF vem sendo indicado e recomendando pelo W3C para a
interoperabilidade na rede, uma vez que, unido aos metadados, ao uso da
linguagem XML e às ontologias, possibilita, de modo flexível, a interope-
rabilidade nos três níveis. A figura abaixo esquematiza a definição de um
esquema para interoperar diversos sistemas utilizando padrões de meta-
dados distintos.
19. 19
3.6. IDADES DA WEB.
3.6.1. 1ª Geração
A primeira geração, baseada na linguagem HTML, tornou possível a
exibição dos documentos independentemente de sua localização física; a
segunda geração possibilitou diferentes formas de apresentação para uma
mesma estrutura de um documento, com base na linguagem XML; a
terceira geração, a da websemântica, consiste na separação do significado
de sua estrutura, isto é, estende a noção de documento com possibilidade
de semântica legível por máquinas. Se a codificação semântica é muito
mais centrada no autor humano [ou inteligência artificial], o computador
pode auto ajudar-se, ajudando o autor a criar tais descrições mais
inteligentes (HYVONEN, 2002 apud FEITOSA, 2006).
3.6.2. 2ª Geração
As informações existentes na web atualmente são apresentadas
(usando-se tecnologias como HTML, PDF e XML, por exemplo) de tal
maneira que possam ser lidas e compreendidas por pessoas. Entretanto,
sem a interpretação de um leitor humano, essas tecnologias nada dizem a
respeito do significado ou do conteúdo de um documento armazenado na
web (FEITOSA, 2006). Quando os usuários da web 2.0 podem participar
das experiências de criação de hipertextos, blogs, assinatura de RSS, wikis
e as redes sociais, confirma a possibilidade de proximidade entre as
pessoas.
3.6.3. 3ª Geração
Segundo o W3C1, a Web Semântica é uma visão para o futuro da
Web, na qual a informação tem um significado explícito, tornando mais
fácil para as máquinas processar e integrar automaticamente informações
disponíveis na Web. A Web Semântica irá desenvolver a capacidade do
XML de definir esquemas de marcação personalizados e a abordagem
1
http://www.w3c.br/Home/WebHome
20. 20
flexível do RDF para representar dados. O primeiro nível acima RDF
necessário para a Web Semântica é uma linguagem de ontologia que pode
descrever formalmente o significado da terminologia usada em docu-
mentos da Web. Se for esperado que as máquinas executem tarefas de
raciocínio úteis nesses documentos, o idioma deve ir além da semântica
básica do esquema RDF. O OWL Use Cases and Requirements Document
fornece mais detalhes sobre ontologias, motiva a necessidade de uma
Web Ontology Language em termos de seis casos de uso e formula metas
de projeto, requisitos e objetivos para OWL.
3.6.4. OWL.
OWL foi projetado para atender a essa necessidade de uma Web
Ontology Language. OWL faz parte das crescentes recomendações do
W3C relacionadas à Web Semântica (W3C, 2017).
OWL acrescenta mais vocabulário para descrever propriedades e
classes: entre outros, relações entre classes (por exemplo, disjunção),
cardinalidade (por exemplo, "exatamente um"), igualdade, digitação mais
rica de propriedades, características de propriedades (por exemplo,
simetria) e classes enumeradas. (W3C, 2017).
21. 21
3.6.5. XML.
O XML fornece uma sintaxe de superfície para documentos
estruturados, mas não impõe restrições semânticas ao significado desses
documentos. XML Schema é um idioma para restringir a estrutura de
documentos XML e também estende XML com tipos de dados (W3C,
2017).
3.6.6. RDF.
RDF é um datamodel para objetos ("recursos") e relações entre eles,
fornece uma semântica simples para este datamodel, e esses datamodels
podem ser representados em uma sintaxe XML. RDF Schema é um
vocabulário para descrever propriedades e classes de recursos RDF, com
uma semântica para hierarquias de generalização de tais propriedades e
classes (W3C, 2017).
22. 22
4. METADADOS.
4.4.1. Metadados são atributos que representam uma entidade
(objeto do mundo real) em um sistema de informação. São
elementos referenciais codificados que representam carac-
terísticas próprias ou atribuídas às entidades; com o intuito
de identificar de forma única uma entidade (recurso infor-
macional) para posterior recuperação.
4.4.2. Os padrões de metadados são estruturas de descrição consti-
tuídas por um conjunto predeterminado de metadados (atri-
butos codificados ou identificadores de uma entidade)
metodologicamente construídos e padronizados. O objetivo
do padrão de metadados é descrever uma entidade gerando
uma representação unívoca e padronizada que possa ser
utilizada para recuperação da mesma.
4.4.3. São exemplos de padrões de metadados:
Directory Interchance Format (DIF) – padrão para criar entradas de
diretórios que descrevem um grupo de dados; Government
Information Locator Service (GILS) – informações governamentais;
Federal Data Geographic Committee (FGDC) – descrição de dados
geoespaciais; Machine Readable Card (MARC) – catalogação biblio-
gráfica; Dublin Core (DC) – dados sobre páginas da Web; Consortium
for the Interchange of Museum Information (CIMI) – informações
sobre museus; Meta Data Interchange Specification (MDIS) - padrão
para troca de metadados entre ferramentas da Tecnologia de Infor-
mação; Open Information Model (OIM) – conjunto de especificações
para facilitar o compartilhamento e reuso no desenvolvimento de
aplicações e data warehouse; Common Warehouse Meta Model
(CWM) – padrão para troca de informações entre esquemas de ban-
co de dados e data warehouse.
23. 23
4.4.4. Dentre os padrões disponíveis na Library of Congress, tem-se:
Resource Description Formats – Standards of Library of Congress
BIBFRAME
Modelo de dados
vinculados (Linked
Data), vocabulário
e ferramentas
para expressar
dados
bibliográficos.
MARCXML
Representação
XML de dados do
MARC 21. É
importante não
confundir este
Standard com o
BIBFRAME, este
que substituirá o
MARC21.
MODS
Marcação XML
para metadados
de registros
MARC 21
existentes e
descrição de
recurso original.
EAD
Marcação XML
projetada para
codificar auxiliares
de localização de
arquivamento.
Fonte: Standards LC.
4.4.5. Metadados são agrupados em estruturas abstratas
conhecidas como esquemas ou formatos de metadados, que
são conjuntos de elementos criados com fins específicos.
Outros exemplos a seguir mostram um pouco dessa
diversidade:
MODS (Metadata Object Description Schema) esquema biblio-
gráfico derivado do MARC 21;
EAD (Encoded Archival Description) voltado para a área de
Arquivologia;
LOM (Learning Object Meta-data) para gerenciar, avaliar e localizar
objetos de aprendizagem;
MPEG Multimedia Metadata para representação de objetos
multimídiaticos.
24. 24
4.4.6. Segundo a sua função os metadados podem ser:
• Administrativos: são metadados usados no gerenciamento e adminis-
tração dos recursos de informação. Esse tipo de metadado fornece
informações como: data de criação dos recursos, tipos de arquivos, formas
de acesso, controle de direitos e reproduções, informação sobre registros
legais, informação sobre localização (GILLILANDSWETLAND, 1999; RO-
SETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010);
• Descritivos: são metadados usados para descrever, identificar e repre-
sentar recursos de informações. Esse tipo fornece informações relacio-
nadas com a catalogação, como título, autor, imprenta, data, resumo,
palavras-chave, e ainda a relação dos hiperlinks entre os recursos,
anotações de usuários etc. (GILLILAND-SWETLAND, 1999; ROSETTO, 2003;
SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010);
• Técnicos: são metadados relacionados com funcionamento dos sistemas
e o comportamento dos metadados. Esse tipo fornece informações sobre
hardware e software, digitalização, controle do tempo de resposta dos
sistemas, autenticidade e segurança dos dados etc. (GILLILAND-
SWETLAND, 1999; ROSET-TO, 2003; SENSO, ROSA PIÑERO, 2003 apud
ALVES, 2010);
• Conservação: são metadados relacionados com a conservação e
preservação dos recursos de informação. Esse tipo fornece informações
sobre as condições físicas de um recurso, informações de como conservar
e preservar as versões físicas e digitais de um recurso etc. (GILLILAND-
SWETLAND, 1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud
ALVES, 2010);
• Uso: são metadados relacionados com o nível e tipo de uso dos recursos
de informação. Esse tipo fornece informações sobre os registros de
exibição, controle de uso e usuários, controles de acesso, informação
sobre versões múltiplas etc. (GILLILAND-SWETLAND, 1999; ROSETTO,
2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010).
25. 25
4.4.7. Os autores Gilliland-Swetland (1999 apud Alves, 2010) e
Senso e Rosa Piñero (2003 apud Alves, 2010) destacam os
seguintes fatores:
FONTE Se os metadados são internos, gerados no momento da criação do recurso
(exemplo: nomes de arquivos), ou são metadados externos, gerados poste-
riormente à criação do recurso (exemplo: fichas e registros de catalogação);
MÉTODO Se os metadados são automáticos, gerados automaticamente por um com-
putador (exemplo: índices de palavras-chave), ou são metadados manuais,
criados por indivíduos (exemplo: registros de catalogação);
CRIAÇÃO Se os metadados foram criados por indivíduos que não são especialistas da área
de informação (exemplo: metadados criados pelo desenvolvedor de uma página
pessoal), ou são metadados criados por especialistas temáticos ou da área de
informação (exemplo: registros em formato MARC elaborados por um
bibliotecário);
STATUS Se os metadados são estáticos, que não mudam depois de criados (exemplo:
título e data de criação de um recurso), ou são metadados dinâmicos, que
podem se modificar de acordo com o uso e a manipulação do recurso (exemplo:
registros de operações dos usuários); se os metadados são de longa duração,
para assegurar o acesso e o uso do recurso (exemplo: formatos técnicos e
processamento da informação), ou são metadados de curta duração, que são
principalmente do tipo operacional (exemplo: informam sobre conservação e
administração dos recursos);
ESTRUTURA Se os metadados são estruturados, ou seja, apresentam uma estrutura
previsível, pré-determinada, baseada em um padrão normalizado interna-
cionalmente (exemplo: MARC), ou são metadados não estruturados, ou seja,
não possuem estrutura previsível (exemplo: formatos de banco de dados locais);
SEMÂNTICA Se os metadados são controlados, ou seja, aqueles que seguem ou são
normalizados por um vocabulário controlado, formulário de autoridade etc
(exemplo: AACR2), ou são metadados não controlados, ou seja, aqueles que não
seguem um vocabulário controlado ou formulário de autoridade (exemplo:
meta etiquetas HTML);
NÍVEL Se os metadados são de coleções, ou seja, estão relacionados a coleções de
documentos ou recursos (exemplo: uma coleção de recursos descritos pelo
formato MARC), ou são metadados individuais, ou seja, metadados relacionados
com recursos individuais ou que não pertencem a nenhuma coleção (exemplo:
legenda de uma imagem).
26. 26
4.4.8. Tendo como base as resoluções do DCMI, os autores Zeng e
Qin (2008 apud ALVES, 2010) destacam a existência de três
princípios básicos para a construção de metadados:
• Simplicidade: refere-se aos atributos (metadados) necessários para a
manutenção de um conjunto mínimo de elementos descritivos para
facilitar a implementação. É importante que os metadados sejam flexíveis
para acomodar as necessidades específicas de descrição, permitindo que
sejam incluídos novos metadados para atender a necessidades específicas
de um domínio específico (ZENG; QIN, 2008, apud ALVES, 2010).
• Extensibilidade: pode ser entendida de duas formas; a capacidade de
um padrão de metadados oferecer um conjunto de elementos descritivos
que possa unificar os diferentes padrões de descrição; e a capacidade de
intercâmbio entre registros de metadados de um padrão de metadados
mais simples para outro mais complexo. A extensibilidade requer que os
sistemas permitam a adição de novos elementos de metadados em um
padrão baseados em normas existentes, ou elementos estabelecidos em
nível local (ZENG; QIN, 2008, apud ALVES, 2010).
• Interoperabilidade: “é a capacidade de múltiplos sistemas com
diferentes hardwares e plataformas de softwares, estruturas de dados e
interfaces intercambiarem dados com a mínima perda de conteúdo e
funcionalidade” (NISO, 2004, apud ALVES, 2010).
27. 27
4.4.9. Duval et.al (2002 apud ALVES, 2010), são princípios:
• Modularidade: permite que os desenvolvedores de padrões de
metadados reutilizem os atributos em outras estruturas semânticas e
sintáticas de padrões de metadados, ao invés de reinventar elementos.
Refere-se à construção de metadados em blocos, categorias, grupos ou
módulos de elementos descritivos, de modo que esses metadados possam
ser estruturados em categorias de outros padrões de metadados com
estruturas sintática e semanticamente diferentes, mas que possam ser
interoperáveis. Em outras palavras, diferentes categorias semânticas de
metadados são combinadas em outros padrões de metadados com
estrutura sintática diferente, porém expressas em uma linguagem comum,
incorporando a funcionalidade e o significado de cada atributo. Dessa
forma, conjuntos de módulos podem ser criados para atender a requisitos
específicos de uma aplicação, combinando exigências específicas de um
domínio com exigências gerais, sem danos à interoperabilidade (DUVAL
et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010).
• Extensibilidade: um dos princípios indicados pelo DCMI, conforme já
explicado, é a capacidade de extensão, ou seja, de permitir a inclusão de
novos metadados em um padrão de acordo com as necessidades espe-
cíficas de aplicação (DUVAL et.al, 2002);
28. 28
• Refinamento: as aplicações de metadados em um domínio irão variar de
acordo com a necessidade do grau de detalhe ou especificidade na
descrição; dessa forma, os padrões de metadados devem permitir a
escolha do nível de detalhes na descrição dos recursos. Duas noções de
refinamento devem ser consideradas: a adição de qualificadores, que são
elementos de metadados que qualificam e tornam o significado de um
atributo mais específico (semelhantes a subcampos de descrição); e
esquemas de codificação externos ao padrão de metadados utilizados para
padronizar a representação determinando os valores do elemento, como,
por exemplo, vocabulários controlados, esquemas de codificação do
conteúdo, notações de sistemas de classificação etc.
• Multilinguismo: incide sobre os aspectos da diversidade cultural e
linguística que devem ser considerados no momento de estabelecer os
metadados de um padrão. Por exemplo, a maneira como as datas são
representadas em diferentes calendários; a direção na qual o texto é
apresentado e lido; conotações culturais de certos ícones e pictogramas,
entre outros. É importante que os metadados descrevam características
relevantes de um recurso respeitando as diferenças culturais e linguísticas
(DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010).
29. 29
4.4.10. Duval et.al (2002 apud ALVES, 2010) são práticas:
• Perfil de aplicação: é um conjunto de elementos de metadados
selecionados de um ou mais esquema de metadados, combinados em um
esquema composto. Os perfis de aplicação oferecem meios para se
expressar os princípios de modularidade e extensibilidade. Sua finalidade é
combinar esquemas de metadados adaptando-os às exigências funcionais
de aplicações específicas, e mantendo a interoperabilidade com esquemas
originais que serviram como base. Seu maior objetivo é facilitar a
interoperabilidade semântica (DUVAL et.al, 2002 apud ALVES, 2010).
• Sintaxe e semântica: é necessário um acordo comum entre dois
domínios, tanto a sintaxe quanto a semântica dos metadados. Em outras
palavras, é preciso que domínios diferentes compartilhem o mesmo
significado de um atributo ou metadado e que estabeleçam uma
convenção comum para a identificação e a codificação dos valores em uma
sintaxe, caso contrário não haverá intercâmbio de dados (DUVAL et.al,
2002 apud ALVES, 2010).
• Associações entre modelos: referem-se à associação entre diferentes
registros de metadados de um mesmo recurso informacional. Múltiplos
registros de metadados refletem os vários propósitos e perspectivas de
diferentes organizações ao criarem e gerenciarem metadados. Espera-se
que esses registros sejam gerenciados de forma coordenada (DUVAL et.al,
2002 apud ALVES, 2010).
• Identificando e nomeando elementos de metadados: símbolos X
etiquetas: os metadados são expressos por um nome que pode ser codifi-
cado por meio de uma etiqueta em linguagem natural ou codificado em
símbolos. Ferramentas específicas podem utilizar rótulos de apresentação
diferentes da codificação original dos metadados para melhor visualização
e entendimento (DUVAL et.al, 2002 apud ALVES, 2010).
30. 30
• Registro de metadados: um sistema formal para documentação de
conjuntos de metadados, perfil de aplicação, esquemas de codificação,
informações de uso do elemento e crosswalks. A função primária dos
registros de metadados é registrar, publicar e gerenciar essas
especificações, como também facilitar a busca dentro do registro (ZENG,
QIN, 2008 apud ALVES, 2010).
• Integralidade na descrição: nem todos os atributos disponíveis em um
esquema de metadados serão utilizados ou são adequados para
representar um recurso; a representação deve conter os atributos
essenciais para caracterizar o recurso. Além disso, a seleção apropriada
dos valores também se constitui em um item importante para compor a
totalidade da descrição. Assim, a riqueza na descrição será determinada
por políticas de melhores práticas estabelecidas pela agência criadora dos
metadados e construídas a partir de requisitos funcionais ou serviços de
aplicação em diferentes domínios (DUVAL et.al, 2002 apud ALVES, 2010).
• Políticas de melhores práticas são orientações para a realização de uma
tarefa de modo mais eficiente (com menos esforço) e mais efetivo (com
melhores resultados). Não se constituem nem como um padrão nem como
um regulamento, mas sim como diretrizes a serem seguidas para
enriquecer a representação (ZENG, QIN, 2008 apud ALVES, 2010).
• Elementos obrigatórios X opcionais: padrões de metadados para
propósitos gerais requerem um alto grau de flexibilidade. Dessa forma, um
elemento de metadado pode ser essencial em um domínio e em outro
não, por não refletir as características de um determinado recurso. Por
esse motivo, não há com pensar em obrigatoriedade em algum elemento
de metadados. Contudo, é importante se pensar em políticas de boas
práticas para especificar normas de conduta para o uso de um
determinado padrão em um domínio, favorecendo, assim, a padronização
na estrutura dos elementos em um domínio e consequentemente a
interoperabilidade (DUVAL et.al, 2002 apud ALVES, 2010).
31. 31
• Metadados subjetivos X objetivos: o processo de criação de metadados
pode envolver metadados objetivos, aqueles que são características de
fato, tais como título, autor, data; ou metadados subjetivos, aqueles que
são atribuídos, tais como assunto, palavras-chave, resumo etc. Outros
metadados são subjetivos por estarem sujeitos a interpretações sob
diferentes pontos de vista ou domínios. Dessa forma, um dos requisitos no
desenvolvimento de metadados é explicitar o contexto da informação,
para que os aplicativos possam identificar mais facilmente o contexto onde
está inserido o recurso (DUVAL et.al, 2002 apud ALVES, 2010).
• Geração automática de metadados: entre a criação manual de
representações em padrões de metadados e entre as ferramentas de
Harvesting e indexação automática de metadados, existe uma variedade
de outras aplicações de padrões as quais podem ser utilizadas para a
geração automática de metadados. É possível reduzir custos com o
processamento automático das informações na medida em que as
descrições e o estabelecimento de metadados sejam mais consistentes
(DUVAL et.al, 2002 apud ALVES, 2010).
32. 32
5. FORMATOS DE DADOS.
5.4. São formatos de dados para a biblioteconomia:
5.4.1. Formatos simples: constituídos por metadados não estru-
turados, extraídos de forma automática por robôs, apre-
sentam na maioria das vezes uma semântica reduzida. Ex.:
MetaTag(s) e metadados utilizados na transferência de dados
por meio do protocolo HTTP - hipertext transfer protocol.
5.4.2. Formatos estruturados: constituídos por metadados mais
estruturados, baseados em normas emergentes e que pro-
porcionam uma descrição mínima do recurso para sua iden-
tificação, localização e recuperação. A descrição geralmente é
feita em campos e nessa categoria começa a ser inserida a
ajuda de especialistas em informação. Ex.: padrão de meta-
dados Dublin Core – DC.
5.4.3. Formatos ricos: também considerados padrões de metadados
altamente estruturados, são constituídos por metadados
complexos, apresentam uma estrutura de descrição mais
formal e detalhada. São baseados em normas e códigos
especializados de um domínio particular, possibilitam a
descrição de um recurso informacional individual ou perten-
cente a uma coleção e facilitam a localização, a recuperação,
o intercâmbio dos recursos informacionais. Ex.: padrão de
metadados ou formato MARC 21, da área de Biblioteconomia.
33. 33
5.5. REPOSITÓRIOS.
São tecnologias e softwares para repositórios:
5.5.1. E-prints.
O E-prints foi o primeiro software desenvolvido especificamente
para a criação de repositórios de literatura científica para ser disseminado
e uti-lizado em todo o mundo. Surgiu de uma iniciativa da Universidade de
Southampton e o seu desenvolvimento e manutenção estão a cargo da
sua School of Electronics and Computer Science. Atualmente, este sistema
está na sua versão 3. Neste momento, março/2007, existem 218
aplicações em todo o mundo que utilizam o E-prints, com uma totalidade
de mais de 222.000 registros. Existe uma versão em português do E-prints,
sob o nome Diálogo Científico, traduzida pelo IBICT. Algumas das
instâncias do Eprints atualmente implementadas são as da Universidade
de Southampton – E-Prints Soton, o e-ms do Istituto Italiano di Medicina
Sociale, na área de medicina social e áreas afins, e, em português, o
Diálogo Científico na área de ciência da informação (BATISTA, et al., 2007).
5.5.2. D-Space.
O Dspace nasceu de uma iniciativa conjunta entre as bibliotecas de
Massachussets Institute of Technology MIT e a HP-Labs, e foi lançado em
novembro de 2002. No entanto, sendo um sistema de código aberto,
centenas de pessoas em todo o mundo contribuem para o seu desenvol-
vimento. No sentido de gerir e garantir a qualidade no processo de
desenvolvimento, em 2004, foi constituída uma equipe, denominada
Dspace committers, que articula os desenvolvimentos realizados em todo
o mundo e é responsável pela aprovação e disponibilização de novas ver-
sões. Os contributos de equipes e programadores individuais são inicial-
mente disponibilizados como add-ons em local apropriado. Seguida-
mente, verificado o interesse da comunidade nesse add-on e existindo a
aprovação pelos committers, um add-on desenvolvido poderá vir a ser
integrado ao código oficial do sistema (BATISTA, et al., 2007).
34. 34
5.5.3. Fedora.
O Fedora é uma iniciativa conjunta da área de Cornell University
Information Science e da University of Virginia Library e foi lançado em
maio de 2003. Do Fedora, talvez por não possuir uma interface usuária,
pouco se tem ouvido falar a respeito de alguma tradução para o
português. No entanto, já houve contatos entre a empresa VTLS e o IBICT,
para uma possí-vel cooperação técnica para a tradução do Fedora. Essa
empresa, a VTLS, oferece o Fedora em seus pacotes de solução para
automação de biblio-tecas. Algumas das instâncias do Fedora atualmente
implementadas são a da biblioteca da Universidade da Virgínia nos EUA e
a do Projeto de Repositório de Objetos Digitais Autênticos RODA do
Instituto dos Arquivos Nacionais Torre do Tombo (IANTT), em Portugal
(BAPTISTA, et al., 2007).
35. 35
6. PRESERVAÇÃO DA TECNOLOGIA.
6.4. DEFINIÇÃO.
É a estratégia baseada na criação de museus tecnológicos que man-
têm equipamentos e software obsoletos, de forma que os documentos
digitais possam ser processados no seu ambiente original. É uma solução
de curto prazo. São operações de preservação digital:
6.4.1. Emulação – estratégia fundamentada na premissa de que o
melhor meio de preservar as funcionalidades e a aparência de
um objeto informacional digital é preservá-lo junto ao seu
software original; dessa forma, o objeto pode ser rodado em
plataformas atuais por meio de emuladores, que são pro-
gramas que criam mímicas do comportamento de hardware e
sistemas operacionais obsoletos em computadores novos.
6.4.2. Migração – tem como fundamento a migração periódica de
um patamar tecnológico em vias de se tornar obsoleto e/ou
de se degradar fisicamente para outro mais atualizado e
íntegro, incluindo mídias, ambientes de software, formatos e
compu-tadores; é a estratégia correntemente mais utilizada
pelas organizações.
6.4.3. Encapsulamento – baseia-se na ideia de que os objetos
preser-vados devem ser autodescritos e encapsulados em
estruturas físicas ou lógicas com todas as informações neces-
sárias para que seja decifrado e compreendido no futuro.
36. 36
7. DISPOSIÇÕES FINAIS.
7.4. VERSÃO E ATUALIZAÇÃO.
A presente cartilha foi elaborada em 15 de novembro de 2018.
Encontra-se em sua segunda versão.
37. 37
7.5. BIBLIOGRAFIA UTILIZADA.
ARAÚJO JÚNIOR, R. H. de. Precisão no processo de busca e recuperação da
informação. Brasília: Thesaurus, 2007.
BAPTISTA, D. M.; ARAÚJO JÚNIOR, R. H. de. (Org.) Organização da
informação: abordagens e práticas. Brasília: Thesaurus, 2015.
CÔRTE, A. R. et al. Avaliação de softwares para bibliotecas e arquivos. 2.
ed. São Paulo: Polis, 2002.
FEITOSA, A. Organização da informação na web: das tags à web-semântica.
Brasília: Thesaurus, 2006.
LEITE, F. et. al. Boas práticas para a produção de repositórios institucionais
da produção científica. Brasília: IBICT, 2012.
MARCONDES, C. H. et. al. (ORG.). Biblioteca digital: saberes e práticas.
Salvador, Brasília: UFBA, IBICT, 2005.
ROBREDO, J. ; BRASCHER, M. (ORG.). EROIC: passeios pelo bosque da
informação. Brasília: IBICT, 2010.
ROBREDO, J. Documentação de hoje e de amanhã: uma abordagem
revisitada ... 4. ed. Brasília: edição do autor, 2005.
ROWLEY, J. Informática para bibliotecas. Briquet de Lemos, 1994.
ROWLEY, J. A biblioteca eletrônica. 2. ed. Briquet de Lemos, 2002.
SAYÃO, L. et. al. (ORG.) Implantação e gestão de repositórios institucionais:
políticas ... Salvador: EDUFBA, 2009.
SOUZA, R. R. Sistemas de recuperação de informações e mecanismos de
busca na web. Perspect. ciênc. inf., Belo Horizonte, v.11 n.2, p. 161 -173,
mai./ago. 2006.
TAMMARO, A. M.; SALARELLI, A. A biblioteca digital. Brasília: Briquet de
Lemos, 2008.
VECHIATO, F. L. ; VIDOTTI, S. A. B. Encontrabilidade da informação. São
Paulo: cultura acadêmica, 2014.
ZAFALON, Z. R.; DAL'EVEDONE, P. R. (ORG). Perspectivas da representação
documental. São Paulo: UFSCAR, 2017.