SlideShare uma empresa Scribd logo
1 de 34
Baixar para ler offline
Priscyla Patrício
PAPIRVM BIBLIOTECONOMIA
Minicurso: conhecimentos básicos de
Enterprise Content Management
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 1
INTRODUÇÃO ÀS TECNOLOGIAS DE ECM – 2.2. Os metadados.
2.2.1. Delimitando o conceito de metadado.
Antes de iniciar o tema é importante fazer duas ressalvas:
• A visão teórica de metadados aqui fornecida é da AIIM pelo ECM p, e não da bibliotecono-
mia ou ciência da informação. Poderá, eventualmente, ser feita uma comparação;
• O metadado aqui é entendido como uma tecnologia fabricada no próprio recurso de tecno-
logia, que capturado, convertido ou migrado para o sistema de ECM, traz consigo algum ní-
vel de descrição. Por isso, não cabe aqui o termo catalogação, mas sim registro.
Por isso, posso descrever utilizando a ISAD(G), para documentos, fazer algum tratamento de da-
dos com BI, ou de processos com o BPM, ou ainda, alguma padronização no recurso de modelo rela-
cional de dados em uma base de dados, e aí, sim, utilizar a RDA ao invés da AACR-2, ISBD(G), etc.
Os Recursos de Descrição e Acesso RDA é uma norma de descrição que pode ser utilizada tanto
em arquivos, como em bibliotecas, e é baseada no modelo conceitual de entidade-relacionamento
FRBR Requisitos Funcionais para Registros Bibliográficos. A RDA é compatível com diversos padrões
de metadados, tais como, MARC21, CCF, etc.
Também posso utilizar para descrever o padrão Dublin Core. Assim, é importante fazer a se-
guinte distinção – modelo de metadado ou formato de dados, no caso do MARC21; é diferente de
conteúdo do metadado, p. ex.: o conteúdo pode ser RDA, ISAD (G), etc., e que, por sua vez, é dife-
rente de camada tecnológica, p. ex.: norma ISO 2709, protocolo z329.50, OAI-PMH, etc.
Por isso é um pouco complicado misturar os conceitos agora, pois a concepção de registro na
biblioteconomia e na arquivologia é avançada em relação à visão da AIIM pelo ECM. Quando for
interessante, conforme dito, serão feitas comparações pontuais.
--
Para a AIIM pelo ECM p os metadados são “dados sobre dados”. São etiquetas com dados
inseridos em conteúdo ou armazenados externamente deste que identificam o conteúdo para fins
de organização e identificação. O conceito de metadados é anterior às tecnologias de ECM.
Então, guarde essa informação – metadado “embutido” e metadado artificial, “fabricado”.
Os metadados externos ou “fabricados”, ou ainda, manualmente inseridos em um sistema de
informação, é a forma mais comum de metadados.
Quando se digitaliza um documento, por exemplo, junto aos arquivos de imagem, ou do ar-
quivo .PDF vem: - nome, local, tamanho, tipo, atributos, proprietário, produtor, etc. Basta clicar com
o botão direito do seu mouse em qualquer arquivo de .PDF e ir para propriedades que lá você encon-
trará essas informações.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 2
Algumas normas e diretrizes pontuam, inclusive, que na digitalização devem ser obedecidos
determinados níveis de granularidade, visibilidade, escala de cinza, etc. Veja a resolução nº 31 do
CONARq, por exemplo. Lá existe um padrão de configuração dos escâneres para a digitalização de
documentos do arquivo permanente, visando sua preservação.
Metadados define o que algo é, para que serve e que características possui. O seu valor con-
siste em identificar e recuperar conteúdo através de suas características.
Propriedades e valores associados à recursos para ajudar a achar, identificar, usar, gerenciar,
avaliar e preservar estes recursos.
A unidade básica de um metadado é uma declaração.
Por isso, o AACR-2, com a ISBD(G), não cabem aqui, pois essas normas catalogam recursos
como se fossem mensagens baseadas em sintaxe e semântica, ou seja, pontuação e posição, e o que
a pontuação e posição significam, mas essas estruturas podem não significar nada para um sistema.
Entretanto, o RDA, em contrapartida, é mais aderente ao conceito de declaração.
Uma declaração (entidade) consiste de uma propriedade (atributo), ou elemento, e de um
valor (conteúdo do atributo), por exemplo, a camisa tem uma cor (propriedade) que é azul (valor).
Declarações de metadados descrevem recursos que podem ser utilizados por tecnologias de
conteúdo. E, na maioria dos casos, é através dos metadados que as tecnologias se tornam interope-
ráveis e possibilitam algum tipo de portabilidade de declaração.
Portanto, no portal de uma loja de roupas e moda, posso localizar todos os produtos que têm
a mesma cor azul.
Ainda, por meio dessa seleção de argumento, posso ter sugestões de outros produtos relaci-
onados ou quem comprou este comprou também..., por meio dos “metadados horizontais”.
E posso fornecer informações para o sistema, mesmo aplicando apenas um clique.
Os metadados, para o ECM p, podem ser usados para descrever conteúdo de três formas:
• Descritivos – descrevem o conteúdo para fins de pesquisa e recuperação;
• Estruturais – unem conteúdo a outras fontes de conteúdo, p. ex., metadados horizontais; e,
• Administrativos – controla o acesso ao conteúdo.
ALERTA:
Essas três formas são diferentes da abordagem das da biblioteconomia e ciência da informação!
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 3
Por que metadados e identificação são importantes?
• Sistemas de ECM podem cobrir um grande leque de informações em diferentes – formatos
de mídia e tipos, sistemas, assuntos, ciclos de vida, etc. Para diferentes receptores;
• Metadados oferecem um meio de gestão da informação pelo seu ciclo de vida;
• Possibilitam a organização do conteúdo para suportar uma variedade de razões corporativas;
• Metadados compreensivos fazem a pesquisa e recuperação ficar mais efetiva.
Fontes de metadados:
• Metadados-fonte;
• Fontes multimídia;
• Auto-classificação e auto-indexação.
Metadados-fonte:
• Específicos do documento – precisa ser digitado pelo usuário (p. ex., título, endereços);
• Específico do usuário – derivado da identificação log-in (p. ex., nome, cargo, contato);
• Dados do sistema – p. ex., datas, horários, a aplicação de software em uso, etc.);
• Padrão – p. ex., idioma, status (rascunho ou publicado “aprovado”) – baseado no que o usu-
ário normalmente faz e na área de negócio que ele normalmente trabalha;
• Valores inerentes da classe e arquivos – de um esquema de classificação no qual o item foi
salvo como um registro.
2.2.2. O valor do metadado para a empresa.
Rowley (2002) ensina que bases de dados são compostas por um conjunto de arquivos e re-
gistros. Arquivo, em uma base de dados, é a coleção de registros similares com relações entre si.
Registro é a informação contida na base e que diz respeito a um item. Os registros bibliográficos são
um tipo de METADADO. Requer um contexto mais especializado de dados. Os registros bibliográficos
podem conter: campos de tamanho fixo, variável e chaves de busca.
Arquivo também pode significar um tipo de recurso, p. ex., um PDF, um JPEG, etc.
Para o ECM p a melhor gestão da informação pelos metadados envolve:
→ Classificação – que corresponde à organização do conteúdo para atender necessidades
empresariais; e a classificação remete ao conteúdo no contexto, para agregar valor ao cliente (ex-
periência do usuário);
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 4
→ Controlar distribuição – quando o conteúdo é liberado para publicação (aprovação) – ou
seja, pressupõe a elaboração do metadado ‘embutido’;
→ Controlar acesso – determinar granularidade/complexidade da segurança do conteúdo;
→ Associar “declarações de qualidade” – sem metadados apropriados, identificar qual o con-
teúdo é o “melhor” fica mais difícil.
Metadados ‘ajudam’ a atividade de investigação e inteligência:
Na medida em que, contém informações ‘embutidas’ no recurso, ou ‘arquivo’.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 5
Localização – Marcas ou identificadores permitem pessoas e máquinas indexar e recuperar
a informação; Identificação implica em recuperação profundamente limitada pelos metadados.
Mas, como assim? Máquinas indexam?
UM ADENDO
Crawler, Spider e Bots.
Crawler - é um software desenvolvido para realizar uma varredura na internet de maneira
sistemática através de informação vista como relevante a sua função. Eles capturam os textos das
páginas e cadastram os links encontrados e assim possibilitam encontrar novas páginas. São uma das
bases das Search Engines, eles são os responsáveis pela indexação dos sites, armazenando-os na base
de dados dos motores de busca. Também são conhecidos como Spider ou Bot (robô).
O processo que um Web crawler executa é chamado de Web crawling ou spidering. Muitos
sites, em particular os motores de busca, usam crawlers para manter uma base de dados atualizada.
Os Web crawlers são principalmente utilizados para criar uma cópia de todas as páginas visitadas
para um pós-processamento por um motor de busca que irá indexar as páginas baixadas para prover
buscas mais rápidas. Crawlers também podem ser usados para tarefas de manutenção automatiza-
das em um Web site, como checar os links ou validar o código HTML. Os crawlers também podem
ser usados para obter tipos específicos de informação das páginas da Web, como minerar endereços
de email (mais comumente para spam).
Bom, os crawlers dos buscadores geralmente procuram informações sobre permissões sobre
o conteúdo. Em espcial existem duas formas de bloquear um crawler decente de indexar uma deter-
minada página (e os links nela contidos). A primeira forma, e mais comum, é através do arquivo ro-
bots.txt. A outra forma é através da tag meta robots, com valor "noindex" ou "nofollow", usados para
não indexar (a própria página) e não seguir (os links contidos na página), respectivamente. Há tam-
bém uma terceira possibilidade, muito menos explorada, que é o uso do atributo rel="nofollow" em
links, indicando ao crawler que aquele link em especial não deve ser seguido.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 6
Spider - Também conhecido como Robô, Robot, Bot ou Crawler. São programas usados pelos
mecanismos de busca para explorar a internet de maneira automática e fazer download de conteúdo
web de sites web. De forma metódica, não expõe o conteúdo que julga irrelevante no código fonte
dos sites, e armazena o resto em seu banco de dados. Deste modo, os mecanismos de busca basea-
dos em robôs (spider ou crawlers) que vasculham a Internet atrás de informações e classificam as
buscas de acordo com os links e também os conteúdos encontrados nas páginas de busca, como é o
caso do maior portal de buscas da web, o Google. Deste modo, qualquer página precisa ser rastreada
pelo robô e assim, poder aparecer nos resultados de busca dos mecanismos em questão.
Bots - Segundo Thurow (2003), os robôs executam três ações básicas: 1. Primeiro eles acham
as páginas do sítio (processo chamado spidering ou crawling) e constroem uma lista de palavras e
frases encontradas em cada página; 2. Com esta lista eles fazem um banco de dados e encontram as
páginas exatas que eles devem procurar, inserindo o sítio vasculhado no banco de dados geral orga-
nizado pelas características encontradas em suas páginas. A máquina que insere o sítio no banco de
dados geral se chama indexer; 3. Depois disso o robô já está apto a encontrar este sítio quando o
usuário final digitar na busca uma palavra ou expressão relativa ao conteúdo encontrado no sítio.
Essa etapa é chamada query processor. Como podemos perceber, por trás de qualquer busca reali-
zada na internet, há uma série de mecanismos que trabalham unidos para fornecer um resultado
satisfatório ao usuário. O processo parece um tanto complexo, no entanto, nada perceptível a nós,
meros buscadores de informações.
Mas tem o outro lado:
Os chatbots e os Coockies são bots usados para vendas. Quando se faz uma busca no Google,
por exemplo, ou se visita um site, o chatbot entende que você está interessado em determinado
produto ou serviço, e passa a te “perseguir” incansavelmente. Brincadeiras à parte, as redes sociais,
como o Facebook disponibilizam muito esse recurso, é só você entrar naquele aplicativo de uma loja,
e ‘voilá’, o seu feed é infestado de promoções, anúncios e conteúdo para vendas.
---
O papel dos chatbots no marketing digital e na indexação de conteúdo da Web para empresas
é uma abordagem consideravelmente relevante. Um pouco sobre organização da informação na In-
ternet, Web Semântica, e outros temas virá na nossa aula sobre o LeXML.
... voltando aos metadados:
Utilizar os metadados embutidos para exibir e incrementar o conteúdo em um formato mais
facilmente compreensível – conteúdo no contexto, é uma ótima estratégia, que combina as duas
formas de metadados – embutidos e os fabricados.
Ordenação – controlar as visões do conteúdo por nome, título, data, etc.
Busca por parâmetros – focado na precisão da pesquisa. Capacidade de endereçar uma pes-
quisa mais precisa de texto livre.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 7
Melhor processo de gestão – processamento; definir prioridades; agregação; fundamental
para o processamento em lotes; ponteiros para a automação da gestão de processos BPM; metada-
dos como forma de conexão entre sistemas.
Melhor gestão do conhecimento – Business Intelligence – inteligência de negócio; permite a
análise de uma coleção de dados; Localização elementar de especialistas; dados sobre pessoas.
Toutain (2005) define metadados como elementos de descrição ou definição ou avaliação de
recursos informacionais armazenados em sistemas computadorizados, organizado por padrões es-
pecíficos e estruturados.
É importante se lembrar que os metadados contém uma declaração de valor sobre um item.
Para a Ciência da Informação, os metadados possuem uma relação com as bases de dados e
os formatos de dados. Metodologicamente, os formatos de dados são categorizados em três tipos –
simples, estruturados e ricos. Essa categorização será revisada adiante no curso.
Um modelo relacional numa base de dados, que suporta a declaração de atributos (modelo
entidade-relacionamento-atributo), possibilita a criação de metadados para registros bibliográficos
e documentos de arquivo, e isso está bem adiantado na biblioteconomia:
FONTE: RDA Toolkit - Modelo Entidade-Relacionamento em uma Base de Dados Bibliográfica
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 8
DEFINIÇÕES DA BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO - Ikematu1
(2001) afirma que as
pessoas que têm algum contato com alguma ferramenta de Tecnologia da Informação provavel-
mente utilizam metadados, mesmo sem saber que as usa ou o seu significado. Isto é normal até
porque a sua própria definição não é um consenso, gerando alguma confusão.
Alves2
(2010) relembra que a definição mais comum de metadados é dados sobre dados Miller
(1996); Souza, Catarino e Santos (1997); Milstead e Feldman (1999); GillilandSwetland (1999); Souza,
Vendrusculo e Melo (2000); Takahashi (2000); Senso e Rosa Piñero (2002); Méndez Rodríguez (2002);
Zeng e Qin (2008) entre outros.
Porém esta definição não diz muita coisa. Ao pesquisar sobre metadados você provavelmente
encontrará diferentes interpretações. A finalidade principal dos metadados é documentar e organi-
zar de forma estruturada os dados, minimizar esforços e facilitar a manutenção dos dados (IKEMATU,
2001). Os metadados são inerentes aos sistemas de informação, porém, existem em uma variedade
de tipos e níveis (ALVES, 2010).
Segundo Rowley (2002) metadados diferem-se de dados bibliográficos, pois a informação de
localização acha-se contida no registro. Possibilita o fornecimento direto do documento a partir de
aplicações apropriadas ou detalhadas quanto ao acesso na rede.
Trata-se de um conjunto de elementos que possuem uma semântica padronizada, possibili-
tando descrever as informações eletrônicas ou recursos eletrônicos (MORATO; MORAES3
, 2007). A
adoção de padrões, normas e modelos é essencial para o intercâmbio de informações (ALVES;
SOUZA4
, 2007).
"Senso e Rosa Piñero (2002, p. 99 apud ALVES, 2010) consideram os metadados como […]
toda aquela informação descritiva sobre o contexto, qualidade, condição ou características de um
recurso, dado ou objeto que tem a finalidade de facilitar sua recuperação, autentificação, evolução,
preservação ou interoperabilidade" (ALVES, 2010).
"Grácio (2002, p. 21 apud ALVES, 2010) afirma: Comumente chamado de dados sobre dados,
o termo metadados pode ser melhor descrito como um conjunto de dados chamados de elementos,
cujo número é variável de acordo com o padrão, e que descreve o conteúdo de um recurso, possibi-
litando a um usuário ou a um mecanismo de busca acessar e recuperar esse recurso. Esses elementos
descrevem informações do tipo nome, descrição, localização, formato, entre outras, que possibilitam
um número maior de campos para pesquisas" (ALVES, 2010).
1
IKEMATU, R. S. Gestão de metadados: sua evolução na tecnologia da informação. DataGramaZero - Revista de Ciência
da Informação - v.2 n.6 dez/01
2
ALVES, R. C. V. Metadados como elementos do processo de catalogação. Tese (Doutorado em Ciência da Informação) –
Faculdade de Filosofia e Ciências – Universidade Estadual Paulista, 2010. Orientação Drª PlácidaLeopoldina Ventura Amo-
rim da Costa Santos. Marília: UNESP.
3
MORATO, A. de C.; MORAES, M. A. de. Metadados Dublin Core: uma breve introdução. 2007.
4
ALVES, M das D R; SOUZA, M I F. Estudo de correspondência de elementos de metadados: Dublin Core e MARC21. Re-
vista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 9
Em outras palavras, metadados são um “conjunto de elementos que descrevem as informa-
ções contidas em um recurso, com o objetivo de possibilitar sua recuperação” (GRÁCIO, 2002, apud
ALVES, 2010).
Analisando as definições encontradas na literatura, observa-se que os metadados estão dire-
tamente vinculados a estruturas padronizadas de descrição e aos objetivos que se pretende repre-
sentar com sua aplicação em um sistema de um determinado domínio (ALVES, 2010).
DADO INFORMAÇÃO CONHECIMENTO INTELIGÊNCIA
Metadados são dados
que descrevem atribu-
tos de um recurso. Ele
suporta um número de
funções: localização,
descoberta, documen-
tação, avaliação, sele-
ção, etc.
Metadados fornece o
contexto para enten-
der os dados através
do tempo.
Metadados é o dado
associado com objetos
que ajudam seus usuá-
rios potenciais a ter
vantagem completa do
conhecimento da sua
existência ou caracte-
rísticas.
Metadados é o instru-
mental para transfor-
mar dados brutos em
conhecimento.
Fonte: (IKEMATU, 2001).
Antigamente os metadados somente estavam vinculados internamente aos programas. Com
o surgimento dos Sistemas Gerenciadores de Banco de Dados (SGBD), muitas organizações tentaram
implementar alguma forma de dicionário de dados, a partir dos anos 1970. Através dos tempos, me-
tadados tem sido apresentado para a comunidade de informática como um problema intratável. En-
tretanto, os próprios problemas com metadados apresentam boas oportunidades para os fabricantes
de software. Porém, isto é mais evidente em ambientes de Data Warehouse corporativos (IKEMATU,
2001).
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 10
Semelhante a esse ponto de vista, encontram-se as seguintes definições no âmbito de aplica-
ção de sistemas de base de dados computacionais: “Metadados são dados que descrevem outros
dados” (TAKAHASHI, 2000, p. 59), ou “Metadados são descrições de dados armazenados em um
banco de dados [...]” (SOUZA; CATARINO; SANTOS, 1997 apud ALVES, 2010); Como uma unidade ele-
mentar. Alves (2010) afirma que em um sistema de banco de dados os metadados são atributos5
, ou
seja, são as características que identificam e representam uma entidade (objeto do mundo real que
pode ser, por exemplo, um recurso informacional); em outras palavras, qualquer propriedade, qua-
lidade ou característica atribuída para descrever um objeto do mundo real (dados representacionais)
em um sistema de banco de dados (CHEN, 1990; COAD, YOURDON, 1991 apud ALVES, 2010). Para
Ortiz-Repiso Jiménez (1999, p. 218 apud ALVES, 2010), podem ser definidos como […] um conjunto
de dados que pode ser usado para descrever e representar recursos informacionais.
Contém um conjunto de elementos de dados que podem ser usados para descrever o conte-
údo e a localização de um recurso informacional e facilitar sua recuperação e acesso na rede" (ALVES,
2010). A autora Rosetto (2003, p. 59) destaca a diferença entre metadados e padrões de metadados,
estes últimos denominados também formatos de metadados (ALVES, 2010):
• Metadados são um conjunto de dados – atributos – referenciais, metodologicamente estru-
turados e codificados, conforme padrões internacionais, para localizar, identificar e recuperar pontos
informacionais de textos, documentos e imagens disponíveis em meios digitais ou convencionais, e
• Formatos de metadados referem-se a padrões que estabelecem regras para a definição de
atributos (metadados) de recursos de informacionais, para a) obter coerência interna entre os ele-
mentos por meio de semântica e sintaxe; b) promover necessária facilidade para esses recursos se-
rem recuperados pelos usuários; c) permitir a interoperabilidade dos recursos (ALVES, 2010).
Metadados são atributos que representam uma entidade (objeto do mundo real) em um sis-
tema de informação. São elementos referenciais codificados que representam características pró-
prias ou atribuídas às entidades; com o intuito de identificar de forma única uma entidade (recurso
informacional) para posterior recuperação (ALVES, 2010).
Os padrões de metadados são estruturas de descrição constituídas por um conjunto prede-
terminado de metadados (atributos codificados ou identificadores de uma entidade) metodologica-
mente construídos e padronizados. O objetivo do padrão de metadados é descrever uma entidade
gerando uma representação unívoca e padronizada que possa ser utilizada para recuperação da
mesma (ALVES, 2010).
Segundo IKEMATU (2001) são padrões de metadados:
5
“Um atributo é um dado (informação de estado) para qual cada Objeto em uma Classe tem seu próprio valor” (COAD,
YOURDON, 1991, p. 117). Essa definição provém da área de Análise Orientada a Objeto e se constitui com conceitos
adotados em sistemas de informações
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 11
• Directory Interchance Format (DIF) – padrão para criar entradas de diretórios que des-
crevem um grupo de dados;
• Government Information Locator Service (GILS) – informações governamentais;
• Federal Data Geographic Committee (FGDC) – descrição de dados geoespaciais;
• Machine Readable Card (MARC) – catalogação bibliográfica;
• Dublin Core (DC) – dados sobre páginas da Web;
• Consortium for the Interchange of Museum Information (CIMI) – informações sobre
museus;
• Meta Data Interchange Specification (MDIS) - padrão para troca de metadados entre
ferramentas da Tecnologia de Informação;
• Open Information Model (OIM) – conjunto de especificações para facilitar o compar-
tilhamento e reuso no desenvolvimento de aplicações e data warehouse;
• Common Warehouse Meta Model (CWM) – padrão para troca de informações entre
esquemas de banco de dados e data warehouse.
Metadados são agrupados em estruturas abstratas conhecidas como esquemas ou formatos
de metadados, que são conjuntos de elementos criados com fins específicos. Os poucos exemplos a
seguir nos mostram um pouco dessa diversidade:
MODS (Metadata Object Description Schema) esquema bibliográfico derivado do MARC 21;
EAD (Encoded Archival Description) voltado para a área de Arquivologia; LOM (Learning Object Me-
tadata) para gerenciar, avaliar e localizar objetos de aprendizagem; MPEG Multimedia Metadata para
representação de objetos multimídiaticos (SAYÃO6
, 2010).
Sayão (2010) classifica a tipologia de metadados em:
• Metadados descritivos: é a face mais conhecida dos metadados, são eles que descrevem
um recurso com o propósito de descoberta e identificação; podem incluir elementos tais como título,
autor, resumo, palavras-chave e identificador persistente (SAYÃO, 2010).
• Metadados estruturais: são informações que documentam como os recursos complexos,
compostos por vários elementos, devem ser recompostos e ordenados. Por exemplo, como as pági-
nas de um livro, digitalizadas separadamente, são vinculadas entre si e ordenadas para formar um
capítulo (SAYÃO, 2010).
• Metadados administrativos: fornecem informações que apoiam os processos de gestão do
ciclo de vida dos recursos informacionais. Incluem, por exemplo, informações sobre como e quando
o recurso foi criado e a razão da sua criação.
6
SAYÃO, L. F. Uma outra face dos metadados: informação para a gestão da preservação digital. Enc. Bibli: R. Eletr. Bibli-
otecon. Ci. Inf., ISSN 1518-2924, Florianópolis, v. 15, n. 30, p.1- 31, 2010.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 12
Nessa categoria, estão metadados técnicos que explicitam as especificidades e dependências
técnicas do recurso; inclui também os metadados voltados para apoio à gestão dos direitos relacio-
nados ao recurso (SAYÃO, 2010).
O estudo dos metadados está relacionado com o processo de racionalização pelo qual se tem
passado nos últimos anos (LOURENÇO7
, 2007).
Rowley (2002) categoriza os metadados em:
Primeira geração – Metadados – interfaces baseadas em comandos, usuários especialistas e
intermediários; número limitado de sistemas em linha nas instituições e disponíveis externamente
por meio de serviços de busca em linha (ROWLEY, 2002).
Segunda geração – Dados com texto integral – interfaces baseadas em menus e comandos;
recursos de recuperação adicionais, como hipertexto e buscas em texto completo (ROWLEY, 2002).
Terceira geração – Multimídia – interfaces gráficas; foco no acesso pelo usuário final; orien-
tada para o mercado e com ênfase em pacotes de produtos; armazenamento e distribuição (ROWLEY,
2002).
Gilliland-Swetland (1999 apud Alves, 2010) aponta que desde os anos de 1960 as bibliotecas
vêm compartilhando metadados descritivos em sistemas informatizados, por meio do uso de normas
e estruturas de descrição, tal como o formato MARC.
Os autores Gilliland-Swetland (1999 apud ALVES, 2010), Senso e Rosa Piñero (2003 apud AL-
VES, 2010) e Rosetto (2003 apud ALVES, 2010) destacam que os tipos de metadados estão relaciona-
dos com as características e funções que eles representam. Deste modo, apresenta-se a seguir a
classificação de alguns tipos de metadados conforme as funções:
• Administrativos: são metadados usados no gerenciamento e administração dos recursos de
informação. Esse tipo de metadado fornece informações como: data de criação dos recursos, tipos
de arquivos, formas de acesso, controle de direitos e reproduções, informação sobre registros legais,
informação sobre localização (GILLILANDSWETLAND, 1999; RO-SETTO, 2003; SENSO, ROSA PIÑERO,
2003 apud ALVES, 2010);
• Descritivos: são metadados usados para descrever, identificar e representar recursos de in-
formações. Esse tipo fornece informações relacionadas com a catalogação, como título, autor, im-
prenta, data, resumo, palavras-chave, e ainda a relação dos hiperlinks entre os recursos, anotações
de usuários etc (GILLILAND-SWETLAND, 1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud AL-
VES, 2010);
7
LOURENÇO, C. A. Metadados: o grande desafio na organização da WEB. Inf. & Soc.:Est., João Pessoa, v.17, n.1, p.65-
72, jan./abr.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 13
• Técnicos: são metadados relacionados com funcionamento dos sistemas e o comporta-
mento dos metadados. Esse tipo fornece informações sobre hardware e software, digitalização, con-
trole do tempo de resposta dos sistemas, autenticidade e segurança dos dados etc (GILLILAND-
SWETLAND, 1999; ROSET-TO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010);
• Conservação: são metadados relacionados com a conservação e preservação dos recursos
de informação. Esse tipo fornece informações sobre as condições físicas de um recurso, informações
de como conservar e preservar as versões físicas e digitais de um recurso etc (GILLILAND-SWETLAND,
1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010);
• Uso: são metadados relacionados com o nível e tipo de uso dos recursos de informação.
Esse tipo fornece informações sobre os registros de exibição, controle de uso e usuários, controles
de acesso, informação sobre versões múltiplas etc (GILLILAND-SWETLAND, 1999; ROSETTO, 2003;
SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010).
Alves (2010) a tipologia de metadados apresentada categorizam-nos por funcionalidade, mas,
existem outros fatores como processo de criação manual e automática e/ou por outras diferentes
funções. Os autores Gilliland-Swetland (1999 apud Alves, 2010) e Senso e Rosa Piñero (2003 apud
Alves, 2010) destacam os seguintes fatores:
Metadados-fonte:
se os metadados são internos, gerados no momento da criação do recurso (exemplo: nomes de
arquivos), ou são metadados externos, gerados posteriormente à criação do recurso (exemplo:
fichas e registros de catalogação);
Metadados-método:
se os metadados são automáticos, gerados automaticamente por um computador (exemplo: índices
de palavras-chave), ou são metadados manuais, criados por indivíduos (exemplo: registros de cata-
logação);
Metadados-criação:
se os metadados foram criados por indivíduos que não são especialistas da área de informação
(exemplo: metadados criados pelo desenvolvedor de uma página pessoal), ou são metadados criados
por especialistas temáticos ou da área de informação (exemplo: registros em formato MARC elabo-
rados por um bibliotecário);
Metadados-status:
se os metadados são estáticos, que não mudam depois de criados (exemplo: título e data de criação
de um recurso), ou são metadados dinâmicos, que podem se modificar de acordo com o uso e a
manipulação do recurso (exemplo: registros de operações dos usuários); se os metadados são de
longa duração, para assegurar o acesso e o uso do recurso (exemplo: formatos técnicos e processa-
mento da informação), ou são metadados de curta duração, que são principalmente do tipo opera-
cional (exemplo: informam sobre conservação e administração dos recursos);
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 14
Metadados-estrutura:
se os metadados são estruturados, ou seja, apresentam uma estrutura previsível, pré-determinada,
baseada em um padrão normalizado internacionalmente (exemplo: MARC), ou são metadados não
estruturados, ou seja, não possuem estrutura previsível (exemplo: formatos de banco de dados lo-
cais);
Metadados-semântica:
se os metadados são controlados, ou seja, aqueles que seguem ou são normalizados por um vocabu-
lário controlado, formulário de autoridade etc (exemplo: AACR2), ou são metadados não controla-
dos, ou seja, aqueles que não seguem um vocabulário controlado ou formulário de autoridade
(exemplo: meta etiquetas HTML);
Metadados-nível:
se os metadados são de coleções, ou seja, estão relacionados a coleções de documentos ou recursos
(exemplo: uma coleção de recursos descritos pelo formato MARC), ou são metadados individuais, ou
seja, metadados relacionados com recursos individuais ou que não pertencem a nenhuma coleção
(exemplo: legenda de uma imagem).
Todos os tipos de metadados se constituem como pontos de acesso aos recursos, sejam os
metadados intrínsecos às entidades (aqueles atributos que individualizam a entidade), sejam extrín-
secos (aqueles atributos que identificam a entidade em um sistema) (MÉNDEZ RODRÍGUEZ, 2002
apud ALVES, 2010).
A função dos metadados em um sistema de informação digital ocorre das seguintes formas:
(a) exerce a mesma função dos catálogos e sistemas de descrição bibliográfica, com identificação,
descrição, busca, localização e recuperação da informação; (b) em relação aos sistemas, sua função
é facilitar a interoperabilidade e intercâmbio de dados, facilitar a busca e o gerenciamento da infor-
mação; (c) em relação aos usuários, indicar a informação acessível, sua localização e as condições
para se chegar até ela (MÉNDEZ RODRÍGUEZ, 2002 apud ALVES, 2010).
A NISO - National Information Standards Organization -, organização sem fins lucrativos cre-
denciada pela ANSI - American National Standards Institute -, responsável por identificar, desenvol-
ver, manter e publicar normas técnicas para o gerenciamento da informação em meio digital, esta-
belece algumas diretrizes ou princípios para a construção de metadados (NISO, 2004 apud ALVES,
2010).
Alves (2010) indica que dentre as normas criadas apresenta um guia para a construção de
coleções digitais (“Framework of Guidance for Building Good Digital Collections”), no qual apresenta
seis princípios para a aplicação de metadados, destacando os requisitos desejáveis para a construção
de metadados. Originalmente é utilizado o termo “good metadata” que aqui se entende como me-
tadados de qualidade (NISO, 2004, p. 10, tradução nossa):
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 15
METADADOS DE QUALIDADE • devem ser apropriados aos materiais de uma coleção, aos
usuários da coleção e destinados ao provável uso por objetos digitais; • devem ser apropriados para
proporcionar a interoperabilidade; • devem proporcionar a utilização de padrões como vocabulários
controlados, para refletir o que, onde, quando e quem em relação ao conteúdo; • devem incluir de-
clarações claras sobre as condições e termos de uso do recurso informacional; apoiam a gestão a
longo prazo de recursos em coleções. • Registros de metadados de qualidade são objetos em si e,
portanto, devem ter a qualidade de arquivamento, persistência e identificação única. Metadados de
qualidade devem ser confiáveis e verificáveis; (ALVES, 2010).
A melhoria dos metadados dependem (ALVES, 2010): 1) Aperfeiçoamento dos padrões de
campos e validação de dados; 2) aprimoramento da interoperabilidade entre padrões; 3) treina-
mento e capacitação das ferramentas de metadados; 4) vocabulários controlados acessíveis e de co-
nhecimento amplo; 5) comunidades de usuários que aperfeiçoam o esquema de dados.
Portanto, essa é a visão da biblioteconomia e Ciência da Informação, que aproxima o registro
bibliográfico em Marc21 à noção de metadado, mesmo sendo utilizada AACR2 e ISBD(G).
---
2.2.3. Estratégia para metadados.
Segundo a AIIM pelo ECM p, são estratégias de metadados:
• Identificação e entendimento dos diferentes tipos de metadados e seus objetivos – formu-
lação e documentação do modelo de metadados;
• Sincronização e adoção em um departamento, projeto, ou unidade na organização respon-
sável pela construção de metadados – que aplicará a concordância sobre os termos, rótulos
e significados dentro e fora da organização;
• Entendimento das pessoas, processos e sistemas que aplicam e integram com os metada-
dos e vocabulários;
• Identificar que se possui diversos metadados e estruturas;
• Planejar a manutenção e mudanças.
BENEFÍCIOS ESTRATÉGICOS
• O uso consistente através da corporação faz os metadados ficarem mais poderosos;
• Diminui as chances de termos, rótulos e marcações ambíguos;
• Entender como mudanças de metadados podem afetar os processos mais adiante;
• Identificação de lacunas de onde deve haver mais metadados;
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 16
• Avaliação realista sobre o esforço envolvido na criação e obtenção de metadados;
• Estabelecimento dos metadados como um acervo central, reusável;
• Compreensão do efeito dos metadados sobre os processos de negócio.
2.2.4. Desafios do metadado.
Quem? O que? Quando? Onde? (centralizado vs. Descentralizado) Identificação? Categorização?
Classificação? Necessita intensamente de recurso...
• É necessário saber que para pessoas, adicionar metadados significa trabalho;
• Indexadores podem não enxergar um benefício dos metadados para eles mesmos;
• Os benefícios tendem a aparecer para a corporação e consumidores de conteúdo;
• Por garantia, empregados podem ser forçados a indexar. Em alguns sistemas de imagens
(imaging), é papel de um especialista. Em outros casos: “não é meu trabalho”;
• Pessoas podem gerar metadados incompletos ou errados;
• Surge então a pergunta: existe uma forma de fazer máquinas agregar em metadados?
Ms Office – Arquivo/Propriedade.
– Quantas pessoas efetivamente preenchem isto? – poucas, muito poucas.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 17
-- Mas, a probabilidade de ter que preencher isto é maior:
Criação manual x automática de metadados.
Assim, a criação de documentos pelo aplicativo Ms Office, em relação ao preenchimento au-
tomático de metadados tem uma desvantagem em comparação com um software de Gerenciamento
Eletrônico de Documentos, pois neste eu, necessariamente, tenho que preencher os metadados.
Além disto, a integridade dos valores e declarações é maior, pois ao logar no sistema de GED,
automaticamente, o sistema atribui a minha autoria (produção), com os meus dados – nome, se-
ção/departamento, cargo, data, horário, etc.
Captura manual x automática de metadados.
Antes de adentrar neste módulo, é importante entender o conceito de interoperabilidade:
INTEROPERABILIDADE: são tecnologias, normas, padrões, regras e protocolos que permitem
uma organização e representação da informação de modo que se possa ser compartilhada entre ins-
tituições cooperantes.
Utiliza-se da padronização de um modelo de dados (formato de dados):
MODELO DE DADOS (FORMATO DE DADOS): especifica as regras segundo as quais os dados
são estruturados, bem como as operações correlatas são permitidas. Pode também ser visto como
uma técnica para a descrição formal de dados, relações entre eles e limitações de uso.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 18
Segundo a International Standard Organization (ISO), interoperabilidade é a habilidade de
dois ou mais sistemas, que podem ser computadores, meios de comunicação, redes de software e
outros componentes de tecnologia da informação, de interagir e de intercambiar dados a partir de
um método definido, objetivando obter os resultados esperados.
A interoperabilidade é o esforço necessário para se vincular um sistema a outro, um fator de
garantia de qualidade de software, conjuntamente com: manutenibilidade, portabilidade, integri-
dade e confiabilidade. Os acordos de cooperação podem ser em três níveis:
• O nível técnico proporciona a interoperabilidade tecnológica;
• O nível de conteúdo remete à interoperabilidade semântica; e,
• O nível organizacional se refere a interoperabilidade política.
Para efeitos da interoperabilidade consideram-se as definições acima bem como seus respec-
tivos requisitos funcionais e não funcionais, a fim de padronização da cooperação entre unidades de
informação.
NÍVEIS DE INTEROPERABILIDADE.
Nível Semântico.
Este nível permite entender o significado de cada elemento descritor do recurso em conjunto
com as associações nele embutidas. Segundo Moura (2002), o uso de vocabulários específicos, onto-
logias e/ou padrões de metadados é essencial para assegurar esse tipo de interoperabilidade. Exis-
tem dois subníveis no nível semântico:
• Epistemológico: relacionado ao significado dos elementos descritores do formato e das rela-
ções nele existentes.
• Ontológico: relacionado ao uso de ontologias, vocabulários controlados e padrões de meta-
dados para o estabelecimento dos significados dos dados representados.
Como exemplo deste nível de interoperabilidade podem-se destacar os campos que têm o
mesmo significado entre elementos descritivos de padrões de representação como o MARC21.
Nível Estrutural.
Este nível estabelece cada elemento componente de um padrão de metadados, descreve os
seus tipos, a escala de valores possíveis para esses elementos e os mecanismos utilizados para rela-
cionar esses elementos de modo que possam ser processados de forma automática. Como exemplo
podem-se destacar os padrões de metadados Dublin Core (DC) e MARCXML.
Nível Sintático
Barreto (1999, p. 85) afirma que “a sintaxe fornece uma linguagem comum para representar
a estrutura dos metadados”. Este nível de interoperabilidade define como os metadados devem ser
codificados para a transferência de informação. Ex.: linguagem XML.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 19
...retomando metadados, segundo a AIIM ECM p:
O Software pode ajudar – modelos de documentos podem conter códigos para capturar me-
tadados. Modelos também podem conter ‘marcadores’, ‘campos’ e outras características para ‘pe-
gar’ metadados. O software também pode ser utilizado para olhar detalhes do usuário (após se ter
logado) - Nome do autor e detalhes; - Cargo, departamento; - Outros valores padrão.
Coleta automatizada de metadados - Ferramenta para categorizar automaticamente. Um
exemplo na Ciência da Informação é o protocolo OAI-PMH.
Aplicação de coleta de metadados na Rede LeXML.
Os softwares de auto-categorização, bem como algumas máquinas de pesquisa podem ten-
tar classificar conteúdo:
• - Elas continuam baseadas em uma taxonomia definida ou vocabulário controlado;
• - Normalmente requer ‘treinamento’ para obter resultados minimamente aceitáveis.
Mas, os resultados tipicamente não são tão bons quanto os humanos:
• - Nível de envolvimento humano se torna uma decisão de custo/benefício.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 20
Aplicações de auto-categorização para Big Data.
Multimídia e classificação automática – Recursos multimídia: - Câmeras: - Aplicações de edi-
toração de imagem/áudio; - Autoria de páginas web e gestão de sítios web; - gravação de áudio (di-
gital); - Dados para gestão de direitos (embutidos).
Lembra do exemplo da Polícia Federal? Pois é, nos arquivos multimídia isso é bem caracteri-
zado porque essas tecnologias aplicam a auto-categorização quando é produzido o arquivo de mídia.
Assim, numa investigação, é possível rastrear: quem tirou determinada fotografia, os dados de IP, os
dados do Smarthphone, etc...
Sobre os dados para gestão de direitos, temos o Creative Commons, que é um padrão de
gestão de direitos e que pode ser elaborado automaticamente em recursos de tecnologia de mídia.
Assim, sempre tenha em mente que uma aplicação não é disponibilizada em vão... Sempre tem algo.
Auto-classificação e auto-indexação - Gravação automática de palavras chave; -Reconheci-
mento de imagens; - Adição de dados externos.
O reconhecimento de imagens, a internet das coisas IoT, Big Data e demais recursos que po-
dem ser aplicados a dispositivos móveis, são uma aposta interessante para a captura automática de
metadados. Imagine numa pandemia, a aplicação de IoT ou reconhecimento de imagens para con-
trole do confinamento social.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 21
Melhores práticas na automação dos metadados - crie o corpo central de metadados de sua
organização; - permita a auto-sugestão para popular campos de metadados para minimizar a quan-
tidade de trabalho necessário pelos trabalhadores e também aumentar o índice de qualidade e con-
sistência.
A captura automática, portanto, está embutida na tecnologia de criação dos arquivos e mí-
dias. Mas, e a captura manual? Lembra do conceito de interoperabilidade? Pois é, na bibliotecono-
mia, quando se faz a importação de registros Marc21 de uma biblioteca para outra, está se fazendo
uma captura manual.
A captura manual, para a biblioteconomia pode ser de dois tipos – migração ou conversão
retrospectiva, quando esta aplica algum tipo de captura, pois quando o metadado é elaborado do
zero, aí a operação não é mais captura, mas sim, criação. A migração pressupõe uma ação em lotes
de diversos itens.
Outros desafios para metadados:
• Ambiguidade – palavras podem ser entendidas de diferentes formas. Isso demonstra a ne-
cessidade de concordância em uma terminologia; e a necessidade de concordância de como
documentos são colocados em categorias;
• Heterogeneidade – conteúdo e comunidades. Isso demonstra a necessidade de endereçar
todas as formas de conteúdo; e a necessidade de suportar todas as comunidades de usuários;
• Criação e uso – Entender a audiência focada; e também entender a necessidade da empresa.
2.2.5. Dublin Core.
Em 2001, o Dublin Core Metadata Initiative (DCMI) e o Institute for Electrical and Electronics
Engineers (IEEE) Learning Object Metadata (LOM) Working Group se reuniram para estabelecer al-
guns princípios considerados básicos e comuns a todos os domínios de metadados, auxiliando no
estabelecimento de padrões de metadados e aplicações (ALVES, 2010).
Atualmente o DCMI é a instituição responsável por guiar essa construção de metadados e
padrões de metadados, estabelecendo princípios comuns que devem estar em consonância com re-
gras e normas emergentes e internacionais, com o intuito de garantir a construção adequada e pa-
dronizada de metadados e, com isso, a interoperabilidade entre sistemas (ZENG, QIN, 2008 apud
ALVES, 2010).
Tendo como base as resoluções do DCMI, os autores Zeng e Qin (2008 apud ALVES, 2010)
destacam a existência de três princípios básicos para a construção de metadados:
• Simplicidade: refere-se aos atributos (metadados) necessários para a manutenção de um
conjunto mínimo de elementos descritivos para facilitar a implementação.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 22
É importante que os metadados sejam flexíveis para acomodar as necessidades específicas de
descrição, permitindo que sejam incluídos novos metadados para atender a necessidades específicas
de um domínio específico (ZENG; QIN, 2008, apud ALVES, 2010).
• Extensibilidade: pode ser entendida de duas formas; a capacidade de um padrão de meta-
dados oferecer um conjunto de elementos descritivos que possa unificar os diferentes padrões de
descrição; e a capacidade de intercâmbio entre registros de metadados de um padrão de metadados
mais simples para outro mais complexo. A extensibilidade requer que os sistemas permitam a adição
de novos elementos de metadados em um padrão baseados em normas existentes, ou elementos
estabelecidos em nível local (ZENG; QIN, 2008, apud ALVES, 2010).
• Interoperabilidade: “é a capacidade de múltiplos sistemas com diferentes hardwares e pla-
taformas de softwares, estruturas de dados e interfaces intercambiarem dados com a mínima perda
de conteúdo e funcionalidade” (NISO, 2004, apud ALVES, 2010).
MNEMÔNICO: princípios básicos SEI SIMPLICIDADE / EXTENSIBILIDADE / INTEROPERABILIDADE
Duval et.al (2002 apud ALVES, 2010), destacam como princípios:
• Modularidade: permite que os desenvolvedores de padrões de metadados reutilizem os
atributos em outras estruturas semânticas e sintáticas de padrões de metadados, ao invés de rein-
ventar elementos. Refere-se à construção de metadados em blocos, categorias, grupos ou módulos
de elementos descritivos, de modo que esses metadados possam ser estruturados em categorias de
outros padrões de metadados com estruturas sintática e semanticamente diferentes, mas que pos-
sam ser interoperáveis. Em outras palavras, diferentes categorias semânticas de metadados são com-
binadas em outros padrões de metadados com estrutura sintática diferente, porém expressas em
uma linguagem comum, incorporando a funcionalidade e o significado de cada atributo. Dessa forma,
conjuntos de módulos podem ser criados para atender a requisitos específicos de uma aplicação,
combinando exigências específicas de um domínio com exigências gerais, sem danos à interoperabi-
lidade (DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010).
• Extensibilidade: um dos princípios indicados pelo DCMI, conforme já explicado, é a capaci-
dade de extensão, ou seja, de permitir a inclusão de novos metadados em um padrão de acordo com
as necessidades específicas de aplicação (DUVAL et.al, 2002);
• Refinamento: as aplicações de metadados em um domínio irão variar de acordo com a ne-
cessidade do grau de detalhe ou especificidade na descrição; dessa forma, os padrões de metadados
devem permitir a escolha do nível de detalhes na descrição dos recursos.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 23
Duas noções de refinamento devem ser consideradas: a adição de qualificadores, que são
elementos de metadados que qualificam e tornam o significado de um atributo mais específico (se-
melhantes a subcampos de descrição); e esquemas de codificação externos ao padrão de metadados
utilizados para padronizar a representação determinando os valores do elemento, como, por exem-
plo, vocabulários controlados, esquemas de codificação do conteúdo, notações de sistemas de clas-
sificação etc. (HILLMANN, 2005; DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010).
• Multilinguismo: incide sobre os aspectos da diversidade cultural e linguística que devem ser
considerados no momento de estabelecer os metadados de um padrão. Por exemplo, a maneira
como as datas são representadas em diferentes calendários; a direção na qual o texto é apresentado
e lido; conotações culturais de certos ícones e pictogramas, entre outros. É importante que os meta-
dados descrevam características relevantes de um recurso respeitando as diferenças culturais e lin-
guísticas (DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010).
Duval et.al (2002 apud ALVES, 2010) destacam como práticas:
• Perfil de aplicação: é um conjunto de elementos de metadados selecionados de um ou mais
esquema de metadados, combinados em um esquema composto. Os perfis de aplicação oferecem
meios para se expressar os princípios de modularidade e extensibilidade. Sua finalidade é combinar
esquemas de metadados adaptando-os às exigências funcionais de aplicações específicas, e man-
tendo a interoperabilidade com esquemas originais que serviram como base. Seu maior objetivo é
facilitar a interoperabilidade semântica (DUVAL et.al, 2002 apud ALVES, 2010).
• Sintaxe e semântica: é necessário um acordo comum entre dois domínios, tanto a sintaxe
quanto a semântica dos metadados. Em outras palavras, é preciso que domínios diferentes compar-
tilhem o mesmo significado de um atributo ou metadado e que estabeleçam uma convenção comum
para a identificação e a codificação dos valores em uma sintaxe, caso contrário não haverá intercâm-
bio de dados (DUVAL et.al, 2002 apud ALVES, 2010).
• Associações entre modelos: referem-se à associação entre diferentes registros de metada-
dos de um mesmo recurso informacional. Múltiplos registros de metadados refletem os vários pro-
pósitos e perspectivas de diferentes organizações ao criarem e gerenciarem metadados. Espera-se
que esses registros sejam gerenciados de forma coordenada (DUVAL et.al, 2002 apud ALVES, 2010).
• Identificando e nomeando elementos de metadados: símbolos X etiquetas: os metadados
são expressos por um nome que pode ser codificado por meio de uma etiqueta em linguagem natural
ou codificado em símbolos. Ferramentas específicas podem utilizar rótulos de apresentação diferen-
tes da codificação original dos metadados para melhor visualização e entendimento (DUVAL et.al,
2002 apud ALVES, 2010).
• Registro de metadados: um sistema formal para documentação de conjuntos de metada-
dos, perfil de aplicação, esquemas de codificação, informações de uso do elemento e crosswalks. A
função primária dos registros de metadados é registrar, publicar e gerenciar essas especificações,
como também facilitar a busca dentro do registro (ZENG, QIN, 2008 apud ALVES, 2010).
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 24
• Integralidade na descrição: nem todos os atributos disponíveis em um esquema de meta-
dados serão utilizados ou são adequados para representar um recurso; a representação deve conter
os atributos essenciais para caracterizar o recurso. Além disso, a seleção apropriada dos valores tam-
bém se constitui em um item importante para compor a totalidade da descrição. Assim, a riqueza na
descrição será determinada por políticas de melhores práticas estabelecidas pela agência criadora
dos metadados e construídas a partir de requisitos funcionais ou serviços de aplicação em diferentes
domínios (DUVAL et.al, 2002 apud ALVES, 2010).
Políticas de melhores práticas são orientações para a realização de uma tarefa de modo mais
eficiente (com menos esforço) e mais efetivo (com melhores resultados). Não se constituem nem
como um padrão nem como um regulamento, mas sim como diretrizes a serem seguidas para enri-
quecer a representação (ZENG, QIN, 2008 apud ALVES, 2010).
• Elementos obrigatórios X opcionais: padrões de metadados para propósitos gerais reque-
rem um alto grau de flexibilidade. Dessa forma, um elemento de metadado pode ser essencial em
um domínio e em outro não, por não refletir as características de um determinado recurso. Por esse
motivo, não há como pensar em obrigatoriedade em algum elemento de metadados. Contudo, é
importante se pensar em políticas de boas práticas para especificar normas de conduta para o uso
de um determinado padrão em um domínio, favorecendo, assim, a padronização na estrutura dos
elementos em um domínio e consequentemente a interoperabilidade (DUVAL et.al, 2002).
• Metadados subjetivos X objetivos: o processo de criação de metadados pode envolver me-
tadados objetivos, aqueles que são características de fato, tais como título, autor, data; ou metada-
dos subjetivos, aqueles que são atribuídos, tais como assunto, palavras-chave, resumo etc. Outros
metadados são subjetivos por estarem sujeitos a interpretações sob diferentes pontos de vista ou
domínios. Dessa forma, um dos requisitos no desenvolvimento de metadados é explicitar o contexto
da informação, para que os aplicativos possam identificar mais facilmente o contexto onde está in-
serido o recurso (DUVAL et.al, 2002 apud ALVES, 2010).
• Geração automática de metadados: entre a criação manual de representações em padrões
de metadados e entre as ferramentas de Harvesting e indexação automática de metadados, existe
uma variedade de outras aplicações de padrões as quais podem ser utilizadas para a geração auto-
mática de metadados. É possível reduzir custos com o processamento automático das informações
na medida em que as descrições e o estabelecimento de metadados sejam mais consistentes (DUVAL
et.al, 2002 apud ALVES, 2010).
ANOTAÇÕES
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 25
UM ADENDO
Segundo o IBICT8
(2020) processo de interoperabilidade, relacionado ao movimento de ar-
quivos abertos, atende a existência de três elementos, os provedores de dados, os provedores de
serviços e os agregadores. Como o foco está no intercâmbio de informação entre sistemas informa-
tizados, de forma automática, os provedores de dados são os sistemas que ofertam os dados para
que sejam coletados para os provedores de serviços, de forma a poderem ofertar serviços consolida-
dos. Os agregadores são sistemas que coletam as informações como os provedores de serviços e,
também, ofertam os dados coletados como os provedores de dados (figura 1).
Um provedor de dados dispõe seus dados na forma de sets, ou seja, conjunto de registros.
Assim, a coleta pode ser feita em todo o provedor ou em apenas alguns sets. Os sets podem ser
estruturais ou virtuais. Em grande parte dos provedores de dados os registros estão contidos em
estruturas de organização, com os sets representando essas estruturas. Outros provedores criam sets
virtuais conforme alguma característica ou para responder a algum provedor de serviço.
Para o processo de coleta automática de metadados (harvesting), por sua vez, tem-se a utili-
zação de um protocolo, os esquemas de metadados, os crosswalks e os mapeamentos. Esse processo
é assíncrono, ocorrendo conforme planejamento, ou seja, um determinado agregador ou provedor
de dados programa a ocorrência da coleta, conforme as necessidades.
No que ser refere ao protocolo, atualmente se concentram em dois, o Open Archives Initiative
Protocol for Metadata Harvesting (OAI-PMH) e o Open Archives Initiative Object Reuse and Exchange
(OAI-ORE). Os dois protocolos possuem a mesma finalidade de coletar automaticamente metadados
dos provedores de dados, mas se diferem apenas em questões simples, enquanto o OAI-PMH coleta
apenas os metadados, o OAI-ORE permite coletar, os metadados, as relações entre os objetos digitais
descritos pelos metadados e até os objetos digitais. Há duas implementações desses protocolos, um
que faz a coleta e outro que responde. O REPOX, como agregador, implementa as duas camadas de
protocolo, que coleta e responde a coleta.
Os metadados coletados se apresentam no formato XML, que facilita o processamento nos
provedores de serviços e agregadores. Entretanto, devem estar em um esquema de metadados, um
padrão que permite que os sistemas processem corretamente o conteúdo. Nesse ponto, grande
parte dos sistemas que implementam a interoperabilidade responde, no mínimo com o esquema de
metadados Dublin Core. O REPOX pode coletar e responder a vários esquemas de metadados graças
à implementação dos Crosswalks.
Como os metadados são interoperados no formato XML, podem-se flexibilizar os provedores
de dados, agregadores e provedores de serviços com os crosswalks, que são programas conversores,
desenvolvidos em XSLT (eXtensible Stylesheet Language for Transformation). Assim, possibilita a
transformação de um esquema de metadados para outros. No REPOX foram desenvolvidos alguns
crosswaks para atender as necessidades da BDTD.
8
IBICT. REPOX. In: Ibict Wiki, 2018. Disponível em: http://wiki.ibict.br/index.php/P%C3%A1gina_principal Acesso em:
13/05/2020.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 26
Outro ponto importante para os provedores de dados e agregadores é a normalização do
conteúdo. Como coleta-se metadados de vários provedores de dados, em muitos casos, utilizam-se
padrões diferentes. Por exemplo, para idioma têm-se padrões ISO com duas ou três letras. Assim,
Português pode ser representado por: pt, pt_br ou por. Para unificar o conteúdo pode-se fazer uso
de mapeadores, em campos que são padronizados nos provedores de dados, mas difere-se de um
provedor para outro. Os mapeadores são implementados com XSLT, da mesma forma que os cros-
swalks.
Nesse contexto, o REPOX permite criar um agregador, com interface para gerenciamento do
harvesting, com a utilização do protocolo OAI-PMH. Oferta, também, facilidades para desenvolvi-
mento e integração de crosswalks e mapeadores. Com isso, torna-se uma ferramenta completa no
que se refere ao harvesting.
O REPOX é um software livre e de código aberto para a criação de provedores de dados, agre-
gadores e provedores de serviços (quadro 1), desenvolvido e mantido pelo Instituto Superior Técnico
– IST de Portugal. Assim, possibilita a implementação de todos os elementos relacionados ao movi-
mento dos arquivos abertos, tornando um software útil a instituições que desejam implementar ser-
viços de arquivos aberto.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 27
... retornando ao Dublin Core:
Segundo Alves (2010) as tipologias de formatos de metadados podem ser assim agrupadas:
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 28
a) Formatos simples: constituídos por metadados não estruturados, extraídos de forma automática
por robôs, apresentam na maioria das vezes uma semântica reduzida. Ex.: MetaTag(s) e metadados
utilizados na transferência de dados por meio do protocolo HTTP - hipertext transfer protocol.
b) Formatos estruturados: constituídos por metadados mais estruturados, baseados em normas
emergentes e que proporcionam uma descrição mínima do recurso para sua identificação, localiza-
ção e recuperação. A descrição geralmente é feita em campos e nessa categoria começa a ser inserida
a ajuda de especialistas em informação. Ex.: padrão de metadados Dublin Core – DC (ALVES, 2010).
c) Formatos ricos: também considerados padrões de metadados altamente estruturados, são cons-
tituídos por metadados complexos, apresentam uma estrutura de descrição mais formal e detalhada.
São baseados em normas e códigos especializados de um domínio particular, possibilitam a descrição
de um recurso informacional individual ou pertencente a uma coleção e facilitam a localização, a
recuperação, o intercâmbio dos recursos informacionais. Ex.: padrão de metadados ou formato
MARC 21, da área de Biblioteconomia (ALVES, 2010).
---
A iniciativa Dublin Core Metadata Initiative (DCMI) teve origem em 1994, em Chicago, Estados
Unidos, durante a segunda Conferência Internacional sobre a Web. A DCMI voltou a se reunir em
1995, dessa vez em Ohio, também nos Estados Unidos. Dessa reunião surgiu o padrão de metadados
que vem sendo amplamente utilizado no mundo todo (PEREIRA9
; RIBEIRO JUNIOR; NEVES, 2005).
Marcondes10
; Sayão (2001) afirmam que a convergência e o uso integrado das tecnologias de
comunicação, de computação e de conteúdo em formato digital, cujo paradigma é a Internet, tem
contribuído nos anos recentes para criar um novo ambiente de acesso, disseminação, cooperação e
promoção do conhecimento em uma escala global.
Uma das dificuldades encontradas em ambiente digital é à busca de informações. Apesar da
existência de uma diversidade de mecanismos de buscas que facilitam a busca e recuperação de in-
formações, em sua maioria, essas ferramentas apresentam um desempenho insatisfatório. Quem
costuma utilizar as ferramentas de pesquisa sabe que a quantidade de resultados apresentadas em
uma sessão de busca é muito grande, havendo a necessidade de refinar a busca para encontrar o
conteúdo procurado (MODESTO11
, 2005).
O padrão Dublin Core foi utilizado nos anos 1990 para websources internos das corporações,
porém com as novas possibilidades dos FRBR, FRAD e do RDA, bem como sua integração ao OWL do
W3C e a web semântica, foi popularizada a aplicação desse padrão de dados à web.
9
PEREIRA, A. M. ; RIBEIRO JÚNIOR, D. I. ; NEVES, G. L. C. Metadados para a descrição de recursos da Internet: as novas
tecnologias desenvolvidas para o padrão Dublin Core e sua utilização. Revista ACB: Biblioteconomia em Santa Catarina.
v. 10, n. 1, p. 241-249, jan./dez., 2005.
10
MARCONDES, C. H.; SAYÃO, L. F. Integração e interoperabilidade de acesso a recursos informacionais eletrônicos em
C&T: a proposta da biblioteca digital brasileira. Ci. Inf., Brasília, v. 30, n. 3, p. 24-33, set./dez. 2001.
11
MODESTO, F. Metadados: introdução básica. Disponível em: Acesso em: 27 mar. 2010.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 29
(SOUZA; CATARINO; SANTOS, 1997)
Assim, organização de conteúdos podem ser viabilizados, tanto em arquiteturas da informa-
ção mais robustas, à mais simples configuração na camada de descrição de uma página XHTML ou
XML descrevendo as características desses conteúdos. Veja na figura acima, que o Dublin Core atende
às demandas dos metadados e a sua encontrabilidade na Internet. Souza; Catarino; Santos (1997)
apresentam a seguir uma breve descrição dos quinze elementos do Dublin Core, de acordo com Wei-
bel (1997):
1. Title (Título) – o nome dado ao documento eletrônico pelo autor;
2. Author or Creator (Autor) – pessoas ou organizações responsáveis pelo conteúdo intelec-
tual do objeto;
3. Subject and Keywords (Assunto) – representa o assunto do documento eletrônico, po-
dendo ser definido a partir de sistemas de classificação (CDD, CDU, LCSH) ou Thesaurus, ou simples-
mente por uma palavra ou conjunto de palavras.
4. Description (Descrição) – descrição do conteúdo, podendo ser resumo para DLO ou con-
junto de palavras.
5. Publisher (Editor) – entidades responsáveis por tomar o documento disponível na presente
forma, tais como editor, universidades ou entidades corporativas.
6. Other Contribuitors (Outros Colaboradores) – outras pessoas que contribuíram para a re-
alização da obra (editores, tradutores, ilustradores, etc.).
7. Date (Data) – a data em que foi disponibilizado o recurso.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 30
8. Resource Type (Tipo de Recurso) – gênero do recurso, tais como: home pages, dicionário,
vídeos, arquivo de dados, software, etc.
9. Format (Formato) – a manifestação física do documento eletrônico, tais como: Postcript,
HTML ou PDF.
10. Resource Identifier (Identificação) – série ou número usado para identificar o documento
(URL, ISBN etc.).
11. Source (Fonte) – o documento (impresso ou eletrônico ou digital) do que se originou o
recurso eletrônico.
12. Language (Idioma) – idioma do conteúdo intelectual do documento.
13. Relation (Relação) – relacionamento com outros documentos impressos ou eletrônicos
(por exemplo imagens em um documento, capítulos em um livro ou itens em uma coleção).
14. Converge (Cobertura) – locação espacial ou duração temporal característica do docu-
mento.
15. Rights Management (Direito Autoral) – informação sobre copyrigth.
(SOUZA; CATARINO; SANTOS, 1997)
Porém, o contexto destes autores SOUZA; CATARINO; SANTOS (1997) trazem a nossa mente
as aplicações web sources estruturadas em banco de dados disponibilizados na superfície da Internet.
Ainda não se discutia as camadas de descrição XHTML. Vamos atualizar, então, o nosso estudo:
Segundo a DCMI12
(2017) o Dublin Core Metadata Element Set [Recomendação DCMI]. Este
documento extrai dos termos de metadados DCMI os quinze elementos do clássico "Dublin Core",
que foi padronizado como: Padrão ISO 15836: 2009 e Norma ANSI / NISO Z39.85-2012.
12
https://www.dublincore.org/specifications/
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 31
A ISO 15836:2017 foi atualizada para suportar aplicações em RDF ou XML Schema processá-
veis em robôs de busca da Internet. A revisão ISO 15836-1/2017 cancela e substitui o ISO 15836:
2009, do qual constitui uma menor versão: 1) Este documento abrange os mesmos elementos que o
ISO 15836: 2009; 2) Propriedades e classes em ISO 15836-2 não foram incluídos na versão anterior
do ISSO 15836: 2009; 3) Os elementos principais e suas especificações estão agora localizados na
Cláusula 3; e 4) Algumas definições foram atualizadas (por exemplo, recurso e data) e a introdução
foi revisada (ISO13
, 2017).
Segundo a ISO 15836-1/2017, o conjunto completo de vocabulários, DCMI Metadata Terms
[DCMI-TERMS], estão especificados no ISO 15836-2. Os elementos principais podem ser usados em
combinação com termos de metadados de outros vocabulários compatíveis no contexto dos perfis
de aplicação, conforme 21 http://www.dublincore.org/specifications/ 22 ISO 15836-1:2017(E) espe-
cificado no DCMI Abstract Model [DCAM]. Nas definições de elementos, as seguintes convenções
foram usadas:
1) cada elemento possui um rótulo descritivo ("rótulo") para o reconhecimento humano;
2) cada elemento também possui um token exclusivo ("nome") para uso no processamento
da máquina;
3) de acordo com a Política de espaço de nomes DCMI [DCMI-NAMESPACE] especificada em
ANSI / NISOZ39.85: 2012, o "nome" de um elemento é anexado a um URI do namespace DCMI [RFC
3986] para construir um Uniform Resource Identifier como um identificador globalmente exclusivo
para esse elemento; e,
4) O uso de nomes de elementos e URIs no contexto de diferentes tecnologias de implemen-
tação, é explicado nas Diretrizes de codificação DCMI [DCMIENCODINGS] (ISO, 2017).
A Z39.85:201214
traz referências para a implantação do Dublin Core. Apresenta uma explica-
ção sucinta dos 15 elementos e os documentos auxiliares que especificam cada elemento desses
conforma a figura acima. É uma norma indicativa e referencial, porém não apresenta detalhes. Estes
dois documentos ISO 15836-1:2017(E) e a ANSI NISO z39.85:2012 são básicos e indispensáveis para
iniciar o Dublin Core.
Os pressupostos em evolução que durante a última década levaram de quinze elementos
[RFC2413] para o Framework de Singapura para Dublin Core Application Profiles [DCAP], podem ser
capturados em um modelo em camadas de interoperabilidade. O modelo de níveis apresentado aqui
aborda a necessidade sentida em muitas comunidades para posicionar vários projetos com vários
graus de interoperabilidade com Dublin Core, mas sem uma terminologia apropriada (DCMI, 2017).
A intenção é fornecer uma "escala de interoperabilidade", especificando as escolhas, custos e bene-
fícios envolvidos na concepção de aplicativos para maior interoperabilidade de níveis.
13
ISO 15836-1:2017(E)
14
ANSI NISO z39.85:2012
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 32
INTEROPERABILIDADE DE NÍVEIS DUBLIN CORE
4: Description Set Profile Interoperability
- Shared formal vocabular and constraints in records
3: Description Set Syntatic Interoperability
- Shared formal vocabularies in exchangeable records
2: Formal Semantic Interoperability
- Shared vocabularies based on formal semantics
1: Shared term definitions
- Shared vocabularies defined in natural language
Nível 1: definições de termos compartilhados O Dublin Core de quinze elementos (como nos
padrões NISO, ISO e IETF) fornece um vocabulário de conceitos com definições de linguagem natural.
Deixando de lado as considerações de processabilidade da máquina (semântica "formal"), tais voca-
bulários fornecem uma base para o compartilhamento de significados dentro e entre grupos de pes-
soas - uma interoperabilidade "informal" que não requer o uso de URIs para termos de referência,
domínios formalmente especificados e intervalos, ou construções de ordem superior, como o modelo
abstrato DCMI [ABSTRACTMODEL]. Por exemplo, a reutilização de definições e mapeamentos de
termo DCMI para termos DCMI fornecidos pelo IEEE Learning Object Metadata pode ser vista como
fornecendo "conformidade informal" com Simple Dublin Core (DCMI, 2017).
Nível 2: interoperabilidade semântica formal A interoperabilidade "semântica" é baseada
em um uso preciso e correto da semântica RDF formal incorporada no modelo de dados de gráfico
RDF e em vocabulários baseados em RDF, como os Termos de Metadados DCMI. A "semântica" neste
sentido não se refere a definições de linguagem natural bem formadas (que é como a palavra "se-
mântica" tradicionalmente tem sido usada na comunidade Dublin Core). Em vez disso, ele se refere
a relações formalmente estabelecidas entre termos e regras para usar essas afirmações para tirar
conclusões automáticas (inferências lógicas). Isso inclui o uso (ou encontrabilidade) de URIs e a con-
formidade com domínios formalmente especificados, intervalos e relações de sub-propriedade. In-
dependentemente do formato de codificação nativo, uma especificação pode ser dita ser "interope-
rável semanticamente" se for fornecer um mapeamento completo para triplos RDF, por exemplo
através de uma transformação GRDDL (DCMI, 2017).
Nível 3: definir interoperabilidade sintática Em cima dos gráficos ilimitados especificados
pelo RDF, o DCMI Abstract Model caminha as noções de Descrições e Conjuntos de Descrição, forne-
cendo uma base para a validação e troca de registros de metadados [ABSTRACT-MODEL]. Metadados
estruturados de acordo com o modelo abstrato DCMI - por exemplo, a criação de dados usando di-
retrizes recentes de sintaxe do DCMI - pode ser dito "modelo abstrato DCMI interoperável". Além da
sintaxe abstrata RDF, o modelo abstrato DCMI fornece:
1) A noção de um "conjunto de descrições" como uma entidade delimitada com uma identi-
dade específica - como na biblioteca e repositório - noção de comunidade de um "registro" que pode
ser gerenciado.
Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2.
Pág. 33
2) A noção de uma "descrição" como uma entidade delimitada com uma identidade especí-
fica, mesmo que a descrição seja incorporada em um registro.
3) Um modelo estendido de "declarações" como gráficos usando várias combinações de URI
de valor, Cadeias de valor e URI de esquema de codificação de vocabulário. (A noção formal do Es-
quema de codificação do vocabulário é específica para o modelo abstrato DCMI).
4) Convenções para distinguir entre a "representação" de um recurso descrito e a "identifica-
ção" desse recurso com um URI. Convenções para "representar" um recurso de valor único com ca-
deias de valores múltiplos (DCMI, 2017).
Nível 4: definir interoperabilidade do perfil A especificação "Descrição Definir perfis: um idi-
oma de restrição para Dublin Core Application Profiles" [DC-DSP] fornece um modelo de informação
e expressão XML de restrições estruturais em um conjunto de descrições. Uma aplicação como o
Perfil de Aplicação de Acadêmicas Acadêmicas (Eprints) pode ser dito ser "Descrição-Definir-Perfil-
interoperável" se fornecer restrições formais em um Conjunto de Descrição que seja compatível com
aqueles na especificação do Perfil de Conjunto de Descrição. Uma especificação relacionada, Singa-
pore Framework for Dublin Core Application Profiles [DCAP], descreve um pacote de elementos de
documentação necessários para apresentar um aplicativo de metadados para máxima interoperabi-
lidade e reutilização - elementos como requisitos funcionais, um modelo de domínio e um conjunto
de descrições Perfil abrangendo o conjunto completo de metadados (DCMI, 2017).
O Dublin Core é atualmente um padrão flexível – elementos opcionais e podem ser repetiti-
vos; elementos podem ser exibidos em qualquer ordem; é extensível (tanto seus elementos, quanto
seus qualificadores); independe de sintaxe; é internacional; e independe de assunto.
2.2.6. O papel dos padrões.
Quanto mais a organização aderirem aos padrões, p. ex., Dublin Core, a informação pode ser
mais facilmente intercambiada entre repositórios. Diversas tecnologias de conteúdo oferecem origi-
nalmente repositórios no padrão Dublin Core e formatos de conteúdo aderentes. Pode-se começar
com um sub-conjunto e usar tanto ou tão pouco quanto necessário.
Existem outros padrões, p. ex., ISO 15489 – informação e documentação – gestão de registros;
ISO 23081 – processos de gestão de registros – metadados para registros – princípios; Departamento
de Defesa dos EUA DOD 5015.2-STD; Padrão de metadados para o e-government do Reino Unido e-
GMS; Padrão de metadados do governo australiano para serviços de localização AGLS; MoReq2 Mo-
delo de requisitos para a especificação de sistemas de gestão eletrônica de registros; etc.
A Library of Congress disponibiliza vários frameworks para metadados e registros. Dentre eles
temos o Marc21, o MARCXML, o EAD, entre outros.

Mais conteúdo relacionado

Semelhante a Aula 2.2. Minicurso de ECM

Bibliotecas digitais21
Bibliotecas digitais21Bibliotecas digitais21
Bibliotecas digitais21silviaalves
 
Software para Gestao de Conteudo: Sete Caracteristicas Criticas
Software para Gestao de Conteudo: Sete Caracteristicas CriticasSoftware para Gestao de Conteudo: Sete Caracteristicas Criticas
Software para Gestao de Conteudo: Sete Caracteristicas CriticasJose Claudio Terra
 
Sistema de Base de Dados1.ppt
Sistema de Base de Dados1.pptSistema de Base de Dados1.ppt
Sistema de Base de Dados1.ppthhuu6
 
Módulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpaceMódulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpaceRodrigo Prado
 
Concepcao de banco_de_dados-aula_1
Concepcao de banco_de_dados-aula_1Concepcao de banco_de_dados-aula_1
Concepcao de banco_de_dados-aula_1Carlos Melo
 
Conceitos Base_de_Dados.pdf
Conceitos Base_de_Dados.pdfConceitos Base_de_Dados.pdf
Conceitos Base_de_Dados.pdfticepcCapelas
 
Trabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetosTrabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetoseneck
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basicoAmadeo Santos
 
Metadados
MetadadosMetadados
Metadadoslulinha
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014WANDERSON JONER
 
Sistemas de gerenciamento de documentos
Sistemas de gerenciamento de documentosSistemas de gerenciamento de documentos
Sistemas de gerenciamento de documentosClaudiane Weber
 
Ver
VerVer
Vercsmp
 

Semelhante a Aula 2.2. Minicurso de ECM (20)

Bibliotecas digitais21
Bibliotecas digitais21Bibliotecas digitais21
Bibliotecas digitais21
 
Banco de dados aula 2
Banco de dados  aula 2Banco de dados  aula 2
Banco de dados aula 2
 
PHP 10 CodeIgniter
PHP 10 CodeIgniterPHP 10 CodeIgniter
PHP 10 CodeIgniter
 
Software para Gestao de Conteudo: Sete Caracteristicas Criticas
Software para Gestao de Conteudo: Sete Caracteristicas CriticasSoftware para Gestao de Conteudo: Sete Caracteristicas Criticas
Software para Gestao de Conteudo: Sete Caracteristicas Criticas
 
Sistema de Base de Dados1.ppt
Sistema de Base de Dados1.pptSistema de Base de Dados1.ppt
Sistema de Base de Dados1.ppt
 
Módulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpaceMódulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpace
 
Aula 2.3. Minicurso de ECM
Aula 2.3. Minicurso de ECMAula 2.3. Minicurso de ECM
Aula 2.3. Minicurso de ECM
 
Concepcao de banco_de_dados-aula_1
Concepcao de banco_de_dados-aula_1Concepcao de banco_de_dados-aula_1
Concepcao de banco_de_dados-aula_1
 
Banco de dados parte 01
Banco de dados parte 01Banco de dados parte 01
Banco de dados parte 01
 
Banco de dados_orientado_a_objetos
Banco de dados_orientado_a_objetosBanco de dados_orientado_a_objetos
Banco de dados_orientado_a_objetos
 
Metadados
MetadadosMetadados
Metadados
 
Conceitos Base_de_Dados.pdf
Conceitos Base_de_Dados.pdfConceitos Base_de_Dados.pdf
Conceitos Base_de_Dados.pdf
 
Ara7129 unidade-1-v1
Ara7129 unidade-1-v1Ara7129 unidade-1-v1
Ara7129 unidade-1-v1
 
Trabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetosTrabalho banco de dados orientado a objetos
Trabalho banco de dados orientado a objetos
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basico
 
Metadados
MetadadosMetadados
Metadados
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
 
Sgc
SgcSgc
Sgc
 
Sistemas de gerenciamento de documentos
Sistemas de gerenciamento de documentosSistemas de gerenciamento de documentos
Sistemas de gerenciamento de documentos
 
Ver
VerVer
Ver
 

Mais de Priscyla Patrício

Bases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dadosBases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dadosPriscyla Patrício
 
Gestão da inovação 4EIIMproject
Gestão da inovação 4EIIMprojectGestão da inovação 4EIIMproject
Gestão da inovação 4EIIMprojectPriscyla Patrício
 
computação cognitiva: interface para a ciência da informação
computação cognitiva: interface para a ciência da informaçãocomputação cognitiva: interface para a ciência da informação
computação cognitiva: interface para a ciência da informaçãoPriscyla Patrício
 
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...Priscyla Patrício
 

Mais de Priscyla Patrício (7)

Aula 1.2. Minicurso de ECM
Aula 1.2. Minicurso de ECMAula 1.2. Minicurso de ECM
Aula 1.2. Minicurso de ECM
 
Aula 1.1. Minicurso de ECM
Aula 1.1. Minicurso de ECMAula 1.1. Minicurso de ECM
Aula 1.1. Minicurso de ECM
 
Bases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dadosBases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dados
 
Plano de Unidades Didáticas
Plano de Unidades DidáticasPlano de Unidades Didáticas
Plano de Unidades Didáticas
 
Gestão da inovação 4EIIMproject
Gestão da inovação 4EIIMprojectGestão da inovação 4EIIMproject
Gestão da inovação 4EIIMproject
 
computação cognitiva: interface para a ciência da informação
computação cognitiva: interface para a ciência da informaçãocomputação cognitiva: interface para a ciência da informação
computação cognitiva: interface para a ciência da informação
 
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...
Implementação da Rede de Bibliotecas Digitais no âmbito do Departamento de Co...
 

Aula 2.2. Minicurso de ECM

  • 1. Priscyla Patrício PAPIRVM BIBLIOTECONOMIA Minicurso: conhecimentos básicos de Enterprise Content Management
  • 2. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 1 INTRODUÇÃO ÀS TECNOLOGIAS DE ECM – 2.2. Os metadados. 2.2.1. Delimitando o conceito de metadado. Antes de iniciar o tema é importante fazer duas ressalvas: • A visão teórica de metadados aqui fornecida é da AIIM pelo ECM p, e não da bibliotecono- mia ou ciência da informação. Poderá, eventualmente, ser feita uma comparação; • O metadado aqui é entendido como uma tecnologia fabricada no próprio recurso de tecno- logia, que capturado, convertido ou migrado para o sistema de ECM, traz consigo algum ní- vel de descrição. Por isso, não cabe aqui o termo catalogação, mas sim registro. Por isso, posso descrever utilizando a ISAD(G), para documentos, fazer algum tratamento de da- dos com BI, ou de processos com o BPM, ou ainda, alguma padronização no recurso de modelo rela- cional de dados em uma base de dados, e aí, sim, utilizar a RDA ao invés da AACR-2, ISBD(G), etc. Os Recursos de Descrição e Acesso RDA é uma norma de descrição que pode ser utilizada tanto em arquivos, como em bibliotecas, e é baseada no modelo conceitual de entidade-relacionamento FRBR Requisitos Funcionais para Registros Bibliográficos. A RDA é compatível com diversos padrões de metadados, tais como, MARC21, CCF, etc. Também posso utilizar para descrever o padrão Dublin Core. Assim, é importante fazer a se- guinte distinção – modelo de metadado ou formato de dados, no caso do MARC21; é diferente de conteúdo do metadado, p. ex.: o conteúdo pode ser RDA, ISAD (G), etc., e que, por sua vez, é dife- rente de camada tecnológica, p. ex.: norma ISO 2709, protocolo z329.50, OAI-PMH, etc. Por isso é um pouco complicado misturar os conceitos agora, pois a concepção de registro na biblioteconomia e na arquivologia é avançada em relação à visão da AIIM pelo ECM. Quando for interessante, conforme dito, serão feitas comparações pontuais. -- Para a AIIM pelo ECM p os metadados são “dados sobre dados”. São etiquetas com dados inseridos em conteúdo ou armazenados externamente deste que identificam o conteúdo para fins de organização e identificação. O conceito de metadados é anterior às tecnologias de ECM. Então, guarde essa informação – metadado “embutido” e metadado artificial, “fabricado”. Os metadados externos ou “fabricados”, ou ainda, manualmente inseridos em um sistema de informação, é a forma mais comum de metadados. Quando se digitaliza um documento, por exemplo, junto aos arquivos de imagem, ou do ar- quivo .PDF vem: - nome, local, tamanho, tipo, atributos, proprietário, produtor, etc. Basta clicar com o botão direito do seu mouse em qualquer arquivo de .PDF e ir para propriedades que lá você encon- trará essas informações.
  • 3. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 2 Algumas normas e diretrizes pontuam, inclusive, que na digitalização devem ser obedecidos determinados níveis de granularidade, visibilidade, escala de cinza, etc. Veja a resolução nº 31 do CONARq, por exemplo. Lá existe um padrão de configuração dos escâneres para a digitalização de documentos do arquivo permanente, visando sua preservação. Metadados define o que algo é, para que serve e que características possui. O seu valor con- siste em identificar e recuperar conteúdo através de suas características. Propriedades e valores associados à recursos para ajudar a achar, identificar, usar, gerenciar, avaliar e preservar estes recursos. A unidade básica de um metadado é uma declaração. Por isso, o AACR-2, com a ISBD(G), não cabem aqui, pois essas normas catalogam recursos como se fossem mensagens baseadas em sintaxe e semântica, ou seja, pontuação e posição, e o que a pontuação e posição significam, mas essas estruturas podem não significar nada para um sistema. Entretanto, o RDA, em contrapartida, é mais aderente ao conceito de declaração. Uma declaração (entidade) consiste de uma propriedade (atributo), ou elemento, e de um valor (conteúdo do atributo), por exemplo, a camisa tem uma cor (propriedade) que é azul (valor). Declarações de metadados descrevem recursos que podem ser utilizados por tecnologias de conteúdo. E, na maioria dos casos, é através dos metadados que as tecnologias se tornam interope- ráveis e possibilitam algum tipo de portabilidade de declaração. Portanto, no portal de uma loja de roupas e moda, posso localizar todos os produtos que têm a mesma cor azul. Ainda, por meio dessa seleção de argumento, posso ter sugestões de outros produtos relaci- onados ou quem comprou este comprou também..., por meio dos “metadados horizontais”. E posso fornecer informações para o sistema, mesmo aplicando apenas um clique. Os metadados, para o ECM p, podem ser usados para descrever conteúdo de três formas: • Descritivos – descrevem o conteúdo para fins de pesquisa e recuperação; • Estruturais – unem conteúdo a outras fontes de conteúdo, p. ex., metadados horizontais; e, • Administrativos – controla o acesso ao conteúdo. ALERTA: Essas três formas são diferentes da abordagem das da biblioteconomia e ciência da informação!
  • 4. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 3 Por que metadados e identificação são importantes? • Sistemas de ECM podem cobrir um grande leque de informações em diferentes – formatos de mídia e tipos, sistemas, assuntos, ciclos de vida, etc. Para diferentes receptores; • Metadados oferecem um meio de gestão da informação pelo seu ciclo de vida; • Possibilitam a organização do conteúdo para suportar uma variedade de razões corporativas; • Metadados compreensivos fazem a pesquisa e recuperação ficar mais efetiva. Fontes de metadados: • Metadados-fonte; • Fontes multimídia; • Auto-classificação e auto-indexação. Metadados-fonte: • Específicos do documento – precisa ser digitado pelo usuário (p. ex., título, endereços); • Específico do usuário – derivado da identificação log-in (p. ex., nome, cargo, contato); • Dados do sistema – p. ex., datas, horários, a aplicação de software em uso, etc.); • Padrão – p. ex., idioma, status (rascunho ou publicado “aprovado”) – baseado no que o usu- ário normalmente faz e na área de negócio que ele normalmente trabalha; • Valores inerentes da classe e arquivos – de um esquema de classificação no qual o item foi salvo como um registro. 2.2.2. O valor do metadado para a empresa. Rowley (2002) ensina que bases de dados são compostas por um conjunto de arquivos e re- gistros. Arquivo, em uma base de dados, é a coleção de registros similares com relações entre si. Registro é a informação contida na base e que diz respeito a um item. Os registros bibliográficos são um tipo de METADADO. Requer um contexto mais especializado de dados. Os registros bibliográficos podem conter: campos de tamanho fixo, variável e chaves de busca. Arquivo também pode significar um tipo de recurso, p. ex., um PDF, um JPEG, etc. Para o ECM p a melhor gestão da informação pelos metadados envolve: → Classificação – que corresponde à organização do conteúdo para atender necessidades empresariais; e a classificação remete ao conteúdo no contexto, para agregar valor ao cliente (ex- periência do usuário);
  • 5. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 4 → Controlar distribuição – quando o conteúdo é liberado para publicação (aprovação) – ou seja, pressupõe a elaboração do metadado ‘embutido’; → Controlar acesso – determinar granularidade/complexidade da segurança do conteúdo; → Associar “declarações de qualidade” – sem metadados apropriados, identificar qual o con- teúdo é o “melhor” fica mais difícil. Metadados ‘ajudam’ a atividade de investigação e inteligência: Na medida em que, contém informações ‘embutidas’ no recurso, ou ‘arquivo’.
  • 6. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 5 Localização – Marcas ou identificadores permitem pessoas e máquinas indexar e recuperar a informação; Identificação implica em recuperação profundamente limitada pelos metadados. Mas, como assim? Máquinas indexam? UM ADENDO Crawler, Spider e Bots. Crawler - é um software desenvolvido para realizar uma varredura na internet de maneira sistemática através de informação vista como relevante a sua função. Eles capturam os textos das páginas e cadastram os links encontrados e assim possibilitam encontrar novas páginas. São uma das bases das Search Engines, eles são os responsáveis pela indexação dos sites, armazenando-os na base de dados dos motores de busca. Também são conhecidos como Spider ou Bot (robô). O processo que um Web crawler executa é chamado de Web crawling ou spidering. Muitos sites, em particular os motores de busca, usam crawlers para manter uma base de dados atualizada. Os Web crawlers são principalmente utilizados para criar uma cópia de todas as páginas visitadas para um pós-processamento por um motor de busca que irá indexar as páginas baixadas para prover buscas mais rápidas. Crawlers também podem ser usados para tarefas de manutenção automatiza- das em um Web site, como checar os links ou validar o código HTML. Os crawlers também podem ser usados para obter tipos específicos de informação das páginas da Web, como minerar endereços de email (mais comumente para spam). Bom, os crawlers dos buscadores geralmente procuram informações sobre permissões sobre o conteúdo. Em espcial existem duas formas de bloquear um crawler decente de indexar uma deter- minada página (e os links nela contidos). A primeira forma, e mais comum, é através do arquivo ro- bots.txt. A outra forma é através da tag meta robots, com valor "noindex" ou "nofollow", usados para não indexar (a própria página) e não seguir (os links contidos na página), respectivamente. Há tam- bém uma terceira possibilidade, muito menos explorada, que é o uso do atributo rel="nofollow" em links, indicando ao crawler que aquele link em especial não deve ser seguido.
  • 7. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 6 Spider - Também conhecido como Robô, Robot, Bot ou Crawler. São programas usados pelos mecanismos de busca para explorar a internet de maneira automática e fazer download de conteúdo web de sites web. De forma metódica, não expõe o conteúdo que julga irrelevante no código fonte dos sites, e armazena o resto em seu banco de dados. Deste modo, os mecanismos de busca basea- dos em robôs (spider ou crawlers) que vasculham a Internet atrás de informações e classificam as buscas de acordo com os links e também os conteúdos encontrados nas páginas de busca, como é o caso do maior portal de buscas da web, o Google. Deste modo, qualquer página precisa ser rastreada pelo robô e assim, poder aparecer nos resultados de busca dos mecanismos em questão. Bots - Segundo Thurow (2003), os robôs executam três ações básicas: 1. Primeiro eles acham as páginas do sítio (processo chamado spidering ou crawling) e constroem uma lista de palavras e frases encontradas em cada página; 2. Com esta lista eles fazem um banco de dados e encontram as páginas exatas que eles devem procurar, inserindo o sítio vasculhado no banco de dados geral orga- nizado pelas características encontradas em suas páginas. A máquina que insere o sítio no banco de dados geral se chama indexer; 3. Depois disso o robô já está apto a encontrar este sítio quando o usuário final digitar na busca uma palavra ou expressão relativa ao conteúdo encontrado no sítio. Essa etapa é chamada query processor. Como podemos perceber, por trás de qualquer busca reali- zada na internet, há uma série de mecanismos que trabalham unidos para fornecer um resultado satisfatório ao usuário. O processo parece um tanto complexo, no entanto, nada perceptível a nós, meros buscadores de informações. Mas tem o outro lado: Os chatbots e os Coockies são bots usados para vendas. Quando se faz uma busca no Google, por exemplo, ou se visita um site, o chatbot entende que você está interessado em determinado produto ou serviço, e passa a te “perseguir” incansavelmente. Brincadeiras à parte, as redes sociais, como o Facebook disponibilizam muito esse recurso, é só você entrar naquele aplicativo de uma loja, e ‘voilá’, o seu feed é infestado de promoções, anúncios e conteúdo para vendas. --- O papel dos chatbots no marketing digital e na indexação de conteúdo da Web para empresas é uma abordagem consideravelmente relevante. Um pouco sobre organização da informação na In- ternet, Web Semântica, e outros temas virá na nossa aula sobre o LeXML. ... voltando aos metadados: Utilizar os metadados embutidos para exibir e incrementar o conteúdo em um formato mais facilmente compreensível – conteúdo no contexto, é uma ótima estratégia, que combina as duas formas de metadados – embutidos e os fabricados. Ordenação – controlar as visões do conteúdo por nome, título, data, etc. Busca por parâmetros – focado na precisão da pesquisa. Capacidade de endereçar uma pes- quisa mais precisa de texto livre.
  • 8. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 7 Melhor processo de gestão – processamento; definir prioridades; agregação; fundamental para o processamento em lotes; ponteiros para a automação da gestão de processos BPM; metada- dos como forma de conexão entre sistemas. Melhor gestão do conhecimento – Business Intelligence – inteligência de negócio; permite a análise de uma coleção de dados; Localização elementar de especialistas; dados sobre pessoas. Toutain (2005) define metadados como elementos de descrição ou definição ou avaliação de recursos informacionais armazenados em sistemas computadorizados, organizado por padrões es- pecíficos e estruturados. É importante se lembrar que os metadados contém uma declaração de valor sobre um item. Para a Ciência da Informação, os metadados possuem uma relação com as bases de dados e os formatos de dados. Metodologicamente, os formatos de dados são categorizados em três tipos – simples, estruturados e ricos. Essa categorização será revisada adiante no curso. Um modelo relacional numa base de dados, que suporta a declaração de atributos (modelo entidade-relacionamento-atributo), possibilita a criação de metadados para registros bibliográficos e documentos de arquivo, e isso está bem adiantado na biblioteconomia: FONTE: RDA Toolkit - Modelo Entidade-Relacionamento em uma Base de Dados Bibliográfica
  • 9. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 8 DEFINIÇÕES DA BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO - Ikematu1 (2001) afirma que as pessoas que têm algum contato com alguma ferramenta de Tecnologia da Informação provavel- mente utilizam metadados, mesmo sem saber que as usa ou o seu significado. Isto é normal até porque a sua própria definição não é um consenso, gerando alguma confusão. Alves2 (2010) relembra que a definição mais comum de metadados é dados sobre dados Miller (1996); Souza, Catarino e Santos (1997); Milstead e Feldman (1999); GillilandSwetland (1999); Souza, Vendrusculo e Melo (2000); Takahashi (2000); Senso e Rosa Piñero (2002); Méndez Rodríguez (2002); Zeng e Qin (2008) entre outros. Porém esta definição não diz muita coisa. Ao pesquisar sobre metadados você provavelmente encontrará diferentes interpretações. A finalidade principal dos metadados é documentar e organi- zar de forma estruturada os dados, minimizar esforços e facilitar a manutenção dos dados (IKEMATU, 2001). Os metadados são inerentes aos sistemas de informação, porém, existem em uma variedade de tipos e níveis (ALVES, 2010). Segundo Rowley (2002) metadados diferem-se de dados bibliográficos, pois a informação de localização acha-se contida no registro. Possibilita o fornecimento direto do documento a partir de aplicações apropriadas ou detalhadas quanto ao acesso na rede. Trata-se de um conjunto de elementos que possuem uma semântica padronizada, possibili- tando descrever as informações eletrônicas ou recursos eletrônicos (MORATO; MORAES3 , 2007). A adoção de padrões, normas e modelos é essencial para o intercâmbio de informações (ALVES; SOUZA4 , 2007). "Senso e Rosa Piñero (2002, p. 99 apud ALVES, 2010) consideram os metadados como […] toda aquela informação descritiva sobre o contexto, qualidade, condição ou características de um recurso, dado ou objeto que tem a finalidade de facilitar sua recuperação, autentificação, evolução, preservação ou interoperabilidade" (ALVES, 2010). "Grácio (2002, p. 21 apud ALVES, 2010) afirma: Comumente chamado de dados sobre dados, o termo metadados pode ser melhor descrito como um conjunto de dados chamados de elementos, cujo número é variável de acordo com o padrão, e que descreve o conteúdo de um recurso, possibi- litando a um usuário ou a um mecanismo de busca acessar e recuperar esse recurso. Esses elementos descrevem informações do tipo nome, descrição, localização, formato, entre outras, que possibilitam um número maior de campos para pesquisas" (ALVES, 2010). 1 IKEMATU, R. S. Gestão de metadados: sua evolução na tecnologia da informação. DataGramaZero - Revista de Ciência da Informação - v.2 n.6 dez/01 2 ALVES, R. C. V. Metadados como elementos do processo de catalogação. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências – Universidade Estadual Paulista, 2010. Orientação Drª PlácidaLeopoldina Ventura Amo- rim da Costa Santos. Marília: UNESP. 3 MORATO, A. de C.; MORAES, M. A. de. Metadados Dublin Core: uma breve introdução. 2007. 4 ALVES, M das D R; SOUZA, M I F. Estudo de correspondência de elementos de metadados: Dublin Core e MARC21. Re- vista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007
  • 10. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 9 Em outras palavras, metadados são um “conjunto de elementos que descrevem as informa- ções contidas em um recurso, com o objetivo de possibilitar sua recuperação” (GRÁCIO, 2002, apud ALVES, 2010). Analisando as definições encontradas na literatura, observa-se que os metadados estão dire- tamente vinculados a estruturas padronizadas de descrição e aos objetivos que se pretende repre- sentar com sua aplicação em um sistema de um determinado domínio (ALVES, 2010). DADO INFORMAÇÃO CONHECIMENTO INTELIGÊNCIA Metadados são dados que descrevem atribu- tos de um recurso. Ele suporta um número de funções: localização, descoberta, documen- tação, avaliação, sele- ção, etc. Metadados fornece o contexto para enten- der os dados através do tempo. Metadados é o dado associado com objetos que ajudam seus usuá- rios potenciais a ter vantagem completa do conhecimento da sua existência ou caracte- rísticas. Metadados é o instru- mental para transfor- mar dados brutos em conhecimento. Fonte: (IKEMATU, 2001). Antigamente os metadados somente estavam vinculados internamente aos programas. Com o surgimento dos Sistemas Gerenciadores de Banco de Dados (SGBD), muitas organizações tentaram implementar alguma forma de dicionário de dados, a partir dos anos 1970. Através dos tempos, me- tadados tem sido apresentado para a comunidade de informática como um problema intratável. En- tretanto, os próprios problemas com metadados apresentam boas oportunidades para os fabricantes de software. Porém, isto é mais evidente em ambientes de Data Warehouse corporativos (IKEMATU, 2001).
  • 11. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 10 Semelhante a esse ponto de vista, encontram-se as seguintes definições no âmbito de aplica- ção de sistemas de base de dados computacionais: “Metadados são dados que descrevem outros dados” (TAKAHASHI, 2000, p. 59), ou “Metadados são descrições de dados armazenados em um banco de dados [...]” (SOUZA; CATARINO; SANTOS, 1997 apud ALVES, 2010); Como uma unidade ele- mentar. Alves (2010) afirma que em um sistema de banco de dados os metadados são atributos5 , ou seja, são as características que identificam e representam uma entidade (objeto do mundo real que pode ser, por exemplo, um recurso informacional); em outras palavras, qualquer propriedade, qua- lidade ou característica atribuída para descrever um objeto do mundo real (dados representacionais) em um sistema de banco de dados (CHEN, 1990; COAD, YOURDON, 1991 apud ALVES, 2010). Para Ortiz-Repiso Jiménez (1999, p. 218 apud ALVES, 2010), podem ser definidos como […] um conjunto de dados que pode ser usado para descrever e representar recursos informacionais. Contém um conjunto de elementos de dados que podem ser usados para descrever o conte- údo e a localização de um recurso informacional e facilitar sua recuperação e acesso na rede" (ALVES, 2010). A autora Rosetto (2003, p. 59) destaca a diferença entre metadados e padrões de metadados, estes últimos denominados também formatos de metadados (ALVES, 2010): • Metadados são um conjunto de dados – atributos – referenciais, metodologicamente estru- turados e codificados, conforme padrões internacionais, para localizar, identificar e recuperar pontos informacionais de textos, documentos e imagens disponíveis em meios digitais ou convencionais, e • Formatos de metadados referem-se a padrões que estabelecem regras para a definição de atributos (metadados) de recursos de informacionais, para a) obter coerência interna entre os ele- mentos por meio de semântica e sintaxe; b) promover necessária facilidade para esses recursos se- rem recuperados pelos usuários; c) permitir a interoperabilidade dos recursos (ALVES, 2010). Metadados são atributos que representam uma entidade (objeto do mundo real) em um sis- tema de informação. São elementos referenciais codificados que representam características pró- prias ou atribuídas às entidades; com o intuito de identificar de forma única uma entidade (recurso informacional) para posterior recuperação (ALVES, 2010). Os padrões de metadados são estruturas de descrição constituídas por um conjunto prede- terminado de metadados (atributos codificados ou identificadores de uma entidade) metodologica- mente construídos e padronizados. O objetivo do padrão de metadados é descrever uma entidade gerando uma representação unívoca e padronizada que possa ser utilizada para recuperação da mesma (ALVES, 2010). Segundo IKEMATU (2001) são padrões de metadados: 5 “Um atributo é um dado (informação de estado) para qual cada Objeto em uma Classe tem seu próprio valor” (COAD, YOURDON, 1991, p. 117). Essa definição provém da área de Análise Orientada a Objeto e se constitui com conceitos adotados em sistemas de informações
  • 12. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 11 • Directory Interchance Format (DIF) – padrão para criar entradas de diretórios que des- crevem um grupo de dados; • Government Information Locator Service (GILS) – informações governamentais; • Federal Data Geographic Committee (FGDC) – descrição de dados geoespaciais; • Machine Readable Card (MARC) – catalogação bibliográfica; • Dublin Core (DC) – dados sobre páginas da Web; • Consortium for the Interchange of Museum Information (CIMI) – informações sobre museus; • Meta Data Interchange Specification (MDIS) - padrão para troca de metadados entre ferramentas da Tecnologia de Informação; • Open Information Model (OIM) – conjunto de especificações para facilitar o compar- tilhamento e reuso no desenvolvimento de aplicações e data warehouse; • Common Warehouse Meta Model (CWM) – padrão para troca de informações entre esquemas de banco de dados e data warehouse. Metadados são agrupados em estruturas abstratas conhecidas como esquemas ou formatos de metadados, que são conjuntos de elementos criados com fins específicos. Os poucos exemplos a seguir nos mostram um pouco dessa diversidade: MODS (Metadata Object Description Schema) esquema bibliográfico derivado do MARC 21; EAD (Encoded Archival Description) voltado para a área de Arquivologia; LOM (Learning Object Me- tadata) para gerenciar, avaliar e localizar objetos de aprendizagem; MPEG Multimedia Metadata para representação de objetos multimídiaticos (SAYÃO6 , 2010). Sayão (2010) classifica a tipologia de metadados em: • Metadados descritivos: é a face mais conhecida dos metadados, são eles que descrevem um recurso com o propósito de descoberta e identificação; podem incluir elementos tais como título, autor, resumo, palavras-chave e identificador persistente (SAYÃO, 2010). • Metadados estruturais: são informações que documentam como os recursos complexos, compostos por vários elementos, devem ser recompostos e ordenados. Por exemplo, como as pági- nas de um livro, digitalizadas separadamente, são vinculadas entre si e ordenadas para formar um capítulo (SAYÃO, 2010). • Metadados administrativos: fornecem informações que apoiam os processos de gestão do ciclo de vida dos recursos informacionais. Incluem, por exemplo, informações sobre como e quando o recurso foi criado e a razão da sua criação. 6 SAYÃO, L. F. Uma outra face dos metadados: informação para a gestão da preservação digital. Enc. Bibli: R. Eletr. Bibli- otecon. Ci. Inf., ISSN 1518-2924, Florianópolis, v. 15, n. 30, p.1- 31, 2010.
  • 13. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 12 Nessa categoria, estão metadados técnicos que explicitam as especificidades e dependências técnicas do recurso; inclui também os metadados voltados para apoio à gestão dos direitos relacio- nados ao recurso (SAYÃO, 2010). O estudo dos metadados está relacionado com o processo de racionalização pelo qual se tem passado nos últimos anos (LOURENÇO7 , 2007). Rowley (2002) categoriza os metadados em: Primeira geração – Metadados – interfaces baseadas em comandos, usuários especialistas e intermediários; número limitado de sistemas em linha nas instituições e disponíveis externamente por meio de serviços de busca em linha (ROWLEY, 2002). Segunda geração – Dados com texto integral – interfaces baseadas em menus e comandos; recursos de recuperação adicionais, como hipertexto e buscas em texto completo (ROWLEY, 2002). Terceira geração – Multimídia – interfaces gráficas; foco no acesso pelo usuário final; orien- tada para o mercado e com ênfase em pacotes de produtos; armazenamento e distribuição (ROWLEY, 2002). Gilliland-Swetland (1999 apud Alves, 2010) aponta que desde os anos de 1960 as bibliotecas vêm compartilhando metadados descritivos em sistemas informatizados, por meio do uso de normas e estruturas de descrição, tal como o formato MARC. Os autores Gilliland-Swetland (1999 apud ALVES, 2010), Senso e Rosa Piñero (2003 apud AL- VES, 2010) e Rosetto (2003 apud ALVES, 2010) destacam que os tipos de metadados estão relaciona- dos com as características e funções que eles representam. Deste modo, apresenta-se a seguir a classificação de alguns tipos de metadados conforme as funções: • Administrativos: são metadados usados no gerenciamento e administração dos recursos de informação. Esse tipo de metadado fornece informações como: data de criação dos recursos, tipos de arquivos, formas de acesso, controle de direitos e reproduções, informação sobre registros legais, informação sobre localização (GILLILANDSWETLAND, 1999; RO-SETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010); • Descritivos: são metadados usados para descrever, identificar e representar recursos de in- formações. Esse tipo fornece informações relacionadas com a catalogação, como título, autor, im- prenta, data, resumo, palavras-chave, e ainda a relação dos hiperlinks entre os recursos, anotações de usuários etc (GILLILAND-SWETLAND, 1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud AL- VES, 2010); 7 LOURENÇO, C. A. Metadados: o grande desafio na organização da WEB. Inf. & Soc.:Est., João Pessoa, v.17, n.1, p.65- 72, jan./abr.
  • 14. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 13 • Técnicos: são metadados relacionados com funcionamento dos sistemas e o comporta- mento dos metadados. Esse tipo fornece informações sobre hardware e software, digitalização, con- trole do tempo de resposta dos sistemas, autenticidade e segurança dos dados etc (GILLILAND- SWETLAND, 1999; ROSET-TO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010); • Conservação: são metadados relacionados com a conservação e preservação dos recursos de informação. Esse tipo fornece informações sobre as condições físicas de um recurso, informações de como conservar e preservar as versões físicas e digitais de um recurso etc (GILLILAND-SWETLAND, 1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010); • Uso: são metadados relacionados com o nível e tipo de uso dos recursos de informação. Esse tipo fornece informações sobre os registros de exibição, controle de uso e usuários, controles de acesso, informação sobre versões múltiplas etc (GILLILAND-SWETLAND, 1999; ROSETTO, 2003; SENSO, ROSA PIÑERO, 2003 apud ALVES, 2010). Alves (2010) a tipologia de metadados apresentada categorizam-nos por funcionalidade, mas, existem outros fatores como processo de criação manual e automática e/ou por outras diferentes funções. Os autores Gilliland-Swetland (1999 apud Alves, 2010) e Senso e Rosa Piñero (2003 apud Alves, 2010) destacam os seguintes fatores: Metadados-fonte: se os metadados são internos, gerados no momento da criação do recurso (exemplo: nomes de arquivos), ou são metadados externos, gerados posteriormente à criação do recurso (exemplo: fichas e registros de catalogação); Metadados-método: se os metadados são automáticos, gerados automaticamente por um computador (exemplo: índices de palavras-chave), ou são metadados manuais, criados por indivíduos (exemplo: registros de cata- logação); Metadados-criação: se os metadados foram criados por indivíduos que não são especialistas da área de informação (exemplo: metadados criados pelo desenvolvedor de uma página pessoal), ou são metadados criados por especialistas temáticos ou da área de informação (exemplo: registros em formato MARC elabo- rados por um bibliotecário); Metadados-status: se os metadados são estáticos, que não mudam depois de criados (exemplo: título e data de criação de um recurso), ou são metadados dinâmicos, que podem se modificar de acordo com o uso e a manipulação do recurso (exemplo: registros de operações dos usuários); se os metadados são de longa duração, para assegurar o acesso e o uso do recurso (exemplo: formatos técnicos e processa- mento da informação), ou são metadados de curta duração, que são principalmente do tipo opera- cional (exemplo: informam sobre conservação e administração dos recursos);
  • 15. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 14 Metadados-estrutura: se os metadados são estruturados, ou seja, apresentam uma estrutura previsível, pré-determinada, baseada em um padrão normalizado internacionalmente (exemplo: MARC), ou são metadados não estruturados, ou seja, não possuem estrutura previsível (exemplo: formatos de banco de dados lo- cais); Metadados-semântica: se os metadados são controlados, ou seja, aqueles que seguem ou são normalizados por um vocabu- lário controlado, formulário de autoridade etc (exemplo: AACR2), ou são metadados não controla- dos, ou seja, aqueles que não seguem um vocabulário controlado ou formulário de autoridade (exemplo: meta etiquetas HTML); Metadados-nível: se os metadados são de coleções, ou seja, estão relacionados a coleções de documentos ou recursos (exemplo: uma coleção de recursos descritos pelo formato MARC), ou são metadados individuais, ou seja, metadados relacionados com recursos individuais ou que não pertencem a nenhuma coleção (exemplo: legenda de uma imagem). Todos os tipos de metadados se constituem como pontos de acesso aos recursos, sejam os metadados intrínsecos às entidades (aqueles atributos que individualizam a entidade), sejam extrín- secos (aqueles atributos que identificam a entidade em um sistema) (MÉNDEZ RODRÍGUEZ, 2002 apud ALVES, 2010). A função dos metadados em um sistema de informação digital ocorre das seguintes formas: (a) exerce a mesma função dos catálogos e sistemas de descrição bibliográfica, com identificação, descrição, busca, localização e recuperação da informação; (b) em relação aos sistemas, sua função é facilitar a interoperabilidade e intercâmbio de dados, facilitar a busca e o gerenciamento da infor- mação; (c) em relação aos usuários, indicar a informação acessível, sua localização e as condições para se chegar até ela (MÉNDEZ RODRÍGUEZ, 2002 apud ALVES, 2010). A NISO - National Information Standards Organization -, organização sem fins lucrativos cre- denciada pela ANSI - American National Standards Institute -, responsável por identificar, desenvol- ver, manter e publicar normas técnicas para o gerenciamento da informação em meio digital, esta- belece algumas diretrizes ou princípios para a construção de metadados (NISO, 2004 apud ALVES, 2010). Alves (2010) indica que dentre as normas criadas apresenta um guia para a construção de coleções digitais (“Framework of Guidance for Building Good Digital Collections”), no qual apresenta seis princípios para a aplicação de metadados, destacando os requisitos desejáveis para a construção de metadados. Originalmente é utilizado o termo “good metadata” que aqui se entende como me- tadados de qualidade (NISO, 2004, p. 10, tradução nossa):
  • 16. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 15 METADADOS DE QUALIDADE • devem ser apropriados aos materiais de uma coleção, aos usuários da coleção e destinados ao provável uso por objetos digitais; • devem ser apropriados para proporcionar a interoperabilidade; • devem proporcionar a utilização de padrões como vocabulários controlados, para refletir o que, onde, quando e quem em relação ao conteúdo; • devem incluir de- clarações claras sobre as condições e termos de uso do recurso informacional; apoiam a gestão a longo prazo de recursos em coleções. • Registros de metadados de qualidade são objetos em si e, portanto, devem ter a qualidade de arquivamento, persistência e identificação única. Metadados de qualidade devem ser confiáveis e verificáveis; (ALVES, 2010). A melhoria dos metadados dependem (ALVES, 2010): 1) Aperfeiçoamento dos padrões de campos e validação de dados; 2) aprimoramento da interoperabilidade entre padrões; 3) treina- mento e capacitação das ferramentas de metadados; 4) vocabulários controlados acessíveis e de co- nhecimento amplo; 5) comunidades de usuários que aperfeiçoam o esquema de dados. Portanto, essa é a visão da biblioteconomia e Ciência da Informação, que aproxima o registro bibliográfico em Marc21 à noção de metadado, mesmo sendo utilizada AACR2 e ISBD(G). --- 2.2.3. Estratégia para metadados. Segundo a AIIM pelo ECM p, são estratégias de metadados: • Identificação e entendimento dos diferentes tipos de metadados e seus objetivos – formu- lação e documentação do modelo de metadados; • Sincronização e adoção em um departamento, projeto, ou unidade na organização respon- sável pela construção de metadados – que aplicará a concordância sobre os termos, rótulos e significados dentro e fora da organização; • Entendimento das pessoas, processos e sistemas que aplicam e integram com os metada- dos e vocabulários; • Identificar que se possui diversos metadados e estruturas; • Planejar a manutenção e mudanças. BENEFÍCIOS ESTRATÉGICOS • O uso consistente através da corporação faz os metadados ficarem mais poderosos; • Diminui as chances de termos, rótulos e marcações ambíguos; • Entender como mudanças de metadados podem afetar os processos mais adiante; • Identificação de lacunas de onde deve haver mais metadados;
  • 17. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 16 • Avaliação realista sobre o esforço envolvido na criação e obtenção de metadados; • Estabelecimento dos metadados como um acervo central, reusável; • Compreensão do efeito dos metadados sobre os processos de negócio. 2.2.4. Desafios do metadado. Quem? O que? Quando? Onde? (centralizado vs. Descentralizado) Identificação? Categorização? Classificação? Necessita intensamente de recurso... • É necessário saber que para pessoas, adicionar metadados significa trabalho; • Indexadores podem não enxergar um benefício dos metadados para eles mesmos; • Os benefícios tendem a aparecer para a corporação e consumidores de conteúdo; • Por garantia, empregados podem ser forçados a indexar. Em alguns sistemas de imagens (imaging), é papel de um especialista. Em outros casos: “não é meu trabalho”; • Pessoas podem gerar metadados incompletos ou errados; • Surge então a pergunta: existe uma forma de fazer máquinas agregar em metadados? Ms Office – Arquivo/Propriedade. – Quantas pessoas efetivamente preenchem isto? – poucas, muito poucas.
  • 18. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 17 -- Mas, a probabilidade de ter que preencher isto é maior: Criação manual x automática de metadados. Assim, a criação de documentos pelo aplicativo Ms Office, em relação ao preenchimento au- tomático de metadados tem uma desvantagem em comparação com um software de Gerenciamento Eletrônico de Documentos, pois neste eu, necessariamente, tenho que preencher os metadados. Além disto, a integridade dos valores e declarações é maior, pois ao logar no sistema de GED, automaticamente, o sistema atribui a minha autoria (produção), com os meus dados – nome, se- ção/departamento, cargo, data, horário, etc. Captura manual x automática de metadados. Antes de adentrar neste módulo, é importante entender o conceito de interoperabilidade: INTEROPERABILIDADE: são tecnologias, normas, padrões, regras e protocolos que permitem uma organização e representação da informação de modo que se possa ser compartilhada entre ins- tituições cooperantes. Utiliza-se da padronização de um modelo de dados (formato de dados): MODELO DE DADOS (FORMATO DE DADOS): especifica as regras segundo as quais os dados são estruturados, bem como as operações correlatas são permitidas. Pode também ser visto como uma técnica para a descrição formal de dados, relações entre eles e limitações de uso.
  • 19. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 18 Segundo a International Standard Organization (ISO), interoperabilidade é a habilidade de dois ou mais sistemas, que podem ser computadores, meios de comunicação, redes de software e outros componentes de tecnologia da informação, de interagir e de intercambiar dados a partir de um método definido, objetivando obter os resultados esperados. A interoperabilidade é o esforço necessário para se vincular um sistema a outro, um fator de garantia de qualidade de software, conjuntamente com: manutenibilidade, portabilidade, integri- dade e confiabilidade. Os acordos de cooperação podem ser em três níveis: • O nível técnico proporciona a interoperabilidade tecnológica; • O nível de conteúdo remete à interoperabilidade semântica; e, • O nível organizacional se refere a interoperabilidade política. Para efeitos da interoperabilidade consideram-se as definições acima bem como seus respec- tivos requisitos funcionais e não funcionais, a fim de padronização da cooperação entre unidades de informação. NÍVEIS DE INTEROPERABILIDADE. Nível Semântico. Este nível permite entender o significado de cada elemento descritor do recurso em conjunto com as associações nele embutidas. Segundo Moura (2002), o uso de vocabulários específicos, onto- logias e/ou padrões de metadados é essencial para assegurar esse tipo de interoperabilidade. Exis- tem dois subníveis no nível semântico: • Epistemológico: relacionado ao significado dos elementos descritores do formato e das rela- ções nele existentes. • Ontológico: relacionado ao uso de ontologias, vocabulários controlados e padrões de meta- dados para o estabelecimento dos significados dos dados representados. Como exemplo deste nível de interoperabilidade podem-se destacar os campos que têm o mesmo significado entre elementos descritivos de padrões de representação como o MARC21. Nível Estrutural. Este nível estabelece cada elemento componente de um padrão de metadados, descreve os seus tipos, a escala de valores possíveis para esses elementos e os mecanismos utilizados para rela- cionar esses elementos de modo que possam ser processados de forma automática. Como exemplo podem-se destacar os padrões de metadados Dublin Core (DC) e MARCXML. Nível Sintático Barreto (1999, p. 85) afirma que “a sintaxe fornece uma linguagem comum para representar a estrutura dos metadados”. Este nível de interoperabilidade define como os metadados devem ser codificados para a transferência de informação. Ex.: linguagem XML.
  • 20. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 19 ...retomando metadados, segundo a AIIM ECM p: O Software pode ajudar – modelos de documentos podem conter códigos para capturar me- tadados. Modelos também podem conter ‘marcadores’, ‘campos’ e outras características para ‘pe- gar’ metadados. O software também pode ser utilizado para olhar detalhes do usuário (após se ter logado) - Nome do autor e detalhes; - Cargo, departamento; - Outros valores padrão. Coleta automatizada de metadados - Ferramenta para categorizar automaticamente. Um exemplo na Ciência da Informação é o protocolo OAI-PMH. Aplicação de coleta de metadados na Rede LeXML. Os softwares de auto-categorização, bem como algumas máquinas de pesquisa podem ten- tar classificar conteúdo: • - Elas continuam baseadas em uma taxonomia definida ou vocabulário controlado; • - Normalmente requer ‘treinamento’ para obter resultados minimamente aceitáveis. Mas, os resultados tipicamente não são tão bons quanto os humanos: • - Nível de envolvimento humano se torna uma decisão de custo/benefício.
  • 21. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 20 Aplicações de auto-categorização para Big Data. Multimídia e classificação automática – Recursos multimídia: - Câmeras: - Aplicações de edi- toração de imagem/áudio; - Autoria de páginas web e gestão de sítios web; - gravação de áudio (di- gital); - Dados para gestão de direitos (embutidos). Lembra do exemplo da Polícia Federal? Pois é, nos arquivos multimídia isso é bem caracteri- zado porque essas tecnologias aplicam a auto-categorização quando é produzido o arquivo de mídia. Assim, numa investigação, é possível rastrear: quem tirou determinada fotografia, os dados de IP, os dados do Smarthphone, etc... Sobre os dados para gestão de direitos, temos o Creative Commons, que é um padrão de gestão de direitos e que pode ser elaborado automaticamente em recursos de tecnologia de mídia. Assim, sempre tenha em mente que uma aplicação não é disponibilizada em vão... Sempre tem algo. Auto-classificação e auto-indexação - Gravação automática de palavras chave; -Reconheci- mento de imagens; - Adição de dados externos. O reconhecimento de imagens, a internet das coisas IoT, Big Data e demais recursos que po- dem ser aplicados a dispositivos móveis, são uma aposta interessante para a captura automática de metadados. Imagine numa pandemia, a aplicação de IoT ou reconhecimento de imagens para con- trole do confinamento social.
  • 22. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 21 Melhores práticas na automação dos metadados - crie o corpo central de metadados de sua organização; - permita a auto-sugestão para popular campos de metadados para minimizar a quan- tidade de trabalho necessário pelos trabalhadores e também aumentar o índice de qualidade e con- sistência. A captura automática, portanto, está embutida na tecnologia de criação dos arquivos e mí- dias. Mas, e a captura manual? Lembra do conceito de interoperabilidade? Pois é, na bibliotecono- mia, quando se faz a importação de registros Marc21 de uma biblioteca para outra, está se fazendo uma captura manual. A captura manual, para a biblioteconomia pode ser de dois tipos – migração ou conversão retrospectiva, quando esta aplica algum tipo de captura, pois quando o metadado é elaborado do zero, aí a operação não é mais captura, mas sim, criação. A migração pressupõe uma ação em lotes de diversos itens. Outros desafios para metadados: • Ambiguidade – palavras podem ser entendidas de diferentes formas. Isso demonstra a ne- cessidade de concordância em uma terminologia; e a necessidade de concordância de como documentos são colocados em categorias; • Heterogeneidade – conteúdo e comunidades. Isso demonstra a necessidade de endereçar todas as formas de conteúdo; e a necessidade de suportar todas as comunidades de usuários; • Criação e uso – Entender a audiência focada; e também entender a necessidade da empresa. 2.2.5. Dublin Core. Em 2001, o Dublin Core Metadata Initiative (DCMI) e o Institute for Electrical and Electronics Engineers (IEEE) Learning Object Metadata (LOM) Working Group se reuniram para estabelecer al- guns princípios considerados básicos e comuns a todos os domínios de metadados, auxiliando no estabelecimento de padrões de metadados e aplicações (ALVES, 2010). Atualmente o DCMI é a instituição responsável por guiar essa construção de metadados e padrões de metadados, estabelecendo princípios comuns que devem estar em consonância com re- gras e normas emergentes e internacionais, com o intuito de garantir a construção adequada e pa- dronizada de metadados e, com isso, a interoperabilidade entre sistemas (ZENG, QIN, 2008 apud ALVES, 2010). Tendo como base as resoluções do DCMI, os autores Zeng e Qin (2008 apud ALVES, 2010) destacam a existência de três princípios básicos para a construção de metadados: • Simplicidade: refere-se aos atributos (metadados) necessários para a manutenção de um conjunto mínimo de elementos descritivos para facilitar a implementação.
  • 23. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 22 É importante que os metadados sejam flexíveis para acomodar as necessidades específicas de descrição, permitindo que sejam incluídos novos metadados para atender a necessidades específicas de um domínio específico (ZENG; QIN, 2008, apud ALVES, 2010). • Extensibilidade: pode ser entendida de duas formas; a capacidade de um padrão de meta- dados oferecer um conjunto de elementos descritivos que possa unificar os diferentes padrões de descrição; e a capacidade de intercâmbio entre registros de metadados de um padrão de metadados mais simples para outro mais complexo. A extensibilidade requer que os sistemas permitam a adição de novos elementos de metadados em um padrão baseados em normas existentes, ou elementos estabelecidos em nível local (ZENG; QIN, 2008, apud ALVES, 2010). • Interoperabilidade: “é a capacidade de múltiplos sistemas com diferentes hardwares e pla- taformas de softwares, estruturas de dados e interfaces intercambiarem dados com a mínima perda de conteúdo e funcionalidade” (NISO, 2004, apud ALVES, 2010). MNEMÔNICO: princípios básicos SEI SIMPLICIDADE / EXTENSIBILIDADE / INTEROPERABILIDADE Duval et.al (2002 apud ALVES, 2010), destacam como princípios: • Modularidade: permite que os desenvolvedores de padrões de metadados reutilizem os atributos em outras estruturas semânticas e sintáticas de padrões de metadados, ao invés de rein- ventar elementos. Refere-se à construção de metadados em blocos, categorias, grupos ou módulos de elementos descritivos, de modo que esses metadados possam ser estruturados em categorias de outros padrões de metadados com estruturas sintática e semanticamente diferentes, mas que pos- sam ser interoperáveis. Em outras palavras, diferentes categorias semânticas de metadados são com- binadas em outros padrões de metadados com estrutura sintática diferente, porém expressas em uma linguagem comum, incorporando a funcionalidade e o significado de cada atributo. Dessa forma, conjuntos de módulos podem ser criados para atender a requisitos específicos de uma aplicação, combinando exigências específicas de um domínio com exigências gerais, sem danos à interoperabi- lidade (DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010). • Extensibilidade: um dos princípios indicados pelo DCMI, conforme já explicado, é a capaci- dade de extensão, ou seja, de permitir a inclusão de novos metadados em um padrão de acordo com as necessidades específicas de aplicação (DUVAL et.al, 2002); • Refinamento: as aplicações de metadados em um domínio irão variar de acordo com a ne- cessidade do grau de detalhe ou especificidade na descrição; dessa forma, os padrões de metadados devem permitir a escolha do nível de detalhes na descrição dos recursos.
  • 24. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 23 Duas noções de refinamento devem ser consideradas: a adição de qualificadores, que são elementos de metadados que qualificam e tornam o significado de um atributo mais específico (se- melhantes a subcampos de descrição); e esquemas de codificação externos ao padrão de metadados utilizados para padronizar a representação determinando os valores do elemento, como, por exem- plo, vocabulários controlados, esquemas de codificação do conteúdo, notações de sistemas de clas- sificação etc. (HILLMANN, 2005; DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010). • Multilinguismo: incide sobre os aspectos da diversidade cultural e linguística que devem ser considerados no momento de estabelecer os metadados de um padrão. Por exemplo, a maneira como as datas são representadas em diferentes calendários; a direção na qual o texto é apresentado e lido; conotações culturais de certos ícones e pictogramas, entre outros. É importante que os meta- dados descrevam características relevantes de um recurso respeitando as diferenças culturais e lin- guísticas (DUVAL et.al, 2002; ZENG; QIN, 2008 apud ALVES, 2010). Duval et.al (2002 apud ALVES, 2010) destacam como práticas: • Perfil de aplicação: é um conjunto de elementos de metadados selecionados de um ou mais esquema de metadados, combinados em um esquema composto. Os perfis de aplicação oferecem meios para se expressar os princípios de modularidade e extensibilidade. Sua finalidade é combinar esquemas de metadados adaptando-os às exigências funcionais de aplicações específicas, e man- tendo a interoperabilidade com esquemas originais que serviram como base. Seu maior objetivo é facilitar a interoperabilidade semântica (DUVAL et.al, 2002 apud ALVES, 2010). • Sintaxe e semântica: é necessário um acordo comum entre dois domínios, tanto a sintaxe quanto a semântica dos metadados. Em outras palavras, é preciso que domínios diferentes compar- tilhem o mesmo significado de um atributo ou metadado e que estabeleçam uma convenção comum para a identificação e a codificação dos valores em uma sintaxe, caso contrário não haverá intercâm- bio de dados (DUVAL et.al, 2002 apud ALVES, 2010). • Associações entre modelos: referem-se à associação entre diferentes registros de metada- dos de um mesmo recurso informacional. Múltiplos registros de metadados refletem os vários pro- pósitos e perspectivas de diferentes organizações ao criarem e gerenciarem metadados. Espera-se que esses registros sejam gerenciados de forma coordenada (DUVAL et.al, 2002 apud ALVES, 2010). • Identificando e nomeando elementos de metadados: símbolos X etiquetas: os metadados são expressos por um nome que pode ser codificado por meio de uma etiqueta em linguagem natural ou codificado em símbolos. Ferramentas específicas podem utilizar rótulos de apresentação diferen- tes da codificação original dos metadados para melhor visualização e entendimento (DUVAL et.al, 2002 apud ALVES, 2010). • Registro de metadados: um sistema formal para documentação de conjuntos de metada- dos, perfil de aplicação, esquemas de codificação, informações de uso do elemento e crosswalks. A função primária dos registros de metadados é registrar, publicar e gerenciar essas especificações, como também facilitar a busca dentro do registro (ZENG, QIN, 2008 apud ALVES, 2010).
  • 25. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 24 • Integralidade na descrição: nem todos os atributos disponíveis em um esquema de meta- dados serão utilizados ou são adequados para representar um recurso; a representação deve conter os atributos essenciais para caracterizar o recurso. Além disso, a seleção apropriada dos valores tam- bém se constitui em um item importante para compor a totalidade da descrição. Assim, a riqueza na descrição será determinada por políticas de melhores práticas estabelecidas pela agência criadora dos metadados e construídas a partir de requisitos funcionais ou serviços de aplicação em diferentes domínios (DUVAL et.al, 2002 apud ALVES, 2010). Políticas de melhores práticas são orientações para a realização de uma tarefa de modo mais eficiente (com menos esforço) e mais efetivo (com melhores resultados). Não se constituem nem como um padrão nem como um regulamento, mas sim como diretrizes a serem seguidas para enri- quecer a representação (ZENG, QIN, 2008 apud ALVES, 2010). • Elementos obrigatórios X opcionais: padrões de metadados para propósitos gerais reque- rem um alto grau de flexibilidade. Dessa forma, um elemento de metadado pode ser essencial em um domínio e em outro não, por não refletir as características de um determinado recurso. Por esse motivo, não há como pensar em obrigatoriedade em algum elemento de metadados. Contudo, é importante se pensar em políticas de boas práticas para especificar normas de conduta para o uso de um determinado padrão em um domínio, favorecendo, assim, a padronização na estrutura dos elementos em um domínio e consequentemente a interoperabilidade (DUVAL et.al, 2002). • Metadados subjetivos X objetivos: o processo de criação de metadados pode envolver me- tadados objetivos, aqueles que são características de fato, tais como título, autor, data; ou metada- dos subjetivos, aqueles que são atribuídos, tais como assunto, palavras-chave, resumo etc. Outros metadados são subjetivos por estarem sujeitos a interpretações sob diferentes pontos de vista ou domínios. Dessa forma, um dos requisitos no desenvolvimento de metadados é explicitar o contexto da informação, para que os aplicativos possam identificar mais facilmente o contexto onde está in- serido o recurso (DUVAL et.al, 2002 apud ALVES, 2010). • Geração automática de metadados: entre a criação manual de representações em padrões de metadados e entre as ferramentas de Harvesting e indexação automática de metadados, existe uma variedade de outras aplicações de padrões as quais podem ser utilizadas para a geração auto- mática de metadados. É possível reduzir custos com o processamento automático das informações na medida em que as descrições e o estabelecimento de metadados sejam mais consistentes (DUVAL et.al, 2002 apud ALVES, 2010). ANOTAÇÕES
  • 26. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 25 UM ADENDO Segundo o IBICT8 (2020) processo de interoperabilidade, relacionado ao movimento de ar- quivos abertos, atende a existência de três elementos, os provedores de dados, os provedores de serviços e os agregadores. Como o foco está no intercâmbio de informação entre sistemas informa- tizados, de forma automática, os provedores de dados são os sistemas que ofertam os dados para que sejam coletados para os provedores de serviços, de forma a poderem ofertar serviços consolida- dos. Os agregadores são sistemas que coletam as informações como os provedores de serviços e, também, ofertam os dados coletados como os provedores de dados (figura 1). Um provedor de dados dispõe seus dados na forma de sets, ou seja, conjunto de registros. Assim, a coleta pode ser feita em todo o provedor ou em apenas alguns sets. Os sets podem ser estruturais ou virtuais. Em grande parte dos provedores de dados os registros estão contidos em estruturas de organização, com os sets representando essas estruturas. Outros provedores criam sets virtuais conforme alguma característica ou para responder a algum provedor de serviço. Para o processo de coleta automática de metadados (harvesting), por sua vez, tem-se a utili- zação de um protocolo, os esquemas de metadados, os crosswalks e os mapeamentos. Esse processo é assíncrono, ocorrendo conforme planejamento, ou seja, um determinado agregador ou provedor de dados programa a ocorrência da coleta, conforme as necessidades. No que ser refere ao protocolo, atualmente se concentram em dois, o Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) e o Open Archives Initiative Object Reuse and Exchange (OAI-ORE). Os dois protocolos possuem a mesma finalidade de coletar automaticamente metadados dos provedores de dados, mas se diferem apenas em questões simples, enquanto o OAI-PMH coleta apenas os metadados, o OAI-ORE permite coletar, os metadados, as relações entre os objetos digitais descritos pelos metadados e até os objetos digitais. Há duas implementações desses protocolos, um que faz a coleta e outro que responde. O REPOX, como agregador, implementa as duas camadas de protocolo, que coleta e responde a coleta. Os metadados coletados se apresentam no formato XML, que facilita o processamento nos provedores de serviços e agregadores. Entretanto, devem estar em um esquema de metadados, um padrão que permite que os sistemas processem corretamente o conteúdo. Nesse ponto, grande parte dos sistemas que implementam a interoperabilidade responde, no mínimo com o esquema de metadados Dublin Core. O REPOX pode coletar e responder a vários esquemas de metadados graças à implementação dos Crosswalks. Como os metadados são interoperados no formato XML, podem-se flexibilizar os provedores de dados, agregadores e provedores de serviços com os crosswalks, que são programas conversores, desenvolvidos em XSLT (eXtensible Stylesheet Language for Transformation). Assim, possibilita a transformação de um esquema de metadados para outros. No REPOX foram desenvolvidos alguns crosswaks para atender as necessidades da BDTD. 8 IBICT. REPOX. In: Ibict Wiki, 2018. Disponível em: http://wiki.ibict.br/index.php/P%C3%A1gina_principal Acesso em: 13/05/2020.
  • 27. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 26 Outro ponto importante para os provedores de dados e agregadores é a normalização do conteúdo. Como coleta-se metadados de vários provedores de dados, em muitos casos, utilizam-se padrões diferentes. Por exemplo, para idioma têm-se padrões ISO com duas ou três letras. Assim, Português pode ser representado por: pt, pt_br ou por. Para unificar o conteúdo pode-se fazer uso de mapeadores, em campos que são padronizados nos provedores de dados, mas difere-se de um provedor para outro. Os mapeadores são implementados com XSLT, da mesma forma que os cros- swalks. Nesse contexto, o REPOX permite criar um agregador, com interface para gerenciamento do harvesting, com a utilização do protocolo OAI-PMH. Oferta, também, facilidades para desenvolvi- mento e integração de crosswalks e mapeadores. Com isso, torna-se uma ferramenta completa no que se refere ao harvesting. O REPOX é um software livre e de código aberto para a criação de provedores de dados, agre- gadores e provedores de serviços (quadro 1), desenvolvido e mantido pelo Instituto Superior Técnico – IST de Portugal. Assim, possibilita a implementação de todos os elementos relacionados ao movi- mento dos arquivos abertos, tornando um software útil a instituições que desejam implementar ser- viços de arquivos aberto.
  • 28. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 27 ... retornando ao Dublin Core: Segundo Alves (2010) as tipologias de formatos de metadados podem ser assim agrupadas:
  • 29. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 28 a) Formatos simples: constituídos por metadados não estruturados, extraídos de forma automática por robôs, apresentam na maioria das vezes uma semântica reduzida. Ex.: MetaTag(s) e metadados utilizados na transferência de dados por meio do protocolo HTTP - hipertext transfer protocol. b) Formatos estruturados: constituídos por metadados mais estruturados, baseados em normas emergentes e que proporcionam uma descrição mínima do recurso para sua identificação, localiza- ção e recuperação. A descrição geralmente é feita em campos e nessa categoria começa a ser inserida a ajuda de especialistas em informação. Ex.: padrão de metadados Dublin Core – DC (ALVES, 2010). c) Formatos ricos: também considerados padrões de metadados altamente estruturados, são cons- tituídos por metadados complexos, apresentam uma estrutura de descrição mais formal e detalhada. São baseados em normas e códigos especializados de um domínio particular, possibilitam a descrição de um recurso informacional individual ou pertencente a uma coleção e facilitam a localização, a recuperação, o intercâmbio dos recursos informacionais. Ex.: padrão de metadados ou formato MARC 21, da área de Biblioteconomia (ALVES, 2010). --- A iniciativa Dublin Core Metadata Initiative (DCMI) teve origem em 1994, em Chicago, Estados Unidos, durante a segunda Conferência Internacional sobre a Web. A DCMI voltou a se reunir em 1995, dessa vez em Ohio, também nos Estados Unidos. Dessa reunião surgiu o padrão de metadados que vem sendo amplamente utilizado no mundo todo (PEREIRA9 ; RIBEIRO JUNIOR; NEVES, 2005). Marcondes10 ; Sayão (2001) afirmam que a convergência e o uso integrado das tecnologias de comunicação, de computação e de conteúdo em formato digital, cujo paradigma é a Internet, tem contribuído nos anos recentes para criar um novo ambiente de acesso, disseminação, cooperação e promoção do conhecimento em uma escala global. Uma das dificuldades encontradas em ambiente digital é à busca de informações. Apesar da existência de uma diversidade de mecanismos de buscas que facilitam a busca e recuperação de in- formações, em sua maioria, essas ferramentas apresentam um desempenho insatisfatório. Quem costuma utilizar as ferramentas de pesquisa sabe que a quantidade de resultados apresentadas em uma sessão de busca é muito grande, havendo a necessidade de refinar a busca para encontrar o conteúdo procurado (MODESTO11 , 2005). O padrão Dublin Core foi utilizado nos anos 1990 para websources internos das corporações, porém com as novas possibilidades dos FRBR, FRAD e do RDA, bem como sua integração ao OWL do W3C e a web semântica, foi popularizada a aplicação desse padrão de dados à web. 9 PEREIRA, A. M. ; RIBEIRO JÚNIOR, D. I. ; NEVES, G. L. C. Metadados para a descrição de recursos da Internet: as novas tecnologias desenvolvidas para o padrão Dublin Core e sua utilização. Revista ACB: Biblioteconomia em Santa Catarina. v. 10, n. 1, p. 241-249, jan./dez., 2005. 10 MARCONDES, C. H.; SAYÃO, L. F. Integração e interoperabilidade de acesso a recursos informacionais eletrônicos em C&T: a proposta da biblioteca digital brasileira. Ci. Inf., Brasília, v. 30, n. 3, p. 24-33, set./dez. 2001. 11 MODESTO, F. Metadados: introdução básica. Disponível em: Acesso em: 27 mar. 2010.
  • 30. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 29 (SOUZA; CATARINO; SANTOS, 1997) Assim, organização de conteúdos podem ser viabilizados, tanto em arquiteturas da informa- ção mais robustas, à mais simples configuração na camada de descrição de uma página XHTML ou XML descrevendo as características desses conteúdos. Veja na figura acima, que o Dublin Core atende às demandas dos metadados e a sua encontrabilidade na Internet. Souza; Catarino; Santos (1997) apresentam a seguir uma breve descrição dos quinze elementos do Dublin Core, de acordo com Wei- bel (1997): 1. Title (Título) – o nome dado ao documento eletrônico pelo autor; 2. Author or Creator (Autor) – pessoas ou organizações responsáveis pelo conteúdo intelec- tual do objeto; 3. Subject and Keywords (Assunto) – representa o assunto do documento eletrônico, po- dendo ser definido a partir de sistemas de classificação (CDD, CDU, LCSH) ou Thesaurus, ou simples- mente por uma palavra ou conjunto de palavras. 4. Description (Descrição) – descrição do conteúdo, podendo ser resumo para DLO ou con- junto de palavras. 5. Publisher (Editor) – entidades responsáveis por tomar o documento disponível na presente forma, tais como editor, universidades ou entidades corporativas. 6. Other Contribuitors (Outros Colaboradores) – outras pessoas que contribuíram para a re- alização da obra (editores, tradutores, ilustradores, etc.). 7. Date (Data) – a data em que foi disponibilizado o recurso.
  • 31. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 30 8. Resource Type (Tipo de Recurso) – gênero do recurso, tais como: home pages, dicionário, vídeos, arquivo de dados, software, etc. 9. Format (Formato) – a manifestação física do documento eletrônico, tais como: Postcript, HTML ou PDF. 10. Resource Identifier (Identificação) – série ou número usado para identificar o documento (URL, ISBN etc.). 11. Source (Fonte) – o documento (impresso ou eletrônico ou digital) do que se originou o recurso eletrônico. 12. Language (Idioma) – idioma do conteúdo intelectual do documento. 13. Relation (Relação) – relacionamento com outros documentos impressos ou eletrônicos (por exemplo imagens em um documento, capítulos em um livro ou itens em uma coleção). 14. Converge (Cobertura) – locação espacial ou duração temporal característica do docu- mento. 15. Rights Management (Direito Autoral) – informação sobre copyrigth. (SOUZA; CATARINO; SANTOS, 1997) Porém, o contexto destes autores SOUZA; CATARINO; SANTOS (1997) trazem a nossa mente as aplicações web sources estruturadas em banco de dados disponibilizados na superfície da Internet. Ainda não se discutia as camadas de descrição XHTML. Vamos atualizar, então, o nosso estudo: Segundo a DCMI12 (2017) o Dublin Core Metadata Element Set [Recomendação DCMI]. Este documento extrai dos termos de metadados DCMI os quinze elementos do clássico "Dublin Core", que foi padronizado como: Padrão ISO 15836: 2009 e Norma ANSI / NISO Z39.85-2012. 12 https://www.dublincore.org/specifications/
  • 32. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 31 A ISO 15836:2017 foi atualizada para suportar aplicações em RDF ou XML Schema processá- veis em robôs de busca da Internet. A revisão ISO 15836-1/2017 cancela e substitui o ISO 15836: 2009, do qual constitui uma menor versão: 1) Este documento abrange os mesmos elementos que o ISO 15836: 2009; 2) Propriedades e classes em ISO 15836-2 não foram incluídos na versão anterior do ISSO 15836: 2009; 3) Os elementos principais e suas especificações estão agora localizados na Cláusula 3; e 4) Algumas definições foram atualizadas (por exemplo, recurso e data) e a introdução foi revisada (ISO13 , 2017). Segundo a ISO 15836-1/2017, o conjunto completo de vocabulários, DCMI Metadata Terms [DCMI-TERMS], estão especificados no ISO 15836-2. Os elementos principais podem ser usados em combinação com termos de metadados de outros vocabulários compatíveis no contexto dos perfis de aplicação, conforme 21 http://www.dublincore.org/specifications/ 22 ISO 15836-1:2017(E) espe- cificado no DCMI Abstract Model [DCAM]. Nas definições de elementos, as seguintes convenções foram usadas: 1) cada elemento possui um rótulo descritivo ("rótulo") para o reconhecimento humano; 2) cada elemento também possui um token exclusivo ("nome") para uso no processamento da máquina; 3) de acordo com a Política de espaço de nomes DCMI [DCMI-NAMESPACE] especificada em ANSI / NISOZ39.85: 2012, o "nome" de um elemento é anexado a um URI do namespace DCMI [RFC 3986] para construir um Uniform Resource Identifier como um identificador globalmente exclusivo para esse elemento; e, 4) O uso de nomes de elementos e URIs no contexto de diferentes tecnologias de implemen- tação, é explicado nas Diretrizes de codificação DCMI [DCMIENCODINGS] (ISO, 2017). A Z39.85:201214 traz referências para a implantação do Dublin Core. Apresenta uma explica- ção sucinta dos 15 elementos e os documentos auxiliares que especificam cada elemento desses conforma a figura acima. É uma norma indicativa e referencial, porém não apresenta detalhes. Estes dois documentos ISO 15836-1:2017(E) e a ANSI NISO z39.85:2012 são básicos e indispensáveis para iniciar o Dublin Core. Os pressupostos em evolução que durante a última década levaram de quinze elementos [RFC2413] para o Framework de Singapura para Dublin Core Application Profiles [DCAP], podem ser capturados em um modelo em camadas de interoperabilidade. O modelo de níveis apresentado aqui aborda a necessidade sentida em muitas comunidades para posicionar vários projetos com vários graus de interoperabilidade com Dublin Core, mas sem uma terminologia apropriada (DCMI, 2017). A intenção é fornecer uma "escala de interoperabilidade", especificando as escolhas, custos e bene- fícios envolvidos na concepção de aplicativos para maior interoperabilidade de níveis. 13 ISO 15836-1:2017(E) 14 ANSI NISO z39.85:2012
  • 33. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 32 INTEROPERABILIDADE DE NÍVEIS DUBLIN CORE 4: Description Set Profile Interoperability - Shared formal vocabular and constraints in records 3: Description Set Syntatic Interoperability - Shared formal vocabularies in exchangeable records 2: Formal Semantic Interoperability - Shared vocabularies based on formal semantics 1: Shared term definitions - Shared vocabularies defined in natural language Nível 1: definições de termos compartilhados O Dublin Core de quinze elementos (como nos padrões NISO, ISO e IETF) fornece um vocabulário de conceitos com definições de linguagem natural. Deixando de lado as considerações de processabilidade da máquina (semântica "formal"), tais voca- bulários fornecem uma base para o compartilhamento de significados dentro e entre grupos de pes- soas - uma interoperabilidade "informal" que não requer o uso de URIs para termos de referência, domínios formalmente especificados e intervalos, ou construções de ordem superior, como o modelo abstrato DCMI [ABSTRACTMODEL]. Por exemplo, a reutilização de definições e mapeamentos de termo DCMI para termos DCMI fornecidos pelo IEEE Learning Object Metadata pode ser vista como fornecendo "conformidade informal" com Simple Dublin Core (DCMI, 2017). Nível 2: interoperabilidade semântica formal A interoperabilidade "semântica" é baseada em um uso preciso e correto da semântica RDF formal incorporada no modelo de dados de gráfico RDF e em vocabulários baseados em RDF, como os Termos de Metadados DCMI. A "semântica" neste sentido não se refere a definições de linguagem natural bem formadas (que é como a palavra "se- mântica" tradicionalmente tem sido usada na comunidade Dublin Core). Em vez disso, ele se refere a relações formalmente estabelecidas entre termos e regras para usar essas afirmações para tirar conclusões automáticas (inferências lógicas). Isso inclui o uso (ou encontrabilidade) de URIs e a con- formidade com domínios formalmente especificados, intervalos e relações de sub-propriedade. In- dependentemente do formato de codificação nativo, uma especificação pode ser dita ser "interope- rável semanticamente" se for fornecer um mapeamento completo para triplos RDF, por exemplo através de uma transformação GRDDL (DCMI, 2017). Nível 3: definir interoperabilidade sintática Em cima dos gráficos ilimitados especificados pelo RDF, o DCMI Abstract Model caminha as noções de Descrições e Conjuntos de Descrição, forne- cendo uma base para a validação e troca de registros de metadados [ABSTRACT-MODEL]. Metadados estruturados de acordo com o modelo abstrato DCMI - por exemplo, a criação de dados usando di- retrizes recentes de sintaxe do DCMI - pode ser dito "modelo abstrato DCMI interoperável". Além da sintaxe abstrata RDF, o modelo abstrato DCMI fornece: 1) A noção de um "conjunto de descrições" como uma entidade delimitada com uma identi- dade específica - como na biblioteca e repositório - noção de comunidade de um "registro" que pode ser gerenciado.
  • 34. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 02 – 2.2. Pág. 33 2) A noção de uma "descrição" como uma entidade delimitada com uma identidade especí- fica, mesmo que a descrição seja incorporada em um registro. 3) Um modelo estendido de "declarações" como gráficos usando várias combinações de URI de valor, Cadeias de valor e URI de esquema de codificação de vocabulário. (A noção formal do Es- quema de codificação do vocabulário é específica para o modelo abstrato DCMI). 4) Convenções para distinguir entre a "representação" de um recurso descrito e a "identifica- ção" desse recurso com um URI. Convenções para "representar" um recurso de valor único com ca- deias de valores múltiplos (DCMI, 2017). Nível 4: definir interoperabilidade do perfil A especificação "Descrição Definir perfis: um idi- oma de restrição para Dublin Core Application Profiles" [DC-DSP] fornece um modelo de informação e expressão XML de restrições estruturais em um conjunto de descrições. Uma aplicação como o Perfil de Aplicação de Acadêmicas Acadêmicas (Eprints) pode ser dito ser "Descrição-Definir-Perfil- interoperável" se fornecer restrições formais em um Conjunto de Descrição que seja compatível com aqueles na especificação do Perfil de Conjunto de Descrição. Uma especificação relacionada, Singa- pore Framework for Dublin Core Application Profiles [DCAP], descreve um pacote de elementos de documentação necessários para apresentar um aplicativo de metadados para máxima interoperabi- lidade e reutilização - elementos como requisitos funcionais, um modelo de domínio e um conjunto de descrições Perfil abrangendo o conjunto completo de metadados (DCMI, 2017). O Dublin Core é atualmente um padrão flexível – elementos opcionais e podem ser repetiti- vos; elementos podem ser exibidos em qualquer ordem; é extensível (tanto seus elementos, quanto seus qualificadores); independe de sintaxe; é internacional; e independe de assunto. 2.2.6. O papel dos padrões. Quanto mais a organização aderirem aos padrões, p. ex., Dublin Core, a informação pode ser mais facilmente intercambiada entre repositórios. Diversas tecnologias de conteúdo oferecem origi- nalmente repositórios no padrão Dublin Core e formatos de conteúdo aderentes. Pode-se começar com um sub-conjunto e usar tanto ou tão pouco quanto necessário. Existem outros padrões, p. ex., ISO 15489 – informação e documentação – gestão de registros; ISO 23081 – processos de gestão de registros – metadados para registros – princípios; Departamento de Defesa dos EUA DOD 5015.2-STD; Padrão de metadados para o e-government do Reino Unido e- GMS; Padrão de metadados do governo australiano para serviços de localização AGLS; MoReq2 Mo- delo de requisitos para a especificação de sistemas de gestão eletrônica de registros; etc. A Library of Congress disponibiliza vários frameworks para metadados e registros. Dentre eles temos o Marc21, o MARCXML, o EAD, entre outros.