O documento apresenta os procedimentos para a conversão de registros bibliográficos do sistema Personal Home Library (PHL) para o Formato MARC 21 utilizando um modelo de conversão. O modelo envolve mapeamento dos campos de metadados entre os formatos PHL e MARC 21, elaboração de uma folha de estilo XSLT e processamento para conversão dos registros. O objetivo é permitir a exportação dos registros PHL no Formato MARC 21.
1. Tecnologias para a conversão de
registros bibliográficos PHL para o
Formato MARC 21
Fabrício Silva Assumpção
Plácida L. V. Amorim da Costa Santos
II Encontro Internacional Dados,
Tecnologia e Informação
Marília, 27 de agosto de 2014
2. Introdução
Importância do Formato MARC 21 no domínio
bibliográfico.
Sistemas que utilizam padrões de metadados
próprios e/ou que não satisfazem o requisito
de importação e de exportação de registros
em MARC 21.
Personal Home Library (PHL)
6. Objetivo
Apresentar os procedimentos para a conversão
dos registros bibliográficos do sistema PHL em
registros MARC 21 utilizando o modelo para a
conversão de registros
7. Personal Home Library (PHL)
Lançado em 2001
3233 bibliotecas
Padrão de metadados próprio: “Formato PHL”
Permite a importação no Formato MARC 21, mas não
a exportação.
PHL: “uma aplicação Web especialmente desenvolvida
para administração de coleções e serviços de
bibliotecas e centros de informações” (OLIVEIRA, 2002)
9. Mapeamento e regras de conversão
Mapeamento (crosswalking) e Mapa (crosswalk)
Diferentes níveis de granularidade
Correspondência exata, um-para-muitos, muitos-para-um,
provável e não correspondência
Separação e junção
Especificidades dos padrões de metadados
Valores codificados de diferentes formas
Conhecimento das regras de conversão, dos
vocabulários e das convenções
10. Mapa
Nível
Formato PHL Formato MARC 21 para Dados Bibliográficos
Tag Campo Tag I1 I2 Sub Campo: subcampo
M, A 005 Tipo de Documento LDR – – /06 Líder: Tipo de registro
M, A 005 Tipo de Documento* 008 – – /23 Informações gerais: Forma do item
M 016 Autor 100 1 # a Ponto de acesso principal -
Nome pessoal: Nome pessoal
M 016 Autor 700 1 # a Ponto de acesso secundário -
Nome pessoal: Nome pessoal
M 018 Título 245 1 0 a Indicação de título: Título
M 038 Informação Descritiva
do Suporte
300 # # a Descrição física: Extensão
M, A 040 Idiomas do Texto* 008 – – /35-
37
Informações gerais: Idioma
M, A 069 ISBN 020 # # a ISBN: ISBN
M, A 085 Área do Conhecimento 500 # # a Notas gerais: Nota geral
M, A 087 Descritores de 650 # 4 a Pontos de acesso de assunto -
11. Elaboração da folha de estilo XSLT
Verificação sintática
Verificação do padrão de metadados e verificação do
conteúdo
<!-- Indicação de edição (MARC 250) – Edição (PHL 063) -->
<xsl:if test="$bibliographicLevel = 'm' and v063">
<marc:datafield tag="250" ind1=" " ind2=" ">
<marc:subfield code="a">
<xsl:value-of select="v063"/>
</marc:subfield>
</marc:datafield>
</xsl:if>
12. Exportação e conversão dos registros
Folha de estilo
XSLT (PHL-MARC)
Registros
PHL (XML)
Registros
MARC 21
(XML)
Processador de
transformação
PHL
Transformaç
ão
13. Exportação e conversão dos registros
<marc:datafield tag="100" ind1="1" ind2=" ">
<marc:subfield code="a">Pescuma, Derna</marc:subfield>
</marc:datafield>
<marc:datafield tag="245" ind1="1" ind2=“0">
<marc:subfield code="a">Projeto de pesquisa</marc:subfield>
<marc:subfield code="b">o que é? como fazer?</marc:subfield>
</marc:datafield>
<v016>Pescuma, Derna</v016>
<v018>Projeto de pesquisa</v018>
<v181>o que é? como fazer?</v181>
14. Considerações finais
Uma alternativa viável e gratuita para a conversão
de registros.
Necessidade de adaptar a folha de estilo de
modo que os registros resultantes da conversão
melhor se adequem às necessidades locais.
Após a conversão, pode ser necessário completar
ou modificar os registros convertidos, o que deve
ser levado em conta pelas instituições em seus
planos para conversão.
15. Considerações finais
Por fim, a conversão de registros não deve ser
uma tarefa apenas da Ciência da Informação
ou apenas da Ciência da Computação.
Ciência da Informação: conhecimento dos
padrões de metadados e dos instrumentos de
descrição; competência necessária para mapear
os metadados de diferentes padrões
Ciência da Computação: conhecimento necessário
à transposição dos mapas para aplicações de
informática que possam converter os registros.
17. Obrigado!
II Encontro Internacional Dados,
Tecnologia e Informação
Marília, 27 de agosto de 2014
Fabrício Assumpção
assumpcao.f@gmail.com | fabricioassumpcao.com
Plácida Santos
placidasantos@gmail.com
Notas do Editor
No domínio bibliográfico, é praticamente um consenso a importância do Formato MARC 21 enquanto padrão de metadados para o intercâmbio de dados. Não somente agora, mas em suas quase 5 décadas de existência.
Apesar do reconhecimento dessa importância, existem sistemas de gerenciamento de bibliotecas que não utilizam tal formato. Esses sistemas, muitas vezes, utilizam padrões de metadados próprios ou não satisfazem o requisito de importação e de exportação de registros no formato MARC 21.
E um desses sistemas é o PHL.
Foi pensando nesses sistemas que, na minha dissertação, eu apresentei um modelo para a conversão dos registros exportados por esses sistemas em registros no Formato MARC 21.
Esse modelo apresenta – na verdade – um conjunto de procedimentos e de tecnologias que são encontrados, mas tratados as vezes em situações muito específicas ou mesmo sem um aprofundamento teórico.
Então nesse modelo buscamos reunir esses procedimentos e tecnologias e, com base num entendimento teórico sobre eles, apresentar uma generalização (um modelo) que pudesse ser aplicada à distintas realidades. O resultado dessa generalização e dessa teorização é, portanto, o próprio modelo.
A 1ª etapa do modelo consiste em mapear o padrão de metadados de origem com o padrão de metadado de destino (que no caso é um Formato MARC 21). Mas, para fazer esse mapeamento entre o padrão X e o padrão MARC 21 eu preciso levar em conta as regras de catalogação, os vocabulários e as convenções que são utilizadas junto desses formatos.
A partir do mapeamento eu tenho então um mapa que indica as correspondências entre os metadados desses dois padrões.
Com base nesse mapa são redigidas regras de conversão, que são explicações breves que ajudam a compreender o mapa.
Depois, a partir do mapa e das regras de conversão é elaborada uma folha de estilo utilizando a linguagem XSLT (que é uma linguagem utilizada para a transformação de documentos XML).
Durante a elaboração dessa folha de estilo são realizadas três verificações (sintática, do padrão de metadados e do conteúdo).
E essas verificação têm por objetivo saber se o resultado da conversão está de acordo com o padrão de metadados, com as regras de catalogação, vocabulários e convenções.
Após essas verificações e a finalização da folha de estilo, a folha de estilo é inserida no processador de transformação (que é o software que vai realizar essa transformação).
Os registros são exportados em XML e também inseridos no processador.
E o resultado são convertidos em registros MARC 21 (marcados em XML).
Para validar esse modelo (para saber se ele realmente era aplicável) ele foi aplicado na conversão dos registros do sistema PHL.
E apresentar como se deu essa aplicação é o objetivo desse trabalho.
A escolha pela aplicação do modelo no caso do PHL foi motivada por vários fatores, entre eles o fato do PHL ter uma quantidade de usuários significativa.
E também por ele ser um daqueles sistemas que não utilizam o formato MARC 21.
Ele tem um padrão de metadados próprio, que aqui eu estou chamando de “Formato PHL”.
Ele permite a importação de dados no formato MARC 21, porém não permite a exportação.
Esse aqui é um exemplo de registro no Formato PHL exportado em XML.
Possibilitar a exportação em XML é um requisito para que o modelo para a conversão de registros possa ser aplicado.
O Formato PHL é composto basicamente por campos representados por 3 dígitos. Essa é uma das semelhanças dele com o MARC 21.
O significado de cada campo é dado na documentação que acompanha o PHL.
Tendo como padrão de metadados origem o Formato PHL e como padrão de metadados de destino no Formato MARC 21, o primeiro passo para aplicar o modelo foi mapear esses dois padrões.
Desse processo de mapeamento resultou um mapa indicando as correspondências entre os dois padrões.
Mas não é uma mapa simples - a correspondência entre os dois padrões não é tão simples assim, pois existem diversos fatores que devem ser levados em conta durante o mapeamento, por exemplo, os níveis de granularidade, que fazem com que eu tenha correspondência exata, um-para-muitos, muitos-para-um, provável e não correspondência e, em alguns casos, tenha que indicar também separações e junções nos dados para que o resultado se adeque ao padrão de destino.
Além das especificidades dos padrões metadados, da consideração de que um mesmo dado (valor) pode ser codificado em um padrão de uma forma e no outro de outra forma.
E considerar também as regras de catalogação, os vocabulários e as convenções que são utilizadas com os padrões de metadados. Por mais que se diga que um independe do outro, em algumas situações, um acaba por restringir ou condicionar a utilização do outro.
Esse é um fragmento do mapa resultante do mapeamento.
Aqui temos os campos do PHL e os campos, indicadores e subcampos que correspondem a eles.
Podemos observar correspondência “exata” (ISBN), “um-para-muitos” (016, 100 e 700), “não correspondência” (085) e campos com valores codificados de formas diferentes (040 e 008).
Esse mapa foi utilizado então para criar a folha de estilo utilizando a linguagem XSLT.
Uma folha de estilo XSLT é um conjunto de regras que vai indicador ao software o que fazer com um documento XML para transformá-lo.
Foram criadas regras com diferentes níveis de complexidade: desde regras simples (pegue o valor de um campo e insira no outro) até mais complexas como (se houver tal campo e não outro campo, faça alguma coisa).
Essa folha de estilo passou pela verificação sintática, do padrão de metadados e do conteúdo, para saber – ainda quando ela estava em desenvolvimento – se os resultados estavam ou não de acordo com o esperado e, se necessário, fazer as correções necessárias.
Depois que a folha de estilo estava pronta, foi realizada a última etapa do modelo.
A folha de estilo foi inserida no processador (no caso foi utilizado o processador de transformação que acompanha do MarcEdit).
Os registros foram exportados do PHL em XML e inseridos no processador.
E o resultado foram registros em MARC 21 codificados em XML (de acordo com o MARCXML).
Com isso, os dados que antes estavam em formato que não conseguia conversar com outros sistemas, puderam ser convertidos para MARC 21 e, a partir do MARC 21, esses dados podem ser transformados/convertidos em uma variedade de formatos, e para isso já existem ferramentas disponíveis.
Com isso temos algumas considerações:
Primeiro, os resultados desse estudos apresentam uma alternativa viável e gratuita para a conversão.
É viável porque os registros resultantes demonstraram estar de acordo com o MARC.
E é gratuita porque tanto a folha de estilo quanto as instruções para utilização dessa estão disponíveis abertamente para quem tiver interesse.
A gente ressalta, no entanto, que quem deseja utilizá-la deve fazer algumas adequações, de modo que os resultado fique de acordo com as necessidades locais.
E que, após a conversão, pode ser necessário ainda um trabalho manual sobre os dados, e que isso deve ser levado em conta em qualquer projeto de conversão, não somente utilizando esse modelo.
Por fim, destacamos que a conversão de registros não deve ser uma tarefa apenas da Ciência da Informação ou apenas da Ciência da Computação.
Pois a CI tem o conhecimento dos padrões de metadados para a representação de documentos... Portanto tem a competência necessária para mapear os padrões considerando suas especificidades, as regras de catalogação, vocabulários e convenções.
E já a Ciência da Computação tem o conhecimento das melhores ferramentas para fazer com a realmente ocorra, ou seja, para traduzir os mapas na formas de programas, scripts que convertam os registros.