O documento discute um modelo para conversão de registros em diferentes padrões de metadados para o formato MARC 21 usando folhas de estilo XSLT. O modelo visa permitir o intercâmbio de dados entre sistemas e padronizar os registros. O autor valida o modelo convertendo registros do sistema PHL para MARC 21.
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
Conversão de registros em XML para MARC 21:um modelo baseado em XSLT (ENANCIB 2014)
1. Conversão de registros em XML
para MARC 21:
um modelo baseado em XSLT
Fabrício S. Assumpção
Mestre e doutorando em Ciência da Informação – UNESP/Marília
Plácida L. V. A. C. Santos
Docente do Programa de Pós-Graduação em Ciência da Informação – UNESP/Marília
2. Padrões de metadados
No domínio bibliográfico, a partir da
década de 1960 surgiram padrões de
metadados que, com as estruturas para a
codificação, permitiram que os dados
resultantes das atividades de catalogação
fossem processados e intercambiados
entre aplicações de informática.
3. Formatos MARC 21
Formatos MARC 21
A possibilidade de importar e de exportar
registros nos Formatos MARC 21 é uma
característica buscada nos sistemas de
gerenciamento de bibliotecas.
Observa-se a existência de sistemas que não
satisfazem esse requisito.
Utilizam padrões de metadados próprios.
4. Problema
A não utilização de padrões de metadados
internacionalmente aceitos reduz as
possibilidades de intercâmbio e pode
ocasionar conflitos durante a migração entre
sistemas.
Como converter os registros exportados por
esses sistemas em registros nos Formatos
MARC 21?
5. Objetivo
Efemeridade das aplicações específicas para a
conversão dos registros de cada sistema.
Possibilidades trazidas pelo uso da XML: folhas de
estilo XSLT.
Objetivo
Apresentar um modelo para a conversão de
registros de distintos padrões de metadados
codificados com a XML em registros nos
Formatos MARC 21, tendo como um de seus
pontos centrais a utilização de folhas de estilo
de transformação elaboradas com a
linguagem XSLT.
6. Padrões de metadados e
codificações
Picco e Ortiz Repiso
(2012, p. 149, tradução nossa)
7. Padrões de metadados e
codificações
Padrão de metadados: “um
conjunto predeterminado de
metadados (atributos
codificados ou
identificadores de uma
entidade)
metodologicamente
construídos e padronizados”
(ALVES, 2010, p. 47-48).
Codificação: permite que os
metadados e os valores a
eles atribuídos sejam
processados por aplicações
de informática.
8. Marcação e transformação
Extensible Markup Language (XML)
Extensible Stylesheet Language for
Transformation (XSLT)
Linguagem Extensível para Folhas de Estilo de
Transformação
Transformação de documentos XML
9. Conversão de registros
Conversão retrospectiva
Do analógico para o digital
Reutilização de metadados
Dados já existentes em ambientes digitais
Entre padrões de metadados
11. Modelo para a conversão de
registros
Diferentes níveis de
granularidade
Correspondência:
Exata
um-para-muitos
muitos-para-um
aproximada
Não correspondência
12.
13.
14. Aplicação do modelo
Validação do modelo por meio de sua
aplicação na conversão de registros
bibliográficos do sistema de
gerenciamento de bibliotecas Personal
Home Library (PHL).
fabricioassumpcao.com/conversao-de-phl-para-marc-21
15. Considerações finais
O modelo apresenta uma generalização e
uma formalização dos processos e dos
componentes necessários à conversão de
registros em XML utilizando folhas de
estilo XSLT, processos e componentes
estes até então dispersos na literatura e
abordados no contexto de realidades
individuais.
16. Considerações finais
Os resultados obtidos com a utilização do
modelo são registros em um dos Formatos
MARC 21 e codificados com a XML
seguindo o MARCXML.
Novas possibilidades passam a existir.
Possibilidades trazidas pela XML
Papel que os Formatos MARC 21 podem
desempenhar como padrões capazes de
intermediar a troca de registros entre
diferentes padrões de metadados no domínio
bibliográfico.
18. Considerações finais
Além de prover uma solução para o
problema de como converter os registros
exportados em registros nos Formatos MARC
21, o modelo apresenta novas possibilidades
para o intercâmbio de dados que favorecem
a interoperabilidade entre diferentes
aplicações de informática.
Apesar de voltado ao contexto dos Formatos
MARC 21, o modelo elaborado pode ser
aplicado na conversão de registros para
outros padrões de metadados.
19. Considerações finais
Fatores que interferem no tempo de elaboração
de uma folha de estilo XSLT:
A complexidade dos padrões
A quantidade de campos/subcampos
A especificidade e o nível de granularidade dos
padrões
O quão mínima é a perda de dados tolerada.
O grau de complexidade das instruções da folha
de estilo relaciona-se diretamente à perda de
dados na conversão.
20. Considerações finais
Em razão das diferenças entre os padrões de
origem e de destino, após a conversão, pode
ser necessário completar ou modificar os
registros convertidos, o que deve ser levado
em conta pelas instituições em seus planos
para conversão.
Deve ser levada em conta a quantidade de
registros que serão convertidos, de modo a
melhor ponderar sobre a relação custo-benefício
da conversão utilizando o modelo.
21. Considerações finais
A conversão de registros não deve ser uma
tarefa realizada apenas por profissionais da
Ciência da Informação ou apenas da Ciência
da Computação.
O modelo é uma tentativa de delineamento
dos papéis exercidos por esses profissionais
na conversão de registros.
22. Referências
ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010. 132 f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia
e Ciências, Universidade Estadual Paulista, Marília, 2010. Disponível em: <http://base.repositorio.unesp.br/handle/11449/103361>. Acesso em: 07 jul. 2014.
ALVES, R. C. V.; SIMIONATO, A. C.; SANTOS, P. L. V. A. da C. Aspectos de granularidade na representação da informação no universo bibliográfico. In:
ENCONTRO NACIONAL DE CATALOGADORES, 1., 2012, Rio de Janeiro. Trabalhos... Rio de Janeiro: Fundação Biblioteca Nacional, 2012. Disponível em:
<http://pt.scribd.com/doc/109274547/Aspectos-de-granularidade-na-representacao-da-informacao-no-universo-bibliografico>. Acesso em: 06 jul. 2014.
ASENSI ARTIGA, V.; RODRÍGUEZ MUÑOZ, J. V. El processo de catalogación automatizada. In: PINTO MOLINA, M. (Org.). Catalogación de documentos: teoria
y práctica. 2. ed. rev. e atual. Madrid: Síntesis, 2001. p. 105-143.
ASSUMPÇÃO, F. S. Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT. 135 f. Dissertação (Mestrado em Ciência
da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2013. Disponível em:
<http://base.repositorio.unesp.br/handle/11449/93658>.
AVERKAMP, S.; LEE, J. Repurposing ProQuest Metadata for Batch Ingesting ETDs into an Institutional Repository. Code4Lib Journal, n. 7, 2009. Disponível
em: <http://journal.code4lib.org/articles/1647>. Acesso em: 06 jul. 2014.
BALBY, C. N. Formatos de intercâmbio de registros bibliográficos: conceitos básicos. Cadernos da F.F.C., v. 4, n. 1, p. 29-35, 1995.
BOICA, A. L.; OLIVEIRA, L. H. M. de. Conversão de metadados do padrão Dublin Core para o RDF. Global Science and Technology, v. 1, n. 2, p. 8-13,
dez./mar. 2008. Disponível em: <http://rioverde.ifgoiano.edu.br/periodicos/index.php/gst/article/view/13>. Acesso em: 06 jul. 2014.
BORKO, H. Information Science: what is it? American Documentation, v. 19, n. 1, p. 3-5, 1968.
BOWMAN, J. H. Retrospective conversion: The early years. Library History, v. 23, p. 331-340, Dec. 2007. <http://dx.doi.org/10.1179/174581607x254811>.
CAFÉ, L.; SANTOS, C. dos; MACEDO, F. Proposta de um método para escolha de software de automação de bibliotecas. Ciência da Informação, v. 30, n. 2, p.
70-79, maio/ago. 2001. Disponível em: <http://dx.doi.org/10.1590/S0100-19652001000200009>. Acesso em: 06 jul. 2014.
CASTRO, F. F. de. Conversão retrospectiva de registros bibliográficos. In: CONGRESSO BRASILEIRO DE CIÊNCIAS DA COMUNICAÇÃO, 24., 2003, Belo
Horizonte. Anais... São Paulo: Intercom, 2003. Disponível em: <http://www.portcom.intercom.org.br/navegacaoDetalhe.php?option=trabalho&id=42503>.
Acesso em: 06 jul. 2014.
CÔRTE, A. R. et al. Automação de bibliotecas e centros de documentação: o processo de avaliação e seleção de softwares. Ciência da Informação, v. 28, n. 3,
p. 241-256, set./dez. 1999. Disponível em: <http://dx.doi.org/10.1590/S0100-19651999000300002>. Acesso em: 06 jul. 2014.
DIAS, M. do R. I. Catalogação e qualidade: breve estudo. Marília: UNESP/CGB, 1999.
EITO BRUN, R. Lenguajes de marcas para la gestión de recursos digitales: aproximación técnica, especificaciones y referencia. Gijón: Trea, 2008.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO 2709:2008: Abstract. Geneva, 2008. Disponível em:
<http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=41319>. Acesso em: 06 jul. 2014.
KEENAN, T. M. Why Purchase When You Can Repurpose? Using Crosswalks to Enhance User Access. Code4Lib Journal, n. 11, 2010. Disponível em:
<http://journal.code4lib.org/articles/3604>. Acesso em: 06 jul. 2014.
KEITH, C. Using XSLT to manipulate MARC metadata. Library Hi Tech, v. 22, n. 2, p. 122-130, 2004. Disponível em:
<http://dx.doi.org/10.1108/07378830410524549>. KURTH, M.; RUDDY, D.; RUPP, N. Repurposing MARC metadata: using digital project experience to
develop a metadata management design. Library Hi Tech, v. 22, n. 2, p. 153-165, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524585>.
Acesso em: 06 jul. 2014.
LE COADIC, Y-F. A ciência da informação. 2. ed. Brasília: Briquet de Lemos, 2004.
LIBRARY OF CONGRESS. MARC 21 XML Schema: official web site. Washington, D.C., 2014. Disponível em: <http://www.loc.gov/standards/marcxml/>.
23. Referências
LIBRARY OF CONGRESS. MARC XML Design Considerations. Washington, D.C., 2004. Disponível em: <http://www.loc.gov/standards/marcxml/marcxml-design.
html>.
LIBRARY OF CONGRESS. The MARC 21 Formats: Background and Principles. Revised November 1996. Washington, D.C.: Library of Congress, 1996.
Disponível em: <http://www.loc.gov/marc/96principl.html>. Acesso em: 06 jul. 2014.
MACHOVEC, G. S. Challenges and issues with metadata crosswalks. Information Intelligence Online Libraries and Microcomputers, v. 20, n. 4, p. 1-3, Apr.
2002.
MURAKAMI, T. Migração de registros de uma Tabela para o MARC21. In: BIBLIOTECÁRIOS sem fronteiras. [S.l.: s.n.], 2012. Disponível em:
<http://bsf.org.br/2012/01/16/migracao-de-registros-de-uma-tabela-para-o-marc21>. Acesso em: 06 jul. 2014.
OLIVEIRA, N. M. et al. Compact Disc Catalonging - CatCD: análise de um instrumento para conversão retrospectiva no Sistema de Bibliotecas da UNICAMP.
Perspectivas em Ciência da Informação, v. 3, n. 1, p. 41-46, jan./jun. 1998. Disponível em:
<http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/608>.
PARANHOS, W. M. M. da R. Fragmentos metodológicos para projetos e execução de gestão informatizada de coleções de documentos e serviços em
bibliotecas. Encontros BIBLI, n. esp., p. 14-32, 2º sem. 2004. Disponível em: <https://periodicos.ufsc.br/index.php/eb/article/view/1518-
2924.2004v9nesp2p14>.
PEREIRA, A. M.; SANTOS, P. L. V. A. da C. O uso estratégico das tecnologias em catalogação. Cadernos da F.F.C., v. 7, n. 1/2, p. 121-131, 1998.
PEREZ, D. R.; LIMA, P. O projeto de conversão retrospectiva de registros bibliográficos: uma experiência do sistema de bibliotecas da Pontifícia Universidade
Católica do Rio de Janeiro. In: SEMINÁRIO NACIONAL DE BIBLIOTECAS UNIVERSITÁRIAS, 12., 2002, Recife. Anais... Recife: UFPE, 2002. Disponível em:
<http://alfarrabiosroger.files.wordpress.com/2009/12/37-a.pdf>. Acesso em: 06 jul. 2014.
PICCO, P.; ORTIZ REPISO, V. RDA, el nuevo código de catalogación: cambios y desafíos para su aplicación. Revista Española de Documentación Científica, v.
35, n. 1, p. 145-173, enero-marzo 2012. Disponível em: <http://dx.doi.org/10.3989/redc.2012.1.848>. Acesso em: 06 jul. 2014.
RAPOSO, M. de F. P.; OLIVEIRA, V. L. S. de; SHINOTSUKA, F. H. Mudança para o formato CALCO: uma experiência. Revista de Biblioteconomia de Brasília, v.
13, n. 1, p. 21-26, jan./jun. 1985.
RAY, E. T. Aprendendo XML. Rio de Janeiro: Campus, 2001.
RUDIĆ, G.; SURLA, D. Conversion of bibliographic records to MARC 21 format. The Electronic Library, v. 27, n. 6, p. 950-967, 2009. Disponível em:
<http://dx.doi.org/10.1108/02640470911004057>. Acesso em: 06 jul. 2014.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da Informação, v. 1, n. 1, p. 41-62, jan./jun. 1996. Disponível
em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/235>. Acesso em: 06 jul. 2014.
SCHMIDT, N.; PATEL, A. MARC record conversion: a generalised approach. Computer Standards & Interfaces, v. 21, p. 287-297, 1999. Disponível em:
<http://dx.doi.org/10.1016/S0920-5489(99)00007-0>. Acesso em: 06 jul. 2014.
ST. PIERRE, M.; LAPLANT, W. P. Issues in Crosswalking Content Metadata Standards. Baltimore: National Information Standards Organization, 1998.
Disponível em: <http://www.niso.org/publications/white_papers/crosswalk>. Acesso em: 06 jul. 2014.
TIDWELL, D. XSLT. 2nd ed. Beijing: O'Reilly, 2008.
W3C. XSL Transformations (XSLT) Version 2.0: W3C Recommendation 23 January 2007. Cambridge, 2007. Disponível em: <http://www.w3.org/TR/xslt20>.
WOODLEY, M. S. Crosswalks, Metadata Harvesting, Federated Searching, Metasearching: Using Metadata to Connect Users and Information. In: BACA, M.
(Org.). Introduction to Metadata. 2nd ed. Los Angeles: Getty Research Institute, 2008. Disponível em:
<http://www.getty.edu/research/publications/electronic_publications/intrometadata/path.pdf>. Acesso em: 06 jul. 2014.
ZAFALON, Z. R. Scan for MARC: princípios sintáticos e semânticos de registros bibliográficos aplicados à conversão de dados analógicos para o Formato
MARC21 bibliográfico. 2012. 169 f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília,
2012. Disponível em: <http://base.repositorio.unesp.br/handle/11449/103386>. Acesso em: 06 jul. 2014.
24. Obrigado!
Fabrício S. Assumpção
assumpcao.f@gmail.com | fabricioassumpcao.com
Plácida L. V. A. C. Santos
placida@marilia.unesp.br