Conversão de registros em XML para MARC 21: um modelo baseado em XSLT (ENANCIB 2014)

4.991 visualizações

Publicada em

Considerando a existência de sistemas de gerenciamento de bibliotecas que não utilizam os Formatos MARC 21 ou quaisquer outros padrões de metadados internacionalmente aceitos, este trabalho tem por objetivo elaborar um modelo para a conversão de registros de distintos padrões de metadados codificados com a Extensible Markup Language (XML) em registros nos Formatos MARC 21, tendo como um dos pontos centrais do modelo a utilização de folhas de estilo de transformação elaboradas com a linguagem Extensible Stylesheet Language for Transformation (XSLT). Após uma revisão de literatura, é apresentado o modelo e seus processos: mapeamento, elaboração de regras de conversão, elaboração da folha de estilo XSLT, verificação da folha de estilo, exportação e conversão dos registros. Como resultados alcançados, destaca-se que o modelo para a conversão de registros (1) busca apresentar uma generalização e uma formalização dos processos e dos componentes necessários à conversão de registros utilizando folhas de estilo XSLT e (2) apresenta novas possibilidades para o intercâmbio de dados que favorecem a interoperabilidade entre diferentes aplicações de informática que comunicam dados sobre recursos informacionais.
Mais informações: http://base.repositorio.unesp.br/handle/11449/93658
http://fabricioassumpcao.com/2014/11/conversao-de-registros-em-xml-para-marc-21-apresentacao-no-enancib-2014.html

Publicada em: Tecnologia
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
4.991
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4.364
Ações
Compartilhamentos
0
Downloads
14
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Conversão de registros em XML para MARC 21: um modelo baseado em XSLT (ENANCIB 2014)

  1. 1. Conversão de registros em XML para MARC 21: um modelo baseado em XSLT Fabrício S. Assumpção Mestre e doutorando em Ciência da Informação – UNESP/Marília Plácida L. V. A. C. Santos Docente do Programa de Pós-Graduação em Ciência da Informação – UNESP/Marília
  2. 2. Padrões de metadados  No domínio bibliográfico, a partir da década de 1960 surgiram padrões de metadados que, com as estruturas para a codificação, permitiram que os dados resultantes das atividades de catalogação fossem processados e intercambiados entre aplicações de informática.
  3. 3. Formatos MARC 21  Formatos MARC 21  A possibilidade de importar e de exportar registros nos Formatos MARC 21 é uma característica buscada nos sistemas de gerenciamento de bibliotecas.  Observa-se a existência de sistemas que não satisfazem esse requisito.  Utilizam padrões de metadados próprios.
  4. 4. Problema  A não utilização de padrões de metadados internacionalmente aceitos reduz as possibilidades de intercâmbio e pode ocasionar conflitos durante a migração entre sistemas. Como converter os registros exportados por esses sistemas em registros nos Formatos MARC 21?
  5. 5. Objetivo  Efemeridade das aplicações específicas para a conversão dos registros de cada sistema.  Possibilidades trazidas pelo uso da XML: folhas de estilo XSLT.  Objetivo  Apresentar um modelo para a conversão de registros de distintos padrões de metadados codificados com a XML em registros nos Formatos MARC 21, tendo como um de seus pontos centrais a utilização de folhas de estilo de transformação elaboradas com a linguagem XSLT.
  6. 6. Padrões de metadados e codificações Picco e Ortiz Repiso (2012, p. 149, tradução nossa)
  7. 7. Padrões de metadados e codificações  Padrão de metadados: “um conjunto predeterminado de metadados (atributos codificados ou identificadores de uma entidade) metodologicamente construídos e padronizados” (ALVES, 2010, p. 47-48).  Codificação: permite que os metadados e os valores a eles atribuídos sejam processados por aplicações de informática.
  8. 8. Marcação e transformação  Extensible Markup Language (XML)  Extensible Stylesheet Language for Transformation (XSLT)  Linguagem Extensível para Folhas de Estilo de Transformação  Transformação de documentos XML
  9. 9. Conversão de registros  Conversão retrospectiva  Do analógico para o digital  Reutilização de metadados  Dados já existentes em ambientes digitais  Entre padrões de metadados
  10. 10. Modelo para a conversão de registros
  11. 11. Modelo para a conversão de registros  Diferentes níveis de granularidade  Correspondência:  Exata  um-para-muitos  muitos-para-um  aproximada  Não correspondência
  12. 12. Aplicação do modelo  Validação do modelo por meio de sua aplicação na conversão de registros bibliográficos do sistema de gerenciamento de bibliotecas Personal Home Library (PHL). fabricioassumpcao.com/conversao-de-phl-para-marc-21
  13. 13. Considerações finais  O modelo apresenta uma generalização e uma formalização dos processos e dos componentes necessários à conversão de registros em XML utilizando folhas de estilo XSLT, processos e componentes estes até então dispersos na literatura e abordados no contexto de realidades individuais.
  14. 14. Considerações finais  Os resultados obtidos com a utilização do modelo são registros em um dos Formatos MARC 21 e codificados com a XML seguindo o MARCXML.  Novas possibilidades passam a existir.  Possibilidades trazidas pela XML  Papel que os Formatos MARC 21 podem desempenhar como padrões capazes de intermediar a troca de registros entre diferentes padrões de metadados no domínio bibliográfico.
  15. 15. UNIMARC Dublin Core MODS/MADS BIBFRAME ...
  16. 16. Considerações finais  Além de prover uma solução para o problema de como converter os registros exportados em registros nos Formatos MARC 21, o modelo apresenta novas possibilidades para o intercâmbio de dados que favorecem a interoperabilidade entre diferentes aplicações de informática.  Apesar de voltado ao contexto dos Formatos MARC 21, o modelo elaborado pode ser aplicado na conversão de registros para outros padrões de metadados.
  17. 17. Considerações finais  Fatores que interferem no tempo de elaboração de uma folha de estilo XSLT:  A complexidade dos padrões  A quantidade de campos/subcampos  A especificidade e o nível de granularidade dos padrões  O quão mínima é a perda de dados tolerada.  O grau de complexidade das instruções da folha de estilo relaciona-se diretamente à perda de dados na conversão.
  18. 18. Considerações finais  Em razão das diferenças entre os padrões de origem e de destino, após a conversão, pode ser necessário completar ou modificar os registros convertidos, o que deve ser levado em conta pelas instituições em seus planos para conversão.  Deve ser levada em conta a quantidade de registros que serão convertidos, de modo a melhor ponderar sobre a relação custo-benefício da conversão utilizando o modelo.
  19. 19. Considerações finais  A conversão de registros não deve ser uma tarefa realizada apenas por profissionais da Ciência da Informação ou apenas da Ciência da Computação.  O modelo é uma tentativa de delineamento dos papéis exercidos por esses profissionais na conversão de registros.
  20. 20. Referências ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010. 132 f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010. Disponível em: <http://base.repositorio.unesp.br/handle/11449/103361>. Acesso em: 07 jul. 2014. ALVES, R. C. V.; SIMIONATO, A. C.; SANTOS, P. L. V. A. da C. Aspectos de granularidade na representação da informação no universo bibliográfico. In: ENCONTRO NACIONAL DE CATALOGADORES, 1., 2012, Rio de Janeiro. Trabalhos... Rio de Janeiro: Fundação Biblioteca Nacional, 2012. Disponível em: <http://pt.scribd.com/doc/109274547/Aspectos-de-granularidade-na-representacao-da-informacao-no-universo-bibliografico>. Acesso em: 06 jul. 2014. ASENSI ARTIGA, V.; RODRÍGUEZ MUÑOZ, J. V. El processo de catalogación automatizada. In: PINTO MOLINA, M. (Org.). Catalogación de documentos: teoria y práctica. 2. ed. rev. e atual. Madrid: Síntesis, 2001. p. 105-143. ASSUMPÇÃO, F. S. Conversão de registros em XML para MARC 21: um modelo baseado em folhas de estilo XSLT. 135 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2013. Disponível em: <http://base.repositorio.unesp.br/handle/11449/93658>. AVERKAMP, S.; LEE, J. Repurposing ProQuest Metadata for Batch Ingesting ETDs into an Institutional Repository. Code4Lib Journal, n. 7, 2009. Disponível em: <http://journal.code4lib.org/articles/1647>. Acesso em: 06 jul. 2014. BALBY, C. N. Formatos de intercâmbio de registros bibliográficos: conceitos básicos. Cadernos da F.F.C., v. 4, n. 1, p. 29-35, 1995. BOICA, A. L.; OLIVEIRA, L. H. M. de. Conversão de metadados do padrão Dublin Core para o RDF. Global Science and Technology, v. 1, n. 2, p. 8-13, dez./mar. 2008. Disponível em: <http://rioverde.ifgoiano.edu.br/periodicos/index.php/gst/article/view/13>. Acesso em: 06 jul. 2014. BORKO, H. Information Science: what is it? American Documentation, v. 19, n. 1, p. 3-5, 1968. BOWMAN, J. H. Retrospective conversion: The early years. Library History, v. 23, p. 331-340, Dec. 2007. <http://dx.doi.org/10.1179/174581607x254811>. CAFÉ, L.; SANTOS, C. dos; MACEDO, F. Proposta de um método para escolha de software de automação de bibliotecas. Ciência da Informação, v. 30, n. 2, p. 70-79, maio/ago. 2001. Disponível em: <http://dx.doi.org/10.1590/S0100-19652001000200009>. Acesso em: 06 jul. 2014. CASTRO, F. F. de. Conversão retrospectiva de registros bibliográficos. In: CONGRESSO BRASILEIRO DE CIÊNCIAS DA COMUNICAÇÃO, 24., 2003, Belo Horizonte. Anais... São Paulo: Intercom, 2003. Disponível em: <http://www.portcom.intercom.org.br/navegacaoDetalhe.php?option=trabalho&id=42503>. Acesso em: 06 jul. 2014. CÔRTE, A. R. et al. Automação de bibliotecas e centros de documentação: o processo de avaliação e seleção de softwares. Ciência da Informação, v. 28, n. 3, p. 241-256, set./dez. 1999. Disponível em: <http://dx.doi.org/10.1590/S0100-19651999000300002>. Acesso em: 06 jul. 2014. DIAS, M. do R. I. Catalogação e qualidade: breve estudo. Marília: UNESP/CGB, 1999. EITO BRUN, R. Lenguajes de marcas para la gestión de recursos digitales: aproximación técnica, especificaciones y referencia. Gijón: Trea, 2008. INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. ISO 2709:2008: Abstract. Geneva, 2008. Disponível em: <http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=41319>. Acesso em: 06 jul. 2014. KEENAN, T. M. Why Purchase When You Can Repurpose? Using Crosswalks to Enhance User Access. Code4Lib Journal, n. 11, 2010. Disponível em: <http://journal.code4lib.org/articles/3604>. Acesso em: 06 jul. 2014. KEITH, C. Using XSLT to manipulate MARC metadata. Library Hi Tech, v. 22, n. 2, p. 122-130, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524549>. KURTH, M.; RUDDY, D.; RUPP, N. Repurposing MARC metadata: using digital project experience to develop a metadata management design. Library Hi Tech, v. 22, n. 2, p. 153-165, 2004. Disponível em: <http://dx.doi.org/10.1108/07378830410524585>. Acesso em: 06 jul. 2014. LE COADIC, Y-F. A ciência da informação. 2. ed. Brasília: Briquet de Lemos, 2004. LIBRARY OF CONGRESS. MARC 21 XML Schema: official web site. Washington, D.C., 2014. Disponível em: <http://www.loc.gov/standards/marcxml/>.
  21. 21. Referências LIBRARY OF CONGRESS. MARC XML Design Considerations. Washington, D.C., 2004. Disponível em: <http://www.loc.gov/standards/marcxml/marcxml-design. html>. LIBRARY OF CONGRESS. The MARC 21 Formats: Background and Principles. Revised November 1996. Washington, D.C.: Library of Congress, 1996. Disponível em: <http://www.loc.gov/marc/96principl.html>. Acesso em: 06 jul. 2014. MACHOVEC, G. S. Challenges and issues with metadata crosswalks. Information Intelligence Online Libraries and Microcomputers, v. 20, n. 4, p. 1-3, Apr. 2002. MURAKAMI, T. Migração de registros de uma Tabela para o MARC21. In: BIBLIOTECÁRIOS sem fronteiras. [S.l.: s.n.], 2012. Disponível em: <http://bsf.org.br/2012/01/16/migracao-de-registros-de-uma-tabela-para-o-marc21>. Acesso em: 06 jul. 2014. OLIVEIRA, N. M. et al. Compact Disc Catalonging - CatCD: análise de um instrumento para conversão retrospectiva no Sistema de Bibliotecas da UNICAMP. Perspectivas em Ciência da Informação, v. 3, n. 1, p. 41-46, jan./jun. 1998. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/608>. PARANHOS, W. M. M. da R. Fragmentos metodológicos para projetos e execução de gestão informatizada de coleções de documentos e serviços em bibliotecas. Encontros BIBLI, n. esp., p. 14-32, 2º sem. 2004. Disponível em: <https://periodicos.ufsc.br/index.php/eb/article/view/1518- 2924.2004v9nesp2p14>. PEREIRA, A. M.; SANTOS, P. L. V. A. da C. O uso estratégico das tecnologias em catalogação. Cadernos da F.F.C., v. 7, n. 1/2, p. 121-131, 1998. PEREZ, D. R.; LIMA, P. O projeto de conversão retrospectiva de registros bibliográficos: uma experiência do sistema de bibliotecas da Pontifícia Universidade Católica do Rio de Janeiro. In: SEMINÁRIO NACIONAL DE BIBLIOTECAS UNIVERSITÁRIAS, 12., 2002, Recife. Anais... Recife: UFPE, 2002. Disponível em: <http://alfarrabiosroger.files.wordpress.com/2009/12/37-a.pdf>. Acesso em: 06 jul. 2014. PICCO, P.; ORTIZ REPISO, V. RDA, el nuevo código de catalogación: cambios y desafíos para su aplicación. Revista Española de Documentación Científica, v. 35, n. 1, p. 145-173, enero-marzo 2012. Disponível em: <http://dx.doi.org/10.3989/redc.2012.1.848>. Acesso em: 06 jul. 2014. RAPOSO, M. de F. P.; OLIVEIRA, V. L. S. de; SHINOTSUKA, F. H. Mudança para o formato CALCO: uma experiência. Revista de Biblioteconomia de Brasília, v. 13, n. 1, p. 21-26, jan./jun. 1985. RAY, E. T. Aprendendo XML. Rio de Janeiro: Campus, 2001. RUDIĆ, G.; SURLA, D. Conversion of bibliographic records to MARC 21 format. The Electronic Library, v. 27, n. 6, p. 950-967, 2009. Disponível em: <http://dx.doi.org/10.1108/02640470911004057>. Acesso em: 06 jul. 2014. SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da Informação, v. 1, n. 1, p. 41-62, jan./jun. 1996. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/235>. Acesso em: 06 jul. 2014. SCHMIDT, N.; PATEL, A. MARC record conversion: a generalised approach. Computer Standards & Interfaces, v. 21, p. 287-297, 1999. Disponível em: <http://dx.doi.org/10.1016/S0920-5489(99)00007-0>. Acesso em: 06 jul. 2014. ST. PIERRE, M.; LAPLANT, W. P. Issues in Crosswalking Content Metadata Standards. Baltimore: National Information Standards Organization, 1998. Disponível em: <http://www.niso.org/publications/white_papers/crosswalk>. Acesso em: 06 jul. 2014. TIDWELL, D. XSLT. 2nd ed. Beijing: O'Reilly, 2008. W3C. XSL Transformations (XSLT) Version 2.0: W3C Recommendation 23 January 2007. Cambridge, 2007. Disponível em: <http://www.w3.org/TR/xslt20>. WOODLEY, M. S. Crosswalks, Metadata Harvesting, Federated Searching, Metasearching: Using Metadata to Connect Users and Information. In: BACA, M. (Org.). Introduction to Metadata. 2nd ed. Los Angeles: Getty Research Institute, 2008. Disponível em: <http://www.getty.edu/research/publications/electronic_publications/intrometadata/path.pdf>. Acesso em: 06 jul. 2014. ZAFALON, Z. R. Scan for MARC: princípios sintáticos e semânticos de registros bibliográficos aplicados à conversão de dados analógicos para o Formato MARC21 bibliográfico. 2012. 169 f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2012. Disponível em: <http://base.repositorio.unesp.br/handle/11449/103386>. Acesso em: 06 jul. 2014.
  22. 22. Obrigado! Fabrício S. Assumpção assumpcao.f@gmail.com | fabricioassumpcao.com Plácida L. V. A. C. Santos placida@marilia.unesp.br

×