Padrões de descrição e boas práticas para a difusão digital de acervos musicais
1. PADRÕES DE DESCRIÇÃO
e
BOAS PRÁTICAS
para a difusão digital de
acervos musicais
Rosana Lanzelotte (rosana@musicabrasilis.org.br)
Rodrigo De Santis (rodrigo@musicabrasilis.org.br)
http://slideshare.net
Instituto Moreira Salles – 17/10/2018
2. Roteiro
• História
• Modelos conceituais
• Web semântica e RDF
• Linked Open Data (LOD): uma nuvem que cresce
• Boas práticas
• RDA – Resource Description & Access
• BIBFRAME
• O Brasil e o mundo
3. História
1964 1º computador da Biblioteca
do Congresso Americano
1965 padrão MARC (MAchine Readable Cataloging)
1969 ISBD (International Standard Bibliographic Description)
1978 AACR2 -> incorpora ISBD
1989 www (World Wide Web)
1995 DCMI (Dublin Core Metadata Initiative) -> digital
1998 IFLA aprova FRBR -> foco no usuário e nas buscas
1999 padrão RDF no âmbito w3c
2002 AACR2 passa a refletir documentos eletrônicos
2010
primeira versão do RDA (Resource Description and Access)
• foco no usuário e no digital
• todos os tipos de conteúdos e mídias
2011 LOC lança a ontologia BIBFRAME p/substituir MARC 21
2016 IFLA lança LRM (Library Reference Model)
4. Modelos conceituais
• Abstrações do mundo real
• Objetivos
• Facilitar a compreensão de um sistema
• Facilitar a troca de informação entre os usuários
• Fornecer base para especificações e buscas
• Documentação, colaboração, reuso
• Metadados (Bagley, 1968): dados que descrevem dados
• Modelo de entidades e relacionamentos (Chen, 1976)
• não hierárquico
• Dublin Core: primeiro padrão de metadados p/
recursos digitais
• Tendência atual: web semântica -> Linked Open Data
5. Web semântica
Web: páginas
processadas por
seres humanos
Web de páginas
Web semântica: dados e
informações manipuladas
pelo computador
Web de conceitos
Tim Berners-Lee, “The Semantic Web”, Scientific American, 2001.
“A Web Semântica é uma extensão da web na qual a informação recebe um
significado bem definido, permitindo que computadores e pessoas trabalhem
em cooperação.”
Tim Berners-Lee, Hendler e Lassila
7. Consórcio w3c
• Fundado por Tim Berners-Lee em 1994
• Objetivo: estabelecer padrões para a criação e a
interpretação de conteúdos para a Web
• Hoje: 478 membros
Amazon, Apple, Boeing, Deutsche Nationalbibliothek
(DNB), Dublin Core Metadata Initiative (DCMI), Google,
Facebook, IBM, Library of Congress, Paypal, Sony, USP
• Ontologias
• Padrão RDF
8. Ontologias
• Descrevem os principais conceitos de um domínio e
seus relacionamentos
• Caracterização dos conceitos, através de definições de
• Classes
Ex: compositor, obra musical, partitura
• Relacionamentos
Ex: compositor compõe obra musical
partitura é uma manifestação de uma obra musical
• Propriedades (ou atributos)
Ex: um compositor tem nome, data de nascimento, ...
uma obra musical tem título, tonalidade, ...
9. RDF – Resource Description Framework
Formalismo para especificar ontologias
Sujeito Objetopredicado
Triplas RDF
Propicia interoperabilidade e reuso
10. Linked Open Data (LOD)
Recomendações para publicar recursos como LOD: Tim Berners LEE (2009)
★ o recurso deve estar disponível na Web, sob uma licença aberta;
★★ o recurso deve estar disponível em formato que pode ser
interpretado por máquina (Ex: .pdf ao invés de .jpg);
★★★ o recurso deve estar disponível em formato não-proprietário
(Ex: .xml ao invés de .doc);
★★★★ o recurso deve estar descrito de acordo com padrões
abertos do W3C (ex: RDF) e ter um identificador único persistente
(URI), de forma a poder ser apontado por outros recursos;
★★★★★ o recurso deve estar ligado a outros -> contexto
(interoperabilidade e reuso)
11. Identificador único e persistente
URL (Unique Record Locator)
URI (Unique Resource Identifier)
Ex: DOI (digital object identiifer) para artigos
opaco x mnemônico ???
http://musicabrasilis.org.br/partituras/luciano-gallet-suite-popular
12. LOD <-> boas práticas
Princípios FAIR
• Facilidade de localização
• Acessibilidade
• Interoperabilidade
• Reuso
WILKINSON, M.D. et al. The FAIR Guiding Principles for scientific data management and stewardship.
Scientific Data volume 3, Article number: 160018 (2016). http://dx.doi.org/10.1038/sdata.2016.18
13. Boas práticas: princípios FAIR
1. Identificadores persistentes: cada recurso digital deve ser identificado por um
endereço único e estável
2. Armazenamento em servidores estáveis, de forma a assegurar a preservação
digital;
3. Acesso através de protocolos padrão, especificados no âmbito da iniciativa
W3C (World Wide Web Consortium);
4. Alinhamento com padrões consagrados de metadados;
5. Explicitação das licenças e direitos de uso de acordo com o Creative Commons;
6. Adoção de catálogos de autoridades, quando existirem (ex: VIAF – Virtual
International Authority File);
7. Indicação da proveniência - cronologia da propriedade do recurso – pode ser
útil para estabelecer contexto ou validar fontes;
8. Controle de qualidade dos metadados, por equipes especializadas.
KOSTER, L.; WINDHOUWER, S.W. FAIR Principles for Library, Archive and Museum Collections: A proposal for
standards for reusable collections. 2018.
15. Alinhamento com iniciativas internacionais
• VIAF – Virtual International Authority File
• ISNI - autoridade de nomes
• OMR – Open Metadata Registry
• GitHub - plataforma de hospedagem de código-
fonte com controle de versão
• IIIF – International Image Interoperability
Framework (p/ repositórios de imagens digitais)
16. LOD: uma nuvem que cresce
DBpedia: a versão Linked Data da Wikipedia
A nuvem dobrou de tamanho a cada 10 meses desde 2007
18. RDA – Resource Description & Access
• JSC (Joint Steering Commi7ee) estabelecido em 2004
para propor RDA em subs@tuição a AACR2
• Foco no usuário: dar suporte à busca de recursos (FRBR)
Achar, Iden@ficar, Selecionar, Obter, Esclarecer, Compreender
(Find, Iden'fy, Select, Obtain, Clarify, Understand)
• Conjunto de elementos e diretrizes para
Øcriar metadados para descrever recursos analógicos e digitais
Øde bibliotecas, arquivos, museus ou repositórios digitais
Øbem formados, de acordo com modelos internacionais
Ødados abertos interligados (LOD = linked open data)
19. RDA: elementos (classes)
• Work: criação / conteúdo intelectual ou artístico (conceito abstrato)
• Expression: uma realização de um work, na forma de notação, som, imagem, objeto,
movimento ou qualquer combinação dessas formas
• Manifestation: uma materialização de uma expression de um work
• Item: uma instância de uma manifestation
• Agent – superclasse de
• Person – pessoa real
• Collective Agent – superclasse de
• Corporate Body: uma organização ou grupo de pessoas e / ou organizações que é identificado por um nome específico e que age ou pode
agir como uma unidade.
• Family: família
• Nomen: uma designação que se refere a uma entidade RDA (ex: título de uma obra,
nome de uma pessoa)
• Place: uma dada extensão de espaço (ex: endereço)
• Timespan: um período temporal, tendo início, fim, duração
responsável pela criação
20. RDA: entidades primárias (FRBR 3.1.1)
work
expression
manifestation
item
é realizado através de
é materializado
é exemplificado por
21. RDA: entidades - propriedades
• Propriedades de work: identificador, título, compositor,
forma, data da 1ª manifestação, etc. (são 327)
• Propriedades de expression: tipo de conteúdo, tipo de
“musical notation”, tonalidade, meio de performance, data,
etc. (são 309)
• Propriedades de manifestation: tipo de mídia, editor,
data de copyright, etc. (são 275)
• Propriedades de item: identificador, proveniência, é
versão digital de, etc. (são 79)
22. RDA: exemplo
w = ópera O Guarany, de autoria de Carlos Gomes
e = par;tura escrita por Carlos Gomes
m = partitura publicada pela Ricordi
i = exemplar da BN
é realizado através de
é materializado por
é exemplificado por
23. RDA – alguns vocabulários
RDA Form of Musical Notation
• graphic notation
• letter notation
• mensural notation
• number notation
• solmization
• staff notation
• tablature
• tonic sol-fa
• neumatic notation
RDA Format of Notated music
• choir book
• chorus score
• condensed score
• part
• piano conductor part
• piano score
• score
• study score
• table book
• violin conductor part
• vocal score
24. RDA – alinhamento com padrões
• IFLA Library Reference Model (LRM), 2017
• Consolidação e atualização de 3 modelos funcionais
anteriores (FRBR, FRAD, FRSAD)
• CIDOC Conceptual Reference Model (CRM), 2006
• Desenvolvido para uso por museus e instituições de
patrimônio cultural
• FRBRoo é uma extensão orientada a objetos de CRM
25. RDA x LOD
w = https://www.wikidata.org/wiki/Q2735143 (Il Guarany),
autor http://viaf.org/viaf/24816997 (Carlos Gomes)
e = http://objdigital.bn.br/acervo_digital/div_musica/mas617632.pdf
(partitura escrita por Carlos Gomes)
m = partitura publicada pela Ricordi
i = exemplar da BN
é realizado através de
é materializado por
é exemplificado por
26. RDA – iniciativas em curso
• JSC inicialmente formado por instituições de 4 países :
Australia, Canada, Estados Unidos e Grã-Bretanha
• DACH aderiu desde 2010
(D) Alemanha, (A) Austria, (CH) Suiça germânica
• França: comitê de migração no âmbito da BNF
• América Latina: México, Chile, Argentina, Colombia, Costa Rica
• Publicado em inglês, alemão, catalão, espanhol, finlandês,
francês, italiano
• Não há tradução prevista para português
• BN Portugal: início de conversas
27. RDA: vantagens e desvantagens
PROS
Interoperabilidade
Reuso
Controle de autoridade
descentralizado
CONS
Modelo complexo
Alta curva de aprendizagem
Toolkit pago
28. BIBFRAME 2.0 (2016)
• Classes principais
oWork
oInstance
oItem
• Outras classes
oAgents: pessoas, organizações, etc.
oSubjects: topics, places, temporal expressions, events,
works, instances, items, agents, etc.
oEvents: ocorrências, manifestações de um Work
Work is planned to analyze elements in other cataloging rule sets and reconcile or
add them to the BIBFRAME vocabulary as appropriate. This along with community
extensions will enable broad use of BIBFRAME.
30. Linked World
Fonte: Tiziana Possemato . How RDA is essential in the reconciliation and conversion processes for quality Linked Data. 2018.
DOI: http://dx.doi.org/10.4403/jlis.it-12447
31. O Brasil e o mundo
• Grupo RDA la1no americano: sem interlocução no Brasil
• Brasil no IAML (Interna1onal Associa1on of Music
Libraries): 4 inscrições individuais, nenhuma ins1tucional
• Carlos Gomes no RISM (Répertoire Interna1onal des
Sources Musicales)
2 registros, que apontam manuscritos na Itália
• Biblioteca de música / COLUMBIA University
nenhuma obra de compositor brasileiro
• LOD: FBN recentemente alinhou-se com VIAF (2017)
32. Referências
• EL-SHERBINI, M. RDA implementation and the emergence of BIBFRAME (2018)
https://www.jlis.it/article/view/66-82
• HEATH, T.; BIZER, C. Linked Data: Evolving the Web into a Global Data Space. Lectures on the Semantic
Web: Theory and Technology (1st edition). Synthesis. Morgan & Claypool. 2011.
http://info.slis.indiana.edu/~dingying/Teaching/S604/LODBook.pdf
• IFLA / LRM. https://www.ifla.org/files/assets/cataloguing/frbr-lrm/ifla-lrm-august-2017_rev201712.pdf
• KOSTER, L.; WINDHOUWER, S.W. FAIR Principles for Library, Archive and Museum Collections: A
proposal for standards for reusable collections. 2018. http://journal.code4lib.org/articles/13427
• LANZELOTTE, R. Por um acervo digital de partituras de música brasileira. 2018.
https://cpdoc.fgv.br/sites/default/files/cpdoc/HDRio2018_Anais.pdf
• MLA. Music Library Association Best Practices for Music Cataloging Using RDA and MARC21 for Chapter
6: Identifying Works and Expressions. 2017. http://access.rdatoolkit.org/mlabpchp6.html
• RDA. http://www.rda-rsc.org
• RDA / BNF. http://www.bnf.fr/fr/professionnels/rda/s.rda_objectifs.html