Novos Modelos de Criação e
Disseminação de Conteúdos
Eletrônicos no Acervo
BNDigital
Aquiles Alencar Brayner
abrayner@yahoo.com
@AquilesBrayner
Aquiles.alencarbrayner@bl.uk
www.bl.uk 2
Sobre o Projeto Pesquisador em
Residência da FBN
• Objetivos:
1. Aplicar técnicas de Curadoria Digital ao
acervo disponível através da plataforma
BNDigital
2. Aumentar a visibilidade e descoberta do
acervo BNDigital entre novos grupos de
usuários
3. Utilizar plataformas abertas para garantir
maior interação entre acervos digitais e
usuários
4. Agregar valor à descrição catalográfica
ofereceida pela FBN através da
folksonomia (tagueamentos)
www.bl.uk 3
Projeto Acervo Afro-Brasileiro a partir do
conteúdo da BN Digital
• Aplicação de técnicas de extração de imagens e
Curadoria Digital ao conteúdo da FBN,
principalmente da hemeroteca gitial
• Tentar recuperar conteúdos perdidos de páginas
disponibilizadas pela BNDigital referentes ao tema
da pesquisa (ex: Tráfico de Escravos no Brasil,
Christiano Júnior e a face escrava do Brasil, etc.)
• Disseminação de acervos utilizando plataformas
Web 2.0 (ex: Flickr, Wikimedia Commons, etc.) “Aguadeiro” (Álbum de vestuário
da América do Sul no século XIX)
Coleção BN Digital
www.bl.uk 4
Acervo Digital Afro-Brasileiro Coleção
BNDigital
• Identificar, extrair e publicar e conectar imagens
relativas à cultura e história afro-brasileiras
• Utilizar plataformas de acesso aberto como Flickr
e Wikimedia Commons para facilitar a
descoberta e enriquecimento de metadados
descritivos (folksonomia) para as imagens
• Ampliar a visibilidade do portal BNDigital em
máquinas de busca abertas como Google
(tagueamento e indexação) para “atrair” novos
grupos de usuários não familiarizados com o
acervo de instituições de memória cultural
• Possibilitar aos pesquisadores e estudantes
maneiras mais eficazes a descoberta de novos
padrões através da relação semântica entre
dados (Linked data), conectando conteúdos
semânticos que não haviam sidos previamente
identificados
De volta do Paraguai
Vida Fluminense ( 11 junho1870)
Revista Illustrada (29 julho 1888)
Fonte (?)
www.bl.uk 5
Alguns exemplos na identificação de significantes
comuns entre imagens:
“Fiquei com o corpo livre, mas estou com os pés no cativeiro”
Revista Illustrada (28 julho1888)
“Ande di pressa, moço! São duas hora e já divia
está no istituto di belleza!”
Don Quixote (16 maio 1917)
www.bl.uk 6
Ainda sobre significantes e sapatos…
O Malho, 10 dezembro 1910 João Cândido, líder da Revolta da Chibata
Careta, 10 dezembro 1910
www.bl.uk 7
Problemas identificados…
• O grande volume de conteúdo disponibilizado na
Hemeroteca Digital não etá sendo trabalhado de
maneira consistente e criativa de modo a facilitar
a descobreta do acervo através de técnicas de
mineração e recompilação de dados
• Embora saibamos o número de páginas
disponíveis nos periódicos digitalizados, não
estão disponibilizados os metadados OCR
(incluindo ALTO) ou indexação temática deste
material
• A máquina de busca da Hemeroteca Digital não
consegue coletar/agrupar termos de busca
através do acervo: o usuário tem de ter um pré-
conhecimento do título, local ou ano de
publicação para chegar à informação que
necessita: http://bndigital.bn.gov.br/hemeroteca-
digital/
www.bl.uk 8
Problemas enfrentados
• Imagens digitalizadas sem criação
de metadados OCR o que
impossibilita o reconhecimento e
extração automatizados de
conteúdos das páginas
digitalizadas, principalmente na
Hemeroteca Digital
• Imagens estão sendo recuperadas
manualmente graças ao trabalho do
bolsista Alexandre Pereira (Ciências
Sociais, UFRJ)
www.bl.uk 9
Possibilidades na criação de novos
acervos iconográficos com imagens de
periódicos do século XIX…
O Rio Nu (21 maio 1898)
Propaganda
“Vestuários para mau tempo"
A Estação (15 janeiro 1879)
ModaQuestão indígena
Revista Illustrada (15 janeiro 1879)
www.bl.uk 10
BNDigital –plataforma Flickr
• Flickr Commons:
https://www.flickr.com/commons/i
nstitutions/
• Acervo Afro-Brasileiro BNDigital:
https://www.flickr.com/photos/ac
ervoafrobrasileiro
www.bl.uk 11
Estatísticas de uso Imagem capturada em 27 de julho 18h
www.bl.uk 12
Outros possíveis projetos
• Contribuição de imagens do
Acervo Digital Afro-Brasileiro a
Wikimedia para ilustrar artigos
na Wikipédia
• Enriquecimento de metadados
para outras coleções digitais (ex:
Rede Memória Virtual Brasileira)
através de Crowdsourcing (ex:
Plataforma Zooniverse)
• https://www.zooniverse.org/
mss1255475_05
www.bl.uk 13
Obrigado!
@AquilesBrayner
Aqules.alencarbrayner@bl.uk
abrayner@yahoo.com

Fcrb 9 agosto_2017

  • 1.
    Novos Modelos deCriação e Disseminação de Conteúdos Eletrônicos no Acervo BNDigital Aquiles Alencar Brayner abrayner@yahoo.com @AquilesBrayner Aquiles.alencarbrayner@bl.uk
  • 2.
    www.bl.uk 2 Sobre oProjeto Pesquisador em Residência da FBN • Objetivos: 1. Aplicar técnicas de Curadoria Digital ao acervo disponível através da plataforma BNDigital 2. Aumentar a visibilidade e descoberta do acervo BNDigital entre novos grupos de usuários 3. Utilizar plataformas abertas para garantir maior interação entre acervos digitais e usuários 4. Agregar valor à descrição catalográfica ofereceida pela FBN através da folksonomia (tagueamentos)
  • 3.
    www.bl.uk 3 Projeto AcervoAfro-Brasileiro a partir do conteúdo da BN Digital • Aplicação de técnicas de extração de imagens e Curadoria Digital ao conteúdo da FBN, principalmente da hemeroteca gitial • Tentar recuperar conteúdos perdidos de páginas disponibilizadas pela BNDigital referentes ao tema da pesquisa (ex: Tráfico de Escravos no Brasil, Christiano Júnior e a face escrava do Brasil, etc.) • Disseminação de acervos utilizando plataformas Web 2.0 (ex: Flickr, Wikimedia Commons, etc.) “Aguadeiro” (Álbum de vestuário da América do Sul no século XIX) Coleção BN Digital
  • 4.
    www.bl.uk 4 Acervo DigitalAfro-Brasileiro Coleção BNDigital • Identificar, extrair e publicar e conectar imagens relativas à cultura e história afro-brasileiras • Utilizar plataformas de acesso aberto como Flickr e Wikimedia Commons para facilitar a descoberta e enriquecimento de metadados descritivos (folksonomia) para as imagens • Ampliar a visibilidade do portal BNDigital em máquinas de busca abertas como Google (tagueamento e indexação) para “atrair” novos grupos de usuários não familiarizados com o acervo de instituições de memória cultural • Possibilitar aos pesquisadores e estudantes maneiras mais eficazes a descoberta de novos padrões através da relação semântica entre dados (Linked data), conectando conteúdos semânticos que não haviam sidos previamente identificados De volta do Paraguai Vida Fluminense ( 11 junho1870) Revista Illustrada (29 julho 1888) Fonte (?)
  • 5.
    www.bl.uk 5 Alguns exemplosna identificação de significantes comuns entre imagens: “Fiquei com o corpo livre, mas estou com os pés no cativeiro” Revista Illustrada (28 julho1888) “Ande di pressa, moço! São duas hora e já divia está no istituto di belleza!” Don Quixote (16 maio 1917)
  • 6.
    www.bl.uk 6 Ainda sobresignificantes e sapatos… O Malho, 10 dezembro 1910 João Cândido, líder da Revolta da Chibata Careta, 10 dezembro 1910
  • 7.
    www.bl.uk 7 Problemas identificados… •O grande volume de conteúdo disponibilizado na Hemeroteca Digital não etá sendo trabalhado de maneira consistente e criativa de modo a facilitar a descobreta do acervo através de técnicas de mineração e recompilação de dados • Embora saibamos o número de páginas disponíveis nos periódicos digitalizados, não estão disponibilizados os metadados OCR (incluindo ALTO) ou indexação temática deste material • A máquina de busca da Hemeroteca Digital não consegue coletar/agrupar termos de busca através do acervo: o usuário tem de ter um pré- conhecimento do título, local ou ano de publicação para chegar à informação que necessita: http://bndigital.bn.gov.br/hemeroteca- digital/
  • 8.
    www.bl.uk 8 Problemas enfrentados •Imagens digitalizadas sem criação de metadados OCR o que impossibilita o reconhecimento e extração automatizados de conteúdos das páginas digitalizadas, principalmente na Hemeroteca Digital • Imagens estão sendo recuperadas manualmente graças ao trabalho do bolsista Alexandre Pereira (Ciências Sociais, UFRJ)
  • 9.
    www.bl.uk 9 Possibilidades nacriação de novos acervos iconográficos com imagens de periódicos do século XIX… O Rio Nu (21 maio 1898) Propaganda “Vestuários para mau tempo" A Estação (15 janeiro 1879) ModaQuestão indígena Revista Illustrada (15 janeiro 1879)
  • 10.
    www.bl.uk 10 BNDigital –plataformaFlickr • Flickr Commons: https://www.flickr.com/commons/i nstitutions/ • Acervo Afro-Brasileiro BNDigital: https://www.flickr.com/photos/ac ervoafrobrasileiro
  • 11.
    www.bl.uk 11 Estatísticas deuso Imagem capturada em 27 de julho 18h
  • 12.
    www.bl.uk 12 Outros possíveisprojetos • Contribuição de imagens do Acervo Digital Afro-Brasileiro a Wikimedia para ilustrar artigos na Wikipédia • Enriquecimento de metadados para outras coleções digitais (ex: Rede Memória Virtual Brasileira) através de Crowdsourcing (ex: Plataforma Zooniverse) • https://www.zooniverse.org/ mss1255475_05
  • 13.