SlideShare uma empresa Scribd logo
1 de 48
Acervos Digitais:
Novos modelos de disseminação,
acesso e uso
Aquiles Alencar Brayner
abrayner@yahoo.com
@AquilesBrayner
Aquiles.alencarbrayner@bl.uk
www.bl.uk 2
Missão das instituições de memória
cultural no século XXI
• Selecionar, capturar, descrever e preservar objetos
digitais, oferecendo novos sistemas de busca e
plataformas de acesso e reutilização destes objetos
• Promover seus acervos entre diferentes tipos de usuários
• Proporcionar a integração de distintos formatos eletrônicos
e criação de ferramentas que facilitem o acesso e análise
de conteúdos digitais
• Participação ativa nos projetos de pesquisa digital,
gerenciando as atividades e disseminação de resultados
obtidos
• Instituições como “laboratórios” de novas idéias e modelos
em pesquisa digital
• Atuar como centros de capacitação para pesquisadores e
profissionais envolvidos na gestão e utilização de dados
eletrônicos
www.bl.uk 3
Curadoria Digital: as regras dos 10 “in"
1.Integridade: acesso ao objeto digital
na maneira em que ele foi criado
2.Integração: diferentes conteúdos e
formatos acessíveis a partir de uma
mesma plataforma
3.Interoperabilidade: compatibilidade
entre diferentes formatos,
plataformas e sistemas operacionais
4.Instantaneidade: acesso irrestrito e
imediato aos objetos eletrônicos
5.Interação: catálogos interativos
incorporando elementos de Web 2.0
(blogs, wikis, tags) e mídia social
6.Informação: planificação de
metadados para maior eficiência e
confiabilidade nos resultados de
busca
7.Incorporação de conteúdos:
constante inclusão de objetos digitais
8. Interpretação: objeto digital
contextualizado em relação a outros
itens equivalentes em vários acervos
9. Inovação: apresentação do material em
plataformas inovativas
10. Acesso Indefinido: objetos digitais
preservados para futura gerações
www.bl.uk 4
Curadoria Digital
Estabelecer
vários canais
de acesso à
coleção
Incentivar a
criação e
manipulação de
base de dados
por usuários
Apoio à
pesquisa e
educação
Objetivos:
 Infra-estrutura de acesso,
depósito e preservação de
conteudos digitais
 Criação extensiva de coleções
digitais
 Promoção e utilização de novas
ferramentas aplicadas ao acervo
digital: anotação, visualisação,
comparação, análise, etc.
 Informação sobre novos métodos e
modelos em pesquisa digital
 Promover uma maior colaboração
entre técnicos, pesquisadores e
bibliotecários
Alcançados através de:
 Projetos colaborativos
 Pataformas interoperacionais
 Conexão entre base de dados e
ferramentas de pesquisa Criação de
Novos modelos
e métodos de
pesquisa
Conteúdo Digital
 Treinamento e
suporte
profissional
www.bl.uk 5
Curadoria Digital (DCC)
• A Curadoria Digital envolve a
criação, manutenção,
preservação e agregação de
valor aos objetos digitais em
toda sua vida útil.
www.bl.uk 6
Modelo Ciclo de Vida Objetos digitais
Ações completas ou essenciais:
1. Descrição e representação da
informação
2. Plano de preservação
3. Observação e participação da
comunidade de usuários
Ações sequenciais:
1. Conceitualização
2. Criação ou coleta
3. Avaliação e seleção
4. Ingestão
5. Ação de preservação
6. Arquivo
7. Acesso, uso e reutilizaçào
8. Transformação
Ações ocasionais:
1. Descarte
2. Reavaliação
https://curadoriadigitalblog.wordpress.com/2015/11/13/ciclo-de-vida-da-curadoria-digital/
www.bl.uk 7
Conteúdos Nato-Digitais
www.bl.uk 8
Desafio: como selecionar, armazenar,
classificar e analisar as informações no
universo digital?
• Qual a quantidade de dados
gerados em 1 dia?
1. Twitter: 7 TB
2. Facebook: 10 TB
• Até 2020 teremos
aproximadamente 35 ZB (1.1
trilhão GB) de dados digitais
disponiveis
www.bl.uk 9
Arquivos de páginas Web
• Contexto: Arquivo e preservação das publicações no domínio
national (ex: .br)
• Aplicação e desenvolvimento de novas ferramentas para
recuperação e análise do conteúdo arquivado
• http://www.webarchive.org.uk/ukwa/
• The Internet Archive
www.bl.uk 10
Domínio .br
• Segundo os dados
coletados do site de
registros de páginas Web
no Brasil,
https://registro.br/estatistic
as.html , o país conta com
cerca 4M de sites criados
desde 1996
• International Internet
Preservation Consortium
(IIPC)
www.bl.uk 11
Panorama da história de páginas Web no
Brasil…
www.bl.uk 12
Arquivo de conteúdos eletrônicos
produzidos por órgãos governamentais
• Páginas Web e Mídias Sociais: National
Archives (GB): arquivo de informação em
formato digital produzida pelo governo britânico
• Dados: Data.Gov.uk: disponibilização/
arquivo de dados abertos (GB)
• Brazil: Dados.gov
www.bl.uk 13
Arquivo e gerenciamento de manuscritos
eletrônicos
• Arquivo de conteúdos
armazenados em dispositivos
eletronicos pessoais
• Recuperação de conteúdo
descartado e/ou modificado
pelo autor
• Garantir a preservação e
acesso a materiais
dependentes de tecnologia
obsoleta
• Maiores informações
http://wiki.bitcurator.net/index.
php?title=Main_Page
www.bl.uk 14
Digitalização: passos essenciais para
reprodução e disseminação de acervos
www.bl.uk 15
Analógico Digital
www.bl.uk 16
Planificação Estratégica
• Critérios:
– Dimensionalidade (ex: 3D)
– Formato(s)
– Metadados (incluindo OCRização)
– Manipulação pós-captura, etc.
• Considerações:
– Público alvo
– Objetivos
– Orçamento
– Representatividade (ex: como nos certificar que
o conteúdo digitalizado possa representar
proporcionalmente objetos em outros formatos
nos nossos acervos?
• Planejamento
– Adoção de modelos refereciais (OAIS, etc.)
– Software de captura, gestão, plataformas de
visualização, etc.
www.bl.uk 17
Critérios na digitalização: exemplos
• Imagem Multispectral: Consiste em
imagens de um mesmo objeto, tomadas
com diferentes comprimentos de ondas
eletromagnéticas. Pode ser luz visível,
infravermelha, ultravioleta, raio-X ou
qualquer outra faixa do espectro.
Diários de David Livingstone:
http://bit.ly/2vM1env
• Digitalização Tridimensional:
http://bit.ly/2tFUcQ5
https://skfb.ly/KGNq
• Imagem de ressonância magnética
Pergaminhos herculanos
www.bl.uk 18
Considerações: exemplo
• Como utilizar tecnologias existentes para maximizar o
acesso e reuso dos nossos acervos eletrônicos entre
diferentes públicos?
• British Library:
– Pinterest: https://www.pinterest.co.uk/britishlibrary/
– Soundcloud: https://soundcloud.com/the-british-library/the-voice-of-
oscar-wilde-the-ballad-of-reading-gaol
– Wikimedia Commons:
https://commons.wikimedia.org/wiki/Category:British_Library
– Flickr: https://www.flickr.com/photos/britishlibrary/
www.bl.uk 19
Planejamento
THOMAZ, Katia P.; SOARES, Antonio José. A preservação digital
e o modelo de referência Open Archival Information System
(OAIS).Datagramazero, v. 5, n. 1, fev. 2004. Disponível
em:<http://www.dgz.org.br/fe-v04/F_I_art.htm>. Acesso em: 10
jan. 2016.
Ex:Modelo de referência OAIS (Open
Archives Information System)
Funções:
1. Inserção / Ingestão
2. Armazenamento
3. Gerenciamento de dados
4. Administração
5. Acesso
6. Planejamento da Preservação
Pacotes de submissão:
1. Pacote de Submissão de Informação (PSI):
Objeto digital + metadados descritivos e
técnicos (incl. OCR)
2. Pacote de Arquivamento da informação (PAI):
dados de conteúdo do objeto (informação de
referência + proveniência + contexto +
fixação: check sum, integridade e
autenticidade) + dados de preservação +
representação da informação)
3. Pacote de disseminação da informação (PDI):
dados de conteudo do objeto + metadados de
sistemas de suporte para acesso e
reutilização do objeto
www.bl.uk 20
Referências
• Impact: https://www.digitisation.eu/new-impact-website/
• Open Archival Information Stystem (OAIS):
http://www.oclc.org/research/publications/library/2000/lavoi
e-oais.html
• Digital Curation Centre (DCC): http://www.dcc.ac.uk/
• Tesseract (programa de OCRização de imagens com
texto): http://tesseract.projectnaptha.com/ e
http://bit.ly/2hbDExx
www.bl.uk 21
Plataformas de acesso e interação
www.bl.uk 22
Plataformas que facilitem o trabalho com
arquivos digitalizados
1. Codex Sinaiticus – Plataforma
colaborativa
2. Casebooks project – identificação de
informação em documentos
3. TITL (Text to Image Linking Tool)
– transcrição e identificação
automatizadas
4. The Archaeology of Reading –
identificação de marginália em textos
impressos
5. The Chymistry of Isaac Newton
www.bl.uk 23
Transcrição
• Transcriptorium Reconhecimento
automático de textos manuscritos – HTR
• Digipal Base de dados para paleógrafos
• Transcribing Bentham Projeto de
participação pública (crowdsourcing) para
transcrição de manuscritos
• The Book of Margery Kempe
Projeto de transcrição incluindo anotações
feitas no manuscrito original
www.bl.uk 24
Transcrição, reconstrução e visualização
de dados
• Escravidão, Abolição e Pós-Abolição
Transcrição e controle de qualidade de
dados
• Projeto Old Weather reconstrução de
dados sobre o tempo a partir de
relatórios de viagens, aventureiros,
etc. https://www.oldweather.org/
• Stanford Spatial History: vários
exemplos de análise e visualização de
dados históricos e literários
• Old Bailey: base de dados sentenças
judiciais na Inglaterra entre 1676 e
1772 https://www.oldbaileyonline.org/
www.bl.uk 25
Projetos de enfoques comunitários
(crowdsourcing) para a construção de acervos
• Projeto Quipu: coleta de depoimentos sobre
esterilização massiva, muitas vezes não
consensual, de peruanos no período do governo
Fujimori (anos 90) https://interactive.quipu-
project.com/#/en/quipu/intro
• Cantos Cautivos: experiências de presos
políticos na época de Pinochet refletidas através da
música
• Europeana 1914-18: participação pública na
digitalização de acervos pessoais, enriquecendo as
coleções institucionais sobre a Primeira Guerra
Mundial
• Plataforma abertas de crowdsourcing:
Zooniverse
www.bl.uk 26
Geo-referencialidades
• BL Maps
• Old Maps
• Mapas em livros
digitalizados e disponíveis
na plataforma Flickr
www.bl.uk 27
www.bl.uk 28
Novos métodos de pesquisa digital
Uso de APIs (Application Programming Interfaces) para
integrar base de dados, ex: metadados, imagens, etc.
Buscas baseadas em locação geográfica Mineração de texto
Crowdsourcing /
Computação humana
Anotação
Processamento em
Linguagem Natural
(NLP)Visualização de dados
Geo-referenciamento
Lista de ferramentas: DiRT (Digital Research Tools) https://dirtdirectory.org/
www.bl.uk 29
O Chartismo (Chartism) foi o maior movimento popular
no século XIX na Inglaterra, que fez campanhas para o
direitp de voto aos homens da época.
http://www.bl.uk/learning/histcitizen/21cc/struggle/chartists1/historicalsources/source6/ke
www.bl.uk 30
Chamadas para as reuniões do movimento
aparecem publicadas no jornal The Northern
Star, de 1838 a 1850
www.bl.uk 31
Extração de OCR
www.bl.uk 32
Como realizamos o projeto?
• Utilização de
OCR das
imagens
OCR
• Uso do programa
Python para a
extração de
nomes de locais
Geo-code
• Extração/identifi
cação de datas
• NLP para o
cálculo de datas
em expressões
temporais como
“amanhã"
Date
www.bl.uk 33
Descobertas
Somente entre o período de1841-44, foram
identificadas 5.519 reuniões em 462 cidades…
www.bl.uk 34
Mapeamento: interface de mapeamento (plataforma Omeka)
http://politicalmeetingsmapper.co.uk/maps/
Número de
palestras dadas
por chartistas,
local de
ocorrência e
frequência destes
eventos…
www.bl.uk 35
Movimento Chartista em Londres
12 de setembro de 2016
https://www.youtube.com/watch?v=0lx0CL_dsQs
www.bl.uk 36
Disponibilização e reutilização de
conteúdos eletrônicos
• Curador Mecânico: extração de imagens de livros digitalizados e
publicação no Flickr
• Imagens tagueadas e classificadas por grupos
• Indexação sinóptica no Wikimedia Commons dos títulos com
imagens
• Interface de busca comparativa para reconhecimento de imagens
www.bl.uk 37
Projeto acervo afro-brasileiro usando o
conteúdo da BN Digital
• Aplicação de técnicas de extração de
imagens e Curadoria Digital ao conteúdo
da FBN, principalmente da hemeroteca
gitial
• Tentar recuperar conteúdos perdidos de
páginas disponibilizadas pela BNDigital
referentes ao tema da pesquisa (ex:
Tráfico de Escravos no Brasil, Christiano
Júnior e a face escrava do Brasil, etc.)
• Disseminação de acervos utilizando
plataformas Web 2.0 (ex: Flickr, Wikimedia
Commons, etc.)
“Aguadeiro” (Álbum de vestuário
da América do Sul no século XIX)
Coleção BN Digital
www.bl.uk 38
Acervo Digital Afro-Brasileiro
• Identificar, extrair e publicar e conectar
imagens relativas à cultura e história afro-
brasileiras
• Utilizar plataformas de acesso aberto como
Flickr e Wikimedia Commons para facilitar a
descoberta e enriquecimento de metadados
descritivos (folksonomia) para as imagens
• Ampliar a visibilidade do portal BNDigital em
máquinas de busca abertas como Google
(tagueamento e indexação) para “atrair”
novos grupos de usuários não familiarizados
com o acervo de instituições de memória
cultural
• Possibilitar aos pesquisadores e estudantes
maneiras mais eficazes a descoberta de novos
padrões através da relação semântica de
dados (Linked data), conectando conteúdos
semânticos que não haviam sidos previamente
identificados
De volta do Paraguai
Vida Fluminense ( 11 junho1870)
Revista Illustrada (29 julho 1888)
Fonte (?)
www.bl.uk 39
Alguns exemplos na identificação de significantes
comuns entre imagens:
“Fiquei com o corpo livre, mas estou com os pés no cativeiro”
Revista Illustrada (28 julho1888)
“Ande di pressa, moço! São duas hora e já divia
está no istituto di belleza!”
Don Quixote (16 maio 1917)
www.bl.uk 40
Ainda sobre significantes e sapatos…
O Malho, 10 dezembro 1910 João Cândido, líder da Revolta da Chibata
Careta, 10 dezembro 1910
www.bl.uk 41
Problemas identificados no acervo digital
da Hemeroteca Digital
• O grande volume de conteúdo disponibilizado na
Hemeroteca Digital não etá sendo trabalhado de
maneira consistente e criativa de modo a facilitar
a descobreta do acervo através de técnicas de
mineração e recompilação de dados
• Embora saibamos o número de páginas
disponíveis nos periódicos digitalizados, não
estão disponibilizados os metadados OCR
(incluindo ALTO) ou indexação temática deste
material
• A máquina de busca da Hemeroteca Digital não
consegue coletar/agrupar termos de busca
através do acervo: o usuário tem de ter um pré-
conhecimento do título, local ou ano de
publicação para chegar à informação que
necessita: http://bndigital.bn.gov.br/hemeroteca-
digital/
www.bl.uk 42
Como estes problemas estão sendo
enfrentados
• Imagens digitalizadas sem criação
de metadados OCR o que
impossibilita o reconhecimento e
extração automatizados de
conteúdos das páginas
digitalizadas, principalmente na
Hemeroteca Digital
• Imagens estão sendo recuperadas
manualmente graças ao trabalho do
bolsista Alexandre Pereira (Ciências
Sociais, UFRJ)
www.bl.uk 43
Próximos passos: possibilidades infinitas
na criação de novos acervos iconográficos
com images de periódicos do século XIX…
O Rio Nu (21 maio 1898)
Propaganda
“Vestuários para mau tempo"
A Estação (15 janeiro 1879)
ModaQuestão indígena
Revista Illustrada (15 janeiro 1879)
www.bl.uk 44
Possíveis contribuições com outros
projetos
• Possibilidade de integração das
imagens em plataformas de base de
dados (ex:
http://www.slavevoyages.org/ )
oferecendo novo material para a
análise e interpretação de resultados
• Aplicar a metodologia utilizada para
extrair e disseminar imagens de
periódicos em outros acervos (IMS,
BDLB, Arquivo Nacional, etc.)
formando, assim, coleções
iconográficas mais completas sobre
cultura afro-brasileira
www.bl.uk 45
Acervo Digital Afro-Brasileiro–plataforma
Flickr
• Flickr Commons:
https://www.flickr.com/commons/i
nstitutions/
• Acervo Digital:
https://www.flickr.com/photos/15
5211508@N06/
www.bl.uk 46
Estatísticas de uso Imagem capturada em 27 de julho 18h
www.bl.uk 47
Outros projetos
• Contribuição de imagens do
Acervo Digital Afro-Brasileiro a
Wikimedia para ilustrar artigos
na Wikipédia
• Enriquecimento de metadados
para outras coleções digitais (ex:
Rede Memória Virtual Brasileira)
através de Crowdsourcing (ex:
Plataforma Zooniverse)
• https://www.zooniverse.org/
mss1255475_05
www.bl.uk 48
Obrigado!
@AquilesBrayner
Aqules.alencarbrayner@bl.uk
abrayner@yahoo.com

Mais conteúdo relacionado

Mais procurados

Curadoria de conteúdos abertos em instituições de memória cultural
Curadoria de conteúdos abertos em instituições de memória culturalCuradoria de conteúdos abertos em instituições de memória cultural
Curadoria de conteúdos abertos em instituições de memória culturalLiber UFPE
 
Apresentação Curadoria Digital UFC - Fortaleza
Apresentação Curadoria Digital UFC - FortalezaApresentação Curadoria Digital UFC - Fortaleza
Apresentação Curadoria Digital UFC - FortalezaAquiles Alencar Brayner
 
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...Liber UFPE
 
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...Tiago Murakami
 
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILSISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILMiguel Angel Mardero Arellano
 
Acesso livre e Comunicação Científica: Intersecções
Acesso livre e Comunicação Científica: IntersecçõesAcesso livre e Comunicação Científica: Intersecções
Acesso livre e Comunicação Científica: IntersecçõesMiguel Angel Mardero Arellano
 
Bibliotecas Digitais: novos desafios e oportunidades
Bibliotecas Digitais: novos desafios e oportunidadesBibliotecas Digitais: novos desafios e oportunidades
Bibliotecas Digitais: novos desafios e oportunidadesDalia Guerreiro
 
Bibliotecas digitais: do crer ao fazer
Bibliotecas digitais: do crer ao fazerBibliotecas digitais: do crer ao fazer
Bibliotecas digitais: do crer ao fazerDalia Guerreiro
 
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicas
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicasTecnologias emergentes e web social: oportunidades nas bibliotecas públicas
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicasPedro Príncipe
 

Mais procurados (14)

Curadoria de conteúdos abertos em instituições de memória cultural
Curadoria de conteúdos abertos em instituições de memória culturalCuradoria de conteúdos abertos em instituições de memória cultural
Curadoria de conteúdos abertos em instituições de memória cultural
 
Apresentação Curadoria Digital Usp
Apresentação Curadoria Digital UspApresentação Curadoria Digital Usp
Apresentação Curadoria Digital Usp
 
Apresentação Curadoria Digital UFC - Fortaleza
Apresentação Curadoria Digital UFC - FortalezaApresentação Curadoria Digital UFC - Fortaleza
Apresentação Curadoria Digital UFC - Fortaleza
 
Curadoria digital Recife
Curadoria digital RecifeCuradoria digital Recife
Curadoria digital Recife
 
Software DSpace 1 de 4
Software DSpace 1 de 4Software DSpace 1 de 4
Software DSpace 1 de 4
 
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...
Que memória preservar para o futuro (uma abordagem ecológica sobre a sustenta...
 
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...
Macro Estrutura de Sistemas de Informação com base em princípios na Web Semân...
 
Repositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação DigitalRepositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação Digital
 
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASILSISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
SISTEMAS DE INFORMAÇÃO PARA O DESENVOLVIMENTO DE PESQUISAS NO BRASIL
 
Acesso livre e Comunicação Científica: Intersecções
Acesso livre e Comunicação Científica: IntersecçõesAcesso livre e Comunicação Científica: Intersecções
Acesso livre e Comunicação Científica: Intersecções
 
Bibliotecas Digitais: novos desafios e oportunidades
Bibliotecas Digitais: novos desafios e oportunidadesBibliotecas Digitais: novos desafios e oportunidades
Bibliotecas Digitais: novos desafios e oportunidades
 
Aula UnB_8_maio-2017
Aula UnB_8_maio-2017Aula UnB_8_maio-2017
Aula UnB_8_maio-2017
 
Bibliotecas digitais: do crer ao fazer
Bibliotecas digitais: do crer ao fazerBibliotecas digitais: do crer ao fazer
Bibliotecas digitais: do crer ao fazer
 
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicas
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicasTecnologias emergentes e web social: oportunidades nas bibliotecas públicas
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicas
 

Semelhante a Curadoria Digital_Arquivo Nacional_julho 2017

Apresentação cariniana rbsp-2014
Apresentação cariniana rbsp-2014Apresentação cariniana rbsp-2014
Apresentação cariniana rbsp-2014Cariniana Rede
 
Apresentação cariniana jbb-2014
Apresentação cariniana jbb-2014Apresentação cariniana jbb-2014
Apresentação cariniana jbb-2014Cariniana Rede
 
Repositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação DigitalRepositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação DigitalCariniana Rede
 
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?Universidade Nova de Lisboa
 
Acessibilidade em bibliotecas digitais
Acessibilidade em bibliotecas digitaisAcessibilidade em bibliotecas digitais
Acessibilidade em bibliotecas digitaisaiadufmg
 
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...Pedro Príncipe
 
A preservação distibuída de coleções de obras raras digitalizadas
A preservação distibuída de coleções de obras raras digitalizadasA preservação distibuída de coleções de obras raras digitalizadas
A preservação distibuída de coleções de obras raras digitalizadasCariniana Rede
 
Apresentação ABEC
Apresentação ABECApresentação ABEC
Apresentação ABECRafael Cobbe
 
O futuro é hoje: perfis e competências dos profissionais da informação na cur...
O futuro é hoje: perfis e competências dos profissionais da informação na cur...O futuro é hoje: perfis e competências dos profissionais da informação na cur...
O futuro é hoje: perfis e competências dos profissionais da informação na cur...Cristiana Freitas
 
Bibliotecas para as Humanidades
Bibliotecas para as HumanidadesBibliotecas para as Humanidades
Bibliotecas para as HumanidadesDalia Guerreiro
 
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidades
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidadesBibliotecas Digitais para as Humanidades: novos desafios e oportunidades
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidadesDalia Guerreiro
 

Semelhante a Curadoria Digital_Arquivo Nacional_julho 2017 (20)

Integrar 2016
Integrar 2016Integrar 2016
Integrar 2016
 
Apresentação Curadoria Digital USP
Apresentação Curadoria Digital USPApresentação Curadoria Digital USP
Apresentação Curadoria Digital USP
 
Ctcm agosto 2017
Ctcm agosto 2017Ctcm agosto 2017
Ctcm agosto 2017
 
Apresentação história ufrj
Apresentação história ufrjApresentação história ufrj
Apresentação história ufrj
 
Abralic 11 agosto_2917
Abralic 11 agosto_2917Abralic 11 agosto_2917
Abralic 11 agosto_2917
 
Apresentação cariniana rbsp-2014
Apresentação cariniana rbsp-2014Apresentação cariniana rbsp-2014
Apresentação cariniana rbsp-2014
 
Apresentação cariniana jbb-2014
Apresentação cariniana jbb-2014Apresentação cariniana jbb-2014
Apresentação cariniana jbb-2014
 
Repositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação DigitalRepositórios, Acesso Livre e Preservação Digital
Repositórios, Acesso Livre e Preservação Digital
 
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?
Visualização e análise espacial nas humanidades: o que ganhamos, o que perdemos?
 
Bibliotecas digitais
Bibliotecas digitaisBibliotecas digitais
Bibliotecas digitais
 
Acessibilidade em bibliotecas digitais
Acessibilidade em bibliotecas digitaisAcessibilidade em bibliotecas digitais
Acessibilidade em bibliotecas digitais
 
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...
Tecnologias emergentes e ferramentas de web social nas bibliotecas: oportunid...
 
A preservação distibuída de coleções de obras raras digitalizadas
A preservação distibuída de coleções de obras raras digitalizadasA preservação distibuída de coleções de obras raras digitalizadas
A preservação distibuída de coleções de obras raras digitalizadas
 
Apresentação ABEC
Apresentação ABECApresentação ABEC
Apresentação ABEC
 
Preservação Digital
Preservação DigitalPreservação Digital
Preservação Digital
 
O futuro é hoje: perfis e competências dos profissionais da informação na cur...
O futuro é hoje: perfis e competências dos profissionais da informação na cur...O futuro é hoje: perfis e competências dos profissionais da informação na cur...
O futuro é hoje: perfis e competências dos profissionais da informação na cur...
 
Bibliotecas para as Humanidades
Bibliotecas para as HumanidadesBibliotecas para as Humanidades
Bibliotecas para as Humanidades
 
Bibliotecas
BibliotecasBibliotecas
Bibliotecas
 
Literacia digital
Literacia digitalLiteracia digital
Literacia digital
 
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidades
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidadesBibliotecas Digitais para as Humanidades: novos desafios e oportunidades
Bibliotecas Digitais para as Humanidades: novos desafios e oportunidades
 

Mais de Aquiles Alencar Brayner (18)

Aula uniceub
Aula uniceubAula uniceub
Aula uniceub
 
Museu do futebol aquiles
Museu do futebol aquilesMuseu do futebol aquiles
Museu do futebol aquiles
 
Fcrb 9 agosto_2017
Fcrb 9 agosto_2017Fcrb 9 agosto_2017
Fcrb 9 agosto_2017
 
Dh2016 dstp
Dh2016 dstpDh2016 dstp
Dh2016 dstp
 
Aclaiir 2016
Aclaiir 2016Aclaiir 2016
Aclaiir 2016
 
Cpd25_Aquiles Alencar Brayner
Cpd25_Aquiles Alencar BraynerCpd25_Aquiles Alencar Brayner
Cpd25_Aquiles Alencar Brayner
 
Bl labs roadshow aab_sheffield.2016
Bl labs roadshow aab_sheffield.2016Bl labs roadshow aab_sheffield.2016
Bl labs roadshow aab_sheffield.2016
 
2016 03_digitorium_conference_aab
2016  03_digitorium_conference_aab2016  03_digitorium_conference_aab
2016 03_digitorium_conference_aab
 
Bl labs roadshow aab_open_university.2016
Bl labs roadshow aab_open_university.2016Bl labs roadshow aab_open_university.2016
Bl labs roadshow aab_open_university.2016
 
Aquiles imlr seminar
Aquiles imlr seminarAquiles imlr seminar
Aquiles imlr seminar
 
Pilas 2015
Pilas 2015Pilas 2015
Pilas 2015
 
Lecture city university_digital_librarian
Lecture city university_digital_librarianLecture city university_digital_librarian
Lecture city university_digital_librarian
 
Charla Biblioteca Nacional 08 Octubre 2015
Charla Biblioteca Nacional 08 Octubre 2015Charla Biblioteca Nacional 08 Octubre 2015
Charla Biblioteca Nacional 08 Octubre 2015
 
Visualising Brazil
Visualising BrazilVisualising Brazil
Visualising Brazil
 
Slides digital scholarship survey 2014
Slides digital scholarship survey 2014Slides digital scholarship survey 2014
Slides digital scholarship survey 2014
 
Europeana 1914 18_collections+open+house
Europeana 1914 18_collections+open+houseEuropeana 1914 18_collections+open+house
Europeana 1914 18_collections+open+house
 
Salalm 2015 Princeton
Salalm 2015 PrincetonSalalm 2015 Princeton
Salalm 2015 Princeton
 
Cpd25 29 may_2015
Cpd25 29 may_2015Cpd25 29 may_2015
Cpd25 29 may_2015
 

Último

Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManuais Formação
 
SEMINÁRIO QUIMICA AMBIENTAL - PPGEEA - FINAL.pptx
SEMINÁRIO QUIMICA AMBIENTAL -  PPGEEA - FINAL.pptxSEMINÁRIO QUIMICA AMBIENTAL -  PPGEEA - FINAL.pptx
SEMINÁRIO QUIMICA AMBIENTAL - PPGEEA - FINAL.pptxCompartilhadoFACSUFA
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesMary Alvarenga
 
RedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfRedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfAlissonMiranda22
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometriajucelio7
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfjanainadfsilva
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxLaurindo6
 
CLASSE DE PALAVRAS completo para b .pptx
CLASSE DE PALAVRAS completo para b .pptxCLASSE DE PALAVRAS completo para b .pptx
CLASSE DE PALAVRAS completo para b .pptxFranciely Carvalho
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelGilber Rubim Rangel
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e CaracterísticassAugusto Costa
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalJacqueline Cerqueira
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptxthaisamaral9365923
 

Último (20)

Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envio
 
SEMINÁRIO QUIMICA AMBIENTAL - PPGEEA - FINAL.pptx
SEMINÁRIO QUIMICA AMBIENTAL -  PPGEEA - FINAL.pptxSEMINÁRIO QUIMICA AMBIENTAL -  PPGEEA - FINAL.pptx
SEMINÁRIO QUIMICA AMBIENTAL - PPGEEA - FINAL.pptx
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das Mães
 
RedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfRedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdf
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometria
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
 
CLASSE DE PALAVRAS completo para b .pptx
CLASSE DE PALAVRAS completo para b .pptxCLASSE DE PALAVRAS completo para b .pptx
CLASSE DE PALAVRAS completo para b .pptx
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim Rangel
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e Característicass
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem Organizacional
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
 

Curadoria Digital_Arquivo Nacional_julho 2017

  • 1. Acervos Digitais: Novos modelos de disseminação, acesso e uso Aquiles Alencar Brayner abrayner@yahoo.com @AquilesBrayner Aquiles.alencarbrayner@bl.uk
  • 2. www.bl.uk 2 Missão das instituições de memória cultural no século XXI • Selecionar, capturar, descrever e preservar objetos digitais, oferecendo novos sistemas de busca e plataformas de acesso e reutilização destes objetos • Promover seus acervos entre diferentes tipos de usuários • Proporcionar a integração de distintos formatos eletrônicos e criação de ferramentas que facilitem o acesso e análise de conteúdos digitais • Participação ativa nos projetos de pesquisa digital, gerenciando as atividades e disseminação de resultados obtidos • Instituições como “laboratórios” de novas idéias e modelos em pesquisa digital • Atuar como centros de capacitação para pesquisadores e profissionais envolvidos na gestão e utilização de dados eletrônicos
  • 3. www.bl.uk 3 Curadoria Digital: as regras dos 10 “in" 1.Integridade: acesso ao objeto digital na maneira em que ele foi criado 2.Integração: diferentes conteúdos e formatos acessíveis a partir de uma mesma plataforma 3.Interoperabilidade: compatibilidade entre diferentes formatos, plataformas e sistemas operacionais 4.Instantaneidade: acesso irrestrito e imediato aos objetos eletrônicos 5.Interação: catálogos interativos incorporando elementos de Web 2.0 (blogs, wikis, tags) e mídia social 6.Informação: planificação de metadados para maior eficiência e confiabilidade nos resultados de busca 7.Incorporação de conteúdos: constante inclusão de objetos digitais 8. Interpretação: objeto digital contextualizado em relação a outros itens equivalentes em vários acervos 9. Inovação: apresentação do material em plataformas inovativas 10. Acesso Indefinido: objetos digitais preservados para futura gerações
  • 4. www.bl.uk 4 Curadoria Digital Estabelecer vários canais de acesso à coleção Incentivar a criação e manipulação de base de dados por usuários Apoio à pesquisa e educação Objetivos:  Infra-estrutura de acesso, depósito e preservação de conteudos digitais  Criação extensiva de coleções digitais  Promoção e utilização de novas ferramentas aplicadas ao acervo digital: anotação, visualisação, comparação, análise, etc.  Informação sobre novos métodos e modelos em pesquisa digital  Promover uma maior colaboração entre técnicos, pesquisadores e bibliotecários Alcançados através de:  Projetos colaborativos  Pataformas interoperacionais  Conexão entre base de dados e ferramentas de pesquisa Criação de Novos modelos e métodos de pesquisa Conteúdo Digital  Treinamento e suporte profissional
  • 5. www.bl.uk 5 Curadoria Digital (DCC) • A Curadoria Digital envolve a criação, manutenção, preservação e agregação de valor aos objetos digitais em toda sua vida útil.
  • 6. www.bl.uk 6 Modelo Ciclo de Vida Objetos digitais Ações completas ou essenciais: 1. Descrição e representação da informação 2. Plano de preservação 3. Observação e participação da comunidade de usuários Ações sequenciais: 1. Conceitualização 2. Criação ou coleta 3. Avaliação e seleção 4. Ingestão 5. Ação de preservação 6. Arquivo 7. Acesso, uso e reutilizaçào 8. Transformação Ações ocasionais: 1. Descarte 2. Reavaliação https://curadoriadigitalblog.wordpress.com/2015/11/13/ciclo-de-vida-da-curadoria-digital/
  • 8. www.bl.uk 8 Desafio: como selecionar, armazenar, classificar e analisar as informações no universo digital? • Qual a quantidade de dados gerados em 1 dia? 1. Twitter: 7 TB 2. Facebook: 10 TB • Até 2020 teremos aproximadamente 35 ZB (1.1 trilhão GB) de dados digitais disponiveis
  • 9. www.bl.uk 9 Arquivos de páginas Web • Contexto: Arquivo e preservação das publicações no domínio national (ex: .br) • Aplicação e desenvolvimento de novas ferramentas para recuperação e análise do conteúdo arquivado • http://www.webarchive.org.uk/ukwa/ • The Internet Archive
  • 10. www.bl.uk 10 Domínio .br • Segundo os dados coletados do site de registros de páginas Web no Brasil, https://registro.br/estatistic as.html , o país conta com cerca 4M de sites criados desde 1996 • International Internet Preservation Consortium (IIPC)
  • 11. www.bl.uk 11 Panorama da história de páginas Web no Brasil…
  • 12. www.bl.uk 12 Arquivo de conteúdos eletrônicos produzidos por órgãos governamentais • Páginas Web e Mídias Sociais: National Archives (GB): arquivo de informação em formato digital produzida pelo governo britânico • Dados: Data.Gov.uk: disponibilização/ arquivo de dados abertos (GB) • Brazil: Dados.gov
  • 13. www.bl.uk 13 Arquivo e gerenciamento de manuscritos eletrônicos • Arquivo de conteúdos armazenados em dispositivos eletronicos pessoais • Recuperação de conteúdo descartado e/ou modificado pelo autor • Garantir a preservação e acesso a materiais dependentes de tecnologia obsoleta • Maiores informações http://wiki.bitcurator.net/index. php?title=Main_Page
  • 14. www.bl.uk 14 Digitalização: passos essenciais para reprodução e disseminação de acervos
  • 16. www.bl.uk 16 Planificação Estratégica • Critérios: – Dimensionalidade (ex: 3D) – Formato(s) – Metadados (incluindo OCRização) – Manipulação pós-captura, etc. • Considerações: – Público alvo – Objetivos – Orçamento – Representatividade (ex: como nos certificar que o conteúdo digitalizado possa representar proporcionalmente objetos em outros formatos nos nossos acervos? • Planejamento – Adoção de modelos refereciais (OAIS, etc.) – Software de captura, gestão, plataformas de visualização, etc.
  • 17. www.bl.uk 17 Critérios na digitalização: exemplos • Imagem Multispectral: Consiste em imagens de um mesmo objeto, tomadas com diferentes comprimentos de ondas eletromagnéticas. Pode ser luz visível, infravermelha, ultravioleta, raio-X ou qualquer outra faixa do espectro. Diários de David Livingstone: http://bit.ly/2vM1env • Digitalização Tridimensional: http://bit.ly/2tFUcQ5 https://skfb.ly/KGNq • Imagem de ressonância magnética Pergaminhos herculanos
  • 18. www.bl.uk 18 Considerações: exemplo • Como utilizar tecnologias existentes para maximizar o acesso e reuso dos nossos acervos eletrônicos entre diferentes públicos? • British Library: – Pinterest: https://www.pinterest.co.uk/britishlibrary/ – Soundcloud: https://soundcloud.com/the-british-library/the-voice-of- oscar-wilde-the-ballad-of-reading-gaol – Wikimedia Commons: https://commons.wikimedia.org/wiki/Category:British_Library – Flickr: https://www.flickr.com/photos/britishlibrary/
  • 19. www.bl.uk 19 Planejamento THOMAZ, Katia P.; SOARES, Antonio José. A preservação digital e o modelo de referência Open Archival Information System (OAIS).Datagramazero, v. 5, n. 1, fev. 2004. Disponível em:<http://www.dgz.org.br/fe-v04/F_I_art.htm>. Acesso em: 10 jan. 2016. Ex:Modelo de referência OAIS (Open Archives Information System) Funções: 1. Inserção / Ingestão 2. Armazenamento 3. Gerenciamento de dados 4. Administração 5. Acesso 6. Planejamento da Preservação Pacotes de submissão: 1. Pacote de Submissão de Informação (PSI): Objeto digital + metadados descritivos e técnicos (incl. OCR) 2. Pacote de Arquivamento da informação (PAI): dados de conteúdo do objeto (informação de referência + proveniência + contexto + fixação: check sum, integridade e autenticidade) + dados de preservação + representação da informação) 3. Pacote de disseminação da informação (PDI): dados de conteudo do objeto + metadados de sistemas de suporte para acesso e reutilização do objeto
  • 20. www.bl.uk 20 Referências • Impact: https://www.digitisation.eu/new-impact-website/ • Open Archival Information Stystem (OAIS): http://www.oclc.org/research/publications/library/2000/lavoi e-oais.html • Digital Curation Centre (DCC): http://www.dcc.ac.uk/ • Tesseract (programa de OCRização de imagens com texto): http://tesseract.projectnaptha.com/ e http://bit.ly/2hbDExx
  • 21. www.bl.uk 21 Plataformas de acesso e interação
  • 22. www.bl.uk 22 Plataformas que facilitem o trabalho com arquivos digitalizados 1. Codex Sinaiticus – Plataforma colaborativa 2. Casebooks project – identificação de informação em documentos 3. TITL (Text to Image Linking Tool) – transcrição e identificação automatizadas 4. The Archaeology of Reading – identificação de marginália em textos impressos 5. The Chymistry of Isaac Newton
  • 23. www.bl.uk 23 Transcrição • Transcriptorium Reconhecimento automático de textos manuscritos – HTR • Digipal Base de dados para paleógrafos • Transcribing Bentham Projeto de participação pública (crowdsourcing) para transcrição de manuscritos • The Book of Margery Kempe Projeto de transcrição incluindo anotações feitas no manuscrito original
  • 24. www.bl.uk 24 Transcrição, reconstrução e visualização de dados • Escravidão, Abolição e Pós-Abolição Transcrição e controle de qualidade de dados • Projeto Old Weather reconstrução de dados sobre o tempo a partir de relatórios de viagens, aventureiros, etc. https://www.oldweather.org/ • Stanford Spatial History: vários exemplos de análise e visualização de dados históricos e literários • Old Bailey: base de dados sentenças judiciais na Inglaterra entre 1676 e 1772 https://www.oldbaileyonline.org/
  • 25. www.bl.uk 25 Projetos de enfoques comunitários (crowdsourcing) para a construção de acervos • Projeto Quipu: coleta de depoimentos sobre esterilização massiva, muitas vezes não consensual, de peruanos no período do governo Fujimori (anos 90) https://interactive.quipu- project.com/#/en/quipu/intro • Cantos Cautivos: experiências de presos políticos na época de Pinochet refletidas através da música • Europeana 1914-18: participação pública na digitalização de acervos pessoais, enriquecendo as coleções institucionais sobre a Primeira Guerra Mundial • Plataforma abertas de crowdsourcing: Zooniverse
  • 26. www.bl.uk 26 Geo-referencialidades • BL Maps • Old Maps • Mapas em livros digitalizados e disponíveis na plataforma Flickr
  • 28. www.bl.uk 28 Novos métodos de pesquisa digital Uso de APIs (Application Programming Interfaces) para integrar base de dados, ex: metadados, imagens, etc. Buscas baseadas em locação geográfica Mineração de texto Crowdsourcing / Computação humana Anotação Processamento em Linguagem Natural (NLP)Visualização de dados Geo-referenciamento Lista de ferramentas: DiRT (Digital Research Tools) https://dirtdirectory.org/
  • 29. www.bl.uk 29 O Chartismo (Chartism) foi o maior movimento popular no século XIX na Inglaterra, que fez campanhas para o direitp de voto aos homens da época. http://www.bl.uk/learning/histcitizen/21cc/struggle/chartists1/historicalsources/source6/ke
  • 30. www.bl.uk 30 Chamadas para as reuniões do movimento aparecem publicadas no jornal The Northern Star, de 1838 a 1850
  • 32. www.bl.uk 32 Como realizamos o projeto? • Utilização de OCR das imagens OCR • Uso do programa Python para a extração de nomes de locais Geo-code • Extração/identifi cação de datas • NLP para o cálculo de datas em expressões temporais como “amanhã" Date
  • 33. www.bl.uk 33 Descobertas Somente entre o período de1841-44, foram identificadas 5.519 reuniões em 462 cidades…
  • 34. www.bl.uk 34 Mapeamento: interface de mapeamento (plataforma Omeka) http://politicalmeetingsmapper.co.uk/maps/ Número de palestras dadas por chartistas, local de ocorrência e frequência destes eventos…
  • 35. www.bl.uk 35 Movimento Chartista em Londres 12 de setembro de 2016 https://www.youtube.com/watch?v=0lx0CL_dsQs
  • 36. www.bl.uk 36 Disponibilização e reutilização de conteúdos eletrônicos • Curador Mecânico: extração de imagens de livros digitalizados e publicação no Flickr • Imagens tagueadas e classificadas por grupos • Indexação sinóptica no Wikimedia Commons dos títulos com imagens • Interface de busca comparativa para reconhecimento de imagens
  • 37. www.bl.uk 37 Projeto acervo afro-brasileiro usando o conteúdo da BN Digital • Aplicação de técnicas de extração de imagens e Curadoria Digital ao conteúdo da FBN, principalmente da hemeroteca gitial • Tentar recuperar conteúdos perdidos de páginas disponibilizadas pela BNDigital referentes ao tema da pesquisa (ex: Tráfico de Escravos no Brasil, Christiano Júnior e a face escrava do Brasil, etc.) • Disseminação de acervos utilizando plataformas Web 2.0 (ex: Flickr, Wikimedia Commons, etc.) “Aguadeiro” (Álbum de vestuário da América do Sul no século XIX) Coleção BN Digital
  • 38. www.bl.uk 38 Acervo Digital Afro-Brasileiro • Identificar, extrair e publicar e conectar imagens relativas à cultura e história afro- brasileiras • Utilizar plataformas de acesso aberto como Flickr e Wikimedia Commons para facilitar a descoberta e enriquecimento de metadados descritivos (folksonomia) para as imagens • Ampliar a visibilidade do portal BNDigital em máquinas de busca abertas como Google (tagueamento e indexação) para “atrair” novos grupos de usuários não familiarizados com o acervo de instituições de memória cultural • Possibilitar aos pesquisadores e estudantes maneiras mais eficazes a descoberta de novos padrões através da relação semântica de dados (Linked data), conectando conteúdos semânticos que não haviam sidos previamente identificados De volta do Paraguai Vida Fluminense ( 11 junho1870) Revista Illustrada (29 julho 1888) Fonte (?)
  • 39. www.bl.uk 39 Alguns exemplos na identificação de significantes comuns entre imagens: “Fiquei com o corpo livre, mas estou com os pés no cativeiro” Revista Illustrada (28 julho1888) “Ande di pressa, moço! São duas hora e já divia está no istituto di belleza!” Don Quixote (16 maio 1917)
  • 40. www.bl.uk 40 Ainda sobre significantes e sapatos… O Malho, 10 dezembro 1910 João Cândido, líder da Revolta da Chibata Careta, 10 dezembro 1910
  • 41. www.bl.uk 41 Problemas identificados no acervo digital da Hemeroteca Digital • O grande volume de conteúdo disponibilizado na Hemeroteca Digital não etá sendo trabalhado de maneira consistente e criativa de modo a facilitar a descobreta do acervo através de técnicas de mineração e recompilação de dados • Embora saibamos o número de páginas disponíveis nos periódicos digitalizados, não estão disponibilizados os metadados OCR (incluindo ALTO) ou indexação temática deste material • A máquina de busca da Hemeroteca Digital não consegue coletar/agrupar termos de busca através do acervo: o usuário tem de ter um pré- conhecimento do título, local ou ano de publicação para chegar à informação que necessita: http://bndigital.bn.gov.br/hemeroteca- digital/
  • 42. www.bl.uk 42 Como estes problemas estão sendo enfrentados • Imagens digitalizadas sem criação de metadados OCR o que impossibilita o reconhecimento e extração automatizados de conteúdos das páginas digitalizadas, principalmente na Hemeroteca Digital • Imagens estão sendo recuperadas manualmente graças ao trabalho do bolsista Alexandre Pereira (Ciências Sociais, UFRJ)
  • 43. www.bl.uk 43 Próximos passos: possibilidades infinitas na criação de novos acervos iconográficos com images de periódicos do século XIX… O Rio Nu (21 maio 1898) Propaganda “Vestuários para mau tempo" A Estação (15 janeiro 1879) ModaQuestão indígena Revista Illustrada (15 janeiro 1879)
  • 44. www.bl.uk 44 Possíveis contribuições com outros projetos • Possibilidade de integração das imagens em plataformas de base de dados (ex: http://www.slavevoyages.org/ ) oferecendo novo material para a análise e interpretação de resultados • Aplicar a metodologia utilizada para extrair e disseminar imagens de periódicos em outros acervos (IMS, BDLB, Arquivo Nacional, etc.) formando, assim, coleções iconográficas mais completas sobre cultura afro-brasileira
  • 45. www.bl.uk 45 Acervo Digital Afro-Brasileiro–plataforma Flickr • Flickr Commons: https://www.flickr.com/commons/i nstitutions/ • Acervo Digital: https://www.flickr.com/photos/15 5211508@N06/
  • 46. www.bl.uk 46 Estatísticas de uso Imagem capturada em 27 de julho 18h
  • 47. www.bl.uk 47 Outros projetos • Contribuição de imagens do Acervo Digital Afro-Brasileiro a Wikimedia para ilustrar artigos na Wikipédia • Enriquecimento de metadados para outras coleções digitais (ex: Rede Memória Virtual Brasileira) através de Crowdsourcing (ex: Plataforma Zooniverse) • https://www.zooniverse.org/ mss1255475_05

Notas do Editor

  1. One way is through the British Library Labs project and the Digital Curator team which make up the Digital Research Team. The aim of the lab is to encourage scholars to experiment at scale with our digital collections and data. The team holds competitions, events, and creates the space in which to engage with scholars working in this realm. Through the labs we’re learning how to better support scholars and build new services.
  2. With an algorithm by Ben O’Steen we snipped out images from digitised books and put them on to Flickr on December 13 2013, there were over a million, but the problem we had was that we knew which books they came from (author/dates), but we didn’t’ have any information about the images. By releasing them onto flickr, we have got people to start tagging them and using them in very creative ways. Hosting them internally was not an option and there was not sufficient metadata to put them on Wikipedia. Flickr seemed the obvious option as it is a platform that can support high usage, did not require metadata, allowed tagging and it is free for public domain images.