Este documento discute normas e boas práticas para bibliotecas digitais. Apresenta definições de biblioteca digital e imagem digital, e discute fatores como resolução, formatos e compressão de imagens. Também aborda boas práticas para digitalização como área de captura, transparência do papel, uso de cunhas de cor e normas aplicáveis.
4. 04/06/2016
4
Imagem digital
Edição de imagem:
Imagens de arquivo;
O tratamento de imagem deve limitar‐se a rotações de 90º ou 180º.
Imagens de consulta:
Criadas digitalmente a partir das imagens de arquivo;
Aplicação de tratamento em função da finalidade.
Redução da resolução
Rotações, corte e redimensionamento
Ajuste de brilho e contraste
Ajuste do equilíbrio de brancos
Ajuste de saturação, luminosidade e matiz ("hue“)
Utilização do histograma e ajuste de curvas
Clonagem e limpeza de elementos indesejáveis
7
Boas práticas na digitalização
Fatores de qualidade na digitalização
A digitalização deve ser realizada de forma a garantir:
Autenticidade – o conteúdo digitalizado deve ser conforme o original, sem o
alterar, no todo ou em parte;
Fidedignidade – o conteúdo digitalizado é digno de crédito, porque reproduz
fielmente o original;
Integridade – o conteúdo digitalizado reproduz integralmente o original;
Inteligibilidade – o conteúdo digitalizado permite a leitura do documento
garantindo a nitidez dos pormenores;
Usabilidade – o conteúdo digitalizado deve ser de fácil acesso e utilização.
8
7. 04/06/2016
7
Boas práticas na digitalização
Cunha de cor (calibração de cor)
Padrões de referência de cor.
Objetivos:
Fazer o tratamento adequado das imagens;
Verificar a qualidade da digitalização.
13
Xrite
Kodak
Boas práticas na digitalização
Cunha de cor
14
Área de cor Branco Cinza fundo Preto
Ponto escolhido RGB 237‐237‐237 102‐102‐102 23‐23‐23
% Preto 7% 60% 91%
Amplitude possível RGB 233 a 241 98 a 106 19 a 27
% preto 5% a 9% 58% to 62% 89% a 93%
8. 04/06/2016
8
Boas práticas na digitalização
Cunha de cor
15
Kodak Q‐13/Q‐14 A M 19 B
Densidade visual 0.05 a 0.10 0.75 a 0.85 1.95 a 2.05 1.65 a 1.75
RGB 242‐242‐242 104‐104‐104 12‐12‐12 24‐24‐24
% Preto 5% 59% 95% 91%
RGB (amplitude
possível)
239 a247 100 a 108 8 a 16 20 a 28
% Black (amplitude
possível)
3% a 6% 58% a 61% 94% a 97% 89% a 92%
Boas práticas na digitalização
Colocação da cunha de cor
Colocar a cunha de cor junto ao documento a digitalizar;
Usar uma cunha de cor adequada ao tamanho do documento.
Se a obra tiver uma coloração
homogénea, pode colocar‐se
apenas no início.
16
Homem, Lopo. Cartógrafo
[Atlas nautique du Monde, dit atlas Miller] ; 1.
[Atlas Miller : hémisphère portugais et page de
titre], 1519.
BNF, Ge D 26179 Rés.
http://gallica.bnf.fr/ark:/12148/btv1b59011395/f
1.item.langPT
10. 04/06/2016
10
Normas para as imagens digitais
ISO ‐ http://www.iso.org/
Comités técnicos 304
Grupos de trabalho
19
Normas para as imagens digitais
ISO/TC42 Standards for Digital Capture Imaging Performance
Terminology
Resolution
“Noise”
“Dynamic range”
Speed
Viewing Conditions
Color
Storage Standards and Guidelines: Media, Formats, Repositories
20
11. 04/06/2016
11
Normas para as imagens digitais
Normas aplicáveis
ISO 10196:2003 Imagem eletrónica: recomendações para a criação de
documentos originais
ISO 10918‐4:1999 Tecnologia digital: compressão e codificação digital de
imagens
ISO 12033:2001 Imagem eletrónica: guias para a seleção de métodos de
compressão de imagem
ISO 12233:2000 Fotografia ‐ câmaras de imagem eletrónica: medição da
resolução
21
Normas para as imagens digitais
Normas aplicáveis
ISO 12234‐2:2001 Fotografia ‐ imagem eletrónica: TIFF/EP formato de
imagem
ISO 12639:2004 Tecnologia gráfica ‐ troca de informação para pré‐impressão ‐
TIFF/IT formato de imagem
ISO 15076‐1:2005 Tecnologia de gestão de imagens a cores: formatos de
perfis e estrutura de imagens
ISO 15801:2004 Imagem eletrónica ‐ informação armazenada
eletronicamente: recomendações para fiabilidade e fidelidade
22
12. 04/06/2016
12
Normas para as imagens digitais
Normas aplicáveis
ISO 15930‐6:2003 Tecnologia gráfica ‐ troca de dados digitais em pré‐
impressão: formato PDF para fluxos de trabalho baseados na cor
ISO 19005‐1:2005 Preservação de gestão documental: formatos de
documentos eletrónicos para preservação de longa duração, uso de PDF
(versão 1.4)
23
Normas para as imagens digitais
Normas aplicáveis
ISO/TS 22028‐2:2006 Fotografia e tecnologia gráfica: ROMM RGB
ISO/TS 22028‐3:2006 Fotografia e tecnologia gráfica: RIMM RGB
Adobe Coorporation 6.0 Especificações técnicas para a utilização de ficheiros
TIFF
24
13. 04/06/2016
13
Printed Text Pictorial Materials Oversized Materials Manuscripts
Library of Congress 300 ppi, 1-bit, TIFF ITU-
T.6
3,000 to 5,000 pixels
8-bit gray or 24-bit color,
TIFF, uncompressed
[Maps]
Color: 300 ppi, 24-bit,
TIFF, uncompressed
300 ppi, 8-bit gray or 24-
bit color, uncompressed
TIFF or JPEG 5:1
compressed
NARA 300 ppi, 8-bit gray, TIFF,
uncompressed
3000 pixels—long side,
2700 for square, 8-bit
gray/24-bit color, TIFF,
uncompressed
200 ppi, 8-bit gray or 24-
bit color, TIFF,
uncompressed
See printed text
Columbia 600 ppi, 1-bit, TIFF ITU-
T.6
200 to 300 ppi, 8-bit gray
or 24-bit color, TIFF
[Large format
transparency]
4096x6144, 24-bit,
PhotoCD or TIFF
See pictorial materials
JIDI
300 ppi, 8-bit (24-bit for
color, tinted or discolored
originals), TIFF v.6,
uncompressed
[Photographic prints]
Same as printed text.
[Art works]
600 ppi, 8-bit gray /24-bit
color, TIFF, uncompr.
Scan from photo
intermediates at 2400 ppi
minimum
Memory of the World 200 ppi, 1-bit, TIFF v.6,
ITU-T.6
100 ppi, 8-bit gray or 24-
bit color, TIFF-JPEG
lossless or lossy for non-
critical images
100 ppi, 8-bit or 24-bit,
TIFF-JPEG lossless. For
maps larger than A3, use
photointermediates.
100 ppi, 4-bit gray, 24-bit
color, TIFF-JPEG lossless,
or lossy for non-critical
images
Colorado Digitization
Project
600 ppi, 1-bit, TIFF,
uncompressed
300 ppi, 8-bit gray, 24-bit
color, TIFF, uncompressed
[Photographs]
3000 to 5000 pixels, 8-bit
gray/24-bit color or
greater, TIFF, uncompr.
[Graphic Materials]
3000 pixels or 300 ppi, 8-
bit gray/24-bit color or
greater, TIFF,
uncompressed
[Maps]
300 ppi, 8-bit gray/24-bit
color, TIFF, uncompressed
California Digital Library 600 ppi, 8-bit gray, TIFF-
LZW
600 ppi, 24-bit color,
TIFF-LZW
600 ppi if possible, but no
less than 300 ppi, 24-bit
color, TIFF-LZW
See pictorial materials
2002, in: http://www.library.cornell.edu/preservation/tutorial/conversion/table3-1.html
25
Digitalização
Formato Resolução Problemas
Encadernados
Manuscritos TIFF
JPG2000
PNG
600ppp Altura da lombada
Encadernação muito apertada
Margens pequenas
Transparência das folhas
Vincos em particular nos mapas e
desdobráveis
Desdobráveis
Impressos 600ppp
ou
300ppp
Desenhos
Mapas
Desdobráveis
Folha avulsa
Manuscritos TIFF
JPG2000
PNG
600ppp Transparência das folhas
Vincos em particular nos mapas e
desdobráveis
Impressos 600ppp
ou
300ppp
Desenhos
Mapas
Desdobráveis
26
14. 04/06/2016
14
Digitalização
Elementos determinantes na escolha do processo de digitalização
Dimensão
Tipologia dos documentos
Estado de conservação
Material encadernado
Digitalização de capa a capa, 1 página por imagem
27
Digitalização
Material iconográfico ou cartográfico
Não se digitalizam as páginas em branco
Espólios
Digitaliza‐se na íntegra, mesmo as páginas em branco
Desdobráveis em monografias
Não se digitalizam os versos dos desdobráveis
28
15. 04/06/2016
15
Digitalização
Fatores adversos à digitalização:
Mau estado de conservação, nomeadamente, o papel frágil ou com
lacunas;
Altura da lombada;
Encadernação muito apertada;
Margens pequenas;
Transparência das folhas;
Vincos;
Obra sem numeração ou com vários tipos de numeração ou numeração
errada.
29
Digitalização
Fatores adversos à aplicação de OCR (Optical character recognition):
Pouca resolução, inferior a 300ppp;
Não há informação suficiente para o reconhecimento de caracteres.
Muita resolução, 600ppp ou superior;
Informação a mais, causa ruído.
Mais do que uma língua no mesmo documento;
Texto em colunas;
Diversos tipos de letras no mesmo documento;
Documentos muito ilustrados;
Pouco contraste;
Documentos sublinhados, rasurados ou anotados.
30
17. 04/06/2016
17
Digitalização
Digitalizador de mesa/digitalização linear
Utiliza‐se para
Material transparente
Material não encadernado
Folhas, Postais, Selos, Mapas, Desenhos, Etc.
Produz imagens de qualidade
O tempo de digitalização é longo para 300ppp ou superior
Capta a textura do papel
33
Digitalização
Digitalizador planetário/CCD‐ charge‐
coupled device
Digitalizadores Planetários
A obra é colocada na horizontal
A mesa tem apoio para a lombada
A obra é aberta num ângulo de
180º
Adequado para a digitalização de
obras encadernadas
34
18. 04/06/2016
18
Digitalização
Digitalizadores planetários com berço em V
A obra é colocada na horizontal
A mesa tem apoio para a lombada
A obra é aberta num ângulo de 120º ou
menos
Adequado para a digitalização de obras
com encadernações apertadas
35
Digitalização
Máquina fotográfica digital(CCD)
Utiliza‐se para
Material encadernado
Material não encadernado
A qualidade das imagens depende
Da marca e modelo do equipamento
Do tamanho do original
Do tipo de iluminação
A digitalização é rápida
Pode chegar a 2.000 imagens dia
36
19. 04/06/2016
19
Equipamentos de digitalização
Máquinas fotográficas digitais
Digitalização por área (CCD)
Utiliza‐se para
Obras de pequenas ou grandes dimensões
Livro antigo
Manuscritos, códices e incunábulos
Iconografia e cartografia
A qualidade das imagens depende
Da marca e modelo do equipamento
Do tamanho do original
Do tipo de iluminação
37
Equipamentos automáticos
Equipamentos com passagem automática das folhas
38
20. 04/06/2016
20
Equipamentos automáticos
Equipamentos de alimentação automática, rotativos ‐ automatic
document feeder (ADF)
Digitalização linear
Utiliza‐se para
Material não encadernado e atual
A qualidade das imagens depende
Da marca e modelo do equipamento
39
Qualidade dos equipamentos
Normas ISO para a calibração do equipamento
Photography ‐ Electronic still‐picture cameras – Resolution measurements ISO
12233:2000
Photography ‐Electronic scanners for photographic images ‐ Spatial resolution
measurements ‐ Part 1: Scanners for reflective media ISO 16067‐1:2003
Photography ‐ Electronic still picture imaging ‐ Noise measurements ISO
15739:2003
Photography ‐ Electronic scanners for photographic images ‐ Dynamic range
measurements ISO 21550 Sept. 2004
Graphic technology and photography ‐ Colour characterisation of digital still
cameras (DSCs) – Part 1: Stimuli, metrology and test procedures ISO/CD
17321‐1 October 2003
40
24. 04/06/2016
24
47
Qualidade dos equipamentos
Universal test target (UTT) – A3
The Universal Test Target (UTT) is a single test target which is designed to
provide insight into the complete image quality of all types of high end cameras
and scanners following the current ISO‐standards
http://www.universaltesttarget.com/
48
25. 04/06/2016
25
Qualidade dos equipamentos
49
Qualidade dos equipamentos
Universal test target (UTT)
O alvo de calibração fornece várias cores e em escala de cinza padrões e
gradientes que permitem uma análise completa de todos os parâmetros
relevantes para a avaliação da imagem.
A homogeneidade de branco e cinza é suportada, tal como o exame de uma
geometria de imagem ou a distorção da imagem.
Escalas contínuas em milímetros e polegadas permite verificar a resolução
nominal na direção X e Y.
Campos de cor facilitar a geração de perfis ICC, dar informações sobre a
fidelidade de cor, e permite verificar o espaço de cor
50
26. 04/06/2016
26
Qualidade dos equipamentos
Universal test target (UTT)
A escala de cinzentos, o desempenho do ruído e da relação sinal‐ruído pode ser
determinada para além de uma medida da função de conversão opto‐
electrónico (OECF).
O alvo permite também a verificação da resolução de até 18 lp / mm, bem
como a determinação da função de transferência de modulação (MTF), em
conformidade com a norma ISO 160‐67‐1, até um máximo de 1200 ppp
A UTT tem um tamanho básico da DIN‐A3 (420 x 300 mm); por meio de
duplicação, o formato A2 tamanhos, A1, A0 e podem ser analisados.
51
Metadados
Metadados utilizados nos os objetos bibliográficos
UNIMARC (Universal Machine Readable Cataloging )
MARC21 (MAchine Readable Cataloging)
DC (Dublin Core)
TEI (Text Encoding Initiative)
METS (Metadata Encoding and Transmission Standard)
ESE (Europeana Semantic Elements)
Europeana Data Model (EDM)
ALTO (Analyzed Layout and Text Object
52