Arkhênum a animé le 13 juin 2013 à Paris une formation dédiée à la numérisation et valorisation des collections sur Internet. Le but était de former et informer les établissements présents sur les différentes étapes d’un projet de numérisation réussi et à valeur ajoutée.
Pour en savoir plus sur les fichiers de récolement, les formats, poids de fichier à attendre, consultez ce support de présentation.
Pour plus d’informations, contactez Emmanuel Fremau au 06 27 16 08 73 ou e.fremau@availpro.com
Numérisation du patrimoine écrit et iconographique
1. 1
Numérisation du patrimoine écrit et
iconographique : de la préparation
jusqu’à sa valorisation sur Internet
Maison de l’Aquitaine
Céline Lavergne - Christian Chabrier
Paris – 13 juin 2013
2. 2
Sommaire
I. Arkhênum en chiffres
II. Notre offre de services et nos équipes
III. La numérisation, première étape vers la
valorisation
1. Quelques notions pour comprendre la numérisation
2. Etapes d’un bon projet de numérisation
IV. Valorisation de son fonds patrimonial
3. 3
Août 2000 - Université d’été d’Hourtin – Catherine TASCAAvril 2000 - AD 63 – Philippe BELAVAL
Octobre 1998 - Salon du Livre de Bordeaux – Alain JUPPE Août 1999 - Université d’été d’Hourtin – Catherine TRAUTMANN
L’environnement
4. 4
I. Arkhênum en chiffres
Date de création: 1999
5 962 907 vues réalisées en 2012
2 sites de production : Bordeaux et Champigny/Marne ainsi que des
sites in situ
Salariés: > 35 personnes
Plus de 300 clients dont près de 60% des archives départementales
mais aussi archives municipales, bibliothèques municipales et
universitaires, musées, établissements nationaux, nous font
confiance
Un savoir faire dédié aux fonds patrimoniaux écrits et
iconographiques qui nécessitent un traitement de qualité
6. 6
II. Notre offre de services
Accompagnement sur l’ensemble de la chaîne de conservation et
valorisation de vos fonds patrimoniaux.
Chaque étape est indépendante l’une de l’autre. Vous choisissez la ou
les prestations dont vous avez besoin.
7. 7
II. Des équipes dédiées
Nos équipes vous accompagnent sur toutes les phases de votre projet :
Un chargé d’affaires qui va analyser votre demande, vous conseiller
Un chef de projet unique pour suivre votre projet et vous informer de son
évolution
Des opérateurs de numérisation spécialisés en fonds patrimoniaux
Un responsable qualité qui se charge de valider avec vous le travail
effectué
Un interlocuteur technique qui est votre référent pour toute demande
technique
Tous les membres qui sont amenés à manipuler vos fonds sont des
spécialistes : histoire de l’art, archivistes, photographes, …
9. 9
1. Quelques notions pour
comprendre la numérisation
Puissance de diffusion du numérique
Numérisation en Noir & Blanc ou en couleurs (RVB)
Naissance du Pixel
Taux d’agrandissement
Calibration des couleurs
La perte d’une dimension
Formats de fichiers de livraison
10. 10
Formats de fichiers:
TIFF, PNG, JPEG, PDF, …
Serveurs de sauvegarde
Résolution de 200 à 2000 dpi
Gravure de CD
Stockage sur bandes
magnétiques
Sécurité, transport
Consultation Internet
Production multimédia
Fac similé papier
Bornes interactives
Puissance de diffusion du numérique
11. 11
01110101
L’information capturée par un capteur est codée sur 8 bits
soit 28 combinaisons possibles.
28 = 256 niveaux de gris
« Numériseur 8 bits = numériseur N&B »
Caméra linéaire constituée de 10000
« capteurs » ou 10000 « pixels »
01110101
L’information capturée par chacun des capteurs est codée sur 8 bits
Le nombre de combinaisons possibles est donc de :
256 x 256 x 256 = 16 millions de nuances de couleur
« Numériseur 3 x 8 bits = 24 bits = numériseur couleur »
Caméra linéaire constituée de 3 x 10000 « capteurs » ou 3 x 10000 « pixels » par exemple
R
V
B
Caméra
N&B
Caméra
couleur
Numérisation Noir & Blanc ou couleur
13. 13
Pixel : plus petit élément de teinte homogène d’une image enregistrée (point élémentaire)
Capteur
1 création de la matrice
2 consultation
3 impression
La naissance du pixel
Manuscrit
Registre
Plan, carte
Plaque verre
Photographie
17. 17
TIFF non compressé :
Pas de compression de l’image, tous les pixels initiaux sont enregistrés
GC35_0012.TIF (exemple 100 Mo)
TIFF LZW :
Compression de type LZ77 sans perte, origine Compuserve
GC35_0012.TIF (exemple 60 à 80 Mo)
PNG :
Compression de type LZ77 sans perte, libre de droits, peu diffusé
GC35_0012.PNG (exemple 60 à 80 Mo)
JPEG :
Compression avec perte, si faible compression (échelle Photoshop 10 à 12)
GC35_0012.JPG (exemple 30 à 50 Mo)
Fichiersde
sauvegarde
Fichiersde
consultation
1 Tera = 1000 Go
1 Go = 1000 Mo
1 Mo = 1000 Ko
1 Ko = 1000 octets
1 CD peut contenir 70 fichiers
A4 N&B en 300 dpi en TIFF
non compressé ….
…… et 25 en couleur
JPEG :
Compression avec perte, avec % de compression à définir (échelle Photoshop de 1 à 7)
GC35_0012.JPG (exemple 100 Ko à 30 Mo)
TIFF CCITT Groupe IV :
Fichiers binaires, au trait (N&B), avec compression sans perte de type CCITT Groupe IV (utilisé
pour fax)
GC35_0012.TIF (exemple 50 Ko)
Formats de fichiers de livraison
19. 19
2. Etapes d’un bon projet de
numérisation
La phase de numérisation est la première phase qui permettra à terme
de valoriser vos fonds
C’est une étape complexe (outils, procédures internes, sauvegarde…) et
primordiale qui aura un impact sur la qualité de la valorisation future
Arkhênum a mis en place des méthodes de travail adaptées :
a. Préparation de vos fonds et organisation de l’atelier de numérisation
b. Des process de travail stricts encadrent chaque projet pour s’assurer
de la qualité de la prestation
c. Nos outils de numérisation s’adaptent à vos fonds
d. Chaque fonds est manipulé de la manière la plus adéquate
e. Aide à la structuration des données en vue de la valorisation
f. Contrôle qualité et sauvegarde des données
20. 20
Numérisation en
mode 120°
Préparation du projet:
- rassemblement de plusieurs compétences
- analyse du fonds, classification, côtes
- définition des noms de fichiers
- formats fichier (TIFF, PNG, JPEG)
- résolution, taux de compression
- Noir & Blanc ou couleur
- logiciels de consultation
- bases de données
- liens HTML, balisage XML, etc…
L’après projet:
- contrôle de la production
- intégration bases de données
- mode d’accès, diffusion WEB, fac similé
- médias de stockage, archivage CD, DVD
- rétro conversion des « originaux » numériques
a. Analyse des fonds / Finalité
22. 22
Numérisation chez le prestataire
Numérisation chez le client
a. Le choix du lieu de numérisation
23. 23
Des clients sur toute la France
Ajaccio
Archives départementales
Matrices cadastrales
Marseille
Musée
Iconographie
Tarbes
Archives départementales
Iconographies, manuscrits, …
Angoulême
Archives départementales
Etat civil
Troyes
Bibliothèque
MS Abbaye Clairvaux
Paris
Musée Quai Branly
Plaques verre, photographies
Et bien d’autres encore…
Carcassonne
Archives départementales
Matricules militaires
Gourbeyre Guadeloupe
Archives départementales
Reg conseil privé, militaires …
Laon
Bibliothèque
Manuscrits médiévaux
Saint Omer
Bibliothèque
Manuscrits médiévaux, délibérations
Morlaix
Le Télégramme
Presse ancienne
24. 24
b. Comment s’organise votre projet
Numérisation
Contrôle et sauvegarde
LOT_001
Repertoire 2
Repertoire 3
Repertoire 1
Livraison du lot
pour validation
Contrôle du client
Conforme
Non conforme
Sauvegarde Arkhenum
Livraison du lot au Client
Suivi
de
projet
25. 25
c. Nos outils s’adaptent à vos fonds
Et non l’inverse…
Scanner de livres :
Registres
Matricules militaires
Carnets
Liasses
….
Dos matriciel
Cartes postales
Plaques de verre
Phototypes
…
Plus de 25 scanners spécialisés pour numériser tous types de
fonds écrits et iconographiques
Scanner AO et A00 :
Cartes
Plans
Atlas
Affiches
….
28. 28
EAD - archives départementales de la Somme
e. Compléter vos exports EAD
1 : Partie complétée par le client
2: Partie renseignée par le prestataire
2 : Partie renseignée par le prestataire
29. 29
Dublin Core : simple (15 champs), augmenté (AP) ou raffiné (QDC)
e. Associer des données textuelles
aux images pour future BDD
30. 30
Fichier MIX - archives départementales de la Gironde
e. Exporter des métadonnées
techniques
33. 33
ALTO : Structuration physique de blocs (coordonnées XY et granularité)
e. Structuration en documents
numériques
34. 34
Moissonnage OAI : exemple de la BNSA (Aquitaine)
e. Le partage des ressources
Conseil régional Aquitaine : BNSA
Archives départementales Dordogne
36. 36
f. Arkhênum sauvegarde vos fonds
Nous assurons une sécurité maximale avec des baies sécurisées:
16 tiroirs HotSwap
Contrôleur RAID redondant + batterie
24 disques durs 2To SATA-2
2 connexions hôte fibre optique (2 x 8 Gbit fibre channel)
Alimentation redondante
Durée de la sauvegarde : à définir suivant vos contraintes
37. 37
Supports non réinscriptibles (WORM) : CD-R, DVD-R, UDO-R
Rapport MTIC: CD-R à court terme & DVD-R à moyen terme Voir évolution UDO
CD = 650 Mo, DVD = 4,7 Go (soit 7 CD) mais fragile, UDO = 30 Go 60 Go
Le CD ne vieillit pas à l’échelle de la journée
Supports réinscriptibles (non WORM) de type bande magnétique:
Accès séquentiel
Au delà du support, choix d’un logiciel de catalogage: Tivoli (IBM), Arcserve (CA), Back-
up exec
DAT = 20 Go, Super DLT = 110 Go, LTO-2 = 200 Go (annonce 400 Go)
DAT = 33 CD, SDLT = 174 CD, LTO-2 = 307 CD !!!
Contrôle plus fréquent du contenu des supports magnétiques
Quantité élevée de données perdues si support défaillant !
Problèmes de compatibilité sur lecteurs similaires support qui peut vieillir rapidement
(champ, poussières)
Supports réinscriptibles (non
WORM) de type « mini
disque »
REV Ioméga, 70 Go
Solution propriétaire
Accès rapide
Supports Serveurs
Grande capacité
Données en ligne
Sécurisation techno Raid
Coût important
f. Supports de livraison disponibles
38. 38
f. Hébergement
Une fois la numérisation faite, la 1ère étape vers la conservation
est accomplie. Etape suivante valorisation Internet
Importance de cette étape exemple des manuscrits
maliens depuis 2009
39. 39
Arkhênum était au Mali dès 2009
Numérisation d’une centaine de manuscrits sur place
Hébergement sur des serveurs sécurisés non réalisé ….
Arrivée des djihadistes à Tombouctou
Que sont devenues toutes les données numérisées ?