6. DUURZAAM DIGITAAL BEHEREN?
“Langdurige toegankelijkheid van digitale data. […]
Het duurzaam toegankelijk houden van data vergt zowel
beleidsmatige beslissingen in de vorm van een
duurzaamheidsstrategie, als praktische oplossingen voor beheer
en behoud.
(ABC Digitaal Erfgoed DEN)
23. VINDBAARHEID: METADATA!
• Descriptief: Wat is de inhoud van het
bestand?
• Administratief: Hoe kan/mag ik het bestand
gebruiken?
• Structureel: Wat is het verband met andere
bestanden?
25. KOPIEËN: ARCHIVERINGSBESTAND
“Een archiveringsbestand is een digitale kopie van het oorspronkelijke
(digitale of analoge) document in de hoogst mogelijke kwaliteit - bij
voorkeur voldoende hoog om het origineel in geval van vernietiging of
beschadiging te vervangen.
Archiveringsbestanden worden gemaakt wanneer het oorspronkelijke
document te kwetsbaar is om het te kunnen raadplegen, of wanneer het
verloren dreigt te gaan.
Ze worden bij voorkeur bewaard in een beveiligde opslagomgeving.”
UF: preservation master
26. KOPIEËN: REPRODUCTIEBESTAND
“Een reproductiebestand is een digitale kopie waarvan de kwaliteit
voldoende hoog is om de inhoud van het oorspronkelijke (digitale of
analoge) document op een betekenisvolle manier toegankelijk te maken.
Reproductiebestanden worden gebruikt als moederbestand voor het maken
van verschillende soorten raadplegingsbestanden.
Reproductiebestanden worden bij voorkeur bewaard in een beveiligde
opslagomgeving en zijn doorgaans enkel ter beschikking via het intranet
van een bewaarinstelling.”
UF: reproduction master, submaster, distributiekopie
27. KOPIEËN: RAADPLEGINGSBESTAND
“Een raadplegingsbestand is een digitale kopie die gebruikt wordt om
een document digitaal ter beschikking te stellen.
De kwaliteit van een raadplegingsbestand wordt bepaald door de aard van
het gebruik. De kwaliteit is vaak veel lager om de opslagcapaciteit en de
benodigde bandbreedte beperkt te houden en het document makkelijker
raadpleegbaar te maken.
Een raadplegingsbestand worden enkel bewaard en beheerd voor de
termijn van het beoogde gebruik.
UF: distribution copy, access copy, raadplegingskopie
31. “ De collectiebeherende cultureel-erfgoedorganisatie hanteert aan
het cultureel erfgoed aangepaste, algemeen aanvaarde standaarden
en kwaliteitsvolle, dynamische werkvormen en –methoden. Voor
digitaliseringsinitiatieven moet dit gebeuren volgens de
algemeen aanvaarde internationale en desgevallend door de
Vlaamse Regering opgelegde standaarden.”
Handleiding bij het cultureel-erfgoeddecreet (juli 2011)
ERFGOEDDECREET
34. RICHTLIJN ?
• Concrete use case
• Do’s & don’ts
• Minimum standaarden
• Aanbevolen standaarden
35. RICHTLIJNEN DIGITALISEREN ?
• Ik wil mijn fotocollectie digitaliseren
• Ik wil tekstdocumenten digitaliseren
• Ik wil geluidsopnames digitaliseren.
• Ik wil video digitaliseren.
37. 4 GEBODEN V/H DIGITALISEREN:
• Beschrijf de collectie
• Maak een moederbestand
• Registreer administratieve metadata
• Maak archiverings-, reproductie en
raadplegingsbestanden
39. 1STE GEBOD:
BESCHRIJF DE COLLECTIE
Minimum:
• Beschrijft de (deel)collectie (COMETA)
• Beschrijf het niveau waarop je ontsluit (reeks, stuk)
Aanbevolen:
• Beschrijf volgens het 1-op-1-principe (object, inhoud, representatie)
• Beschrijf het niveau van het digitale bestand (reeks, stuk, onderdeel)
• Beschrijf m.b.v. de standaarden voor:
• het type collectie (musea, bibliotheek, archief)
• het soort object (tekst, foto, geluid, video)
40. 2DE GEBOD:
MAAK EEN MOEDERBESTAND
Algemeen:
• Bewaar een onbewerkte versie van het moederbestand
• Kwaliteitseisen doelstellingen digitalisering
• Toegang tot de inhoud?
• Betrouwbare weergave?
• Substitutie origineel?
• Infrastructuur & kennis in huis?
41. 2DE GEBOD:
MAAK EEN MOEDERBESTAND (TEKST)
Minimum:
• Open en goed gedocumenteerd formaat
• Beeldformaat: TIFF of JPEG2000, soms JPG of PNG, geen PDF!
• Resolutie: ‘punten’&‘openingen’ ↔ 300ppi
• Bitdiepte: 8bit ↔ 24 bit; sRGB ↔ ECIRGB
• Tekstformaat: UTF-8
Aanbevolen:
• TEI
• METS
42. 2DE GEBOD:
MAAK EEN MOEDERBESTAND (FOTO)
Minimum:
• Uncompressed Baseline IBM TIFF v6.0
• Resolutie: 300ppi
• Bitdiepte: 8bit ↔ 24 bit; ECIRGB
Aanbevolen:
• JPEG2000, soms JPG, PNG of GIF, geen PDF!
43. 2DE GEBOD:
MAAK EEN MOEDERBESTAND (GELUID)
Minimum:
• Magneetbanden reinigen en correct identificeren!
• Vermijd subjectieve correcties!
• Open en goed gedocumenteerd formaat
• Linear Pulse Code Modulatie: 48kHz-96kHz; 24 bit
• Geen compressie!
Aanbevolen:
• WAV, AIFF, FLAC
44. 2DE GEBOD:
MAAK EEN MOEDERBESTAND (VIDEO)
Minimum:
• Magneetbanden reinigen en correct identificeren!
• Vermijd subjectieve correcties!
• Open en goed gedocumenteerd formaat
• Bewaar beeldeigenschappen (frame rate, aspect ration, etc.)
• Geen compressie!
Aanbevolen:
• MXF, AVI, MOV
• MXF/MJPEG2000 codering
45. 2DE GEBOD:
MAAK EEN MOEDERBESTAND
(BESTANDSNAMEN)
Minimum:
• uniek!
• letters
• cijfers
• liggend streepje ( _ )
• koppelteken (-)
Aanbevolen:
• Betekenisloze namen (UUID)
• Betekenisvolle namen (collectiecode / identificatienummer)
46. 2DE GEBOD:
MAAK EEN MOEDERBESTAND (STRUCTUUR)
Minimum:
• gestructureerd tekstbestand (CSV, XML)
• soms in de bestandsnaam (eenvoudige objecten)
• geen mappen!
Aanbevolen:
• XML Schema’s:
• MPEG DIDL
• METS
• PREMIS
47. 3DE GEBOD:
REGISTREER ADMINISTRATIEVE METADATA
‘Editievermelding’:
• Wie heeft het bestand gemaakt en hoe? (technische data)
• Welke beperkingen rusten op het gebruik ? (rechten data)
• Hoe moet het bestand bewaard worden? (preserveringsdata)
48. 3DE GEBOD:
REGISTREER ADMINISTRATIEVE METADATA
Minimum:
• Selecteer de elementen
• Gestructureerd tekstbestand (CSV, XML)
• Of in de header
Aanbevolen:
• PREMIS
• Identificeer en valideer (DROID, JHOVE)
60. DUURZAME BEWARING IS…
Organisatiestructuur
Mensen en middelen
Opslagsystemen
Standaarden
Karakteriseren en valideren
Checksums
Archiverings- en raadplegingsformaten
Migreren en normaliseren
Preservation metadata
Structural metadata
Technology watch
….
61. NORMEN VOOR EDEPOTS
TRAC
Trustworthy Repositories Audit &
Certification: Criteria and Checklist
Door OCLC, NARA en CRL
94 pagina’s
62. NORMEN VOOR EDEPOTS
DRAMBORA
Digital Repository Audit Method Based
on Risk Assessment
Door DCC en DPE
221 pagina’s (draft)
63. NORMEN VOOR EDEPOTS
ED3
Eisen Duurzaam Digitaal Depot
Gebaseerd op TRAC
V.2 op komst
39 p.
Brongegevens:
De combinatie van digitaal bronobject en
representatie informatie, die bewaard
moet blijven.
66. NORMEN VOOR EDEPOTS
OAIS BLUE BOOK
Ontwikkeld door NASA
ISO 14721:2003
148 pagina’s
Content Information: The set of information that is the
original target of preservation. It is an Information
Object comprised of its Content Data Object and its
Representation Information. An example of Content
Information could be a single table of numbers
representing, and understandable as, temperatures,
but excluding the documentation that would explain its
history and origin, how it relates to other observations,
etc.
RECOMMENDATION FOR SPACE
DATA SYSTEM STANDARDS
Reference Model for an
Open Archival Information
System (OAIS)
CCSDS 650.0-B-1
BLUE BOOK
January 2002
67. NORMEN VOOR EDEPOTS
OAIS MAGENTA BOOK
Gebaseerd op TRAC
ISO 14721:2003
77 pagina’s
4.1.1 The repository shall identify the Content
Information and the Information Properties that the
repository will preserve.
Supporting Text. This is necessary in order to make it
clear to funders, depositors, and users what
responsibilities the repository is taking on and what
aspects are excluded. It is also a necessary step in
defining the information which is needed from the
information producers or depositors.
Recommendation for Space Data System Practices
MAGENTA BOOK
AUDIT AND
CERTIFICATION OF
TRUSTWORTHY DIGITAL
REPOSITORIES
RECOMMENDED PRACTICE
CCSDS 652.0-M-1
September 2011
68.
69.
70.
71. EEN GROEIMODEL VOOR EDEPOTS
DOEL
Risico-analyse tool
Gebaseerd op normen
Laagdrempelig
Oplossingsgericht
72. EEN GROEIMODEL VOOR EDEPOTS
60 EISEN
Context
Risico’s
Voorbeeld
Oplossingen
73. EEN GROEIMODEL VOOR EDEPOTS
DRIE NIVEAUS:
Hoog risico
Matig risico
Laag risico
79. SECTIE 1: MANDAAT EN BELEID
1. Het duurzaam bewaren van de digitale objecten sluit
aan bij de missie of doelstelling van de organisatie.
(Risiconiveau hoog)
5. De rechten en plichten met betrekking tot het
aanleveren, beheren en raadplegen van digitale objecten
zijn afdoende vastgelegd. (Risiconiveau normaal)
6. De intellectuele rechten die rusten op de digitale
objecten worden gecontroleerd en nageleefd. De
auteursrechtelijke status van elk object wordt in de
metadata vastgelegd. (Risiconiveau normaal)
80. SECTIE 2: BEWAARSTRATEGIE
3. Voor elk digitaal object kan bepaald worden wat de
essentiële eigenschappen (inhoud, vorm, gedrag,
structuur) zijn die bewaard moeten worden. Daarbij wordt
rekening gehouden met de eisen van de leveranciers en
afnemers. (Risiconiveau hoog)
4. Op basis van de essentiële eigenschappen kan bepaald
worden onder welk bestandsformaat een object moet
worden bewaard en zo nodig moet worden gemigreerd.
(Risiconiveau hoog)
81. SECTIE 2: BEWAARSTRATEGIE
5. Bij de keuze van bestandformaten wordt zo veel
mogelijk gekozen voor open, wijdverspreide
archiveringsformaten. (Risiconiveau normaal)
11. De bewaarstrategie is schriftelijk vastgelegd in een
preserveringsbeleidsplan dat regelmatig wordt
geactualiseerd. Dit plan bevat alle eerder genoemde
punten in deze sectie: d.w.z. punt 1 t/m 11. (Risiconiveau
normaal)
82. SECTIE 3: KENNIS EN ORGANISATIE
3. De verantwoordelijken beschikken over de nodige
technische expertise voor de uitvoering van hun taak.
(Risiconiveau hoog)
5. De organisatie beschikt over voldoende expertise om op
hoofdlijnen de goede werking van de duurzame opslag te
kunnen monitoren. (Risiconiveau normaal)
83. SECTIE 4: OPSLAGBEHEER
1. De gearchiveerde digitale objecten zijn opgeslagen in
een opslagsysteem dat deel uitmaakt van een
computernetwerk. (Risiconiveau normaal)
7. De integriteit van de digitale objecten wordt regelmatig
gecontroleerd. (Risiconiveau hoog)
9. De noodkopie wordt bewaard op een fysiek andere
locatie. (Risiconiveau normaal)
84. SECTIE 5: OPNAME
3. Er zijn tools of technologie actief om bestandsformaten
te kunnen karakteriseren (identificeren). (Risiconiveau
normaal)
6. Het is bekend met welke applicaties je alle
bestandsformaten die je binnenkrijgt kan openen.
(Risiconiveau normaal)
85. SECTIE 5: OPNAME
RELEVANTE METADATA WORDEN VASTGELEGD:
8. een onveranderlijke, unieke naam (identifier)
9. de locatie (reference information)
10. de context waarin het digitaal object is ontstaan
11. de technische kenmerken van het digitaal object
12. Structurele metadata
13. minimale set van inhoudelijke gegevens (wie, wanneer,
wat, waar)
86. SECTIE 6: PLANNING EN
KWALITEITSCONTROLE
2. De technische details van de migraties worden
gedocumenteerd (in de preservation metadata).
(Risiconiveau normaal)
87. SECTIE 7: TOEGANKELIJKHEID
3. Elk digitaal object is bereikbaar met een persistente
URI. (Risiconiveau laag)
4. De digitale objecten zijn voor de gebruiker beschikbaar
in gangbare, zoveel mogelijk open formaten. (Risiconiveau
normaal)