Jindra Pavelková - Die Bibliothek des Stiftes in Welehrad im Augenblick seine...
Digitalizace a dlouhodobá ochrana digitálních dokumentů
1. Modul 3: Služby
Ochrana knihovních fondů
– Digitalizace a dlouhodobá ochrana
digitálních dokumentů
Tento projekt je financován z Evropského sociálního fondu prostřednictvím Operačního programu
Lidské zdroje a zaměstnanost a ze státního rozpočtu ČR.
Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kultura
Název kurzu: Seminář pro knihovníky a informační pracovníky –
Inovační knihovnický kurz
2. Digitalizace a dlouhodobá
ochrana digitálních
dokumentů
Mgr. Pavla Švástová
Moravská zemská knihovna
25.5.2011 Inovační knihovnický kurz, Brno
3. Obsah
● Digitalizace, digitální dokument
● Digitalizační workflow
● Formáty dat a metadat, identifikátory
● Problematika dlouhodobého uchování
digitálních dokumentů
4. Moravská zemská knihovna
Digitalizace
● převod fyzického dokumentu do digitální
podoby
● jedna z metod ochrany knihovního fondu
● cesta ke zpřístupnění kulturního dědictví
široké veřejnosti
● projekty v ČR
○ VISK6 Manuscriptorium a VISK7 Kramerius
○ Národní digitální knihovna, Norské fondy
○ Europeana Travel, GoogleBooks
○ WebArchiv
10. Moravská zemská knihovna
Vlastnosti digitálního dokumentu
● čím se liší od fyzického dokumentu?
● obsahové vlastnosti jsou stejné!
● formální vlastnosti se liší!
● digitální forma uložení – bit stream
● nezávislost na nosiči
● pro jeho zpracování a zobrazení potřebujeme počítač
● lze donekonečna kopírovat beze změny kvality
(vznikají další originály)
● nové vlastnosti? lepší prohledávání, možnosti
popisu...
11. Moravská zemská knihovna
Co vzít v potaz, než začnu digitalizovat?
● co chci digitalizovat?
○ knihy, periodika, diplomové práce, grafiky, mapy, 3D
objekty, obrazy, zvuk, video
● proč chci digitalizovat?
○ archivace a zpřístupnění poškozených nebo vzácných
dokumentů, nedostupných nebo hodně využívaných
dokumentů...
● jak chci digitalizovat?
● náklady na digitalizaci, výrobu metadat,
archivaci, nákup HW a SW
12. Moravská zemská knihovna
● neustálý vývoj hardware
○ počítat s novými typy zařízení (e-readery,
SmartPhone, tablety apod.)
○ ceny jdou dolů
● neustálý vývoj software
○ používat pouze rozšířené a standardizované formáty
dat a metadat
○ hlídat zastarávájící data
● ?
Co vzít v potaz, než začnu digitalizovat?
14. Moravská zemská knihovna
Digitalizační workflow
● proces výroby digitálního dokumentu,
jeho zpracování, archivace a zpřístupnění
● příprava dokumentů
● skenování
● úprava obrazu
● výroba metadat a OCR
● archivace
● zpřístupnění
15. Moravská zemská knihovna
Příprava dokumentů před skenováním
● vyhledání nejkvalitnější předlohy
● kompletace dokumentu (periodika)
● katalogizace a přidělení identifikátorů
● restaurování poškozených dokumentů
● analýza stavu dokumentu, vybrání vhodné
techniky skenování
● příprava pracoviště (optimální a rovnoměrné
nasvícení)
16. Moravská zemská knihovna
Skenování aneb jak vyrobit obrázky?
● černobílé? škála šedi? barva?
● rozlišení (300-600 DPI)
● velikost obrázku (MB)
● (stránka monografie A5 x nejkvalitněji
naskenovaná mapa)
● v jakém formátu uložit dokument? které
formáty se hodí pro dlouhodobou ochranu?
(tiff, jp2, jpg, djvu)
● kompletnost dokumentu (kontrola kvality)
● systém ukládání (adresářová struktura)
17. Moravská zemská knihovna
Zpracování obrazu
● ořez
● narovnání
● barevná škála a kalibrace
● výroba náhledů z originálního obrázku
● konverze do různých formátů (z tiff do jp2)
18. Moravská zemská knihovna
Výroba OCR
● optical character recognition
● převod obrazového textu do počítačem
čitelné podoby
● FineReader
● kvalita OCR
● opravy OCR?
○ kolaborativni opravy (Národní australská knihovna),
http://trove.nla.gov.au/newspaper
○ projekt IMPACT, http://www.impact-project.eu/
19. Moravská zemská knihovna
Jak obrázky popsat aneb výroba metadat
● identifikátory
○ čísla z knihovního katalogu = provázání s fyzickou
jednotkou (systémové číslo, signatura, čárový kód,
ČNB, evidenční číslo)
○ identifikace celého dokumentu, ročníku novin, kapitoly
knihy, každé stránky
● metadata
○ data, která uchovávájí informace o vzniku dokumentu,
o jeho vlastnostech, struktuře atd.
20. Moravská zemská knihovna
Metadata I.
● deskriptivní (=popisná)
○ obdobná těm z knihovního katalogu (autor, název...)
○ jediné popisují obsah dokumentu
○ MODS, DC, MARCXML
● strukturální
○ jak je dokument poskládán?
○ jak jdou stránky po sobě? jaká jsou jejich fyzická a
logická čísla?
○ periodikum-ročník-číslo-článek
○ provázání různých kvalit téhož obrázku
○ METS, FOXML
21. Moravská zemská knihovna
Metadata II.
● technická
● jaká je kvalita a velikost obrázků
● na jakém přístroji byly obrázky vyrobeny?
● kdy byly snímky pořízeny
● formát obrázků
● MIX, ALTO
● administrativní
● kdo je vlastníkem dokumentu?
● komu je možné dokument zpřístupnit a za jakých
podmínek?
● zaznamenán životní cyklus dokumentu
● PREMIS
22. Moravská zemská knihovna
Zpřístupnění digitálních dokumentů
● vystavení dokumentů online
○ v digitální knihovně ke čtení
○ ke stažení (e-books)
○ uložení na digitální nosič
● myslet na autorský zákon!
● uživatelská přívětivost prostředí
● dáváme dokumentům přidanou hodnotu (2.0
služby)
23. Moravská zemská knihovna
Archivace digitálních dokumentů
● archivuje se nejlepší kvalita obrázku a
veškerá příslušející metadata
● uložení na disky (operativnější a rychlejší)
nebo na pásky (pomalejší, ale bezpečnější)
● zálohování!
● kontrola přístupů
● LTP systémy
24. Moravská zemská knihovna
● dlouhodobá?
○ 5 let? 100 let? trvale?
○ účel – dokdy má dokument význam pro uživatele
○ počítat s neustálým vývojem software a hardware
○ sledovat formáty dat a metadat
○ dodržovat kompatibilitu
● neustálé sledování trendů vývoje informačních
technologií a budování strategií, které se se
změnami dokáží vyrovnat
Dlohodobá ochrana digitálních dat???
25. Moravská zemská knihovna
● co chráníme?
○ informaci, vložené finance, kulturní dědictví...
○ ochrana bit streamu X ochrana logiky dokumentu
● proč?
○ srozumitelnost
○ použitelnost
○ vyhledatelnost
○ dostupnost v budoucnu
● jak?
○ potřebujeme plán!
○ vše evidovat, ukládat kontrolní součy apod.
○ dodržovat standardy, OAIS
Dlohodobá ochrana digitálních dat???
26. Moravská zemská knihovna
Dlohodobá ochrana digitálních dat
● identifikace (co to je za formát?) a validace
(opravdu je to ten formát) – jsou všechny
soubory standardní?
● kontrolní součty (při přesunech a kopírování)
● kapacita – máme místo na discích na archivní
data, data pro zpřístupnění a jejich zálohy?
● standardy, standardy, standardy!
● odhad risků – které formáty souborů
zastarávají a jak je transformovat?
● zobrazení – jak zobrazím, otevřu soubor v
určitém formátu
27. Moravská zemská knihovna
Dlohodobá ochrana digitálních dat
● LTP systémy – softwarová ochrana
● bezpečná úložiště – hardwarová ochrana
● open source nástroje:
○ RODA, ARCHIVEMATICA, AIDA, MOPSEUS
● komerční řešení
○ Rosseta (ExLibris), SDB (Tessela),...
28. Moravská zemská knihovna v Brně
www.mzk.cz
Děkuji za pozornost
Pavla Švástová
pavla.svastova@gmail.com