presentatie gehouden door Jeroen van der Vliet van DEN over de BASIS tijdens de studiemiddag Open Bronnen op 14 oktober 2009 in het Meisjeshuis in Delft, georganiseerd door het PHC
3. Omvang (fysiek) cultureel erfgoed musea: ca. 44 miljoen objecten ( MUSIP/Collectiebalans 2008 ) archieven: ca. 600 km of 3,6 miljard pagina's ( Alles uit de kast 1998 ) wetenschapsbibliotheken: ca. 9 miljoen items ( Alles uit de kast 1998 ) monumentenzorg: 42.792 gemeentelijke en 61.037 rijksmonumenten en archeologie: 12.996 archeologische terreinen ( Erfgoedbalans 2009 ) beeld en geluid: 1.500.000 uur ( NORAA, Schatgraven in de regio 2006 ) Alles digitaal kost naar schatting minimaal 150.000 levensjaren !
4. Doel van digitalisering Waarvoor? Toegankelijkheid voor het publiek 26% Conservering 23% Wetenschappelijk onderzoek 18% Educatie 16% Communicatie 14% Anders 3% Bron: DEN, De Digitale Feiten 2008
6. A - Beleid B - Plannen C - Uitvoering D - Evaluatie Voorbereiding Vervaardiging Beschrijving Opslag Toegang Presentatie Beheer & gebruik Interoperabiliteit Duurzaamheid Praktijk van het digitaliseren
7.
8.
9.
10.
11. Wat is inmiddels opgenomen? 2K, AIFF, D10, Dublin Core, ECIRGB, GML, HTTP, JPEG, JPEG2000, Kodak Greyscale 013, MacBeth Colorchecker, (KML), MPEG-2, MPEG-4, MP3, NAP, OAI-PMH, OAIS, QuickTime, RD, SRU/SRW, TIFF, (TEI), TRAC, UTF-8, URI, WAV, XML voor Vindbaarheid , Vervaardiging en Duurzaamheid van het digitaal erfgoed Wat staat er nog in de wacht? Presentatie: toegankelijkheid; online presentaties; Web 2.0 Beschrijving: gebruik metadata en terminologiebronnen zoals vocabulaires, thesauri en ontologieën; semantisch web-toepassingen DE BASIS: Bouwen Aan Succesvolle ICT-Strategie
12. Casus: is digitaal erfgoed ook vindbaar op het Web? op zoek naar informatie over Tamme Beth IJsbrandsz. of Tamme Beth Ysbrandsz Ta?me Bet? ?sbrands* Tamme Beth wat weten we? was actief als scheepsmakelaar, cargadoor en boekhouder leefde en werkte in Amsterdam in tweede helft 18de eeuw
13. Gezocht op "tamme beth" en 50 treffers retour. Google Maar is alles ook bruikbaar? Een selectie ... www.google.nl/search?q="tamme+beth"
14. Tsja, wel de juiste naam, maar niet Facebook van de persoon die we zoeken ... www.facebook.com
15. Google scant oude boeken en maakt die Google Books op trefwoorden doorzoekbaar ... books.google.nl
16. ... dankzij tekstherkenning of OCR , hier als "plat" tekstbestand; The Internet Archive effectief maar de tekst staat nog wel vol met "lees"-fouten. www.archive.org
17. Ook een database is goed indexeerbaar voor De VOC-site (particulier initiatief) zoekmachines, tenminste als ... www.vocsite.nl
18. ... elke bron of pagina een Maritieme Kalender (Scheepvaart Museum Amsterdam) eigen URL heeft. www.scheepvaartmuseum.nl/collectie/maritieme-kalender
19. Een "platte" tekst zoals HTML: daar kunnen alle Texelse genealogie (particulier initiatief) zoekmachines probleemloos mee uit de voeten. home.hccnet.nl/mwk/
21. Niet gevonden omdat de bronnen geen eigen URL hebben, Maritiem Digitaal die is er wel, maar zit verstopt in de pagina zelf ... www.maritiemdigitaal.nl
22. Zou er nou echt niet iets te vinden zijn? Archiefbank (Stadsarchief Amsterdam) www.stadsarchief.amsterdam.nl/archieven/archiefbank/
23. A-ha! Wel een URI via het afbeeldingsnummer, Archiefbank (Stadsarchief Amsterdam) maar de plaatjes hebben geen metadata ... www.stadsarchief.amsterdam.nl/archieven/archiefbank/
24. Metadata helpt afbeeldingen doorzoekbaar Archiefbank (Stadsarchief Amsterdam) te maken, handig als spelling soms anders is ... www.stadsarchief.amsterdam.nl/archieven/archiefbank/
25. Beschrijf gescande teksten en afbeeldingen en koppel Dataset Archief van de Waterschout de data aan het object via een unieke identifier, bijv. img . staat nog op de computer van de auteur
26. Toevalstreffer? Dankzij de juiste karakterset (UTF-8) is Google Images / Museovirasto (Finland) deze Finse pagina goed indexeerbaar en ook leesbaar images.google.nl / www.nba.fi