Uitgangspunt: een publicatie moet een modulaire structuur hebben om deze te kunnen verrijken. Een verrijkte publicatie kent verschillende vormen.
Er bestaat echter ook een vorm van verrijking waarbij in een traditionele publicatie gebruik wordt gemaakt van XML . In dit geval is de traditionele publicatie geen onderdeel van een verzameling objecten, maar vindt de verrijking puur in de traditionele publicatie zelf plaats. Met XML is het mogelijk de semantiek van een artikel weer te geven. Je kunt aangeven waar de feiten, de probleemstelling, de hypothese, het empirisch bewijs, de analyse en de conclusie in de publicatie staan. Soms wordt wel gezegd dat de publicatie dan bestaat uit verschillende modulen of objecten. Deze modulen of objecten zijn dan voorzien van metadata. Door naast XML bovendien gebruik te maken van een ontologie, is het mogelijk kennis te koppelen aan gerelateerd feiten, publicaties, databases, etc. De ontologie beschrijft de entiteiten en de onderlinge relaties en regels binnen een bepaalde discipline. Sommige Markup Languages zijn dan ook verbonden aan bepaalde disciplines, bijv. Chemical Markup Language (CML); Mathematics Markup Language en Biology Markup Language . Deze taal (ontologie) helpt de informatie te vinden, bijvoorbeeld in databases. De structuur is namelijk niet alleen van belang voor de lezer, maar ook voor de machines. Data mining zal immers steeds belangrijker worden Structuur (Kircz) Van lineair naar modulaire publicatie, incl. Onderzoekgegevens + relatie/links naar andere modules/delen van het artikel
Elsevier heeft in de zomer van 2009 twee prototypen van verrijkte publicaties gepubliceerd ( http:// beta.cell.com / ) Auteurs wordt gevraagd wat zij van de nieuwe modellen vinden. De prototypen bevatten o.a. een hiërarchische presentatie van tekst en figuren, een grafisch abstract, audio en video geïntegreerd.
Prospect - Deze tools helpen om het artikel sneller te doorgronden en door definities te geven en relevante artikelen op te sommen. Informatie/semantiek Royal Society of Chemistry Project Prospect Ontology Terms Feature: 1. gemarkeerde termen 2. gedetaileerde informatie 3. relevante publicaties
Beter, sneller te berijgpen voor mens en machine
Van der Poel Meestal wordt dit type van een verrijkte publicatie gezien als het samenbrengen van gerelateerde objecten onder één metadata record. Aan de traditionele publicatie worden bijvoorbeeld datasets, video’s, etc. gelinkt. Nature heeft een speciale website Nature Multimedia met streaming video’s, pod casts, blogs en tools . Maar vanaf de video’s wordt niet verwezen naar de publicatie: de lezer van het artikel weet niets van de video, en de kijker van de video niet van het bestaan van het artikel.
Publicaties van uitgevers zijn slechts beperkt verrijkt. Ze zijn voorzien van hyperlinkt referenties en soms van bijlagen. Elsevier en Blackwell bieden onderzoeksdata aan bij de publicatie. Helaas betreft het meestal PDFs en zelden ruwe onderzoeksdata.
De Public Library of Science (PloS) is de enige uitgever die de mogelijkheid biedt om na het verschijnen gegevens toe te voegen, zowel commentaar, rankings, als trackbacks.
Indien er wordt voortgebouwd op het onderzoek in een verrijkte publicatie, moet de publicatie zoals die ten tijde van de citatie beschikbaar was, ook in de toekomst voor collega-onderzoekers beschikbaar zijn. Van de objecten die een onderdeel vormen van de verrijkte publicatie moet bovendien zeker zijn om welk object het gaat, en ook dat het object niet is veranderd.
Om de interoperabiliteit te waarborgen is gebruik van een ontologie noodzakelijk . Elsevier, Wiley, Springer, Nature, etc. Supplementary materials maar problemen met: geen wederzijdse relatie toegang duurzaam omvang
Er is in ieder geval een uitgever, de American Astronomical Society (AAS), die op een juiste manier verwijst naar externe bronnen. De AAS eist voor iedere dataset een unieke en permanente identifier. Alle astronomische data centra kennen deze unieke identifiers toe aan iedere gewenste set. De data centra zijn overeengekomen de identifiers tot in de lengte der dagen toegankelijk te houden.
De delen van een verrijkte publicatie moeten daarom zorgvuldig worden geselecteerd. Verrijkte publicaties of onderdelen daarvan moeten daarom aan de volgende voorwaarden voldoen: Het is eenvoudig te controleren of twee objecten hetzelfde zijn, maar bij (grote) datasets kan dat ingewikkeld zijn. Data-correctie, -updates, en -onderhoud kunnen bovendien de data beïnvloeden. Om te garanderen en onafhankelijk te kunnen controleren dat de dataset niet is veranderd, zelfs niet als het formaat is veranderd, kan de Universal Numeric Fingerprint (UNF) worden gebruikt. UNF is een digitale sleutel (een korte rij getallen en karakters) die uit de inhoud van een dataset wordt gegenereerd, zodanig dat een enkele wijziging in een andere UNF resulteert.
De digitale objecten en de links vormen als geheel de verrijkte publicatie.
To handle this complex process, only the OAI-ORE model is sufficient
Scientific Publication Package (SPP) - experimenten eenvoudig te herhalen, controleren en verspreiden In de pakketten worden de stappen van het wetenschappelijk onderzoek vastgelegd. Zo kan duidelijk worden gemaakt hoe de data en andere resultaten van onderzoek (bijv. de publicatie) tot stand zijn gekomen. Deze manier van beschrijven maakt het mogelijk de experimenten eenvoudig te herhalen, controleren en verspreiden. Fouten, anomalieën, e.d. zijn dan gemakkelijker te achterhalen. Aan het eind van het wetenschappelijk proces publiceert de wetenschapper zijn/haar SPP. Alle componenten worden voorzien van een unieke identifier. Een SPP bestaat uit data (database gegevens, beelden, visualisaties, grafieken), functies, software, specificaties, publicaties (Endnote files, rapporten, documentatie etc.). Het samengesteld digitaal object wordt opgeslagen als RDF pakket. De relaties tussen de objecten worden duidelijk door de metadata gebruikte ontologie of pakketgebonden specificaties. De SPP kan in een repository worden geplaatst en aldaar worden geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd.
Repositories have an infrastructure that is very well suited to collect, to make accessible & archive scholarly output U niversities and research institutes should take the responsibility to archive the digital scholarly output of their organisation in a sustainable way.
Redenen om verrijkte publicaties samen te stellen kunnen zijn (1), (2) (3). Scientific Publication Package (SPP) experimenten eenvoudig te herhalen, controleren en verspreiden componenten - unieke identifier. data (database gegevens, beelden, visualisaties, grafieken) functies, software, specificaties publicaties (Endnote files, rapporten, documentatie etc.). samengesteld digitaal object - RDF pakket. relaties metadata gebruikte ontologie pakketgebonden specificaties. SPP in een repository geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd. In de pakketten worden de stappen van het wetenschappelijk onderzoek vastgelegd. Zo kan duidelijk worden gemaakt hoe de data en andere resultaten van onderzoek (bijv. de publicatie) tot stand zijn gekomen. Deze manier van beschrijven maakt het mogelijk de experimenten eenvoudig te herhalen, controleren en verspreiden. Fouten, anomalieën, e.d. zijn dan gemakkelijker te achterhalen. Aan het eind van het wetenschappelijk proces publiceert de wetenschapper zijn/haar SPP. Alle componenten worden voorzien van een unieke identifier. Een SPP bestaat uit data (database gegevens, beelden, visualisaties, grafieken), functies, software, specificaties, publicaties (Endnote files, rapporten, documentatie etc.). Het samengesteld digitaal object wordt opgeslagen als RDF pakket. De relaties tussen de objecten worden duidelijk door de metadata gebruikte ontologie of pakketgebonden specificaties. De SPP kan in een repository worden geplaatst en aldaar worden geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd.