Al món físic col·leccionem fotografies en àlbums, carreguem l'Ipod amb les nostres cançons preferides, llegim revistes que contenen col·leccions d'articles... Aquesta pràctica d'agregació també l'estenem al web, sobretot a partir de l'aparició del web 2.0 acumulem llistes d'URL a l'apartat de preferits del nostre navegador o al Delicious, agrupem fotografies en llocs web com FlickR o Picasa, pugem els vídeos a Youtube, les notícies i novetats en agregadors d'RSS, etc. No existeix una manera estàndard de descriure i identificar aquestes agregacions al web, i és aquest el punt de partida de l'Open Archives Initiative Object Reuse and Exchange (OAI-ORE).
L'OAI-ORE defineix estàndards per a la descripció i l'intercanvi d'agregacions de recursos web. Aquestes agregacions, de vegades anomenades objectes digitals compostos, poden combinar recursos distribuïts amb múltiples formats, com ara text, imatges, dades i vídeos. L'objectiu d'aquests estàndards és exposar la riquesa d'aquest contingut agregat a aplicacions de dipòsit, intercanvi, visualització, reús i preservació, com poden ser els dipòsits d'e-informació.
La sessió informativa pretén descriure el funcionament bàsic d'aquestes especificacions, tot diferenciant-les del protocol OAI-PMH, i explorar les seves possibilitats descrivint alguns dels experiments que s'estan realitzant. També es mostraran les primeres passes que el CESCA hi està fent en el marc d'un grup de treball del projecte RECOLECTA.
http://www.cesca.cat/promocio/conferencies/2009/primavera.html#OAI
1. Object Reuse and Exchange (OAI- ORE)
Ricard de la Vega
Àrea de Portals i Repositoris (PiR)
Centre de Supercomputació de Catalunya (CESCA)
22 de juny de 2009
2. Agenda
Introducció
Conceptes previs
Què és l’OAI-ORE?
• Exemples d’agregacions
• El model
• OAI-ORE vs OAI-PMH
• Implementació
Experiments
Grup de treball OAI-ORE a RECOLECTA
Signes d’adopció
Conclusions
Referències
4. Introducció
CERN workshop on Innovations in Scholarly
Communication (OAI5) al 2007
5. Introducció
CERN workshop on Innovations in Scholarly
Communication (OAI6) al 2009
6. Conceptes previs
El web semàntic és el Web de les dades. Es basa en la
idea d’afegir metadades semàntiques i ontològiques al
www. Això s’ha proporcionar de manera formal perquè
sigui possible avaluar-se automàticament per màquines.
(Tim Berners-Lee, http://en.wikipedia.org/wiki/Semantic_Web)
7. Què és OAI-ORE?
Imatges de http://www.slideshare.net/hvdsomp/an-overview-of-the-oai-object-reuse-and-exchange-interoperability-framework
9. Què és OAI-ORE?
Agregacions de recursos web
L’objectiu és publicar mapes de recursos (Resource
Maps) al Web que instanciïn, descriguin i identifiquin
agregacions
20. El model OAI-ORE
OAI-ORE identifica i descriu les agregacions de recursos
web per fer-les visibles als agents del web, com els motors
de cerca (màquines).
Agregació: Recurs web amb una URI que l’identifica que
conté un conjunt de recursos. No té representació, és una
construcció conceptual.
Resource Map (ReM) és un recurs web amb representació
Descriu una agregació i enumera els recursos agregats. A
més, pot contenir informació addicional (tipus, relacions...).
21. OAI-PMH vs OAI-ORE
OAI-PMH Protocol
Centrat en les medatades
Centrat en els repositoris
Especificació
Centrat en objectes digitals complexes
Més enllà dels repositoris, centrat en el Web
25. Agenda
Introducció
Conceptes previs
Què és l'OAI-ORE?
Experiments
• Foresite (HP i JSTOR)
• TheOREM project (University of Cambridge)
• Repositoris holandesos (Tilburg University)
• Tècniques de preservació (Old Dominion University)
• Altres
Grup de treball OAI-ORE a RECOLECTA
Signes d'adopció
Conclusions
Referències
26. Foresite
Functional Object Reuse and Exchange
• http://foresite.cheshire3.org
Què?
• Descripció jerarquia revista/número/article en ORE
• Importació massiva de descripcions de revistes al DSpace
Gràfic de http://foresite.cheshire3.org/docs/foresite-or.ppt
27. Foresite
JSTOR, gran col·lecció de revistes (+1.000; 1,8 M articles)
Ingesta i emmagatzematge de RM via SWORD al DSpace
Transferència via ORE/SWORD entre repositoris
Investigar la citació externa
Investigar l’anàlisi gràfic dels recursos
...
28. TheOREM Project
Theses with ORE Metadata (University of Cambridge)
Gràfics de http://dspace.cam.ac.uk/handle/1810/196185
29. Repositoris holandesos
Aplicacions ORE sobre la infraestructura de repositoris
d'Holanda. DAREnet.
Relacions entre publicacions i data sets
Gràfic de http://openarchives.org/ore/meetings/Soton/Place-Possible%20ORE%20aplications.pdf
30. Tècniques de preservació
Tècniques de preservació per agregacions ORE
Old Dominion University
Deixa que la infraestructura web preservi la teva informació
Gràfic de http://www.openarchives.org/ore/meetings/Soton/ore-amf-client-side-southampton-pdf
31. Tècniques de preservació
Els ReMs són clau per a aquesta preservació
• Repositori A usa ReMs per les seves agregacions
• Repositori B por recol·lectar aquestes agregacions
• Internet Archive o PADICAT (http://www.padi.cat) també
Gràfic de http://www.openarchives.org/ore/meetings/Soton/ore-amf-client-side-southampton-pdf
33. Agenda
Introducció
Conceptes previs
Què és l'OAI-ORE?
Experiments
• Foresite (HP i JSTOR)
• TheOREM project (University of Cambridge)
• Repositoris holandesos (Tilburg University)
• Tècniques de preservació (Old Dominion University)
• Altres
Grup de treball OAI-ORE a RECOLECTA
Signes d'adopció
Conclusions
Referències
34. Grup de treball OAI-ORE a RECOLECTA
RECOLECTA és un projecte de la Fundación para la
Ciencia y la Tecnología (FECYT) i la Red Bibliotecas
Universitarias Española (REBIUN)
Recol·lector
OAI-PMH
Grups de treball
• Estadístiques
• OAI-ORE
• Avaluació de repositoris
• Identificador únic
35. Grup de treball OAI-ORE a RECOLECTA
Qui?
• UNED coordina el grup de treball
• CESCA
• Ceta-CIEMAT
• Fundación Euskomedia
• I2Basque de la UPV/EHU
• Universidad Carlos III de Madrid
• Universidad Complutense de Madrid
Què?
• Creació de 10 agregacions per institució (objectes complexes)
– EL CESCA les codificarà en RDF-XML
36. Grup de treball OAI-ORE a RECOLECTA
Què?
• Arquitectura
– Instal·lació d’un node principal amb les eines per desenvolupar i una
base de dades d’RDFs Mulgara (A la UNED).
– Instal·lació d’un segon node amb una altra base de dades d’RDFs
Mulgara per a poder realitzar cerques federades (al CESCA).
• Desenvolupament
– Creació d’un front-end amb XFORMS per a la càrrega dels casos d’ús
(serialització en RDF-XML).
– Representació gràfica i HTML dels grafs dels Resources Maps (RM)
generats amb la funcionalitat de clicar per entrar dins els diferents
elements.
• Creació de serveis
– Cerca i cerca federada (amb iTQL).
– Servei de cites (quantes vegades ha estat citat un autor?...).
– Servei de reutilització de components.
37. Agenda
Introducció
Conceptes previs
Què és l'OAI-ORE?
Experiments
• Foresite (HP i JSTOR)
• TheOREM project (University of Cambridge)
• Repositoris holandesos (Tilburg University)
• Tècniques de preservació (Old Dominion University)
• Altres
Grup de treball OAI-ORE a RECOLECTA
Signes d'adopció
Conclusions
Referències
38. Signes d'adopció
Experiments i demonstrators
El model ORE és explorat/recomanat per manegar
recursos de publicació i de patrimoni cultural en alguns
projectes de gran visibilitat
• OREchem
• NSF DataNet
• EU funded DRIVER 2, Europeana, EDLnet
http://driver2.dans.knaw.nl/demonstrator/html
La majoria dels repositoris institucionals l’implementen
(Fedora, DSpace, Eprints)
41. Conclusions
You may say I'm a dreamer, but imagine...
• aquesta presentació com un objecte complex que resideix al Web
(transparències, imatges...)
• i que serveis de valor afegit com recol·lectors de cites ho detecten
de manera automàtica.
Existeixes eines per a l’exportació en OAI-ORE, falten
serveis de valor afegit sobre aquesta tecnologia i la seva
adopció.
Bona tendència al repositoris. Molt per fer fora d’aquests.
Impacte a PADICAT, si s’estén el seu ús.
43. Referències
An Overview of the Object Reuse and Exchange
Interoperability Framework
• Herbert Van de Sompel (Los Alamos National Laboratory)
• http://www.slideshare.net/hvdsomp/an-overview-of-the-oai-object-
reuse-and-exchange-interoperability-framework
OAI-ORE, Context and motivation
• Herbert Van de Sompel et altri.
• http://www.openarchive.org/ore/meetings/Soton/ContextMotivation_
hvds.pdf
Grup de treball OAI-ORE a RECOLECTA
• http://www.recolecta.net/wiki/index.php/Grupo_de_Trabajo_OAI-
ORE
Base de dades de RDFs Mulgara
• http://www.mulgara.org
44. Referències
International conference on Open Repositories
• http://openrepositories.org
CERN workshop on Innovations in Scholarly
Communication (OAI)
• http://indico.cern.ch/conferenceDisplay.py?confId=48321
International World Wide Web Conference (www)
• http://www2009.org
Wordlets fets amb Many Eyes
• http://manyeyes.alphaworks.ibm.com/manyeyes