SlideShare uma empresa Scribd logo
1 de 19
Baixar para ler offline
10 años de repositorios cooperativos


Ricard de la Vega
Jefe del Servicio de Portales y Repositorios
Centre de Supercomputació de Catalunya

4as. Jornadas OS-Repositorios
Barcelona, 3-5 marzo de 2010
Un taller en 5 partes

  Las diferentes fases que han vivido los repositorios
  cooperativos     Lluís M. Anglada

  Actuaciones llevadas a cabo en estos 10 años para
  llenarlos de contenido  Sandra Reoyo

  Experiencia de la UPF como participante en estos
  repositorios y con uno institucional Anna Casaldàliga

  Infraestructura técnica en que se han desarrollado y han
  evolucionado      Ricard de la Vega

  Los retos a los que se enfrentan los repositorios
  cooperativos     Lluís M. Anglada
Centre de Supercomputació de Catalunya


                            Consorcio público
                            Creado en 1991
                            Formado por:
                             •   Generalitat de Catalunya
                             •   Fundació Catalana per a la
                                 Recerca i la Innovació
                             •   9 universidades catalanas
                             •   Consejo Superior de
                                 Investigaciones Científicas

                            Anella Científica creada en
                            1993
Nuestros servicios
Índice

  Introducción

  Software
   •   ETD-db (TDR)
   •   DSpace (RECERCAT, MDX)
   •   Open Journal Systems (RACO)
   •   CONTENTdm (MDC)


  Hardware
   • 2001     2010


  Conclusiones
Software



  Se ha hecho un estudio inicial para cada repositorio con
  el objetivo de conocer qué software sería el más
  adecuado en cada caso

  La mayoría de repositorios son software de código
  abierto, hecho que ha permitido, entre otras ventajas, la
  adaptación a las necesidades concretas de cada
  proyecto

  Interoperatividad a través de OAI-PMH
  • Proveedores de datos
  • Proveedores de servicios
ETD-db (2000, TDR)

  Gestión de contenidos            ETD-db
  • Proyecto de colaboración entre:
     − Graduate School at Virginia Tech
     − Digital Library and Archives (DLA)
     − National Digital Library of Thesis and Disertations (NDLTD)
  • 1 instancia de ETD-db para cada institución


  Indexación y publicación     Glimpse y Webglimpse
  • Consultas globales al repositorio


  Módulo para la exportación por OAI-PMH y de estadísticas

  Desde 2007, recolector de tesis españolas
     Módulo MetaIndex + librerías X-Server de Ex Libris
DSpace (2005, RECERCAT; 2009, MDX)

  Software para repositorios digitales

  Desarrollado por MIT i HP
  Actualmente bajo DURASPACE

  Software de código abierto

  Unas 700 instalaciones

  OLD Dominion University plugin para la recolección por OAI-PMH

  Desarrollos propios
   • Módulo de estadísticas
   • Herramienta de importación desde REPEC
Open Journal Systems (2006, RACO)

  Herramienta para la gestión editorial + repositorio

  Public Knowledge Project (PKP)
   •   Simon Fraser University Library
   •   School of Education at Stanford University
   •   Simon Fraser University
   •   Faculty of Education at the University of British Columbia

  Software de código abierto

  Casi 3.000 instalaciones
  (1-N revistas)

  Desarrollos propios
   • Módulo de publicación simplificado
   • Módulo de gestión de instituciones
   • Módulo de estadísticas
CONTENTdm (2006, MDC)

 Gestor de colecciones digitales

 Online Computer Library Center (OCLC)

 Licencia privativa basada en el número de documentos

 Unas 1.400 instalaciones

 Las colecciones pueden estar formadas por diferentes
 tipos de ficheros: imágenes, pdf, audio, video...

 Extensión OCR para colecciones digitalizadas. Permite
 incluir el transcript
Más allá del software de base...

  Adaptación del software de base
   •   Diseño gráfico, traducciones y adaptación de textos
   •   Configuración de parámetros (stop words…)
   •   Corrección de errores
   •   Ampliación de funcionalidades (diacríticos…)

  Instalación de módulos o plugins
   • Para la exportación o importación OAI-PMH, Manakin…

  Desarrollo de módulos propios
   • Estadísticas, ingesta masiva de datos, módulos de RACO…

  Software complementario
   • Intranets, páginas de novedades, herramientas de monitorización…
Índice

  Introducción

  Software
   •   ETD-db (TDR)
   •   DSpace (RECERCAT, MDX)
   •   Open Journal Systems (RACO)
   •   CONTENTdm (MDC)


  Hardware
   • 2001     2010


  Conclusiones
Hardware

    2001         2005       2006   2006   2009




 ~80 GB y 7.690 consultas

 HP V2500 (cálculo)
  • 16 procesadores
  • 4 GB de memoria
  • 227 GB de disco


 StorageTek TimberWolf 9740
  • 2,7 TB en cintas
Hardware

     2001            2005        2006   2006   2009




 En 2003 ~100 GB y 278.710 consultas

 HP rp5430 (servidor)
  • 2 procesadores PA8700
  • 704 GB de memoria

 HP EVA V.2 (cabina de discos)
  • 2,8 TB de disco

 StorageTek TimberWolf 9740
  • 5 TB en cintas
Hardware

    2001          2005        2006     2006       2009




 En 2010 ~2 TB y 8.019.930 consultas (TDR+RECERCAT+RACO)

 Clúster de e-Información
  • 32 nodos Proliant DL360
  • 291 GB de memoria

 NetApp FAS3140
  • 100 TB de disco

 ADIC Scalar i2000
  • 156 TB en cintas
Hardware en 2010

                                                           Escalable
Repositorios                                               Alta disponibilidad
                                                           Balanceo de carga
           Balanceadores                    …              Virtualización

       …
           Servicios
                                 Nodos dedicados
                                    GAIA (3)
   …                                PADICAT (7)
                                    Metalib (1)
            Datos                   MDC (1)


   …
                 Entorno de desarrollo
                 Entorno de preproducción
                 Entorno de producción
                                              Red de almacenamiento
Índice

  Introducción

  Software
   •   ETD-db (TDR)
   •   DSpace (RECERCAT, MDX)
   •   Open Journal Systems (RACO)
   •   CONTENTdm (MDC)


  Hardware
   • 2001     2010


  Conclusiones
Conclusiones



Con la cooperación se consigue:

  Adopción de procedimientos comunes
  Mayor visibilidad
  …
  Economías de escala
  • En software
  • En hardware
  • En el equipo humano
10 años de repositorios cooperativos

Mais conteúdo relacionado

Destaque

Tdr documentacion
Tdr documentacionTdr documentacion
Tdr documentacionandresf123
 
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10tatimosquera
 
Tdr terminos de_referencia
Tdr terminos de_referenciaTdr terminos de_referencia
Tdr terminos de_referencia19801734
 
Terminos de referencia
Terminos de referenciaTerminos de referencia
Terminos de referenciauber21
 
Research Papers Recommender based on Digital Repositories Metadata
Research Papers Recommender based on Digital Repositories MetadataResearch Papers Recommender based on Digital Repositories Metadata
Research Papers Recommender based on Digital Repositories MetadataRicard de la Vega
 
Tdr tesis doctoral
Tdr tesis doctoralTdr tesis doctoral
Tdr tesis doctoralRolandoav
 
Como venderle al_estado_2014 abril
Como venderle al_estado_2014 abrilComo venderle al_estado_2014 abril
Como venderle al_estado_2014 abrilOscar Saravia
 
Importancia de la vegetación en el control de inundaciones
Importancia de la vegetación en el control de inundacionesImportancia de la vegetación en el control de inundaciones
Importancia de la vegetación en el control de inundacionesJuan Carlos Valdelamar Villegas
 
Términos de Referencia - TDR
Términos de Referencia - TDRTérminos de Referencia - TDR
Términos de Referencia - TDRCOEECI
 
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTES
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTESELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTES
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTESOswaldo Olaya
 

Destaque (20)

Tdr documentacion
Tdr documentacionTdr documentacion
Tdr documentacion
 
Tdr2
Tdr2Tdr2
Tdr2
 
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10
Medidas de mitigación a las problemáticas del cambio climático - equipo wiki10
 
Tesis en TDX-TDR
Tesis en TDX-TDRTesis en TDX-TDR
Tesis en TDX-TDR
 
Proposta TDR
Proposta TDRProposta TDR
Proposta TDR
 
Leptospirosis
LeptospirosisLeptospirosis
Leptospirosis
 
Tdr terminos de_referencia
Tdr terminos de_referenciaTdr terminos de_referencia
Tdr terminos de_referencia
 
Terminos de referencia
Terminos de referenciaTerminos de referencia
Terminos de referencia
 
Research Papers Recommender based on Digital Repositories Metadata
Research Papers Recommender based on Digital Repositories MetadataResearch Papers Recommender based on Digital Repositories Metadata
Research Papers Recommender based on Digital Repositories Metadata
 
Tdr tesis doctoral
Tdr tesis doctoralTdr tesis doctoral
Tdr tesis doctoral
 
Como venderle al_estado_2014 abril
Como venderle al_estado_2014 abrilComo venderle al_estado_2014 abril
Como venderle al_estado_2014 abril
 
Tdr termino de referencia 4 c2
Tdr termino de referencia 4 c2Tdr termino de referencia 4 c2
Tdr termino de referencia 4 c2
 
Presentació tdr
Presentació tdrPresentació tdr
Presentació tdr
 
Dengue
DengueDengue
Dengue
 
Importancia de la vegetación en el control de inundaciones
Importancia de la vegetación en el control de inundacionesImportancia de la vegetación en el control de inundaciones
Importancia de la vegetación en el control de inundaciones
 
Términos de Referencia - TDR
Términos de Referencia - TDRTérminos de Referencia - TDR
Términos de Referencia - TDR
 
Terminos de referencia pip
Terminos de referencia pipTerminos de referencia pip
Terminos de referencia pip
 
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTES
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTESELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTES
ELABORACION DE EETT Y TDR PARA COMPRAS EFICIENTES
 
Como escribir términos de referencia
Como escribir términos de referenciaComo escribir términos de referencia
Como escribir términos de referencia
 
Estructura TDR
Estructura TDREstructura TDR
Estructura TDR
 

Semelhante a 10 años de repositorios cooperativos

Experiencias con software libre en repositorios de e-información
Experiencias con software libre en repositorios de e-informaciónExperiencias con software libre en repositorios de e-información
Experiencias con software libre en repositorios de e-informaciónRicard de la Vega
 
Aspectos gerenciales de una red de preservación digital distribuída
Aspectos gerenciales de una red de preservación digital distribuídaAspectos gerenciales de una red de preservación digital distribuída
Aspectos gerenciales de una red de preservación digital distribuídaCariniana Rede
 
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)Joseba Abaitua
 
8 bibliotecas digitales nube_felipe_gomez_colombia
8 bibliotecas digitales nube_felipe_gomez_colombia8 bibliotecas digitales nube_felipe_gomez_colombia
8 bibliotecas digitales nube_felipe_gomez_colombiaJuan Piizz Z
 
Construir Bibliotecas Virtuales: la Nueva Alejandría. Por Lourdes Feria
Construir Bibliotecas Virtuales:  la Nueva Alejandría. Por Lourdes FeriaConstruir Bibliotecas Virtuales:  la Nueva Alejandría. Por Lourdes Feria
Construir Bibliotecas Virtuales: la Nueva Alejandría. Por Lourdes FeriaLourdes Feria
 
Catalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasCatalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasAna Ordás
 
Colecciones digitales en bibliotecas universitarias
Colecciones digitales en bibliotecas universitariasColecciones digitales en bibliotecas universitarias
Colecciones digitales en bibliotecas universitariasDidac Margaix
 
Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2RIBDA 2009
 
Servicios de datos para todo el ciclode investigación
Servicios de datos para todo el ciclode investigaciónServicios de datos para todo el ciclode investigación
Servicios de datos para todo el ciclode investigaciónRicard de la Vega
 
Creación Y Desarrollo De Colecciones Digitales
Creación Y Desarrollo De Colecciones DigitalesCreación Y Desarrollo De Colecciones Digitales
Creación Y Desarrollo De Colecciones DigitalesOCLC LAC
 
Actividad teórico paquetes especializados
Actividad teórico paquetes especializadosActividad teórico paquetes especializados
Actividad teórico paquetes especializadosmilebote
 
Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Fernando-Ariel Lopez
 
Preservación digital: estándares y buenas prácticas
Preservación digital: estándares y buenas prácticasPreservación digital: estándares y buenas prácticas
Preservación digital: estándares y buenas prácticasLibio Huaroto
 
2016 unesp-tic-bibliotecas
2016 unesp-tic-bibliotecas2016 unesp-tic-bibliotecas
2016 unesp-tic-bibliotecasErnest Abadal
 
TIC y bibliotecas: situación actual y perspectivas
TIC y bibliotecas: situación actual y perspectivasTIC y bibliotecas: situación actual y perspectivas
TIC y bibliotecas: situación actual y perspectivasErnest Abadal
 

Semelhante a 10 años de repositorios cooperativos (20)

Experiencias con software libre en repositorios de e-información
Experiencias con software libre en repositorios de e-informaciónExperiencias con software libre en repositorios de e-información
Experiencias con software libre en repositorios de e-información
 
Repositorios en la nube
Repositorios en la nubeRepositorios en la nube
Repositorios en la nube
 
Aspectos gerenciales de una red de preservación digital distribuída
Aspectos gerenciales de una red de preservación digital distribuídaAspectos gerenciales de una red de preservación digital distribuída
Aspectos gerenciales de una red de preservación digital distribuída
 
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
 
Presentació Eureca.pdf
Presentació Eureca.pdfPresentació Eureca.pdf
Presentació Eureca.pdf
 
8 bibliotecas digitales nube_felipe_gomez_colombia
8 bibliotecas digitales nube_felipe_gomez_colombia8 bibliotecas digitales nube_felipe_gomez_colombia
8 bibliotecas digitales nube_felipe_gomez_colombia
 
Construir Bibliotecas Virtuales: la Nueva Alejandría. Por Lourdes Feria
Construir Bibliotecas Virtuales:  la Nueva Alejandría. Por Lourdes FeriaConstruir Bibliotecas Virtuales:  la Nueva Alejandría. Por Lourdes Feria
Construir Bibliotecas Virtuales: la Nueva Alejandría. Por Lourdes Feria
 
Catalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas IberoamericanasCatalogo Colectivo de Filmotecas Iberoamericanas
Catalogo Colectivo de Filmotecas Iberoamericanas
 
Colecciones digitales en bibliotecas universitarias
Colecciones digitales en bibliotecas universitariasColecciones digitales en bibliotecas universitarias
Colecciones digitales en bibliotecas universitarias
 
Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2
 
Servicios de datos para todo el ciclode investigación
Servicios de datos para todo el ciclode investigaciónServicios de datos para todo el ciclode investigación
Servicios de datos para todo el ciclode investigación
 
Servicios de datos para todo el ciclo de la investigación
Servicios de datos para todo el ciclo de la investigaciónServicios de datos para todo el ciclo de la investigación
Servicios de datos para todo el ciclo de la investigación
 
La Aplicacion De Las Directrices Driver
La Aplicacion De Las Directrices DriverLa Aplicacion De Las Directrices Driver
La Aplicacion De Las Directrices Driver
 
El reto de la interoperabilidad en las IDE
El reto de la interoperabilidad en las IDEEl reto de la interoperabilidad en las IDE
El reto de la interoperabilidad en las IDE
 
Creación Y Desarrollo De Colecciones Digitales
Creación Y Desarrollo De Colecciones DigitalesCreación Y Desarrollo De Colecciones Digitales
Creación Y Desarrollo De Colecciones Digitales
 
Actividad teórico paquetes especializados
Actividad teórico paquetes especializadosActividad teórico paquetes especializados
Actividad teórico paquetes especializados
 
Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬
 
Preservación digital: estándares y buenas prácticas
Preservación digital: estándares y buenas prácticasPreservación digital: estándares y buenas prácticas
Preservación digital: estándares y buenas prácticas
 
2016 unesp-tic-bibliotecas
2016 unesp-tic-bibliotecas2016 unesp-tic-bibliotecas
2016 unesp-tic-bibliotecas
 
TIC y bibliotecas: situación actual y perspectivas
TIC y bibliotecas: situación actual y perspectivasTIC y bibliotecas: situación actual y perspectivas
TIC y bibliotecas: situación actual y perspectivas
 

Mais de Ricard de la Vega

The Research Portal of Catalonia: Growing more (information) & more (services)
The Research Portal of Catalonia: Growing more (information) & more (services)The Research Portal of Catalonia: Growing more (information) & more (services)
The Research Portal of Catalonia: Growing more (information) & more (services)Ricard de la Vega
 
Padicat: O archivo da web da Catalunha
Padicat: O archivo da web da CatalunhaPadicat: O archivo da web da Catalunha
Padicat: O archivo da web da CatalunhaRicard de la Vega
 
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...Ricard de la Vega
 
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...Ricard de la Vega
 
Quatre tuits sobre metodologies àgils
Quatre tuits sobre metodologies àgilsQuatre tuits sobre metodologies àgils
Quatre tuits sobre metodologies àgilsRicard de la Vega
 
Preservaçao digital de tese e dissertaçoes
Preservaçao digital de tese e dissertaçoesPreservaçao digital de tese e dissertaçoes
Preservaçao digital de tese e dissertaçoesRicard de la Vega
 
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...Analysis of requirements and benchmarking of CRIS for the Universities of Cat...
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...Ricard de la Vega
 
Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...Ricard de la Vega
 
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)Ricard de la Vega
 
De què parlem quan parlem de serveis al núvol?
De què parlem quan parlem de serveis al núvol?De què parlem quan parlem de serveis al núvol?
De què parlem quan parlem de serveis al núvol?Ricard de la Vega
 
El Portal de la Investigación de Catalunya, una suma de información de los CR...
El Portal de la Investigación de Catalunya, una suma de información de los CR...El Portal de la Investigación de Catalunya, una suma de información de los CR...
El Portal de la Investigación de Catalunya, una suma de información de los CR...Ricard de la Vega
 
The Catalan Research portal: collecting information from Catalan universities...
The Catalan Research portal: collecting information from Catalan universities...The Catalan Research portal: collecting information from Catalan universities...
The Catalan Research portal: collecting information from Catalan universities...Ricard de la Vega
 
Let's do data research work: the creation of a portal with research informati...
Let's do data research work: the creation of a portal with research informati...Let's do data research work: the creation of a portal with research informati...
Let's do data research work: the creation of a portal with research informati...Ricard de la Vega
 
Top ten-dències tecnològiques
Top ten-dències tecnològiquesTop ten-dències tecnològiques
Top ten-dències tecnològiquesRicard de la Vega
 
Infraestructures per dades de recerca
Infraestructures per dades de recercaInfraestructures per dades de recerca
Infraestructures per dades de recercaRicard de la Vega
 
Programari lliure en un centre gestor d'e-infrastructures, el CESCA
Programari lliure en un centre gestor d'e-infrastructures, el CESCAProgramari lliure en un centre gestor d'e-infrastructures, el CESCA
Programari lliure en un centre gestor d'e-infrastructures, el CESCARicard de la Vega
 
Papel de la infraestructura tecnológica en el movimiento de los repositorios
Papel de la infraestructura tecnológica en el movimiento de los repositoriosPapel de la infraestructura tecnológica en el movimiento de los repositorios
Papel de la infraestructura tecnológica en el movimiento de los repositoriosRicard de la Vega
 

Mais de Ricard de la Vega (20)

The Research Portal of Catalonia: Growing more (information) & more (services)
The Research Portal of Catalonia: Growing more (information) & more (services)The Research Portal of Catalonia: Growing more (information) & more (services)
The Research Portal of Catalonia: Growing more (information) & more (services)
 
Visualització de dades
Visualització de dadesVisualització de dades
Visualització de dades
 
Visualització de dades
Visualització de dadesVisualització de dades
Visualització de dades
 
Padicat: O archivo da web da Catalunha
Padicat: O archivo da web da CatalunhaPadicat: O archivo da web da Catalunha
Padicat: O archivo da web da Catalunha
 
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...
La conservació digital d'obres cinematpgràfiques: un projecte del CSUC pel Ce...
 
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...
Technical Challenges and Approaches to Build an Open Ecosystem of Heterogeneo...
 
Quatre tuits sobre metodologies àgils
Quatre tuits sobre metodologies àgilsQuatre tuits sobre metodologies àgils
Quatre tuits sobre metodologies àgils
 
Preservaçao digital de tese e dissertaçoes
Preservaçao digital de tese e dissertaçoesPreservaçao digital de tese e dissertaçoes
Preservaçao digital de tese e dissertaçoes
 
Informàtic
InformàticInformàtic
Informàtic
 
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...Analysis of requirements and benchmarking of CRIS for the Universities of Cat...
Analysis of requirements and benchmarking of CRIS for the Universities of Cat...
 
Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...
 
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)
Preservaçao digital distribuída de um repositório de teses de doutorado (TDX)
 
De què parlem quan parlem de serveis al núvol?
De què parlem quan parlem de serveis al núvol?De què parlem quan parlem de serveis al núvol?
De què parlem quan parlem de serveis al núvol?
 
El Portal de la Investigación de Catalunya, una suma de información de los CR...
El Portal de la Investigación de Catalunya, una suma de información de los CR...El Portal de la Investigación de Catalunya, una suma de información de los CR...
El Portal de la Investigación de Catalunya, una suma de información de los CR...
 
The Catalan Research portal: collecting information from Catalan universities...
The Catalan Research portal: collecting information from Catalan universities...The Catalan Research portal: collecting information from Catalan universities...
The Catalan Research portal: collecting information from Catalan universities...
 
Let's do data research work: the creation of a portal with research informati...
Let's do data research work: the creation of a portal with research informati...Let's do data research work: the creation of a portal with research informati...
Let's do data research work: the creation of a portal with research informati...
 
Top ten-dències tecnològiques
Top ten-dències tecnològiquesTop ten-dències tecnològiques
Top ten-dències tecnològiques
 
Infraestructures per dades de recerca
Infraestructures per dades de recercaInfraestructures per dades de recerca
Infraestructures per dades de recerca
 
Programari lliure en un centre gestor d'e-infrastructures, el CESCA
Programari lliure en un centre gestor d'e-infrastructures, el CESCAProgramari lliure en un centre gestor d'e-infrastructures, el CESCA
Programari lliure en un centre gestor d'e-infrastructures, el CESCA
 
Papel de la infraestructura tecnológica en el movimiento de los repositorios
Papel de la infraestructura tecnológica en el movimiento de los repositoriosPapel de la infraestructura tecnológica en el movimiento de los repositorios
Papel de la infraestructura tecnológica en el movimiento de los repositorios
 

10 años de repositorios cooperativos

  • 1. 10 años de repositorios cooperativos Ricard de la Vega Jefe del Servicio de Portales y Repositorios Centre de Supercomputació de Catalunya 4as. Jornadas OS-Repositorios Barcelona, 3-5 marzo de 2010
  • 2. Un taller en 5 partes Las diferentes fases que han vivido los repositorios cooperativos Lluís M. Anglada Actuaciones llevadas a cabo en estos 10 años para llenarlos de contenido Sandra Reoyo Experiencia de la UPF como participante en estos repositorios y con uno institucional Anna Casaldàliga Infraestructura técnica en que se han desarrollado y han evolucionado Ricard de la Vega Los retos a los que se enfrentan los repositorios cooperativos Lluís M. Anglada
  • 3. Centre de Supercomputació de Catalunya Consorcio público Creado en 1991 Formado por: • Generalitat de Catalunya • Fundació Catalana per a la Recerca i la Innovació • 9 universidades catalanas • Consejo Superior de Investigaciones Científicas Anella Científica creada en 1993
  • 5. Índice Introducción Software • ETD-db (TDR) • DSpace (RECERCAT, MDX) • Open Journal Systems (RACO) • CONTENTdm (MDC) Hardware • 2001 2010 Conclusiones
  • 6. Software Se ha hecho un estudio inicial para cada repositorio con el objetivo de conocer qué software sería el más adecuado en cada caso La mayoría de repositorios son software de código abierto, hecho que ha permitido, entre otras ventajas, la adaptación a las necesidades concretas de cada proyecto Interoperatividad a través de OAI-PMH • Proveedores de datos • Proveedores de servicios
  • 7. ETD-db (2000, TDR) Gestión de contenidos ETD-db • Proyecto de colaboración entre: − Graduate School at Virginia Tech − Digital Library and Archives (DLA) − National Digital Library of Thesis and Disertations (NDLTD) • 1 instancia de ETD-db para cada institución Indexación y publicación Glimpse y Webglimpse • Consultas globales al repositorio Módulo para la exportación por OAI-PMH y de estadísticas Desde 2007, recolector de tesis españolas Módulo MetaIndex + librerías X-Server de Ex Libris
  • 8. DSpace (2005, RECERCAT; 2009, MDX) Software para repositorios digitales Desarrollado por MIT i HP Actualmente bajo DURASPACE Software de código abierto Unas 700 instalaciones OLD Dominion University plugin para la recolección por OAI-PMH Desarrollos propios • Módulo de estadísticas • Herramienta de importación desde REPEC
  • 9. Open Journal Systems (2006, RACO) Herramienta para la gestión editorial + repositorio Public Knowledge Project (PKP) • Simon Fraser University Library • School of Education at Stanford University • Simon Fraser University • Faculty of Education at the University of British Columbia Software de código abierto Casi 3.000 instalaciones (1-N revistas) Desarrollos propios • Módulo de publicación simplificado • Módulo de gestión de instituciones • Módulo de estadísticas
  • 10. CONTENTdm (2006, MDC) Gestor de colecciones digitales Online Computer Library Center (OCLC) Licencia privativa basada en el número de documentos Unas 1.400 instalaciones Las colecciones pueden estar formadas por diferentes tipos de ficheros: imágenes, pdf, audio, video... Extensión OCR para colecciones digitalizadas. Permite incluir el transcript
  • 11. Más allá del software de base... Adaptación del software de base • Diseño gráfico, traducciones y adaptación de textos • Configuración de parámetros (stop words…) • Corrección de errores • Ampliación de funcionalidades (diacríticos…) Instalación de módulos o plugins • Para la exportación o importación OAI-PMH, Manakin… Desarrollo de módulos propios • Estadísticas, ingesta masiva de datos, módulos de RACO… Software complementario • Intranets, páginas de novedades, herramientas de monitorización…
  • 12. Índice Introducción Software • ETD-db (TDR) • DSpace (RECERCAT, MDX) • Open Journal Systems (RACO) • CONTENTdm (MDC) Hardware • 2001 2010 Conclusiones
  • 13. Hardware 2001 2005 2006 2006 2009 ~80 GB y 7.690 consultas HP V2500 (cálculo) • 16 procesadores • 4 GB de memoria • 227 GB de disco StorageTek TimberWolf 9740 • 2,7 TB en cintas
  • 14. Hardware 2001 2005 2006 2006 2009 En 2003 ~100 GB y 278.710 consultas HP rp5430 (servidor) • 2 procesadores PA8700 • 704 GB de memoria HP EVA V.2 (cabina de discos) • 2,8 TB de disco StorageTek TimberWolf 9740 • 5 TB en cintas
  • 15. Hardware 2001 2005 2006 2006 2009 En 2010 ~2 TB y 8.019.930 consultas (TDR+RECERCAT+RACO) Clúster de e-Información • 32 nodos Proliant DL360 • 291 GB de memoria NetApp FAS3140 • 100 TB de disco ADIC Scalar i2000 • 156 TB en cintas
  • 16. Hardware en 2010 Escalable Repositorios Alta disponibilidad Balanceo de carga Balanceadores … Virtualización … Servicios Nodos dedicados GAIA (3) … PADICAT (7) Metalib (1) Datos MDC (1) … Entorno de desarrollo Entorno de preproducción Entorno de producción Red de almacenamiento
  • 17. Índice Introducción Software • ETD-db (TDR) • DSpace (RECERCAT, MDX) • Open Journal Systems (RACO) • CONTENTdm (MDC) Hardware • 2001 2010 Conclusiones
  • 18. Conclusiones Con la cooperación se consigue: Adopción de procedimientos comunes Mayor visibilidad … Economías de escala • En software • En hardware • En el equipo humano