Balance sobre la aplicación de la tecnología del cloud computing en el ámbito de la ciencia
Ignacio Blanquer, Departamento de Sistemas Informáticos. Universidad Politécnica de Valencia.
Jornada 'El impacto de la Nube y el Big Data en la Ciencia'
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
La e-investigación en España
1. La e-Investigación en España
Ignacio Blanquer - iblanque@dsic.upv.es
Universidad Politécnica de Valencia
1
2. Presentación
• Ignacio Blanquer es profesor titular de la Escuela Superior de
Ingeniería Informática.
• Pertenece al grupo de investigación en Grid y Computación de
Altas Prestaciones, fundado por el profesor Vicente
Hernández, desde hace casi 20 años.
• Su principal actividad investigadora se ha concentrado en la
aplicación de estas tecnologías en el ámbito de la salud.
• Es además:
– Investigador del Instituto de Instrumentación para Imagen
Molecular (I3M).
– Responsable de aplicaciones del proyecto VENUS-C y del
área de aplicaciones de la Red Española de e-Ciencia.
– Miembro de los grupos de investigación multidisciplinares
2
GIBI230 y HPC4NGS.
3. “Disclaimer”
• Esta presentación pretende hacer un repaso
inevitablemente incompleto de la actividad de e-
Ciencia en España que se ha constatado a través
de la Red Española de e-Ciencia.
• La presentación contiene numerosas
transparencias y datos producidos por otros
investigadores españoles.
• No obstante, las conclusiones y opiniones son
enteramente personales.
3
4. Contenido
• E-Ciencia y conceptos asociados
• Panorama Europeo
– Infraestructuras Computacionales: EGI, PRACE, GEANT,
HelixNebula.
– El futuro próximo: Horizonte 2020.
• Posición Española
– E-Infraestructuras: IBERGRID, RES, RedIRIS, Centros
Autonómicos.
– Usuarios: La Red de e-Ciencia.
• Conclusiones.
4
6. E-Science as “enhanced” Science
El Concepto de la e-Ciencia
• "e-Science is about
global collaboration in
key areas of science, and
the next generation of
infrastructure that will
enable it.“
• "e-Science will change
the dynamic of the way
science is undertaken.“
John Taylor
Director General of Research Councils
Office of Science and Technology
6
7. El cuarto paradigma
El Concepto de la e-Ciencia
• En el milenio pasado, la ciencia era empírica:
– Descripción de fenómenos naturales.
• Hace unos pocos siglos se inicia la aproximación teórica
– Uso de modelos, fórmulas y generalizaciones. 2
.
c2
• En las últimas décadas aparece la rama a 4 G
a 3 a2
computacional
– Simulación de fenómenos complejos
• En la actualidad se centra en la exploración de los datos:
(e-Ciencia)
– Unificación de teoría, experimentación y simulación
– Captura masiva de datos mediante instrumentos o generada
mediante simulación y Procesada por computador.
– Conocimiento e información almacenada digitalmente.
– Científicos analizando bases de datos y ficheros en infraestructuras de datos.
Jim Gray, National Research Council, http://sites.nationalacademies.org/NRC/index.htm;
7
Computer Science and Telecommunications Board, http://sites.nationalacademies.org/cstb/index.htm.
8. e-Ciencia como una nueva visión de la Ciencia
El Concepto de la e-Ciencia
Technology push
Application pull
networking value added of
grids distributed collaborative
instrumentation research (virtual
computing communities)
data curation…
••• 8
• Large challenges with large
social impact
• The famous “Data deluge”
• Interdisciplinarity.
• Virtual Research
Communities.
Source: Mario Campolargo, Former Head of Unit
on e-Infrastructures, European Commission
9. Las e-Infraestructuras
Conceptos Asociados
• Según el e-IRG: “The term e-Infrastructure refers to this new
research environment in which all researchers - whether working in
the context of their home institutions or in national or multinational
scientific initiatives - have shared access to unique or distributed
scientific facilities (including data, instruments, computing and
communications), regardless of their
type and location in the world.”
• En este modelo encontramos
sistemas para el descubrimiento
de recursos, la gestión de datos
distribuida, la monitorización
de recursos y aplicaciones,
la gestión eficiente de los
recursos y la seguridad.
9
10. Las e-Infraestructuras
Conceptos Asociados
• Diferenciación de infraestructuras en e-ciencia
Data
H
Capability computing P Petaflop Supercomputers
C
Data
Grid of Supercomputers
Data
H
Capacity computing T Grid of dedicated
C clusters & computers
Data
Desktop Grids
10
11. Middleware
Conceptos Asociados
• Conjunto de aplicaciones y servicios que
permiten utilizar de forma coordinada y eficiente
las e-Infraestructuras
– Se sitúa entre el sistema operativo y las
aplicaciones.
• Federa identidades
• Gestiona el acceso remoto
• Equilibra la carga
• Indexa los datos
• Federa los recursos
• Monitoriza el sistema
• Virtualiza los recursos
• Autoriza el acceso
• Facilita la programación de
aplicaciones
11
12. Science Gateways
Conceptos Asociados
• Las e-Infraestructuras a veces ofrecen interfaces complejos o poco
amigables
– La adaptación de las aplicaciones requiere un conocimiento de los recursos y del
middleware.
• Los Science
Gateways facilitan
el acceso y uso de
las e-infraestructuras
automatizando
procesos y ofreciendo
interfaces amigables
– Como consecuencia se
puede perder
flexibilidad.
12
13. Organizaciones Virtuales - Virtual Organizations
Conceptos Asociados
• Conjunto de usuarios de • Internacionales
diferentes organizaciones – Atlas, biomed, embrace, compchem,
reales que colaboran auger, planck,…
– Técnicamente son listados de • Nacionales
identificadores de usuarios y – ict.vo.ibergrid.eu, life.vo.ibergrid.eu,
los roles asociados. earth.vo.ibergrid.eu,…
• La pertenencia a una VO
define a grosso modo los
recursos a los que un
usuario puede acceder.
13
15. La e-Ciencia como una apuesta internacional
Situación en Europa
• El Consejo de Liubliana de 2008 definió una nueva visión del
Espacio Europeo de Investigación (ERA -
http://ec.europa.eu/research/era) basada en la libre circulación del
conocimiento (la «quinta libertad»).
• El informe Aho de mayo de 2008 subrayaba la importancia de
desarrollar unas infraestructuras que permitan divulgar la ciencia
por medios electrónicos (la e-ciencia).
• Infraestructuras y retos científicos a gran escala que transcienden la
capacidad individual de los países.
• En 2008 se crea el e-IRG (e-Infrastructure Reflection Group -
http://www.e-irg.eu), para crear un marco político, tecnológico y
administrativo para el uso compartido y eficiente de
infraestructuras electrónicas distribuidas en Europa
– Recientemente publica la 4º versión de su roadmap.
15
16. Marco Estratégico – Hacia el Liderazgo Mundial en e-Ciencia
Situación en Europa
• La “Communication from the European Commission on ICT Infrastructures for e-
Science (COM (2009)” de la Unión Europea define un plan para alcanzar el
liderazgo en e-Ciencia a través del desarrollo de un conjunto de e-Infraestructuras
y su explotación para promover la innovación.
– La inversión en infraestructuras electrónicas representa una oportunidad para fomentar
el crecimiento y el empleo, así como para impulsar un nuevo renacimiento científico.
– El crecimiento en el rendimiento de los equipos informáticos permite responder a las
nuevas necesidades de modelización y simulación informáticas de ciertos sectores, tales
como la investigación sobre el cambio climático o la asistencia sanitaria selectiva.
• Sus conclusiones fueron:
– GÉANT debe seguir aumentando su rendimiento,
– Se anima a las empresas a que utilicen los Grids de e-ciencia europeos.
– Impulso de las iniciativas Grid nacionales creadas por los estados miembros e
interacción a nivel internacional.
– Mejora del acceso a la información científica.
– Nueva generación de servicios de supercomputación en la escala exa en 2020.
– Impulsar la explotación de las infraestructuras por los Estados Miembros con el objetivo
de alojar a las comunidades científicas virtuales mundiales. 16
17. Grid Computing – Iniciativa Europea de Grid (EGI)
Situación en Europa
• Participan 332 Organizaciones de 58 Países.
• Alcanza los 320.000 Cores y 152 PBytes.
– VOs para la Resolución de Grandes Problemas en las
Áreas de Física de Altas Energías, Biocomputación,
Geofísica, Astrofísica.
• 1.700.000 trabajos
diarios y 20.000 usuarios
registrados.
• España participa a través
de la Iniciativa nacional
de Grid. http://www.egi.eu 17
18. PRACE (Partnership for Advanced Computing in Europe)
Situación en Europa
• PRACE es una iniciativa dirigida a fortalecer el uso de
infraestructuras de supercomputación para permitir alcanzar un
impacto importante en la investigación básica y aplicada.
• PRACE se estructura en varios niveles (tiers) siendo el tier 0 el
que aporta los recursos de mayor envergadura.
• En PRACE participan 25 países miembros y el tier 0 está formado
por 4 países y seis equipos.
– BSC (España), CINECA (Italia), GCS (Alemania)
y GENCI (Francia).
• Conjuntamente aportan una potencia
sostenida de más de 11,5 Pflops y casi 1M de
cores (943.616) con 6 computadores en las
posiciones 5, 6, 7, 9, 11, 27 y 36 de la lista TOP500 (www.top500.org).
18
19. Redes de Comunicaciones - GEANT
Situación en Europa
• GÉANT es la red de investigación
y educación paneuropea que
conecta las redes nacionales
europeas de investigación y
educación (NRENs).
• GÉANT une más de 40 millones
de investigadores y estudiantes
en Europa y permite el acceso
de banda ancha a diferentes
recursos singulares para física de
altas energías, radio astronomía,
biomedicina, cambio climático,
observación de la tierra, arte,
etc.
• GÉANT está parcialmente
fundada por la Comisión
Europea.
19
20. Cloud computing
Situación en Europa
• El cloud computing se asocia más a un modelo de
negocio en la provisión de recursos.
• Con un impacto enorme en el sector industrial (especialmente
PYMES), su aplicación científica está despegando con la inclusión de
nuevos servicios.
• Enfocado a la • Enfocado a la “gran ciencia”
”long-tail of scientists” − Consorcio entre grandes
− Experiencia piloto en actores científicos y grandes
el desarrollo de un stack de componentes para empresas para avanzar en la
aplicaciones científicas en infraestructuras cloud provisión sostenible de recursos de
públicas o privadas. computación en la nube.
− 27 aplicaciones, 2 Millones de horas*core, − Tres casos de uso: Física de Altas Energías,
componentes de código abierto para ejecución de Genómica y Observación de la Tierra.
workflows, acceso a datos, contabilidad, seguridad. − En fase de definición y exploración.
− Soportando los estándares industriales.
20
21. Un ecosistema de soluciones
Situación en Europa
Grids Supercomputers
Entorno Colaborativo Escasos
Recursos Distribuidos (político/sociológico) Redes de interconexión de baja latencia
Commodity hardware Admisión bajo revisión científica
Gestión de Datos Aplicaciones altamente acopladas
Interfaces complejos Interfaces de acceso tradicionales
No existe una única
solución para todos
Clouds los problemas Computación Voluntaria
Gestión basada en la economía de escala Acceso simplificado a millones de CPUs
Commodity hardware Problemas de latencia y transmisión de datos
Virtualización para la previsión de servicios Entornos difícilmente controlables
Detalles de la infraestructura física ocultos Implica una participación activa
Interfaces simplificados Interfaces complejos
La interoperabilidad entre las infraestructuras podrían permitir el desarrollo de
aplicaciones heterogéneas que aprovechen lo mejor de cada una
21
Fuente: Ian Bird, CERN
22. El futuro: Horizonte2020
Situación en Europa
• Se espera un incremento del 46% del presupuesto (para 2014–20).
• Las iniciativas “Horizon 2020”, “Digital Agenda for Europe” e
“Innovation Union” proponen una actuación cohesionada:
– alcanzar el liderazgo mundial en la e-ciencia;
– consolidar infraestructuras electrónicas;
– explotar estas infraestructuras electrónicas para impulsar la innovación.
• Énfasis en servicios innovadores, “digital curation”, acceso abierto,
interoperabilidad y un mayor enfoque centrado en el usuario
– Mejora de la relación entre usuarios y proveedores de servicios
– Apostar por el desarrollo de las e-infraestructuras de datos.
– Impulsar el diálogo y transferencia tecnológica con industria (especialmente
PYMES).
– Extender el rol de las e-infraestructuras a nuevas comunidades y requerimientos.
– Afrontar los problemas medioambientales de las infraestructuras.
22
24. ES-NGI: Infraestructura Nacional de Grid
Infraestructuras Grid en España
• ES-NGI es la Infraestructura Nacional de Grid en España (www.es-
ngi.es).
• La componen actualmente 28 centros, aportando 17.690 cores y con
más de 100 usuarios registrados.
• La NGI española opera desde 2010
– Misión
• Dar soporte a los investigadores a través a infraestructuras de computación
distribuídas, y que provea de acceso uniforme a recursos de computación,
almacenamiento y datos.
– Objetivo
• Conectar a investigadores de todas las disciplinas con servicios ICT innovativos
que les ayuden a llevar a cabo sus proyectos de investigación.
– Promueve la internacionalización
• Formando parte de una Federación Europea de recursos digitales, EGI.
• Opera de forma federada con la iniciativa Portuguesa de Grid.
24
25. IBERGRID
Infraestructuras Grid en España
• IBERGRID es la federación de las iniciativas de grid nacionales
Española y Portuguesa.
EN IBERGRID HAY MÁS DE
24,000 CORES DE EJECUCIÓN Y
20 PETABYTES DE
ALMACENAMIENTO ONLINE
DEDICADOS A DAR SOPORTE A
COMUNIDADES DE USUARIOS EN
EL GRID
25
27. ES-NGI, Utilización: Comunidades Internacionales
Infraestructuras Grid en España
3000000 90000000
80000000
2500000
70000000
2000000 60000000
50000000
1500000 2011 2011
40000000
2012 2012
1000000 30000000
20000000
500000
10000000
0 0
Fusion Biomed Quimica Ingenieria ATLAS CMS LHCb
• 130 Millones de horas de CPU en el año 2011
– 13% en soporte a áreas de investigación ajenas al LHC
• 177 Millones de horas de CPU en el año 2012
– 18% en soporte a áreas de investigación ajenas al LHC
• Equivalente a 20,000 CPUs (KSI2K) constantemente ejecutando
– 65% de la infraestructura está provista por centros Tier del LHC
– 35% es infraestructura genérica. 27
28. Actividad no-LHC comparada con otras NGIs Europeas
Infraestructuras Grid en España
120 2
1.8
100
1.6
1.4
Millones de horas
80
1.2
60 1
0.8
40
0.6
0.4
20
0.2
0 0
Actividad en términos absolutos Crecimiento 2011/2012
28
29. Actividad Internacional
Infraestructuras Grid en España
LIFE • Astrofísica:
CHEM.IBERGRID
AUGER, CTA, MAGIC y parte
ICT.IBERGRID
(1M) de PHYS.ibergrid
MAGIC
IFIC
• Fusión: FUSION
ENG.IBERGRID • Química:
COMPCHEM COMPCHEM, CHEM.ibergrid
FUSION • Biología:
CTA BIOMED, LIFE.ibergrid
VO.EDGES
• Ingeniería:
BIOMED
ENG.ibergrid, ICT.ibergrid
PHYS.IBERGRID
AUGER
• Genéricos: PHYS.ibergrid, IFIC
y EDGES
0 1000000 2000000 3000000 4000000 5000000 6000000
• TOTAL = 15 millones KSI2K
29
30. Interacción con la Red Española de e-Ciencia
Infraestructuras Grid en España
• Canal de comunicación con los usuarios
– El entorno de la Red de e-Ciencia es un
Canal de información valioso entre la
Infraestructura y sus potenciales usuarios.
– Solamente en el UK existe un entorno
similar.
– Potencial para organizar
reuniones con los usuarios
• Comunicación con los
usuarios
– E-science network mailing list.
– Más de 450 personas suscritas.
30
31. Acceso a la Infraestructura ES-NGI
Infraestructuras Grid en España
• Usuarios de colaboraciones en
VOs internacionales
– Acceso a través de su propio
mecanismo de acceso a la VO
• ATLAS, CMS, COMPCHEM,
FUSION, BIOMED,…
• Usuarios nacionales
– Formulario de acceso a recursos con descripción de necesidades
– Información en: http://www.es-ngi.es/usuarios_acceso_ngi.php
– Acceso automático para proyectos de investigación financiados en
convocatorias competitivas.
• En otro caso, se evalúa según los recursos existentes
– Con el objetivo de hacer seguimiento más que limitar el acceso de
usuarios. 31
32. Estrategia para nuevos servicios de ES-NGI
Infraestructuras Grid en España
• Las infraestructuras distribuidas deben evolucionar:
– Datos; Creación y Gestión de Bases de Datos de manera eficiente.
– Acceso interactivo a recursos.
– Inclusión de nuevas arquitecturas (GPUs).
– Interoperación con otras plataformas digitales,….
• La tecnología Grid ha desarrollado un modelo de autenticación
digital, organización de usuarios en VOs, gestión distribuida de
datos, Monitorización global, etc…
• La evolución implica nuevos modos de acceso a la infraestructura:
– Utilización de la virtualización de servicios (software y hardware especializado)
– Acceso a recursos necesita ser más ágil.
– Ser capaces de desplegar nuevos servicios sobre infraestructuras en producción de
manera no disruptiva.
• El modo de producción Grid debe seguir.
– Muchos usuarios sin embargo encuentran actualmente sus necesidades cubiertas.
32
33. La Red Española de Supercomputación y los
Centros Autonómicos
33
34. Red Española de Supercomputación
Infraestructuras Supercomputación en España
• Compuesta por 8 centros y liderada por el BSC
– MareNostrum, MinoTauro en el Centro de Supercomputación de Barcelona.
– Magerit en el Centro de Supercomputación y Visualización de Madrid
(CeSViMa - UPM)
– LaPalma en el Instituto Astrofísico de Canarias (IAC)
– Altamira en el Instituto de Física de Cantabria (IFCA).
– Picasso en la Universidad
de Málaga.
– Tirant en la Universidad
de Valencia.
– Caesaraugusta en el
Instituto de Biocomputación
y Física de Sistemas
Complejos (BIFI) de la
Universidad de Zaragoza.
34
– Atlante en el Instituto Canario de Tecnología (ICT).
35. BSC – Mare Nostrum III
Infraestructuras Supercomputación en España
• Potencia Pico de 1 Petaflops.
• 48,448 cores Intel SandyBridge-EP E5-2670 a 2.6 GHz
(3,028 nodos).
• 94.625 TB de memoria principal
(32 GB/nodo).
• 1.9 PB de almacenamiento en disco.
• 2 Redes de Interconexión:
– Infiniband y Gigabit Ethernet.
• Sistema Operativo: Linux –
Distribuión SuSe.
35
36. El Resto de la RES
Infraestructuras Supercomputación en España
Altamira Caesaraugusta
3840 procesadores x86 512 procesadores PPC64
(Intel E5-2670) y 15TB de (IBM PowerPC 970) y 1TB de
RAM con un rendimiento de RAM y com um rendimiento
74 TFlops de 3Tflops
Marguerit2
3920 Procesadores PC64 Tirant
(IBM POWER7) y 7840 GB 2048 procesadores PPC64
RAM, con un rendimiento (IBM PowerPC 970MP)
de 72 Tflops y 4086 GB de RAM con un
rendimiento de 13 TFlops
Picasso Atlante
512 procesadores 336 procesadores
PPC64 (IBM PowerPC PPC64 (IBM PowerPC
970) y 1TB de RAM y 970) y 672 GB Picasso
un rendimiento de RAM, con un 512 procesadores PPC64
3Tflops rendimiento de 2 (IBM PowerPC 970) y 1TB
Tflops. de RAM y com um
rendimiento de 3Tflops
36
37. Centros Autonómicos de Supercomputación
Infraestructuras Supercomputación en España
• CESGA, Centro de Supercomputación de Galicia.
– Finis Terrae: 2,580 Procesadores Itanium, con una
Potencia Sostenida de 16 Tflop/s en 147 Nodos
NUMA con 20 TB de Memoria Compartida.
• CESCA, Centro de Supercomputación de Cataluña.
– Diversos equipos hasta 5 Tflops.
• FCSCL, Fundación Centro de Supercomputación de Castilla y León
– Caléndula, 304 nodos blade bi Xeon Qcore y 33TF.
• CénitS, Centro Extremeño de investigación, Innovación Tecnológica y
Supercomputación
– Lusitania, 128 procesadores Itanium dual-core.
• FPCMUR, Fundación Parque Científico de Murcia
– Ben Arabi, 192 nodos blade Xeon quad-core y 18 Tflops.
37
39. Participación Española en DCIs Europeos Call 7
Finalización
Mayo 2015
Mayo 2013
Abril 2013
Junio 2012
Junio 2012
Junio 2012
Junio 2012
39
40. Participación Española en DCIs Europeos Call 9
BSC, UPVL
Octubre 2013 C
1M€
Fecyt
Junio 2014 5M€
BIFI
Octubre 2014
4M€
BSC, RedIRI
BSC Noviembre 2014 S
Enero 2015 18,5M€ 16M€
UPM, BIFI
BSC Febrero 2014 1M€
Septiembre 2013 35M€
UPM, CSIC,
UCM Octubre 2014 UMA, IAC
Noviembre 2013 1,1M€ 3,5M€
BSC
RedIRIS Octubre 2014
Septiembre 2012 14M€
0,4M€
Alba
Octubre 2014 14M€
40
42. Grupos Participantes en la Red Española de e-Ciencia
Usuarios Españoles de infraestructuras de e-Ciencia
• Más de 1000 Investigadores.
• 101 Grupos de Investigación.
• 76 Instituciones.
• Estructura Dinámica
– Inicialmente se Inscribieron 68
Grupos.
Financiada por el anterior Ministerio de
Ciencia e Innovación a través de las ayudas
CAC-2007-52, ICTS-2008-12 e ICTS-2009-22
de las D.G. de Política Científica y el
Programa Nacional de Infraestructuras
Científico-Tecnológicas.
42
43. Incorporación de Nuevos Grupos a la Red
Usuarios Españoles de infraestructuras de e-Ciencia
101 Grupos de usuarios
76 Instituciones
1300 Usuarios mostraron su
interés, avalando los
grupos
455 Usuarios inscritos en la
Red
>50 Mensajes por mes en
la lista
43
44. Distribución por Áreas de las Aplicaciones y Pilotos
Usuarios Españoles de infraestructuras de e-Ciencia
• Tras las dos llamadas, realizadas en octubre
de 2008 y julio de 2010, se han obtenido 25
Aplicaciones, 26 Pilotos y 12 Grupos de Soporte
– 28 Aplicaciones / pilotos han rellenado la Información en el Wiki.
– 35 Constituyen nuevos proyectos de e-Ciencia que no se habían
iniciado anteriormente.
3 1 Biomedicina/Salud
10
5
Astrofísica/Astronomía
5 Física de Altas Energías
6 Química Computacional
Ingeniería
Ciencias de la Tierra
10 6
TIC
5
Fusión
Archivos
44
45. La Física de Altas Energías – El Large Hadron Collider
Usuarios Españoles de infraestructuras de e-Ciencia
• The Compact Muon Solenoid • International Linear Collider (ILC)
Experiment (CMS) – Instituto de Física de Cantabria.
– Port d’Informació Científica. • Lattice QCD (LQCD)
– Instituto de Física de Cantabria. – Physics Institute of Cantabria.
– CIEMAT. – Univ. Autónoma de Madrid.
– Univ. Autónoma de Madrid . – Univ. deZaragoza
– Univ. of Oviedo.
• Evaluación de sectores observables del
• Large Hadron Collider beauty bosón de Higgs (FeynHiggs)
experiment (LHCb) – Instituto de Física de Cantabria.
– Univ. de Barcelona.
– Univ. de Santiago de Compostela.
– Port d’Innovació Científica.
• A Toroidal LHC ApparatuS (ATLAS)
– Instituto de Física Corpuscular (IFIC).
– Instituto de Física de Altas Energías (IFAE).
– Univ. Autónoma de Madrid.
– Port d’Informació Científica (PIC).
45
46. VPH (Virtual Physiological Human)
Usuarios Españoles de infraestructuras de e-Ciencia
• Iniciativa internacional financiada en el FP7 Ayla-Red (BSC)
con más de 200 M€
– Orientada hacia la simulación integral de
sistemas, órganos y enfermedades.
– Gran necesidad computacional (alianzas con
DEISA, PRACE, MAPPER, EGI, etc.)
– Participación española en 15/36 proyectos VPH de
las últimas 4 llamadas del FP7
• MOSAIC, AIRPROM, EUCOGIII, NEOMARK, DISCI
PULUS, PREDICT, SYNERGY-COPD, P- E-IMRT (CESGA)
MEDICINE, VPH-
SHARE, INBIOMEDVISION, INTEGRATE, MYSPINE,
EUHEART y ACTION-GRID
• Importante historia previa en el FP6, con
proyectos como @neurist, ACGT, etc. 46
47. Ciencias de la Vida
Usuarios Españoles de infraestructuras de e-Ciencia
• Gran impacto en el análisis genómico y
proteómico y la simulación bioquímica
– Colaboración en la iniciativa WISDOM (Wide
in Silico Docking in Malaria)
• 80 años de CPU en 6 semanas.
• Clave en la Bioinformática moderna
WISDOM
– P.e. ELIXIR ESFRI
• Compuesto por actores clave en el
análisis de datos
(CNIO, CRG, CIPF, IRB, UMA, BSC, CNB, IM
IM, UPF, CNAG)
• Interés en el desarrollo y transferencia a
la comunidad de servicios de alto nivel
MoDEL, CellBase, CentrosomeDB, ABS, H cellBase / genomemaps - CIPF
47
CAD, etc. y en el alojamiento del
48. Química Computacional
Usuarios Españoles de infraestructuras de e-Ciencia
• La comunidad Virtual “compchem” supone el 5% de toda la
actividad no LHC de EGI (con 13.000M de horas normalizadas
SI2K).
– 7% se ha ejecutado en España y Portugal.
• Grid Empowered Molecular Simulator (GEMS)
– Toolkit desarrollado en la EHU, con un uso
sostenido de 5M de horas anuales.
• Spanish Initiative for Electronic Simulations with
Thousand of Atoms (SIESTA)
– Método y código para resolver numéricamente las
ecuaciones mecanocuánticas que gobiernan el
comportamiento de los electrones.
– Diseñado para explotar recursos HPC.
– The SIESTA method for ab initio order-N materials simulation (3608 citas)
48
49. Ingeniería - Mecánica
Usuarios Españoles de infraestructuras de e-Ciencia
• Modelado de flujos • Simulación del campo electromagnético de gran
turbulentos escala
– Base de datos de – PRACE Award 2009 – “High
Turbulencia de la UPM. scalability multipole method.
• Aplicaciones aerospaciales Solving half billion of unknowns”.
y en motores. • CESGA – UEX – UVIGO.
• Simulación de inyección en • Análisis estático y dinámico en la simulación de
motores diesel (CMT) estructuras de edificación
– OpenFOAM, openWAN. – Integración en un código existente (Architrave) de
servicios Grid y cloud:
– En 2D, 98% tiempo de
• Reducción en 25 veces del tiempo de proceso.
cálculo es la química.
• Decremento del coste constructivo.
– Innovación:
• Se transfiere el servicio a una plataforma cloud pública
• Un análisis completo
supone un coste
de 3.38 €.
49
50. Fusión
Usuarios Españoles de infraestructuras de e-Ciencia
• Liderado por el CIEMAT.
7000000
• Numerosos códigos portados a Grid y HPC 6000000
5000000
– Pioneros del Grid en investigación en Fusión. 4000000
– Plasma-Wall Intercation and Edge Physics 3000000
(EIRENE, BIT1). 2000000
1000000
– Transporte (ISDEP, DKES, GEM, ASTRA). 0
2007 2008 2009 2010 2011 2012
– Calentamiento (MaRaTra, FAFNER).
– Equilibrio y MHD (VMEC, Helena).
• Necesidad de entornos heterogéneos
para adaptar los diferentes tipos de
requisitos
– Workflows HPC – Grid.
• >60 publicaciones indexadas desde 2007. 50
51. Y otras muchas más
Usuarios Españoles de infraestructuras de e-Ciencia
51
52. Conclusiones
• España se encuentra excelentemente posicionada en la e-
Ciencia a nivel internacional tanto en infraestructuras como
en aplicaciones
– Existe una gran comunidad de técnicos y usuarios dispuestos a apoyar
a nuevos usuarios.
• El acceso está abierto en todos los casos
– Convocatorias RES y propias de los centros de Supercomputación
Autonómicos.
– A través de ES-NGI.
– A través de PRACE.
• El acceso a infraestructuras internacionales es una
oportunidad para el desarrollo especialmente en la situación
actual.
52
55. ¿Preguntas?
La e-Investigación en España
Ignacio Blanquer - iblanque@dsic.upv.es
Universidad Politécnica de Valencia
55
Notas do Editor
The first PRACE machine has been installed in Julich: JUGENE (IBM Blue Gene/P) - total of 72 racks with 294,912 processors, peak performance of 1 petaflop. Main memory 2 Gbytes/node. Can only store data for 90 days. PRACE expects to install another 4 machines (different suppliers/architectures) around Europe (roughly 1 per year) to ensure Europe has access to the latest HPC machines for the 5 years to come.http://www.prace-project.eu/hpc-access/page-7