SlideShare uma empresa Scribd logo
1 de 53
Baixar para ler offline
El papel del Cloud Computing en BD & DS
Javier Cacheiro López
jlopez@cesga.es
Contenido
 Soluciones Cloud
 Cloud Federado: EGI FedCloud
 BigData en FedCloud
 Conclusiones
Cloud
Cloud
Modelos Cloud
 Infrastructure as a Service (IaaS)
 Amazon EC2
 Platform as a Service (PaaS)
 Salesforce, Google App Engine
 Software as a Service (SaaS)
 Google Docs
Escalabilidad
Escalabilidad vertical: Scale up
Escalabilidad horizontal: Scale out
Virtualización
Virtual Machine Monitor (VMM)
VMM / Hipervisor
Hardware Máquina Física
Máquina
Virtual
Máquina
Virtual
Máquina
Virtual
Anillos de Protección
Tipos de VMM
 VMM Tipo 1 (bare metal)
 Anillo 0
 Hipervisor directamente sobre el hardware
 VMM Tipo 2 (hosted)
 Anillo 3
 Hipervisor dentro de un SO
Modos de Virtualización
Descripción Ventajas Ejemplos
Rendimiento Xen PV
Rendimiento KVM, Xen HVM
Desventaj
as
Virtualización
completa (full
virtualization)
Simulación completa del
hardware de la máquina física
Pérdida de
rendimiento
No es necesario
modificar el SO
de la MV
VMWare
Workstation,
VirtualBox
Paravirtualización
Simulación parcial del hardware
de la máquina física. La MV es
consciente de que corre en un
entorno virtual.
Es
necesario
modificar el
SO de la MV
para que se
ejecute en
el anillo 1
Virtualización
asistida por
hardware (Native
Virtualization)
Virtualización total que se
aprovecha del soporte para
virtualización presente en el
hardware como las extensiones
VT de Intel o Pacifica de AMD
Es
necesario
hardware
específico
Soluciones de Virtualización en entornos cloud
 Xen
 KVM
 VMware
 Hyper-V
Xen: Conceptos Básicos
 Dom0: el SO anfitrión con el kernel de Xen
 DomU: cada una de las máquinas virtuales
 VIF: Virtual Network Inferface
 VBD: Virtual Block Device
 HVM: Virtualización con soporte hardware
Linux paravirt_ops (pv-ops)
 Pv-ops es una parte del kernel de Linux que le
permite ejecutarse como máquina paravirtual
 Está disponible para x86, x86_64 e ia64
 El mismo kernel puede arrancar nativamente
en el hardware físico o como máquina
paravirtual
 Xen y VMware tienen soporte de pv-ops
Xen StubDom
 StubDom representa un nuevo modelo de
gestión de dispositivos para MV HVM
disponible a partir de Xen 3.3
 El nuevo modelo utiliza un mini-SO para tareas
como acceso a disco, a dispositivos de vídeo o
a memoria
 Se consigure una mejora considerable de
rendimiento
KVM: Conceptos Básicos
 Requiere de un procesador con soporte de
virtualización
 Soporta paravirtualización para ciertos drivers a
través de VirtIO
 RHEL6 añade KVM y elimina Xen
Virtualización Completa vs Paravirtualización
MicroKernel
Hardware
Máquina
Virtual
Máquina
Virtual
Máquina
Virtual
Driver Driver
API Gestión Traducción Binaria
Hipervisor
Hardware
Máquina
Virtual
Máquina
Virtual
Máquina
Virtual
API Gestión API Hardware Virtual HVM
Virtualización Completa Paravirtualización
Xen vs KVM: Linpack
Xen vs KVM: I/O
Standards
 Open Virtualization Format (OVF): Formato
standard para exportar máquinas virtuales
entre VMMs
 Virtual Machine Disk Format (VMDK): Formato
standard para la creación de discos virtuales
(usado principalmente por VMware)
 VMI: Interfaz alternativo a pv-ops desarrollado
por VMware (eliminado a partir del kernel
2.6.37)
Consideraciones prácticas
 Las máquinas virtuales HVM y con
virtualización total pueden presentar problemas
con el reloj del sistema
 Muchos VMM no gestionan eficiencientemente
MV multi-procesador
 El rendimiento de ficheros y LVM para
almacenar las MV es similar
 Algunas distribuciones de Linux incluyen una
versión de /lib/tls que no es compatible con Xen
(es recomendable deshabilitarla)
Soluciones Cloud IaaS
IaaS Pública IaaS Privada
Google Compute Engine
Public IaaS: Hipervisores
 AWS Amazon EC2:
 Xen en general y Xen HVM para instancias tipo:
cluster compute, high I/O, second generation (m3)
and Windows
 Rackspace:
 Xen para Linux y XenServer para Windows
 Google Compute Engine
 KVM
 Windows Azure
 Hyper-V
IaaS
Comparativa
Fuente: http://blog.opennebula.org/?p=4042
Arquitectura OpenNebula
Almacenamiento Cloud
Evolución soluciones almacenamiento
Almacenamiento local
SAN
Distributed Replicated Block Device (DRDB)
Object Storage
Tipos de Almacenamiento
Object Storage
Amazon S3
OpenStack Swift
Ceph
File Storage
NAS (NFS, CIFS)
GlusterFS
Ceph FS
Block Storage
SAS/SATA/iSCSI
Amazon EBS
Ceph RDB
Object Storage
 Escalable:
 Posibilidad de ampliar/reducir el almacenamiento
 Barato:
 Agrega los discos locales de muchos servidores
 Replicación automática:
 Tolerancia a fallos
 Interfaz http: usualmente API REST
Object Storage: Ejemplos
 Amazon S3
 OpenStack Swift
 Ceph
 Object Storage: Ceph filesystem
 Block Storage: Ceph RADOS Block Device (RDB)
 File Storage: Ceph FS
 GlusterFS
Object Storage: Inconvenientes
 Si se actualiza un fichero hay que esperar a
que se propaguen los cambios a todas la
réplicas
 Preferible para almacenar datos que no
cambian mucho
 Interfaz http
Soluciones de Almacenamiento IaaS
AWS
Object Storage Block Storage
Simple Storage Service (S3) Elastic Block Storage (EBS)
OpenStack Swift Ceph, GlusterFS, NetApp
Eucalyptus Walrus Storage Controller (SC)
CloudStack Swift Ceph
OpenNebula Ceph
Cloud Federado
EGI FedCloud
MonitorizaciónMonitorización
AccountingAccounting
OpenNebula
3.x
MySQL
database
MySQL
database
Summarized records
Running /stopped/finished VMs
Summarized records
Running /stopped/finished VMs
meghacloud.cesga.es
Apelglobalrepo.
Ejecutando Hadoop en FedCloud
Configuración de Hadoop
N+1 Hadoop cluster
 1 Master
 NameNode / Secondary NameNode
 JobTracker
 N Slaves
 DataNode
 TaskTracker
Despliegue del cluster
Tiempo de despliegue de un cluster Hadoop de
101 nodos
 Obtener identificador: 71-86 min
 Tiempo total: 2,5-3 horas
Despliegue: Carga en el frontend
Despliegue: Uso de red
Enciclopedia Británica
Wikipedia
GAIA
GAIA
 Misión de la ESA para elaborar un mapa
tridimensional de nuestra Galaxia, la vía
láctea: http://sci.esa.int/gaia/
 El satélite será lanzado en agosto
 Datos a analizar: ~1PB
GAIA
Se analizaron distintas soluciones:
• Cassandra
• Hadoop
• InterSystems Cache
• IBM DB2
• PostgreSQL 9 + Pl/Proxy2 + Cassandra
GAIA
 Solución elegida: Hadoop
GAIA: Escalabilidad en FedCloud
Conclusiones
BigData + Cloud
Ejecutar BigData sobre una plataforma IaaS
ofrece ventajas e inconvenientes
Pros
 Elasticidad: tanta como tenga la aplicación
 Rapidez para obtener recursos
 Facilidad en la configuración
 Sencillez en el despliegue
 Ideal para pruebas
Contras
 Tiempo de despliegue:
 Es necesario optimizar el gestor cloud para mejorar
el tiempo de despliegue
 Rendimiento
 Es necesario optimizar las MV para mejorar su
rendimiento de E/S
 Entorno heterogéneo
 Rendimiento de cada MV variable dependiendo
de la carga del anfitrión

Mais conteúdo relacionado

Mais procurados

Veeam Agents para Linux y Microsoft Windows
Veeam Agents para Linux y Microsoft Windows Veeam Agents para Linux y Microsoft Windows
Veeam Agents para Linux y Microsoft Windows Jorge de la Cruz
 
Virtualizacion De Servidores De Infraestructura Microsoft
Virtualizacion De Servidores De Infraestructura MicrosoftVirtualizacion De Servidores De Infraestructura Microsoft
Virtualizacion De Servidores De Infraestructura MicrosoftDavid Armas Armas
 
Módulo de Alta Disponibilidad de Elastix
Módulo de Alta Disponibilidad de ElastixMódulo de Alta Disponibilidad de Elastix
Módulo de Alta Disponibilidad de ElastixPaloSanto Solutions
 
La era de la Virtualización y sus beneficios para las empresas
La era de la Virtualización y sus beneficios para las empresasLa era de la Virtualización y sus beneficios para las empresas
La era de la Virtualización y sus beneficios para las empresasMundo Contact
 
Proyecto XenServer
Proyecto XenServerProyecto XenServer
Proyecto XenServerPol Grandes
 
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012SolidQ
 
Congreso del mediterraneo_xen_server_v010
Congreso del mediterraneo_xen_server_v010Congreso del mediterraneo_xen_server_v010
Congreso del mediterraneo_xen_server_v010Javier Sanchez Alcazar
 
Virtualización
VirtualizaciónVirtualización
VirtualizaciónOscar
 
OpenNebula Oneflow: give me the flow!
OpenNebula Oneflow: give me the flow!OpenNebula Oneflow: give me the flow!
OpenNebula Oneflow: give me the flow!OpenNebula Project
 

Mais procurados (20)

Virtualization Station
Virtualization StationVirtualization Station
Virtualization Station
 
Veeam Agents para Linux y Microsoft Windows
Veeam Agents para Linux y Microsoft Windows Veeam Agents para Linux y Microsoft Windows
Veeam Agents para Linux y Microsoft Windows
 
Docker 2014 v2
Docker 2014 v2Docker 2014 v2
Docker 2014 v2
 
Virtualizacion De Servidores De Infraestructura Microsoft
Virtualizacion De Servidores De Infraestructura MicrosoftVirtualizacion De Servidores De Infraestructura Microsoft
Virtualizacion De Servidores De Infraestructura Microsoft
 
Módulo de Alta Disponibilidad de Elastix
Módulo de Alta Disponibilidad de ElastixMódulo de Alta Disponibilidad de Elastix
Módulo de Alta Disponibilidad de Elastix
 
Informe laboratorio 1 kvm
Informe laboratorio 1 kvmInforme laboratorio 1 kvm
Informe laboratorio 1 kvm
 
La era de la Virtualización y sus beneficios para las empresas
La era de la Virtualización y sus beneficios para las empresasLa era de la Virtualización y sus beneficios para las empresas
La era de la Virtualización y sus beneficios para las empresas
 
Introducción a VMware vSAN
Introducción a VMware vSANIntroducción a VMware vSAN
Introducción a VMware vSAN
 
Proyecto XenServer
Proyecto XenServerProyecto XenServer
Proyecto XenServer
 
Como reducir costos en AWS
Como reducir costos en AWSComo reducir costos en AWS
Como reducir costos en AWS
 
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012
Virtualizar o no virtualizar, esa es la cuestión | SolidQ Summit 2012
 
Cbs aws-fundamentals-3
Cbs aws-fundamentals-3Cbs aws-fundamentals-3
Cbs aws-fundamentals-3
 
Proyecto Integrado ASIR
Proyecto Integrado ASIRProyecto Integrado ASIR
Proyecto Integrado ASIR
 
Esx, vcenter, vclient, vmotion, freenas
Esx, vcenter, vclient, vmotion, freenas Esx, vcenter, vclient, vmotion, freenas
Esx, vcenter, vclient, vmotion, freenas
 
Vmware
VmwareVmware
Vmware
 
EC2 Cómputo en la nube a profundidad
EC2 Cómputo en la nube a profundidad EC2 Cómputo en la nube a profundidad
EC2 Cómputo en la nube a profundidad
 
Veeam Fastscp Español
Veeam Fastscp EspañolVeeam Fastscp Español
Veeam Fastscp Español
 
Congreso del mediterraneo_xen_server_v010
Congreso del mediterraneo_xen_server_v010Congreso del mediterraneo_xen_server_v010
Congreso del mediterraneo_xen_server_v010
 
Virtualización
VirtualizaciónVirtualización
Virtualización
 
OpenNebula Oneflow: give me the flow!
OpenNebula Oneflow: give me the flow!OpenNebula Oneflow: give me the flow!
OpenNebula Oneflow: give me the flow!
 

Destaque

Virtualizacion Con Xen En Open Solaris
Virtualizacion Con Xen En Open SolarisVirtualizacion Con Xen En Open Solaris
Virtualizacion Con Xen En Open SolarisToni de la Fuente
 
Building Scalable .NET Web Applications
Building Scalable .NET Web ApplicationsBuilding Scalable .NET Web Applications
Building Scalable .NET Web ApplicationsBuu Nguyen
 
Administración de Memoria en UNIX
Administración de Memoria en UNIXAdministración de Memoria en UNIX
Administración de Memoria en UNIXNatalia Ludeña
 
Scaling asp.net websites to millions of users
Scaling asp.net websites to millions of usersScaling asp.net websites to millions of users
Scaling asp.net websites to millions of usersoazabir
 

Destaque (6)

Virtualizacion Con Xen En Open Solaris
Virtualizacion Con Xen En Open SolarisVirtualizacion Con Xen En Open Solaris
Virtualizacion Con Xen En Open Solaris
 
Building Scalable .NET Web Applications
Building Scalable .NET Web ApplicationsBuilding Scalable .NET Web Applications
Building Scalable .NET Web Applications
 
Gestion de memoria en unix y solaris
Gestion de memoria en unix y solarisGestion de memoria en unix y solaris
Gestion de memoria en unix y solaris
 
Administración de Memoria en UNIX
Administración de Memoria en UNIXAdministración de Memoria en UNIX
Administración de Memoria en UNIX
 
Scaling asp.net websites to millions of users
Scaling asp.net websites to millions of usersScaling asp.net websites to millions of users
Scaling asp.net websites to millions of users
 
Gestion de memoria en Linux
Gestion de memoria en LinuxGestion de memoria en Linux
Gestion de memoria en Linux
 

Semelhante a Cloud y BigData

Virtualizar con microsoft hyper v - por qué ahora parte2
Virtualizar con microsoft hyper v - por qué ahora parte2Virtualizar con microsoft hyper v - por qué ahora parte2
Virtualizar con microsoft hyper v - por qué ahora parte2Pablo Campos
 
Sacale El Jugo A La Virtualizacion
Sacale El Jugo A La VirtualizacionSacale El Jugo A La Virtualizacion
Sacale El Jugo A La VirtualizacionPablo Campos
 
Virtualizar con microsoft hyper v - por qué ahora parte1
Virtualizar con microsoft hyper v - por qué ahora parte1Virtualizar con microsoft hyper v - por qué ahora parte1
Virtualizar con microsoft hyper v - por qué ahora parte1Pablo Campos
 
Datacenter dinamico parte1
Datacenter dinamico parte1Datacenter dinamico parte1
Datacenter dinamico parte1Pablo Campos
 
Hyper v private cloud
Hyper v private cloudHyper v private cloud
Hyper v private cloudPablo Campos
 
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...Israel Martínez Bermejo
 
Windows Server2008 R2 Overview
Windows Server2008 R2 OverviewWindows Server2008 R2 Overview
Windows Server2008 R2 OverviewPablo Campos
 
Datacenter dinamico parte2
Datacenter dinamico parte2Datacenter dinamico parte2
Datacenter dinamico parte2Pablo Campos
 
2 la nueva versión de v mware
2   la nueva versión de v mware2   la nueva versión de v mware
2 la nueva versión de v mwareOmega Peripherals
 
Virtualizacion con Software Libre en el camino hacia la nube
Virtualizacion con Software Libre en el camino hacia la nubeVirtualizacion con Software Libre en el camino hacia la nube
Virtualizacion con Software Libre en el camino hacia la nubeRodolfo Pilas
 
Webcast Conociendo Hyperv R2
Webcast   Conociendo Hyperv R2Webcast   Conociendo Hyperv R2
Webcast Conociendo Hyperv R2ITSanchez
 
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacion
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacionPlan antiguo manana-_enrique_gullon-_presentacion_virtualizacion
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacionegullon
 
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta  Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta ITSanchez
 
Frikeando Con Imagenes Virtuales Asegura It Camp
Frikeando Con Imagenes Virtuales   Asegura It CampFrikeando Con Imagenes Virtuales   Asegura It Camp
Frikeando Con Imagenes Virtuales Asegura It CampChema Alonso
 

Semelhante a Cloud y BigData (20)

Hyper v r2 -javier acero
Hyper v r2  -javier aceroHyper v r2  -javier acero
Hyper v r2 -javier acero
 
Virtualizar con microsoft hyper v - por qué ahora parte2
Virtualizar con microsoft hyper v - por qué ahora parte2Virtualizar con microsoft hyper v - por qué ahora parte2
Virtualizar con microsoft hyper v - por qué ahora parte2
 
Sacale El Jugo A La Virtualizacion
Sacale El Jugo A La VirtualizacionSacale El Jugo A La Virtualizacion
Sacale El Jugo A La Virtualizacion
 
Virtualizar con microsoft hyper v - por qué ahora parte1
Virtualizar con microsoft hyper v - por qué ahora parte1Virtualizar con microsoft hyper v - por qué ahora parte1
Virtualizar con microsoft hyper v - por qué ahora parte1
 
Datacenter dinamico parte1
Datacenter dinamico parte1Datacenter dinamico parte1
Datacenter dinamico parte1
 
Hyper v private cloud
Hyper v private cloudHyper v private cloud
Hyper v private cloud
 
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...
Virtualizacion de servidores con VMware vSphere 5.5. (Proyecto Fin de Curso) ...
 
Windows Server2008 R2 Overview
Windows Server2008 R2 OverviewWindows Server2008 R2 Overview
Windows Server2008 R2 Overview
 
Datacenter dinamico parte2
Datacenter dinamico parte2Datacenter dinamico parte2
Datacenter dinamico parte2
 
[Run Reloaded] SCVMM 2008 R2 a fondo (Antonio Scuotto + Alejandro Ponicke)
[Run Reloaded] SCVMM 2008 R2 a fondo (Antonio Scuotto + Alejandro Ponicke)[Run Reloaded] SCVMM 2008 R2 a fondo (Antonio Scuotto + Alejandro Ponicke)
[Run Reloaded] SCVMM 2008 R2 a fondo (Antonio Scuotto + Alejandro Ponicke)
 
Techdays 2010 Hyper-V R2 SP1
Techdays 2010 Hyper-V R2 SP1Techdays 2010 Hyper-V R2 SP1
Techdays 2010 Hyper-V R2 SP1
 
2 la nueva versión de v mware
2   la nueva versión de v mware2   la nueva versión de v mware
2 la nueva versión de v mware
 
Virtualizacion con Software Libre en el camino hacia la nube
Virtualizacion con Software Libre en el camino hacia la nubeVirtualizacion con Software Libre en el camino hacia la nube
Virtualizacion con Software Libre en el camino hacia la nube
 
Virtualización
VirtualizaciónVirtualización
Virtualización
 
Webcast Conociendo Hyperv R2
Webcast   Conociendo Hyperv R2Webcast   Conociendo Hyperv R2
Webcast Conociendo Hyperv R2
 
Virtualización de GNU/Linux Debian con Xen
Virtualización de GNU/Linux Debian con XenVirtualización de GNU/Linux Debian con Xen
Virtualización de GNU/Linux Debian con Xen
 
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacion
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacionPlan antiguo manana-_enrique_gullon-_presentacion_virtualizacion
Plan antiguo manana-_enrique_gullon-_presentacion_virtualizacion
 
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta  Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta
Webcast Technet: Profundizar el respaldo Hyper-V: Una mirada bajo la cubierta
 
Frikeando Con Imagenes Virtuales Asegura It Camp
Frikeando Con Imagenes Virtuales   Asegura It CampFrikeando Con Imagenes Virtuales   Asegura It Camp
Frikeando Con Imagenes Virtuales Asegura It Camp
 
V virtualización
V virtualizaciónV virtualización
V virtualización
 

Último

Clasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxClasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxCarolina Bujaico
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdfBetianaJuarez1
 
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaYeimys Ch
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerenciacubillannoly
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersIván López Martín
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDAVIDROBERTOGALLEGOS
 
Nomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de NóminaNomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de Nóminacuellosameidy
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptxHugoGutierrez99
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armadob7fwtwtfxf
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar24roberto21
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)JuanStevenTrujilloCh
 
PROYECCIÓN DE VISTAS planos de vistas y mas
PROYECCIÓN DE VISTAS planos de vistas y masPROYECCIÓN DE VISTAS planos de vistas y mas
PROYECCIÓN DE VISTAS planos de vistas y maslida630411
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024u20211198540
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1ivanapaterninar
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosAlbanyMartinez7
 

Último (20)

Clasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxClasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptx
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
 
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
 
El camino a convertirse en Microsoft MVP
El camino a convertirse en Microsoft MVPEl camino a convertirse en Microsoft MVP
El camino a convertirse en Microsoft MVP
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerencia
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 Testcontainers
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptx
 
Nomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de NóminaNomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de Nómina
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armado
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)
 
PROYECCIÓN DE VISTAS planos de vistas y mas
PROYECCIÓN DE VISTAS planos de vistas y masPROYECCIÓN DE VISTAS planos de vistas y mas
PROYECCIÓN DE VISTAS planos de vistas y mas
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos Juridicos
 

Cloud y BigData

  • 1. El papel del Cloud Computing en BD & DS Javier Cacheiro López jlopez@cesga.es
  • 2. Contenido  Soluciones Cloud  Cloud Federado: EGI FedCloud  BigData en FedCloud  Conclusiones
  • 5. Modelos Cloud  Infrastructure as a Service (IaaS)  Amazon EC2  Platform as a Service (PaaS)  Salesforce, Google App Engine  Software as a Service (SaaS)  Google Docs
  • 6. Escalabilidad Escalabilidad vertical: Scale up Escalabilidad horizontal: Scale out
  • 8. Virtual Machine Monitor (VMM) VMM / Hipervisor Hardware Máquina Física Máquina Virtual Máquina Virtual Máquina Virtual
  • 10. Tipos de VMM  VMM Tipo 1 (bare metal)  Anillo 0  Hipervisor directamente sobre el hardware  VMM Tipo 2 (hosted)  Anillo 3  Hipervisor dentro de un SO
  • 11. Modos de Virtualización Descripción Ventajas Ejemplos Rendimiento Xen PV Rendimiento KVM, Xen HVM Desventaj as Virtualización completa (full virtualization) Simulación completa del hardware de la máquina física Pérdida de rendimiento No es necesario modificar el SO de la MV VMWare Workstation, VirtualBox Paravirtualización Simulación parcial del hardware de la máquina física. La MV es consciente de que corre en un entorno virtual. Es necesario modificar el SO de la MV para que se ejecute en el anillo 1 Virtualización asistida por hardware (Native Virtualization) Virtualización total que se aprovecha del soporte para virtualización presente en el hardware como las extensiones VT de Intel o Pacifica de AMD Es necesario hardware específico
  • 12. Soluciones de Virtualización en entornos cloud  Xen  KVM  VMware  Hyper-V
  • 13. Xen: Conceptos Básicos  Dom0: el SO anfitrión con el kernel de Xen  DomU: cada una de las máquinas virtuales  VIF: Virtual Network Inferface  VBD: Virtual Block Device  HVM: Virtualización con soporte hardware
  • 14. Linux paravirt_ops (pv-ops)  Pv-ops es una parte del kernel de Linux que le permite ejecutarse como máquina paravirtual  Está disponible para x86, x86_64 e ia64  El mismo kernel puede arrancar nativamente en el hardware físico o como máquina paravirtual  Xen y VMware tienen soporte de pv-ops
  • 15. Xen StubDom  StubDom representa un nuevo modelo de gestión de dispositivos para MV HVM disponible a partir de Xen 3.3  El nuevo modelo utiliza un mini-SO para tareas como acceso a disco, a dispositivos de vídeo o a memoria  Se consigure una mejora considerable de rendimiento
  • 16. KVM: Conceptos Básicos  Requiere de un procesador con soporte de virtualización  Soporta paravirtualización para ciertos drivers a través de VirtIO  RHEL6 añade KVM y elimina Xen
  • 17. Virtualización Completa vs Paravirtualización MicroKernel Hardware Máquina Virtual Máquina Virtual Máquina Virtual Driver Driver API Gestión Traducción Binaria Hipervisor Hardware Máquina Virtual Máquina Virtual Máquina Virtual API Gestión API Hardware Virtual HVM Virtualización Completa Paravirtualización
  • 18. Xen vs KVM: Linpack
  • 19. Xen vs KVM: I/O
  • 20. Standards  Open Virtualization Format (OVF): Formato standard para exportar máquinas virtuales entre VMMs  Virtual Machine Disk Format (VMDK): Formato standard para la creación de discos virtuales (usado principalmente por VMware)  VMI: Interfaz alternativo a pv-ops desarrollado por VMware (eliminado a partir del kernel 2.6.37)
  • 21. Consideraciones prácticas  Las máquinas virtuales HVM y con virtualización total pueden presentar problemas con el reloj del sistema  Muchos VMM no gestionan eficiencientemente MV multi-procesador  El rendimiento de ficheros y LVM para almacenar las MV es similar  Algunas distribuciones de Linux incluyen una versión de /lib/tls que no es compatible con Xen (es recomendable deshabilitarla)
  • 22. Soluciones Cloud IaaS IaaS Pública IaaS Privada Google Compute Engine
  • 23. Public IaaS: Hipervisores  AWS Amazon EC2:  Xen en general y Xen HVM para instancias tipo: cluster compute, high I/O, second generation (m3) and Windows  Rackspace:  Xen para Linux y XenServer para Windows  Google Compute Engine  KVM  Windows Azure  Hyper-V
  • 24. IaaS
  • 28. Evolución soluciones almacenamiento Almacenamiento local SAN Distributed Replicated Block Device (DRDB) Object Storage
  • 29. Tipos de Almacenamiento Object Storage Amazon S3 OpenStack Swift Ceph File Storage NAS (NFS, CIFS) GlusterFS Ceph FS Block Storage SAS/SATA/iSCSI Amazon EBS Ceph RDB
  • 30. Object Storage  Escalable:  Posibilidad de ampliar/reducir el almacenamiento  Barato:  Agrega los discos locales de muchos servidores  Replicación automática:  Tolerancia a fallos  Interfaz http: usualmente API REST
  • 31. Object Storage: Ejemplos  Amazon S3  OpenStack Swift  Ceph  Object Storage: Ceph filesystem  Block Storage: Ceph RADOS Block Device (RDB)  File Storage: Ceph FS  GlusterFS
  • 32. Object Storage: Inconvenientes  Si se actualiza un fichero hay que esperar a que se propaguen los cambios a todas la réplicas  Preferible para almacenar datos que no cambian mucho  Interfaz http
  • 33. Soluciones de Almacenamiento IaaS AWS Object Storage Block Storage Simple Storage Service (S3) Elastic Block Storage (EBS) OpenStack Swift Ceph, GlusterFS, NetApp Eucalyptus Walrus Storage Controller (SC) CloudStack Swift Ceph OpenNebula Ceph
  • 37. AccountingAccounting OpenNebula 3.x MySQL database MySQL database Summarized records Running /stopped/finished VMs Summarized records Running /stopped/finished VMs meghacloud.cesga.es Apelglobalrepo.
  • 39. Configuración de Hadoop N+1 Hadoop cluster  1 Master  NameNode / Secondary NameNode  JobTracker  N Slaves  DataNode  TaskTracker
  • 40. Despliegue del cluster Tiempo de despliegue de un cluster Hadoop de 101 nodos  Obtener identificador: 71-86 min  Tiempo total: 2,5-3 horas
  • 41. Despliegue: Carga en el frontend
  • 45. GAIA
  • 46. GAIA  Misión de la ESA para elaborar un mapa tridimensional de nuestra Galaxia, la vía láctea: http://sci.esa.int/gaia/  El satélite será lanzado en agosto  Datos a analizar: ~1PB
  • 47. GAIA Se analizaron distintas soluciones: • Cassandra • Hadoop • InterSystems Cache • IBM DB2 • PostgreSQL 9 + Pl/Proxy2 + Cassandra
  • 51. BigData + Cloud Ejecutar BigData sobre una plataforma IaaS ofrece ventajas e inconvenientes
  • 52. Pros  Elasticidad: tanta como tenga la aplicación  Rapidez para obtener recursos  Facilidad en la configuración  Sencillez en el despliegue  Ideal para pruebas
  • 53. Contras  Tiempo de despliegue:  Es necesario optimizar el gestor cloud para mejorar el tiempo de despliegue  Rendimiento  Es necesario optimizar las MV para mejorar su rendimiento de E/S  Entorno heterogéneo  Rendimiento de cada MV variable dependiendo de la carga del anfitrión