SlideShare uma empresa Scribd logo
1 de 34
© 2015, Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.
Cindy Polin
Enterprise Solutions Architect
Abril, 2017
Introducción a Big Data
Opciones de análisis de AWS y casos
de uso comunes
Índice
• Introducción a Big Data para AWS
• Opciones de análisis de Big Data en AWS
• Prácticas de uso recomendadas y no recomendadas
• Desempeño y costo
• Durabilidad y escalabilidad
• Interfaces
• Creación de soluciones de análisis de Big Data: enfoque de AWS
• Ejemplos de escenarios
Big Data en AWS
Disponibilidad inmediata. Implementación instantánea. Sin tener
que adquirir hardware ni mantener o escalar la infraestructura.
Confiabilidad y seguridad. Diseñado para cumplir los requisitos
más estrictos. Auditorías constantes, incluidas las de certificaciones
como ISO 27001, FedRAMP, DoD CSM y PCI DSS.
Capacidades robustas y numerosas. Más de 50 servicios y
cientos de características para respaldar prácticamente cualquier
aplicación y carga de trabajo de Big Data.
Cientos de socios y soluciones. Obtenga ayuda de un socio de
consultoría o elija entre cientos de herramientas y aplicaciones
que abarcan todos los aspectos de la administración de datos.
En tiempo real
Amazon Kinesis Firehose
Almacenamiento
de objetos
Amazon S3
RDBMS
Amazon RDS
NoSQL
DynamoDB
Ecosistema de Hadoop
Amazon EMR
En tiempo real
AWS Lambda
Amazon Kinesis Analytics
Almacenamiento
de datos
Amazon Redshift
Aprendizaje automático
Amazon Machine Learning
Inteligencia de negocio
y visualización de datos
Amazon QuickSight
En tiempo real
Amazon Kinesis Streams
Análisis con
búsquedas elásticas
Amazon ElasticSearch
Recopilar Almacenar Procesar y analizar Visualizar
Importación de datos
Amazon Import/Export
Snowball
IoT
Amazon IoT
Capacidades numerosas y estrechamente integradas
Envergadura
de petabytes
Procesamiento
masivo en paralelo
Almacén de datos relacionales
Administración completa, sin
intervención del administrador
Tan solo 1 000 USD/TB/año
mucho más rápido
mucho más
económico
muchísimo más
simpleAmazon Redshift
Amazon Redshift
• Prácticas de uso idóneas: análisis
• Datos de ventas
• Datos históricos
• Datos de juegos de azar
• Tendencias sociales
• Datos publicitarios
• Desempeño
• Procesamiento masivo en paralelo
• Almacenamiento en columnas
• Compresión de datos
• Mapas de zonas
• Almacenamiento directamente integrado
• Modelo de costos
• Sin costos iniciales ni compromisos a largo plazo
• Almacenamiento gratuito de copias de seguridad
equivalente al 100% del almacenamiento aprovisionado
Con el almacenamiento en
columnas, solo se leen los
datos que se necesitan
Amazon Redshift
• Escalabilidad y elasticidad
• Redimensionamiento o escalado: el número o tipo
de nodos se puede cambiar con solo unos clics.
• Durabilidad y disponibilidad
• Replicación
• Copia de seguridad
• Recuperación automatizada en caso de
errores de unidades y nodos
• Interfaces
• Interfaz JDBC/ODBC con herramientas de BI/ETL
• Amazon S3 o DynamoDB
• Prácticas de uso no recomendadas
• Conjuntos de datos pequeños
• OLTP
• Datos no estructurados
• Datos BLOB
10 GigE
(HPC)
Adquisición
Copia de
seguridad
Restauración
JDBC/ODBC
Adquisición de datos en streaming
Procesamiento de datos en tiempo real
Almacenamiento de terabytes de datos
por hora
Amazon Kinesis
Amazon Kinesis Streams
• Prácticas de uso idóneas: adquisición
y procesamiento de datos en streaming
• Análisis de datos en tiempo real
• Admisión y procesamiento de datos; por ejemplo,
registros
• Métricas e informes en tiempo real
• Desempeño
• Capacidad de rendimiento en términos de
fragmentos
• Modelo de costos
• Sin costos iniciales ni compromisos a largo plazo
• Precio de pago por uso
• Cargo por horas por fragmento
• Cargo por 1 millón de transacciones PUT
Amazon Kinesis Streams
• Escalabilidad y elasticidad
• Escala: aumento del número
de fragmentos
• Durabilidad y disponibilidad
• Replicación
• Conservación del cursor
• Interfaces
• Entrada: datos entrantes
• Salida: datos salientes
• Kinesis Firehose
• Prácticas de uso no
recomendadas
• Rendimiento uniforme a pequeña escala
• Almacenamiento y análisis de datos a largo plazo
Lanzamiento de un clúster en minutos
Pago por horas y ahorro con las
instancias de subasta
MapReduce, Apache Spark, Presto
Amazon EMR
Amazon EMR
• Prácticas de uso idóneas
• Procesamiento y análisis de registros
• Movimiento de datos y ETL de gran tamaño
• Modelos de riesgos y análisis de amenazas
• Segmentación de anuncios y análisis de
secuencias de clics
• Genómica
• Análisis predictivos
• Minería y análisis de datos ad hoc
• Desempeño basado en:
• Tipo de instancia
• Número de instancias
• Modelo de costos
• Pago por horas solo si el clúster está activo
• Instancia de EC2 y precio de EMR
Amazon EMR
• Escalabilidad y elasticidad
• Cambio del tamaño de un clúster en ejecución
• Adición de más nodos principales o de tarea
• Durabilidad y disponibilidad
• Tolerancia a errores de nodos esclavos (HDFS)
• Copia de seguridad en S3 para aportar
resistencia en caso de errores de nodos
maestros
• Interfaces
• Hive, Pig, Spark, Hbase, Impala, Hunk, Presto
y otras herramientas populares
• Prácticas de uso no recomendadas
• Conjuntos de datos pequeños
• ACID (atomicidad, uniformidad, aislamiento
y durabilidad)
Clúster de Amazon EMR
Clúster de Amazon EMR
Clúster de Amazon EMR
Base de datos NoSQL totalmente
administrada.
Latencia de milisegundos de un solo dígito
Admite documentos y pares de clave-valor
Amazon
DynamoDB
Amazon DynamoDB
• Prácticas de uso idóneas
• Aplicaciones móviles, juegos de azar, servicio de
anuncios digitales, votaciones en directo, redes de
sensores, adquisición de registros
• Control de acceso a contenido basado en Web,
carros de la compra para comercio electrónico
• Administración de sesiones web
• Desempeño
• SSD
• Rendimiento de aprovisionamiento por tabla
• Escalabilidad y elasticidad
• Sin límite de la cantidad de datos almacenada
• Regulación ascendente o descendente de la
capacidad de lectura y escritura de una tabla
• Modelo de costos
• Pago por uso
• Capacidad de rendimiento aprovisionada (por hora)
• Almacenamiento de datos indexados (por GB y mes)
• Transferencia de datos entrante o saliente (por GB y mes)
 Rendimiento de lectura/escritura aprovisionado por tabla
 Alto desempeño previsible escalado mediante consola o API
Amazon DynamoDB
• Durabilidad y disponibilidad
• Tres zonas de disponibilidad (AZ)
• Interfaces
• Consola de administración de AWS
• API
• SDK
• Prácticas de uso no recomendadas
• Aplicación asociada a base de datos
relacional tradicional
• Uniones y transacciones complejas
• Datos BLOB
• Datos voluminosos con velocidad de
E/S baja
AZ A
AZ B
AZ C
Servicio administrado diseñado para facilitar
el uso del aprendizaje automático a
desarrolladores de todos los niveles.
Se basa en la misma tecnología de aprendizaje
automático que utilizan los propios científicos
de datos de Amazon desde hace años.
Amazon Machine Learning (ML) usa
implementaciones escalables y robustas de los
algoritmos de aprendizaje automático estándar
del sector.
Amazon
Machine Learning
Amazon Machine Learning
• Prácticas de uso idóneas
• Permitir aplicaciones que marcan
transacciones sospechosas
• Personalizar el contenido de aplicaciones
• Predecir la actividad de los usuarios
• Escuchar las redes sociales
• Modelo de costos
• Pago por uso
• No hay que administrar instancias,
solamente pagar el servicio
• Desempeño
• Predicciones en tiempo real diseñadas para
su devolución en 100 ms
• Posibilidad de gestionar 200 transacciones
por segundo de forma predeterminada
(se puede aumentar)
Amazon Machine Learning
• Durabilidad y disponibilidad
• Sin tiempos de mantenimiento ni de
inactividad programada
• Diseñado para abarcar varias zonas de
disponibilidad
• Escalabilidad y elasticidad
• Entrenamiento de modelos de hasta 100 GB
• Posibilidad de ejecutar varias tareas de
aprendizaje automático a la vez
• Interfaces
• Creación de orígenes de datos desde S3,
RDS y Redshift
• Interacción con ML desde la consola, los
SDK y la API de ML
• Prácticas de uso no recomendadas
• Conjuntos de datos masivos para modelado
> 100 GB
• Predicción de secuencias o tarea de
clustering sin supervisar
Informática basada en eventos
totalmente administrada
Sin infraestructura que
administrar
Escalado automático
AWS Lambda
AWS Lambda
• Prácticas de uso idóneas
• Procesamiento de archivos en tiempo real
• Extracción, transformación y carga (ETL)
• Desempeño
• Procesamiento de eventos en
milisegundos
• Modelo de costos
• Pago por uso
• No hay que administrar instancias,
solamente pagar el servicio
• La capa gratuita de Lambda incluye
1 millón de solicitudes gratuitas
1 2 3
Sin servidor Escala basada
en eventos
Facturación de menos
de un segundo
AWS Lambda
• Durabilidad y disponibilidad
• Sin tiempos de mantenimiento ni
inactividad programados
• Las funciones asíncronas se
reintentan 3 veces en caso de error
• Escalabilidad y elasticidad
• Posibilidad de ejecutar cualquier
cantidad de funciones concurrentes
• AWS Lambda asigna dinámicamente la
capacidad de acuerdo con la velocidad
de entrada de eventos
• Interfaces
• Lambda admite Java, Node.js, Python,
C#
• Desencadenamiento mediante eventos
o programación
• Prácticas de uso no recomendadas
• Aplicaciones de ejecución prolongada
• Aplicaciones con estado en Lambda
Configuración de un clúster de
Elasticsearch en unos minutos
Integración con Logstash y Kibana
Escalado sin problemas de clústeres
de Elasticsearch
Amazon
Elasticsearch
Service
Amazon Elasticsearch
• Prácticas de uso idóneas
• Analizar registros
• Analizar actualizaciones de streaming de datos de
otros servicios de AWS
• Proporcionar a los clientes una completa
experiencia de búsqueda y navegación
• Monitorizar el uso de las aplicaciones móviles
• Desempeño
• Depende de diversos factores, tales como el tipo
de instancia, la carga de trabajo, el índice, el
número de fragmentos utilizados o las réplicas de
lectura
• Configuraciones de almacenamiento:
almacenamiento de instancias o EBS
• Modelo de costos
• Pago por uso
• Pago por capacidad informática y almacenamiento
Amazon Elasticsearch
• Durabilidad y disponibilidad
• Reconocimiento de zona
• Instantáneas automáticas y manuales
• Escalabilidad y elasticidad
• Adición o eliminación de instancias
• Modificación de volúmenes de EBS para
crecimiento de datos
• Interfaces
• Consola de administración de AWS
• API
• SDK
• Kibana y Logstash (pila de ELK)
• Prácticas de uso no recomendadas
• OLTP
• Cargas de trabajo con requisitos de
almacenamiento superiores a 5 TB
Elasticsearch + Logstash + Kibana =
(ELK) análisis y visualización en tiempo real
Creación de visualizaciones
Realización de análisis ad-hoc
Intercambio y colaboración mediante guiones
Acceso nativo en las principales plataformas
de móviles
Amazon
QuickSight
Presentamos Amazon QuickSight
Servicio de inteligencia de negocio (BI) basado
en la nube con la décima parte del costo
del software de BI tradicional
 Sin esfuerzo de TI. Sin modelado dimensional
 Detección automática de todos los orígenes de
datos de AWS
 Motor de cálculo en memoria, en paralelo y
ultrarrápido (SPICE, por sus siglas en inglés)
 Totalmente administrado
aws.amazon.com/quicksight
Escalado ascendente o descendente
según las necesidades
Pago por uso
Varias opciones
Creación de aplicaciones propias de
Big Data
Amazon EC2
Enfoque de AWS
• Flexibilidad Uso de la mejor herramienta para cada tarea
• Estructura de datos, latencia, rendimiento, patrones de acceso
• Escalabilidad Inmutable (solo mediante anexos)
• Capa de servicio/lotes/velocidad
• Mínimos gastos generales administrativos Saca partido de los
servicios administrados de AWS
• Sin intervención del administrador o muy poca
• Bajo costo Big Data ≠ costo elevado
Escenario 1: Almacén de datos empresariales
Escenario 2: Captura y análisis de datos de sensores
Escenario 3: Análisis de opinión en las redes sociales
Escenarios
de Big Data
Escenario 1: Almacén de datos empresariales
Arquitectura de los almacenes de datos
Orígenes de
datos
Amazon
S3
Amazon
EMR
Amazon
S3
Amazon
Redshift
Amazon
QuickSight
Escenario 2: Captura y análisis de datos de sensores
Orígenes de
datos
Amazon
S3
Amazon
Redshift
Amazon
QuickSight
Apl.
habilitada
para Amazon
Kinesis
Apl.
habilitada
para Amazon
Kinesis
Amazon
DynamoDB
Panel de
informes
Acceso de
clientes
Amazon
Kinesis
1
2 3 4 5
6 7 8 9
Escenario 3: Análisis de opinión en las redes sociales
Datos de redes
sociales
Amazon
EC2
Amazon
Lambda
Amazon
ML
Amazon
Kinesis
Amazon
S3
Amazon
SNS
1 2 4 5 6
3 7
Pasos siguientes
• Suscríbase a AWS Big Data Blog: blogs.aws.amazon.com/bigdata
• Busque más información y consulte los tutoriales, guías o
laboratorios autoguiados en: aws.amazon.com/big-data
• Consulte el seminario web sobre Big Data:
Building Smart Applications with Amazon Machine Learning
https://aws.amazon.com/es/about-
aws/events/monthlywebinarseries/archive/
smartapplicationsonamazonmachinelearningondemand/
(consultar próximas fechas)

Mais conteúdo relacionado

Mais procurados

AWS S3 Tutorial For Beginners | Edureka
AWS S3 Tutorial For Beginners | EdurekaAWS S3 Tutorial For Beginners | Edureka
AWS S3 Tutorial For Beginners | EdurekaEdureka!
 
Getting Started with Amazon Aurora
Getting Started with Amazon AuroraGetting Started with Amazon Aurora
Getting Started with Amazon AuroraAmazon Web Services
 
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...Amazon Web Services
 
Serverless computing with AWS Lambda
Serverless computing with AWS Lambda Serverless computing with AWS Lambda
Serverless computing with AWS Lambda Apigee | Google Cloud
 
Serverless Computing
Serverless ComputingServerless Computing
Serverless ComputingAnand Gupta
 
Introduction to AWS Lambda and Serverless Applications
Introduction to AWS Lambda and Serverless ApplicationsIntroduction to AWS Lambda and Serverless Applications
Introduction to AWS Lambda and Serverless ApplicationsAmazon Web Services
 
(SEC318) AWS CloudTrail Deep Dive
(SEC318) AWS CloudTrail Deep Dive(SEC318) AWS CloudTrail Deep Dive
(SEC318) AWS CloudTrail Deep DiveAmazon Web Services
 
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon Web Services Korea
 
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016Amazon Web Services Korea
 
AWS Route53 Fundamentals
AWS Route53 FundamentalsAWS Route53 Fundamentals
AWS Route53 FundamentalsPiyush Agrawal
 
Cloud cost optimization (AWS, GCP)
Cloud cost optimization (AWS, GCP)Cloud cost optimization (AWS, GCP)
Cloud cost optimization (AWS, GCP)Szabolcs Zajdó
 

Mais procurados (20)

AWS S3 Tutorial For Beginners | Edureka
AWS S3 Tutorial For Beginners | EdurekaAWS S3 Tutorial For Beginners | Edureka
AWS S3 Tutorial For Beginners | Edureka
 
Getting Started with Amazon Aurora
Getting Started with Amazon AuroraGetting Started with Amazon Aurora
Getting Started with Amazon Aurora
 
Introduction to Amazon Aurora
Introduction to Amazon AuroraIntroduction to Amazon Aurora
Introduction to Amazon Aurora
 
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...
Massive Message Processing with Amazon SQS and Amazon DynamoDB (ARC301) | AWS...
 
Deep Dive on Amazon S3
Deep Dive on Amazon S3Deep Dive on Amazon S3
Deep Dive on Amazon S3
 
Serverless computing with AWS Lambda
Serverless computing with AWS Lambda Serverless computing with AWS Lambda
Serverless computing with AWS Lambda
 
Serverless computing
Serverless computingServerless computing
Serverless computing
 
Amazon S3 Masterclass
Amazon S3 MasterclassAmazon S3 Masterclass
Amazon S3 Masterclass
 
Deep Dive on AWS Lambda
Deep Dive on AWS LambdaDeep Dive on AWS Lambda
Deep Dive on AWS Lambda
 
Serverless Computing
Serverless ComputingServerless Computing
Serverless Computing
 
Introduction to AWS Lambda and Serverless Applications
Introduction to AWS Lambda and Serverless ApplicationsIntroduction to AWS Lambda and Serverless Applications
Introduction to AWS Lambda and Serverless Applications
 
(SEC318) AWS CloudTrail Deep Dive
(SEC318) AWS CloudTrail Deep Dive(SEC318) AWS CloudTrail Deep Dive
(SEC318) AWS CloudTrail Deep Dive
 
AWS Lambda
AWS LambdaAWS Lambda
AWS Lambda
 
Introduction to Amazon Redshift
Introduction to Amazon RedshiftIntroduction to Amazon Redshift
Introduction to Amazon Redshift
 
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
Amazon Personalize 소개 (+ 실습 구성)::김영진, 솔루션즈 아키텍트, AWS::AWS AIML 스페셜 웨비나
 
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
 
Athena & Glue
Athena & GlueAthena & Glue
Athena & Glue
 
AWS Route53 Fundamentals
AWS Route53 FundamentalsAWS Route53 Fundamentals
AWS Route53 Fundamentals
 
Cloud cost optimization (AWS, GCP)
Cloud cost optimization (AWS, GCP)Cloud cost optimization (AWS, GCP)
Cloud cost optimization (AWS, GCP)
 
Python on AWS Lambda
Python on AWS Lambda Python on AWS Lambda
Python on AWS Lambda
 

Semelhante a AWS Big Data análisis opciones

Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSAmazon Web Services LATAM
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSAmazon Web Services LATAM
 
AWS Summit Bogotá Track Básico: Bases de datos en AWS
AWS Summit Bogotá Track Básico: Bases de datos en AWSAWS Summit Bogotá Track Básico: Bases de datos en AWS
AWS Summit Bogotá Track Básico: Bases de datos en AWSAmazon Web Services
 
AWS Summits América Latina 2015- Bases de Datos en AWS
AWS Summits América Latina 2015- Bases de Datos en AWSAWS Summits América Latina 2015- Bases de Datos en AWS
AWS Summits América Latina 2015- Bases de Datos en AWSAmazon Web Services LATAM
 
Big Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSBig Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSAmazon Web Services LATAM
 
Servicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSServicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSAmazon Web Services LATAM
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosAmazon Web Services LATAM
 
Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Amazon Web Services LATAM
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosAmazon Web Services LATAM
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSAmazon Web Services LATAM
 
Casos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL ServerCasos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL ServerEduardo Castro
 
Modelado y carga de datos con Azure SSAS
Modelado y carga de datos con Azure SSAS Modelado y carga de datos con Azure SSAS
Modelado y carga de datos con Azure SSAS Juan Alvarado
 

Semelhante a AWS Big Data análisis opciones (20)

Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
Sistema de Bases de Datos AWS
Sistema de Bases de Datos AWSSistema de Bases de Datos AWS
Sistema de Bases de Datos AWS
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWS
 
AWS en Español
AWS en EspañolAWS en Español
AWS en Español
 
AWS en Español
AWS en EspañolAWS en Español
AWS en Español
 
Big Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWSBig Data: Arquitectura y mejores prácticas en AWS
Big Data: Arquitectura y mejores prácticas en AWS
 
Como reducir costos en AWS
Como reducir costos en AWSComo reducir costos en AWS
Como reducir costos en AWS
 
AWS Summit Bogotá Track Básico: Bases de datos en AWS
AWS Summit Bogotá Track Básico: Bases de datos en AWSAWS Summit Bogotá Track Básico: Bases de datos en AWS
AWS Summit Bogotá Track Básico: Bases de datos en AWS
 
AWS Summits América Latina 2015- Bases de Datos en AWS
AWS Summits América Latina 2015- Bases de Datos en AWSAWS Summits América Latina 2015- Bases de Datos en AWS
AWS Summits América Latina 2015- Bases de Datos en AWS
 
AWSome Day - Conferencia Online Junio 2020
AWSome Day - Conferencia Online Junio 2020 AWSome Day - Conferencia Online Junio 2020
AWSome Day - Conferencia Online Junio 2020
 
Servicios de bases de datos en AWS
Servicios de bases de datos en AWSServicios de bases de datos en AWS
Servicios de bases de datos en AWS
 
Big Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWSBig Data: Arquitecturas y mejores prácticas en AWS
Big Data: Arquitecturas y mejores prácticas en AWS
 
Servicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWSServicios de bases de datos administradas en AWS
Servicios de bases de datos administradas en AWS
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuarios
 
Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS Servicios de Bases de Datos administradas en AWS
Servicios de Bases de Datos administradas en AWS
 
Escalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuariosEscalando para sus primeros 10 millones de usuarios
Escalando para sus primeros 10 millones de usuarios
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWS
 
Casos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL ServerCasos de bodegas de datos con SQL Server
Casos de bodegas de datos con SQL Server
 
Modelado y carga de datos con Azure SSAS
Modelado y carga de datos con Azure SSAS Modelado y carga de datos con Azure SSAS
Modelado y carga de datos con Azure SSAS
 

Mais de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAmazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.Amazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAmazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAmazon Web Services LATAM
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSAmazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSAmazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAmazon Web Services LATAM
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAmazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosAmazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSAmazon Web Services LATAM
 

Mais de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 

Último

LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzzAlexandergo5
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificialcynserafini89
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfedepmariaperez
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOnarvaezisabella21
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 

Último (20)

LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzz
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificial
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdf
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 

AWS Big Data análisis opciones

  • 1. © 2015, Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados. Cindy Polin Enterprise Solutions Architect Abril, 2017 Introducción a Big Data Opciones de análisis de AWS y casos de uso comunes
  • 2. Índice • Introducción a Big Data para AWS • Opciones de análisis de Big Data en AWS • Prácticas de uso recomendadas y no recomendadas • Desempeño y costo • Durabilidad y escalabilidad • Interfaces • Creación de soluciones de análisis de Big Data: enfoque de AWS • Ejemplos de escenarios
  • 3. Big Data en AWS Disponibilidad inmediata. Implementación instantánea. Sin tener que adquirir hardware ni mantener o escalar la infraestructura. Confiabilidad y seguridad. Diseñado para cumplir los requisitos más estrictos. Auditorías constantes, incluidas las de certificaciones como ISO 27001, FedRAMP, DoD CSM y PCI DSS. Capacidades robustas y numerosas. Más de 50 servicios y cientos de características para respaldar prácticamente cualquier aplicación y carga de trabajo de Big Data. Cientos de socios y soluciones. Obtenga ayuda de un socio de consultoría o elija entre cientos de herramientas y aplicaciones que abarcan todos los aspectos de la administración de datos.
  • 4. En tiempo real Amazon Kinesis Firehose Almacenamiento de objetos Amazon S3 RDBMS Amazon RDS NoSQL DynamoDB Ecosistema de Hadoop Amazon EMR En tiempo real AWS Lambda Amazon Kinesis Analytics Almacenamiento de datos Amazon Redshift Aprendizaje automático Amazon Machine Learning Inteligencia de negocio y visualización de datos Amazon QuickSight En tiempo real Amazon Kinesis Streams Análisis con búsquedas elásticas Amazon ElasticSearch Recopilar Almacenar Procesar y analizar Visualizar Importación de datos Amazon Import/Export Snowball IoT Amazon IoT Capacidades numerosas y estrechamente integradas
  • 5. Envergadura de petabytes Procesamiento masivo en paralelo Almacén de datos relacionales Administración completa, sin intervención del administrador Tan solo 1 000 USD/TB/año mucho más rápido mucho más económico muchísimo más simpleAmazon Redshift
  • 6. Amazon Redshift • Prácticas de uso idóneas: análisis • Datos de ventas • Datos históricos • Datos de juegos de azar • Tendencias sociales • Datos publicitarios • Desempeño • Procesamiento masivo en paralelo • Almacenamiento en columnas • Compresión de datos • Mapas de zonas • Almacenamiento directamente integrado • Modelo de costos • Sin costos iniciales ni compromisos a largo plazo • Almacenamiento gratuito de copias de seguridad equivalente al 100% del almacenamiento aprovisionado Con el almacenamiento en columnas, solo se leen los datos que se necesitan
  • 7. Amazon Redshift • Escalabilidad y elasticidad • Redimensionamiento o escalado: el número o tipo de nodos se puede cambiar con solo unos clics. • Durabilidad y disponibilidad • Replicación • Copia de seguridad • Recuperación automatizada en caso de errores de unidades y nodos • Interfaces • Interfaz JDBC/ODBC con herramientas de BI/ETL • Amazon S3 o DynamoDB • Prácticas de uso no recomendadas • Conjuntos de datos pequeños • OLTP • Datos no estructurados • Datos BLOB 10 GigE (HPC) Adquisición Copia de seguridad Restauración JDBC/ODBC
  • 8. Adquisición de datos en streaming Procesamiento de datos en tiempo real Almacenamiento de terabytes de datos por hora Amazon Kinesis
  • 9. Amazon Kinesis Streams • Prácticas de uso idóneas: adquisición y procesamiento de datos en streaming • Análisis de datos en tiempo real • Admisión y procesamiento de datos; por ejemplo, registros • Métricas e informes en tiempo real • Desempeño • Capacidad de rendimiento en términos de fragmentos • Modelo de costos • Sin costos iniciales ni compromisos a largo plazo • Precio de pago por uso • Cargo por horas por fragmento • Cargo por 1 millón de transacciones PUT
  • 10. Amazon Kinesis Streams • Escalabilidad y elasticidad • Escala: aumento del número de fragmentos • Durabilidad y disponibilidad • Replicación • Conservación del cursor • Interfaces • Entrada: datos entrantes • Salida: datos salientes • Kinesis Firehose • Prácticas de uso no recomendadas • Rendimiento uniforme a pequeña escala • Almacenamiento y análisis de datos a largo plazo
  • 11. Lanzamiento de un clúster en minutos Pago por horas y ahorro con las instancias de subasta MapReduce, Apache Spark, Presto Amazon EMR
  • 12. Amazon EMR • Prácticas de uso idóneas • Procesamiento y análisis de registros • Movimiento de datos y ETL de gran tamaño • Modelos de riesgos y análisis de amenazas • Segmentación de anuncios y análisis de secuencias de clics • Genómica • Análisis predictivos • Minería y análisis de datos ad hoc • Desempeño basado en: • Tipo de instancia • Número de instancias • Modelo de costos • Pago por horas solo si el clúster está activo • Instancia de EC2 y precio de EMR
  • 13. Amazon EMR • Escalabilidad y elasticidad • Cambio del tamaño de un clúster en ejecución • Adición de más nodos principales o de tarea • Durabilidad y disponibilidad • Tolerancia a errores de nodos esclavos (HDFS) • Copia de seguridad en S3 para aportar resistencia en caso de errores de nodos maestros • Interfaces • Hive, Pig, Spark, Hbase, Impala, Hunk, Presto y otras herramientas populares • Prácticas de uso no recomendadas • Conjuntos de datos pequeños • ACID (atomicidad, uniformidad, aislamiento y durabilidad) Clúster de Amazon EMR Clúster de Amazon EMR Clúster de Amazon EMR
  • 14. Base de datos NoSQL totalmente administrada. Latencia de milisegundos de un solo dígito Admite documentos y pares de clave-valor Amazon DynamoDB
  • 15. Amazon DynamoDB • Prácticas de uso idóneas • Aplicaciones móviles, juegos de azar, servicio de anuncios digitales, votaciones en directo, redes de sensores, adquisición de registros • Control de acceso a contenido basado en Web, carros de la compra para comercio electrónico • Administración de sesiones web • Desempeño • SSD • Rendimiento de aprovisionamiento por tabla • Escalabilidad y elasticidad • Sin límite de la cantidad de datos almacenada • Regulación ascendente o descendente de la capacidad de lectura y escritura de una tabla • Modelo de costos • Pago por uso • Capacidad de rendimiento aprovisionada (por hora) • Almacenamiento de datos indexados (por GB y mes) • Transferencia de datos entrante o saliente (por GB y mes)  Rendimiento de lectura/escritura aprovisionado por tabla  Alto desempeño previsible escalado mediante consola o API
  • 16. Amazon DynamoDB • Durabilidad y disponibilidad • Tres zonas de disponibilidad (AZ) • Interfaces • Consola de administración de AWS • API • SDK • Prácticas de uso no recomendadas • Aplicación asociada a base de datos relacional tradicional • Uniones y transacciones complejas • Datos BLOB • Datos voluminosos con velocidad de E/S baja AZ A AZ B AZ C
  • 17. Servicio administrado diseñado para facilitar el uso del aprendizaje automático a desarrolladores de todos los niveles. Se basa en la misma tecnología de aprendizaje automático que utilizan los propios científicos de datos de Amazon desde hace años. Amazon Machine Learning (ML) usa implementaciones escalables y robustas de los algoritmos de aprendizaje automático estándar del sector. Amazon Machine Learning
  • 18. Amazon Machine Learning • Prácticas de uso idóneas • Permitir aplicaciones que marcan transacciones sospechosas • Personalizar el contenido de aplicaciones • Predecir la actividad de los usuarios • Escuchar las redes sociales • Modelo de costos • Pago por uso • No hay que administrar instancias, solamente pagar el servicio • Desempeño • Predicciones en tiempo real diseñadas para su devolución en 100 ms • Posibilidad de gestionar 200 transacciones por segundo de forma predeterminada (se puede aumentar)
  • 19. Amazon Machine Learning • Durabilidad y disponibilidad • Sin tiempos de mantenimiento ni de inactividad programada • Diseñado para abarcar varias zonas de disponibilidad • Escalabilidad y elasticidad • Entrenamiento de modelos de hasta 100 GB • Posibilidad de ejecutar varias tareas de aprendizaje automático a la vez • Interfaces • Creación de orígenes de datos desde S3, RDS y Redshift • Interacción con ML desde la consola, los SDK y la API de ML • Prácticas de uso no recomendadas • Conjuntos de datos masivos para modelado > 100 GB • Predicción de secuencias o tarea de clustering sin supervisar
  • 20. Informática basada en eventos totalmente administrada Sin infraestructura que administrar Escalado automático AWS Lambda
  • 21. AWS Lambda • Prácticas de uso idóneas • Procesamiento de archivos en tiempo real • Extracción, transformación y carga (ETL) • Desempeño • Procesamiento de eventos en milisegundos • Modelo de costos • Pago por uso • No hay que administrar instancias, solamente pagar el servicio • La capa gratuita de Lambda incluye 1 millón de solicitudes gratuitas 1 2 3 Sin servidor Escala basada en eventos Facturación de menos de un segundo
  • 22. AWS Lambda • Durabilidad y disponibilidad • Sin tiempos de mantenimiento ni inactividad programados • Las funciones asíncronas se reintentan 3 veces en caso de error • Escalabilidad y elasticidad • Posibilidad de ejecutar cualquier cantidad de funciones concurrentes • AWS Lambda asigna dinámicamente la capacidad de acuerdo con la velocidad de entrada de eventos • Interfaces • Lambda admite Java, Node.js, Python, C# • Desencadenamiento mediante eventos o programación • Prácticas de uso no recomendadas • Aplicaciones de ejecución prolongada • Aplicaciones con estado en Lambda
  • 23. Configuración de un clúster de Elasticsearch en unos minutos Integración con Logstash y Kibana Escalado sin problemas de clústeres de Elasticsearch Amazon Elasticsearch Service
  • 24. Amazon Elasticsearch • Prácticas de uso idóneas • Analizar registros • Analizar actualizaciones de streaming de datos de otros servicios de AWS • Proporcionar a los clientes una completa experiencia de búsqueda y navegación • Monitorizar el uso de las aplicaciones móviles • Desempeño • Depende de diversos factores, tales como el tipo de instancia, la carga de trabajo, el índice, el número de fragmentos utilizados o las réplicas de lectura • Configuraciones de almacenamiento: almacenamiento de instancias o EBS • Modelo de costos • Pago por uso • Pago por capacidad informática y almacenamiento
  • 25. Amazon Elasticsearch • Durabilidad y disponibilidad • Reconocimiento de zona • Instantáneas automáticas y manuales • Escalabilidad y elasticidad • Adición o eliminación de instancias • Modificación de volúmenes de EBS para crecimiento de datos • Interfaces • Consola de administración de AWS • API • SDK • Kibana y Logstash (pila de ELK) • Prácticas de uso no recomendadas • OLTP • Cargas de trabajo con requisitos de almacenamiento superiores a 5 TB Elasticsearch + Logstash + Kibana = (ELK) análisis y visualización en tiempo real
  • 26. Creación de visualizaciones Realización de análisis ad-hoc Intercambio y colaboración mediante guiones Acceso nativo en las principales plataformas de móviles Amazon QuickSight
  • 27. Presentamos Amazon QuickSight Servicio de inteligencia de negocio (BI) basado en la nube con la décima parte del costo del software de BI tradicional  Sin esfuerzo de TI. Sin modelado dimensional  Detección automática de todos los orígenes de datos de AWS  Motor de cálculo en memoria, en paralelo y ultrarrápido (SPICE, por sus siglas en inglés)  Totalmente administrado aws.amazon.com/quicksight
  • 28. Escalado ascendente o descendente según las necesidades Pago por uso Varias opciones Creación de aplicaciones propias de Big Data Amazon EC2
  • 29. Enfoque de AWS • Flexibilidad Uso de la mejor herramienta para cada tarea • Estructura de datos, latencia, rendimiento, patrones de acceso • Escalabilidad Inmutable (solo mediante anexos) • Capa de servicio/lotes/velocidad • Mínimos gastos generales administrativos Saca partido de los servicios administrados de AWS • Sin intervención del administrador o muy poca • Bajo costo Big Data ≠ costo elevado
  • 30. Escenario 1: Almacén de datos empresariales Escenario 2: Captura y análisis de datos de sensores Escenario 3: Análisis de opinión en las redes sociales Escenarios de Big Data
  • 31. Escenario 1: Almacén de datos empresariales Arquitectura de los almacenes de datos Orígenes de datos Amazon S3 Amazon EMR Amazon S3 Amazon Redshift Amazon QuickSight
  • 32. Escenario 2: Captura y análisis de datos de sensores Orígenes de datos Amazon S3 Amazon Redshift Amazon QuickSight Apl. habilitada para Amazon Kinesis Apl. habilitada para Amazon Kinesis Amazon DynamoDB Panel de informes Acceso de clientes Amazon Kinesis 1 2 3 4 5 6 7 8 9
  • 33. Escenario 3: Análisis de opinión en las redes sociales Datos de redes sociales Amazon EC2 Amazon Lambda Amazon ML Amazon Kinesis Amazon S3 Amazon SNS 1 2 4 5 6 3 7
  • 34. Pasos siguientes • Suscríbase a AWS Big Data Blog: blogs.aws.amazon.com/bigdata • Busque más información y consulte los tutoriales, guías o laboratorios autoguiados en: aws.amazon.com/big-data • Consulte el seminario web sobre Big Data: Building Smart Applications with Amazon Machine Learning https://aws.amazon.com/es/about- aws/events/monthlywebinarseries/archive/ smartapplicationsonamazonmachinelearningondemand/ (consultar próximas fechas)

Notas do Editor

  1. Follow Up Email
  2. Amazon https://www.youtube.com/watch?v=P4KPPvEb_QI Genera registros web a razón de 2 TB/día, con un crecimiento interanual del 67%. Sistema heredado Oracle RAC Velocidad de análisis: 1 semana de datos/hora Límite de nodos RAC alcanzado: 32 nodos Más datos => ralentización de consultas Migrado a Redshift Velocidad de análisis: 15 meses de datos (2,25 billones de filas) en 14 min Escalado a un clúster DS1.8XL de 101 nodos: petabytes Desempeño multiplicado por más de 10 21 000 millones de filas más 10 000 millones de filas en 2 horas en lugar de días Seguridad: HasOffers carga 60 millones de filas por día en intervalos de 2 min; Desk: portal para usuarios con alto nivel de concurrencia (clúster de lectura/escritura), escala de PB en Amazon.com/NTT. Pinterest multiplicó la velocidad por entre 50 y 100 al trasladar 300 TB de Hadoop a Redshift. Nokia redujo los costos en un 50%. https://www.youtube.com/watch?v=O4wAH5FQjS8
  3. 30 millones de oportunidades de anuncios al mes
  4. Yelp usa Amazon S3 para almacenar los registros y fotos diarios. Genera aproximadamente 1,2 TB de registros al día. Además, la compañía utiliza Amazon EMR para ejecutar aproximadamente 20 scripts independientes de procesamiento por lotes, la mayoría para procesar los registros. Las características basadas en Amazon Elastic MapReduce son, entre otras: Los desarrolladores de Yelp recomiendan a otras personas que trabajan con AWS que utilicen la API boto y también mrjob para garantizar la utilización plena de los flujos de tareas de Amazon Elastic MapReduce. Yelp ejecuta aproximadamente 250 tareas de Amazon Elastic MapReduce al día que suponen procesar 30 TB de datos y agradece a AWS Support su ayuda con el desarrollo de su aplicación Hadoop.
  5. Dropcam: ejecuta servidores de streaming de vídeo y almacenamiento en Amazon EC2 y Amazon S3 y utiliza Amazon DynamoDB para escalar y mantener el rendimiento. “DynamoDB crece a la par que el número de cámaras que se conectan al servicio”, afirma Nelson. “El rendimiento se mantiene muy estable cuando las cámaras se conectan. El uso de DynamoDB nos ha permitido reducir el tiempo de entrega de los eventos de vídeo a menos de 50 milisegundos”, añade.
  6. Dropcam - Dropcam runs video streaming and storage servers on Amazon EC2 and Amazon S3, and uses Amazon DynamoDB to scale and maintain throughput. “DynamoDB grows with the number of cameras that are connected to the service,” says Nelson. “Throughput is very steady as cameras come online. By using DynamoDB, we reduced delivery time for video events to less than 50 milliseconds,” says Nelson.
  7. Build Fax: utiliza Amazon Machine Learning para proporcionar cálculos de antigüedad de los tejados y los costos de los trabajos a aseguradoras y constructoras, con valores específicos de los inmuebles que no tienen que depender de cálculos amplios basados en códigos postales. Los modelos que antes tardaban seis meses o más en crearse se completan ahora en cuatro semanas o menos. Crea oportunidades de nuevos servicios de análisis de datos que BuildFax puede ofrecer a sus clientes, tales como el análisis de textos en Amazon ML para calcular los costos de los trabajos con una precisión del 80%.
  8. VidRoll: AWS Lambda habilita NoOps, que nos permite comenzar y permanecer a escala sin preocuparnos por la infraestructura. Como organización exponencial, es fundamental que nuestros desarrolladores se concentren en la innovación. Lambda evita que tengamos que codificar para cuestiones como la concurrencia, los sistemas de archivos distribuidos y otros “problemas del éxito” que suelen surgir cuando hay que escalar los sistemas. Gracias a Lambda, ahorramos tiempo y dinero.
  9. Amazon Elasticsearch Service permite implementar y escalar de forma fácil y segura una pila de ELK en solo unos minutos. La integración con Logstash está acoplada estrechamente. Además, se configura una instancia de Kibana. El servicio detecta y sustituye automáticamente los nodos de Elasticsearch con errores. De este modo, se reducen los costos asociados con las infraestructuras autoadministradas y el software Elasticsearch.
  10. https://aws.amazon.com/solutions/case-studies/major-league-baseball-mlbam/ Major League Baseball Advanced Media, L.P, que gestiona MLB.com, usa Elasticsearch de forma generalizada en su aplicación avanzada de estadísticas de jornadas de partidos. “Elasticsearch nos permite construir de forma fácil y rápida aplicaciones de análisis de Big Data de vanguardia mediante la pila de ELK”, señala Sean Curtis, arquitecto de MLB.com. “Al ofrecer acceso directo a la API de Elasticsearch y reducir las tareas administrativas, Amazon Swift nos aporta la facilidad de administración, la flexibilidad y el control que necesitamos”.
  11. Antes de abordar la arquitectura de Big Data, me gustaría presentar varios principios sólidos y acreditados relativos a ella. En AWS, estamos convencidos de que se debe usar la herramienta apropiada para cada tarea; en lugar de usar una navaja multiusos cuando se necesita un destornillador, lo mejor es usar un destornillador. Esto resulta especialmente importante para las arquitecturas de Big Data. Ahondaremos en esta idea más adelante. Arquitectura desacoplada (http://whatis.techtarget.com/definition/decoupled-architecture): en general, una arquitectura desacoplada es un marco de trabajo complejo que permite que los componentes permanezcan totalmente autónomos y se desconozcan mutuamente. La eficacia de este enfoque se ha demostrado en la práctica. Los servicios administrados son algo relativamente nuevo. ¿Debo instalar Cassandra, MongoDB o CouchDB en AWS? Por supuesto que puede. En ocasiones, hay buenos motivos para hacerlo. De hecho, muchos clientes lo hacen. Netflix es un ejemplo excelente de ello. Gestionan Cassandra con varias regiones y son un modelo en este ámbito. Sin embargo, a la mayoría de los clientes les resulta más práctico delegar esta tarea en AWS, porque les conviene más dedicar el tiempo a crear funciones para sus clientes que a desarrollar sistemas distribuidos altamente escalables. Arquitectura de Lambda: