investigación de los Avances tecnológicos del siglo XXI
Business Discovery for Big Data (Spanish)
1. BD 4 BD
Big Data & QlikView
Juan Gerardo Cabeza (Juan.Cabeza@QlikView.com)
Ferran García (Ferran.GarciaPagans@QlikView.com)
2. Agenda
• ¿Qué es Big Data?
• Las famosas tres V’s
• ¿Cómo lo hacemos con QlikView?
• Un ejemplo
• Conclusiones
3. ¿Qué es Big Data?
• "Big Data" es un término aplicado a conjuntos de datos que
superan la capacidad del software habitual para ser capturados,
gestionados y procesados en un tiempo razonable.
• Las dificultades más habituales en estos casos se centran en la
captura, el almacenado, búsqueda, compartición,
análisis, y visualización.
9. El valor del Big Data viene del Contexto y la Relevancia
Data
warehouse
Datos de Maquinas,
datos web, datos cloud
Big Data
cluster
Google
BigQuery
Sistemas
Operacionales
14. Aplicación
Presentación
Plataforma BD4BD
BUSINESS DISCOVERY APPS
QLIKVIEW
SERVER
QLIKVIEW
PUBLISHER
Usuarios de Negocio
QVW & QVD files
GOVERNANCE
DASHBOARD
QLIKVIEW
DEVELOPER
Acceso a Datos
QLIKVIEW
EXPRESSOR ENGINE
QLIKVIEW EXPRESSOR
METADATA
QLIKVIEW
EXPRESSOR DESKTOP
ERP
CRM
Fuentes de Datos
15. En memoria
Muchos escenarios de uso de Big Data se pueden tratar en memoria
Drill-to-Detail
Dashboard Resumen
(10 MM filas)
App Detalle
(500 MM filas)
Drill-to-Segmented-Detail
Dashboard Resumen
(10 MM filas)
App Región Este
(150 MM filas)
App Región Oeste
(150 MM filas)
App Región Norte
(150 MM filas)
App Región Sur
(150 MM filas)
Cross Subject Navigation
Dashboard
Resumen
(20 MM filas)
Dashboard
Productos
(10 MM filas)
Dashboard
Cliente
(5 MM filas)
Dashboard
Pedidos
(50 MM filas)
16. Combinamos datos ‘Big Data’ y de orígenes tradicionales
Combina distintas fuentes de datos en memoria
Aggregates / Detail
EDW Data
Data
Warehouse
17. Combinamos datos ‘Big Data’ y de orígenes tradicionales
Combinamos fuentes de datos distintas utilizando Direct Discovery
Direct Discovery
EDW Data
Data
Warehouse
18. Arquitectura de aplicaciones Híbrida
Algunos escenarios de uso de Big Data pueden tratarse con una
aproximación híbrida
In Memory
(Agregado)
Aplicación Direct
Discovery
(Detalle)
Tendencias Históricas
Direct Discovery
(Agregado)
In Memory
(Agregado)
Aplicación Direct Discovery
(Detalle)
Time Sensitive
Aplicación Direct
Discovery
(Detalle)
In Memory Dashboard
(Detalle)
Drill-to-Detail
19. Encadenar Aplicaciones
• Navegar entre Aplicaciones QlikView
• Manteniendo Selecciones / Contexto
1) Los Usuarios Realizan
Selecciones en la aplicación 1
2) Click para saltar a otra
aplicación
3) La aplicación 2 se abre,
las selecciones se
tranfieren y se aplican
20. Arquitectura General
• En memoria
•
Arquitectura de datos, QVDs, Agregaciones
•
Publisher, Expressor
• Direct Discovery
• Modelo híbrido
In Memory
Direct Discovery
Hybrid
21. BD4BD, siempre es QlikView
Asociado: Blanco
Selecciones: verde
No Asociado: gris
24. QlikView y Big Data en King.com
• 1.600 millones de registros de datos diarios en Hadoop — 211M
de registros diarios extraídos para análisis en QlikView.
• Actividad de navegación de los clientes, interacciones de
jugadores con cada juego, muchas más métricas.
• Resultados: ROI en campañas de Marketing conseguido por
primera vez (Nº de jugadores, Nº de partidas, tiempo jugado,
etc.)
25. ¿Por qué QlikView para Big Data?
• Conectividad con fuentes de datos heterogéneas
– Big Data: Hadoop, MongoB, Aster, Google Big Query...
– Otras fuentes de datos: Operacionales, Social Media, EDW…
– Extraer, Limpiar y Transformar datos
– Modelo de Datos agnóstico
• Arquitectura de Datos Flexible
– Modelo de Datos en Memoria, Direct Discovery, Híbrido
• Datos Frescos
– Recargas periódicas, bajo demanda, Direct Discovery…
• Facilidad de Análisis
– Permite descubrir tendencias y confrontarlas con los datos de detalle
26. Direct Discovery 2.0
DIRECT QUERY
DIMENSION
CustomerID,
SalesOrderID,
OrderDate,
NATIVE('month([OrderDate])') AS OrderMonth,
NATIVE('year([OrderDate])') AS OrderYear
MEASURE
SubTotal,
TaxAmt,
DETAIL
DueDate,
ShipDate,
ModifiedDate
DETACH
SalesOrderID,
AccountNumber
FROM AdventureWorks.Sales.SalesOrderHeader;
QlikView 11.2 SR5