Introducir, demostrar y aprender como las poderosas características y herramientas que nos proveen Windows Azure y SQL Database con SQL Reporting, nos lleva a implementar capacidades de consumo de datos visualmente, así mismo, explicar la arquitectura que trae este servicio para la nube.
5. AGENDA
Análisis Empresarial en el Nuevo Mundo de
Datos
Análisis del Big Data
Plataforma Analítica On-Premise, Cloud y
Híbrida
Análisis Avanzado
Demo
Conclusiones
11. Valores de análisis modernos
Nuevo
mundo de
datos
En 2015, las organizaciones han de integrar alto
valor, diversificándose, generando nuevos tipos y
fuentes de información en una infraestructura de
gestión de información coherente, superando a sus
colegas del sector financieramente por más de 20 %.
Gartner, Regina Casonato et al., “Information
Management in the 21st Century”
26. Big data, o sólo datos complejos?
Velocidad
Variedad Complejidad
volume
InterpretandoPreparando
27. Big data de hoy, pocos datos del mañana
Complejidad vs. Capacidades actuales
28. Dominio Escenarios comunes de Big Data
Servicios Financieros Modelando riesgos reales
Detección de fraude y análisis de amenazas
Vigilancia del comercio
Credit scoring y análisis
Medios & Entretenimientos Motores de recomendación
Ad targeting
Calidad de búsqueda
Abuso y haga clic en detección de fraude
Ventas Punto de análisis de transacciones de ventas
Análisis de abandono de clientes
Sentimiento analítico
Telecomunicaciones Prevención de abandono de clientes
Optimización de rendimiento de la red
Análisis Call Detail Record (CDR)
Predicción de fallas de redes
Gobierno Seguridad cibernética (botnets, fraudes)
Congestión de tráfico y desvíos
Monitoreo ambiental
Monitorización antisocial a través de los medios de comunicación social
Salud Investigación genómica
Investigación del cáncer
Detección temprana de las pandemias de salud
Monitoreo de la calidad del aire
Big data de hoy, pocos datos del mañana
29. Big Data + BI Tradicional =
Power & Simplicidad
Grandes, rápido, o
datos complejos
Microsoft HDInsight
SQL Server tabular,
multidimensional, DW
relacional, o PDW
010101010101010101
1010101010101010
01010101010101
101010101010
Interacción, exploración,
visualización
38. Contador de Palabras en JS - MapReduce
• var map = function (key, value, context) {
• var words = value.split(/[^a-zA-Z]/);
• for (var i = 0; i < words.length; i++) {
• if (words[i] !== "") {
•
context.write(words[i].toLowerCase(),
1);
• }
• }
• };
• var reduce = function (key, values, context) {
• var sum = 0;
• while (values.hasNext()) {
• sum += parseInt(values.next());
• }
• context.write(key, sum);
• };
39. Ejemplo de Pig Latin - Esto es Paralelismo!!!
raw = LOAD ’search.log' USING PigStorage('t') AS (user, time, query);
houred = FOREACH raw GENERATE user, org.apache.pig.tutorial.ExtractHour(time) as hour, query;
ngramed1 = FOREACH houred GENERATE user, hour, flatten(org.apache.pig.tutorial.NGramGenerator(query)) as ngram;
ngramed2 = DISTINCT ngramed1;
hour_frequency1 = GROUP ngramed2 BY (ngram, hour);
… [see http://pig.apache.org/docs/r0.7.0/tutorial.html]
STORE ordered_uniq_frequency INTO '/tmp/tutorial-results' USING PigStorage();
40. Procesamiento lógico reutilizable - Librerías
Filtrado
colaborativo, Recomendadores,
Clustering,
La descomposición en valores
simple,
Parallel frequent pattern mining,
Naive Bayes, Árbol de decisión
58. Aplicaciones Híbridas (VM)
Business App
Connect
SQL Server
ON-PREM
WINDOWS
AZURE
Windows Azure
Virtual Network
Extend
Flexibility &
Control
Low TCO for
Existing Apps
Full SQL
Server
Capability
Managed
Infrastructure
SQL Server in VM
59. Nuevos diseños de Apps en la Nube
SQL Database
Mobile Web
Managed
Platform & Infra.
Low TCO for New
Apps
Dynamic
Scalability
Based on SQL
Server
Technology
60. Apps Híbridos (no VM)
On-Prem
Business App
SQL Database
On-Prem
SQL Server
Connect
Connect
Managed
Platform & Infra.
Low TCO for New
Apps
Dynamic
Scalability
Based on SQL
Server
Technology
61.
62. Todas las características
Nube Privada Analítica
System Center para la administración y aprovisionamiento de la
nube privada
64. Soluciones para la Nube Privada
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Construido sobre DW
relacional
Arquitectura de Referencia
Fast Track DW
Infraestructura PDW & BDW
67. Expresiones DAX
= [First Name] & " " & [Last Name] Concatenación de cadenas, como en Excel
= SUM (Sales[Amount]) Creación de SUM en contextos de agregaciones
= RELATED (Product[Cost]) Sigue relaciones entre tablas, como las uniones
No se hace
referencia a celdas o
rangos individuales
Las funciones
siempre se refieren a
las columnas o tablas
68. Modelo Semántico BI
Data Model
Business Logic & Queries
Data Access ROLAP MOLAP xVelocity
MDX, soon: “DAXMD” DAX
Multidimensional Tabular
Applications Power View Excel PowerPivot
Databases Applications Files OData feeds Cloud services
SharePoint
Direct query
69. Entregando Power View y
PowerPivot a los usuarios
Archivos Standalone Excel
Excel en SharePoint, SharePoint
Online,
SkyDrive
Power View,
PowerPivot
directamente
en SSAS
Modo
SharePoint
Modelo tabular
SSAS nativo +
Archivo de
conexión
SharePoint
BISM
71. Power View
Exploración de datos
interactivos y
presentación visual
Experiencia de usuario
Excel
2013
SharePoint
2013 SQL
2012 SP1
Reporting
Service
72. Visualización de datos
Power View
Tablas, matrices, small
multiples, cards, tiles, filters,
slicers
Chart, scatte
r
plot, bubble
animation
Interacción
Geoespacial
y Mapas con
Bing
76. SQL Server
Analysis
Services
Server
Tus modelos de mineria de datos
Algoritmos de mineria de datos Origen
datos
Excel, Visio, SSRS
Tu aplicación
Despliegue
Excel
Visio
SSDT
SSMS
App
Data
Arquitectura de la Minería de Datos
78. Decision Trees Finds the odds of an outcome, great for visualising relationships
between values
Association Rules Identifies causal relationships between cases, good for market basket
analysis and recommendation engines
Clustering Classifies cases into distinctive groups based on any attribute sets
Naïve Bayes Shows the differences in a particular variable for various data elements
Sequence Clustering Groups or clusters data based on a sequence of previous events
Time Series Analyzes and forecasts time-based data combining the power of
ARTXP for accurate short-term predictions with ARIMA
Neural Nets Uncovers non-intuitive relationships
Linear Regression Determines mathematical linear relationship between inputs and an
outcome
Logistic Regression Determines the relationship between columns in order to evaluate the
probability that a column will contain a specific state
80. • Análisis de negocios en el nuevo mundo de los datos:
Conectados, inmersivo, de cualquier tamaño
• Plataforma Microsoft más poderosa y sencilla
• Big data = Datos demasiado complejos para los métodos
tradicionales
• Microsoft HDInsight + Sencillez de BI tradicional = Potentes
herramientas de análisis
• Desde el centro de datos tradicional a la nube OS: Su opción flexible
para el análisis
• Nube en sus propios términos: Está bien cambiar de opinión
• Advanced Analytics no es complejo hoy día
• Microsoft Business Analytics: Potencia y simplicidad
CONCLUSIONES
81. Inteligencia de Negocio en la nube, una
realidad palpable!!!
Jose Redondo - SQL Server MVP
Correos: redondoj@gmail.com | jredondo@solidq.com
Twitter: @redondoj
Blog: redondoj.wordpress.com