SlideShare uma empresa Scribd logo
1 de 68
Introducción al análisis predictivo
con SQL Server
Ing. Eduardo Castro, PhD
ecastro@simsasys.com
Microsoft SQL Server MVP
PASS Regional Mentor
SQL Saturday Sponsors
Gold Sponsors
Silver Sponsors
Bronze Sponsors
Fuentes consultadas
 TechEd 2014 Channel 9
 Enhancing Applications with SQL Server
Data Mining. Peter Myers
 Predictive Analytics in the Enterprise. Carlos
Bossy
 El arte (y ARIMA) de Forecasting. Dejan
Sarka
Canal en YouTube
 http://www.youtube.com /
eduardocastrom
 http://slideshare.net/ecastrom
 http://tinyurl.com/comunidad
windows
Agenda
 Fundamentos
 Demostración
 Recursos
Definiciones
Frase Objetivo
"La minería de datos" Toma de decisiones
"Machine Learning" Determinar el algoritmo de mejor
desempeño
Introducción
Análisis predictivo
Predictive Analytics
Predictive
Modeling
Data Mining
Análisis predictivo
Análisis predictivo
¿Por qué el resurgimiento en el análisis
predictivo?
Antes <-----> Hoy
Explosión de datos se duplica cada 3
años (Ley de Moore)
Los volúmenes de datos no pueden ser
comprendidos por los seres humanos
Difícil de encontrar patrones de
ventaja competitiva
Mejorar el criterio profesional de
expertos de dominio (pequeño pero
valioso)
Descubrimiento de Conocimiento
HoyAntes
Volúmenes manejables de datos
La facilidad y el poder de SQL
Los expertos de dominio podría
comprender y analizar una base de
datos completa
CPU con poder limitado
Datos Finitos
Científico de datos
Un científico de datos incorpora técnicas y teorías de
muchos campos, incluyendo las matemáticas, la estadística,
la ingeniería de datos, reconocimiento de patrones,
aprendizaje avanzado , visualización, modelado de la
incertidumbre, almacenamiento de datos y la computación
de alto rendimiento con el objetivo de extraer el significado
de datos.
Ciencia de datos: un término
utilizado indistintamente con
inteligencia de negocio o análitica
empresarial
¿Qué es el análisis predictivo?
 El análisis de datos con técnicas matemáticas de
estadística, minería de datos y aprendizaje
automático. Se utiliza para descubrir patrones
ocultos, que da una ventaja competitiva.
Qué es el análisis predictivo?
Predictive Analytics es el descubrimiento de información
predictiva, a veces oculta, de las bases de datos utilizando
atributos de datos relacionados y no relacionados con la
aplicación de algoritmos de análisis, y la creación de modelos
que generan resultados predictivos.
Modelaje Predictivo es el proceso
de creación de un modelo para
predecir mejor la probabilidad de
un resultado.
La introducción de Data Mining
Minería de datos habilitada predictivo Analítica
Análisis predictivo
Presentación Exploración Descubri
miento
Pasivo
Interactivo
Proactiv
e
Insight
Negocios
Informes en
conserva
Ad hoc Reporting
Modelo de Datos
Data Mining
Papel de
Software
¿Qué es el análisis predictivo?
Análisis Predictivo
Un componente vital en la Arquitectura de BI y
disponible en tiempo real a las aplicaciones, informes,
ETL
145% vs 89%
Predictive Analytics and ROI: Lessons from IDC's
Financial Impact Study (Fuente: IDC
http://www.spss.hu/home_page/idcreport.htm)
Medidas
(pasado)
Predección
(desconocido)
Escenarios comunes de clientes por análisis
predictivo
Metodología / Enfoque
Planteamiento del problema
What do you want
to predict?
Is data available?
Set a Target
Improve on
current results
Develop Solution
Integrate into
Applications or
Reports
Metodología / Enfoque
Obtener
datos
Explorar
datos
Preparar
datos
Entrenamiento Pruebas
Elegir
algoritmos
Entrenar
Probar
Despliegue
Monitorear
Modelado de minería de datos
Etapa de diseño
Etapa de
procesamiento
Etapa de
consulta
Modelo de
minería
Modelado de minería de datos
Modelo de
minería
Datos de
entrenamiento
Data
Engine
Minería
Etapa de diseño
Etapa de
procesamiento
Etapa de
consulta
Modelado de minería de datos
Data
Engine
Minería
Datos para
predecir
Datos
Predicción
Modelo de
minería
Etapa de diseño
Etapa de
procesamiento
Etapa de
consulta
El análisis predictivo ejemplo de flujo de
trabajo: tarjetas de crédito
El análisis predictivo ejemplo de flujo de
trabajo: tarjetas de crédito
Datos de crédito del Banco.
Los datos del historial de pago de la
oficina de crédito.
Los datos demográficos de terceros.
Hacer frente a los valores extremos y
valores perdidos.
Preparar las variables continuas y
categóricas.
El análisis predictivo ejemplo de flujo de
trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
El análisis predictivo ejemplo de flujo de
trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
Representar al modelo como una fórmula.
Implementar el modelo en la herramienta de puntuación del banco.
Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o
los socios del banco.
El análisis predictivo ejemplo de flujo de
trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
Monitorear continuamente el rendimiento del cuadro de mando
de los nuevos clientes.
Revisar el modelo una vez que comienza bajo rendimiento.
Representar al modelo como una fórmula.
Implementar el modelo en la herramienta de puntuación del banco.
Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o
los socios del banco.
Definiciones
Variable de Clase son los datos que estamos prediciendo.
Instancia y Atributo es similar a una fila y columna que se utiliza como
entrada para un modelo predictivo.
Soporte se refiere al número de instancias de un patrón particular.
Overfitting (Sobreentrenamiento) es un defecto en un modelo predictivo en
el que el modelo refleja los datos de entrenamiento de forma muy similar
Confussion Matrix (Matriz de clasificación) es una tabla que muestra los
valores pronosticados y su precisión.
Cross Validation es una forma de desarrollar y probar un modelo mediante el
uso de un porcentaje de los datos para probar
Herramientas de análisis predictivo de
Microsoft
Solución de problemas empresariales reales con herramientas de
análisis predictivo de Microsoft: el problema
Solución de problemas empresariales reales con herramientas
de análisis predictivo de Microsoft: la solución
Modelos de orientación al cliente: árboles de
decisión
Modelos de orientación al cliente: resultados
Solución # 2: Análisis de victorias / derrotas
Modelo de segmentación del cliente con la
agrupación
Modelo de segmentación del cliente
Entender por qué algunos clientes no compran productos
X
SQL Server Data Mining
 Servicio, no aplicación
 SQL Server Análisis
Services (SSAS)
 Múltiples interfaces:
 SQL Server Data Tools
(SSDT) ​​SQL Server
Management Studio
(SSMS)
 PowerShell
Elija Algoritmos
Clustering Classification
Regression Association
SQL Server Data Mining
SQL Server 2005 y 2008
• Analysis Services
SQL Server 2012
• Servicio de Análisis Multidimensional
Desarrollo
• Business Intelligence Development Studio
• Excel Data Mining Add-in
SQL Analysis Services Algoritmos de
minería
 Algoritmos de clasificación
 Árboles de decisión de Microsoft
 Microsoft Neural Network
 Microsoft Naive Bayes
 Algoritmos de regresión
 Serie temporal de Microsoft
 Regresión lineal de Microsoft
 Microsoft regresión logística
 Algoritmos de segmentación o agrupación
 Microsoft Clustering
 Algoritmos de asociación
 Microsoft Asociación
 Algoritmos de análisis de la secuencia
 Microsoft clústeres de secuencia
Datos SQL Server Algoritmos de minería
Algoritmo rápido y accesible
Se utiliza para clasificación
Técnica de minería de datos populares
Se utiliza para la clasificación, regresión y asociación
Busca la mejor manera posible en línea recta a través de una serie de puntos
Se utiliza para el análisis de predicción
SQL Server Data Mining Algoritmos
Continuado
Más sofisticados que los árboles de decisión y de Naïve Bayes, este algoritmo
puede explorar escenarios muy complejos
Se utiliza para la clasificación y regresión tareas
Un caso particular de la red neuronal algoritmo
Encuentra agrupaciones naturales dentro de los datos
Apoya las tareas de segmentación y detección de anomalías
SQL Server Data Mining Algoritmos
Continuado
Grupos de una secuencia de eventos discretos en grupos naturales basados ​​en
semejanza
Se utiliza para predecir los valores futuros de una serie temporal
Fue mejorado en SQL Server 2008 para producir más precisa pronósticos a más
largo plazo
Comúnmente utilizado para el mercado análisis de la cesta de aprender qué
productos se compran juntos
SQL Server Data Mining Algoritmos
Continuado
Clasificar
• Decision
Trees
• Logistic
Regression
• Naïve Bayes
• Neural
Networks
Estimar
• Decision
Trees
• Linear
Regression
• Logistic
Regression
• Neural
Networks
Cluster
• Clustering
Forecast
• Time Series
Asociación
• Association
Rules
• Decision
Trees
ARIMA
 ARIMA (p, d, q): Auto-Regresivo Integrado de
Promedios
 p es el número de términos autorregresivos
 d es el número de diferencias no estacionales
 q es el número de errores de pronóstico
rezagados en la ecuación de predicción
 Ecuación general ARIMA
17
 

q
i
t
i
i
p
i
t
di
i LYLL
11
*)*1(*)1)(*1( 
ARIMA Ejemplos
 ARIMA (0,1,0) -
paseo aleatorio
 ARIMA (1,1,0) -
differenced modelo
autorregresivo de
primer orden
 ARIMA (0,1,1) con
constante =
suavización
exponencial simple
con un crecimiento
 ARIMA (1,1,1)
18
1 tt YY 
)( 21
1




tt
tt
YY
YY


11 *   ttt YY 
1
21
1
*
)(






t
tt
tt
YY
YY



tiemp
o
venta¿Qué algoritmo es mejor?
Venta real
Las
medias
móviles
suavizada
s a la
regresión
lineal
simple
Regresión
lineal por
tramos
Nota: ajuste mejor no siempre significa mejor predicción!
El arte de la Previsión
tiempo
venta
Las ventas reales (dos
productos)
Las medias móviles
suavizadas a la
regresión lineal
simple -todos los
tiempos
Regresión lineal
simple - la última vez
Regresión lineal por
tramos
¿Qué algoritmo es mejor?
Nota: ajuste mejor no siempre significa mejor predicción!
Minería de datos para Excel
 Construido para Office 2010:
32-bit o 64-bit Add-In
 Requiere Analysis Services
 SQL Server 2012 Data
Mining
 Enterprise o
 Inteligencia de Negocios o
 Revelador
Minería de datos para Excel
 Minería de datos cliente para Excel
 Construir, validar y gestionar los modelos de datos
 Examinar y modelos de minería de datos de consulta
• Herramientas de tabla de análisis para Excel
 Lleve a cabo una serie de análisis de mesa
 No se requieren conocimientos de la minería de datos
PowerPivot para Excel
 Características
 Libros de Excel
 Aprovecha la memoria: Procesamiento rápido
 Carga los grandes conjuntos de datos (especialmente de 64 bits)
 Analytics a través DAX
 Aprovecha los procesadores Multi-Core
PowerPivot
http://www.microsoft.com / en-us / bi /
powerpivot.aspx
Los datos de demostración
 Contoso Retail conjunto de datos de demostración
 http://www.microsoft.com/en-
us/download/details.aspx?id=18279
 De Windows Azure Marketplace
 https://datamarket.azure.com/
DEMOSTRACIÓN
Errores comunes en el análisis predictivo
Resumen
Cómo empezar
 Excel Data Mining Add-In (gratuito)
 http://www.microsoft.com/en-us/download/details.aspx?id=29061
 PowerPivot (Free)
 http://www.microsoft.com / en-us / bi / powerpivot.aspx
 Windows 7
 http://windows.microsoft.com/en-US/windows/shop/windows-7
 SQL Server 2012
 http://www.microsoft.com / sqlserver / es / es / default.aspx
 Microsoft Office
 http://office.microsoft.com/en-us/
Conclusión
 SQL Server Analysis Services proporciona la
minería de datos de nivel empresarial para
Excel 2013 con PowerPivot
72 |
Eduardo
Castro
ecastro@simsasys.com ecastrom.blogspot.com
edocastro
PREGUNTAS Y RESPUESTAS

Mais conteúdo relacionado

Mais procurados

Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data WarehouseEduardo Castro
 
Modelo Del Negocio con RUP y UML Parte 3
Modelo Del Negocio con RUP y UML Parte 3Modelo Del Negocio con RUP y UML Parte 3
Modelo Del Negocio con RUP y UML Parte 3David Motta Baldarrago
 
Sistemas de gestión de base de datos
Sistemas de gestión de base de datosSistemas de gestión de base de datos
Sistemas de gestión de base de datosjudithmore16
 
Vistas En Sql Y My Sql
Vistas En Sql Y My SqlVistas En Sql Y My Sql
Vistas En Sql Y My Sqltec lerdo
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosFranklin Parrales Bravo
 
Presentacion herramientas CASE
Presentacion herramientas CASEPresentacion herramientas CASE
Presentacion herramientas CASEdavidsande
 
Azure+Databricks+Course+Slide+Deck+V4.pdf
Azure+Databricks+Course+Slide+Deck+V4.pdfAzure+Databricks+Course+Slide+Deck+V4.pdf
Azure+Databricks+Course+Slide+Deck+V4.pdfChitresh Kaushik
 
Breve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQLBreve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQLTotus Muertos
 
COMO CREAR UNA BASE DE DATOS EN XAMPP
COMO CREAR UNA BASE DE DATOS EN XAMPPCOMO CREAR UNA BASE DE DATOS EN XAMPP
COMO CREAR UNA BASE DE DATOS EN XAMPPdisenarUniminuto
 
Analisis y Diseños de Sistemas 2-Metodologia OOSE
Analisis y Diseños de Sistemas 2-Metodologia OOSEAnalisis y Diseños de Sistemas 2-Metodologia OOSE
Analisis y Diseños de Sistemas 2-Metodologia OOSEMari Cruz
 
Tipos de datos en MySQL
Tipos de datos en MySQLTipos de datos en MySQL
Tipos de datos en MySQLTotus Muertos
 
Diagramas de proceso de negocio bpd
Diagramas de proceso de negocio bpdDiagramas de proceso de negocio bpd
Diagramas de proceso de negocio bpdJuan Jara
 
Casos de Estudio-Investigación de operaciones
Casos de Estudio-Investigación de operacionesCasos de Estudio-Investigación de operaciones
Casos de Estudio-Investigación de operacionesProjectIOP
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Eduardo Castro
 

Mais procurados (20)

Introduccion a PowerBI
Introduccion a PowerBIIntroduccion a PowerBI
Introduccion a PowerBI
 
Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
 
Data Access Patterns
Data Access PatternsData Access Patterns
Data Access Patterns
 
Modelo Del Negocio con RUP y UML Parte 3
Modelo Del Negocio con RUP y UML Parte 3Modelo Del Negocio con RUP y UML Parte 3
Modelo Del Negocio con RUP y UML Parte 3
 
Big data presentacion diapositiva
Big data presentacion diapositivaBig data presentacion diapositiva
Big data presentacion diapositiva
 
Sistemas de gestión de base de datos
Sistemas de gestión de base de datosSistemas de gestión de base de datos
Sistemas de gestión de base de datos
 
Vistas En Sql Y My Sql
Vistas En Sql Y My SqlVistas En Sql Y My Sql
Vistas En Sql Y My Sql
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
 
Ejemplos de requerimientos
Ejemplos de requerimientosEjemplos de requerimientos
Ejemplos de requerimientos
 
Presentacion herramientas CASE
Presentacion herramientas CASEPresentacion herramientas CASE
Presentacion herramientas CASE
 
Azure+Databricks+Course+Slide+Deck+V4.pdf
Azure+Databricks+Course+Slide+Deck+V4.pdfAzure+Databricks+Course+Slide+Deck+V4.pdf
Azure+Databricks+Course+Slide+Deck+V4.pdf
 
Breve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQLBreve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQL
 
Formas Normales
Formas NormalesFormas Normales
Formas Normales
 
COMO CREAR UNA BASE DE DATOS EN XAMPP
COMO CREAR UNA BASE DE DATOS EN XAMPPCOMO CREAR UNA BASE DE DATOS EN XAMPP
COMO CREAR UNA BASE DE DATOS EN XAMPP
 
Analisis y Diseños de Sistemas 2-Metodologia OOSE
Analisis y Diseños de Sistemas 2-Metodologia OOSEAnalisis y Diseños de Sistemas 2-Metodologia OOSE
Analisis y Diseños de Sistemas 2-Metodologia OOSE
 
Tipos de datos en MySQL
Tipos de datos en MySQLTipos de datos en MySQL
Tipos de datos en MySQL
 
Diagramas de proceso de negocio bpd
Diagramas de proceso de negocio bpdDiagramas de proceso de negocio bpd
Diagramas de proceso de negocio bpd
 
Casos de Estudio-Investigación de operaciones
Casos de Estudio-Investigación de operacionesCasos de Estudio-Investigación de operaciones
Casos de Estudio-Investigación de operaciones
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022
 

Semelhante a Introducción al análisis predictivo con SQL Server

Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Eduardo Castro
 
Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Eduardo Castro
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaLPI ONG
 
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big DataKEEDIO
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Presentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsPresentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsMauricio Smith Mejia
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datosedwin
 
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)DQSconsulting
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis ServicesMartha
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo
 
La investigacion operativa aplicado a la administracion
La investigacion operativa aplicado a la administracionLa investigacion operativa aplicado a la administracion
La investigacion operativa aplicado a la administracionSandra Bolo Gomez
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerEduardo Castro
 
Conceptos generales de sia
Conceptos generales de siaConceptos generales de sia
Conceptos generales de siaAntonio Atenas
 

Semelhante a Introducción al análisis predictivo con SQL Server (20)

Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012
 
Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Presentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsPresentacion software-Predictive Analytics
Presentacion software-Predictive Analytics
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
Inteligencia Artificial aplicada a la empresa (PPT del WEBINARIO)
 
Analysis services
Analysis  servicesAnalysis  services
Analysis services
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
 
Marcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de DatosMarcos Macedo Entregable final Analítica de Datos
Marcos Macedo Entregable final Analítica de Datos
 
La investigacion operativa aplicado a la administracion
La investigacion operativa aplicado a la administracionLa investigacion operativa aplicado a la administracion
La investigacion operativa aplicado a la administracion
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL Server
 
De 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine LearningDe 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine Learning
 
Conceptos generales de sia
Conceptos generales de siaConceptos generales de sia
Conceptos generales de sia
 

Mais de Eduardo Castro

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL ServerEduardo Castro
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL AzureEduardo Castro
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflowEduardo Castro
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022Eduardo Castro
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022Eduardo Castro
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceEduardo Castro
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022Eduardo Castro
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Eduardo Castro
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricksEduardo Castro
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql serverEduardo Castro
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsEduardo Castro
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Eduardo Castro
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsEduardo Castro
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en AzureEduardo Castro
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL ServerEduardo Castro
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Eduardo Castro
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesEduardo Castro
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesEduardo Castro
 
Que es azure sql datawarehouse
Que es azure sql datawarehouseQue es azure sql datawarehouse
Que es azure sql datawarehouseEduardo Castro
 
Novedades en SQL Server 2019
Novedades en SQL Server 2019Novedades en SQL Server 2019
Novedades en SQL Server 2019Eduardo Castro
 

Mais de Eduardo Castro (20)

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL Azure
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflow
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed Instance
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricks
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql server
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analytics
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse Analytics
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en Azure
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL Server
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure Enclaves
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure Enclaves
 
Que es azure sql datawarehouse
Que es azure sql datawarehouseQue es azure sql datawarehouse
Que es azure sql datawarehouse
 
Novedades en SQL Server 2019
Novedades en SQL Server 2019Novedades en SQL Server 2019
Novedades en SQL Server 2019
 

Último

Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 

Último (15)

Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 

Introducción al análisis predictivo con SQL Server

  • 1. Introducción al análisis predictivo con SQL Server Ing. Eduardo Castro, PhD ecastro@simsasys.com Microsoft SQL Server MVP PASS Regional Mentor
  • 2. SQL Saturday Sponsors Gold Sponsors Silver Sponsors Bronze Sponsors
  • 3. Fuentes consultadas  TechEd 2014 Channel 9  Enhancing Applications with SQL Server Data Mining. Peter Myers  Predictive Analytics in the Enterprise. Carlos Bossy  El arte (y ARIMA) de Forecasting. Dejan Sarka
  • 4. Canal en YouTube  http://www.youtube.com / eduardocastrom  http://slideshare.net/ecastrom  http://tinyurl.com/comunidad windows
  • 6. Definiciones Frase Objetivo "La minería de datos" Toma de decisiones "Machine Learning" Determinar el algoritmo de mejor desempeño
  • 10. ¿Por qué el resurgimiento en el análisis predictivo?
  • 11. Antes <-----> Hoy Explosión de datos se duplica cada 3 años (Ley de Moore) Los volúmenes de datos no pueden ser comprendidos por los seres humanos Difícil de encontrar patrones de ventaja competitiva Mejorar el criterio profesional de expertos de dominio (pequeño pero valioso) Descubrimiento de Conocimiento HoyAntes Volúmenes manejables de datos La facilidad y el poder de SQL Los expertos de dominio podría comprender y analizar una base de datos completa CPU con poder limitado Datos Finitos
  • 12. Científico de datos Un científico de datos incorpora técnicas y teorías de muchos campos, incluyendo las matemáticas, la estadística, la ingeniería de datos, reconocimiento de patrones, aprendizaje avanzado , visualización, modelado de la incertidumbre, almacenamiento de datos y la computación de alto rendimiento con el objetivo de extraer el significado de datos. Ciencia de datos: un término utilizado indistintamente con inteligencia de negocio o análitica empresarial
  • 13. ¿Qué es el análisis predictivo?  El análisis de datos con técnicas matemáticas de estadística, minería de datos y aprendizaje automático. Se utiliza para descubrir patrones ocultos, que da una ventaja competitiva.
  • 14. Qué es el análisis predictivo? Predictive Analytics es el descubrimiento de información predictiva, a veces oculta, de las bases de datos utilizando atributos de datos relacionados y no relacionados con la aplicación de algoritmos de análisis, y la creación de modelos que generan resultados predictivos. Modelaje Predictivo es el proceso de creación de un modelo para predecir mejor la probabilidad de un resultado.
  • 15. La introducción de Data Mining Minería de datos habilitada predictivo Analítica Análisis predictivo Presentación Exploración Descubri miento Pasivo Interactivo Proactiv e Insight Negocios Informes en conserva Ad hoc Reporting Modelo de Datos Data Mining Papel de Software
  • 16. ¿Qué es el análisis predictivo?
  • 17. Análisis Predictivo Un componente vital en la Arquitectura de BI y disponible en tiempo real a las aplicaciones, informes, ETL 145% vs 89% Predictive Analytics and ROI: Lessons from IDC's Financial Impact Study (Fuente: IDC http://www.spss.hu/home_page/idcreport.htm) Medidas (pasado) Predección (desconocido)
  • 18. Escenarios comunes de clientes por análisis predictivo
  • 19. Metodología / Enfoque Planteamiento del problema What do you want to predict? Is data available? Set a Target Improve on current results Develop Solution Integrate into Applications or Reports
  • 20. Metodología / Enfoque Obtener datos Explorar datos Preparar datos Entrenamiento Pruebas Elegir algoritmos Entrenar Probar Despliegue Monitorear
  • 21. Modelado de minería de datos Etapa de diseño Etapa de procesamiento Etapa de consulta Modelo de minería
  • 22. Modelado de minería de datos Modelo de minería Datos de entrenamiento Data Engine Minería Etapa de diseño Etapa de procesamiento Etapa de consulta
  • 23. Modelado de minería de datos Data Engine Minería Datos para predecir Datos Predicción Modelo de minería Etapa de diseño Etapa de procesamiento Etapa de consulta
  • 24. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
  • 25. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Datos de crédito del Banco. Los datos del historial de pago de la oficina de crédito. Los datos demográficos de terceros. Hacer frente a los valores extremos y valores perdidos. Preparar las variables continuas y categóricas.
  • 26. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto.
  • 27. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto. Representar al modelo como una fórmula. Implementar el modelo en la herramienta de puntuación del banco. Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o los socios del banco.
  • 28. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto. Monitorear continuamente el rendimiento del cuadro de mando de los nuevos clientes. Revisar el modelo una vez que comienza bajo rendimiento. Representar al modelo como una fórmula. Implementar el modelo en la herramienta de puntuación del banco. Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o los socios del banco.
  • 29. Definiciones Variable de Clase son los datos que estamos prediciendo. Instancia y Atributo es similar a una fila y columna que se utiliza como entrada para un modelo predictivo. Soporte se refiere al número de instancias de un patrón particular. Overfitting (Sobreentrenamiento) es un defecto en un modelo predictivo en el que el modelo refleja los datos de entrenamiento de forma muy similar Confussion Matrix (Matriz de clasificación) es una tabla que muestra los valores pronosticados y su precisión. Cross Validation es una forma de desarrollar y probar un modelo mediante el uso de un porcentaje de los datos para probar
  • 30. Herramientas de análisis predictivo de Microsoft
  • 31. Solución de problemas empresariales reales con herramientas de análisis predictivo de Microsoft: el problema
  • 32. Solución de problemas empresariales reales con herramientas de análisis predictivo de Microsoft: la solución
  • 33. Modelos de orientación al cliente: árboles de decisión
  • 34. Modelos de orientación al cliente: resultados
  • 35. Solución # 2: Análisis de victorias / derrotas
  • 36. Modelo de segmentación del cliente con la agrupación
  • 37. Modelo de segmentación del cliente Entender por qué algunos clientes no compran productos X
  • 38. SQL Server Data Mining  Servicio, no aplicación  SQL Server Análisis Services (SSAS)  Múltiples interfaces:  SQL Server Data Tools (SSDT) ​​SQL Server Management Studio (SSMS)  PowerShell
  • 40. SQL Server Data Mining SQL Server 2005 y 2008 • Analysis Services SQL Server 2012 • Servicio de Análisis Multidimensional Desarrollo • Business Intelligence Development Studio • Excel Data Mining Add-in
  • 41. SQL Analysis Services Algoritmos de minería  Algoritmos de clasificación  Árboles de decisión de Microsoft  Microsoft Neural Network  Microsoft Naive Bayes  Algoritmos de regresión  Serie temporal de Microsoft  Regresión lineal de Microsoft  Microsoft regresión logística  Algoritmos de segmentación o agrupación  Microsoft Clustering  Algoritmos de asociación  Microsoft Asociación  Algoritmos de análisis de la secuencia  Microsoft clústeres de secuencia
  • 42. Datos SQL Server Algoritmos de minería Algoritmo rápido y accesible Se utiliza para clasificación Técnica de minería de datos populares Se utiliza para la clasificación, regresión y asociación Busca la mejor manera posible en línea recta a través de una serie de puntos Se utiliza para el análisis de predicción
  • 43. SQL Server Data Mining Algoritmos Continuado Más sofisticados que los árboles de decisión y de Naïve Bayes, este algoritmo puede explorar escenarios muy complejos Se utiliza para la clasificación y regresión tareas Un caso particular de la red neuronal algoritmo Encuentra agrupaciones naturales dentro de los datos Apoya las tareas de segmentación y detección de anomalías
  • 44. SQL Server Data Mining Algoritmos Continuado Grupos de una secuencia de eventos discretos en grupos naturales basados ​​en semejanza Se utiliza para predecir los valores futuros de una serie temporal Fue mejorado en SQL Server 2008 para producir más precisa pronósticos a más largo plazo Comúnmente utilizado para el mercado análisis de la cesta de aprender qué productos se compran juntos
  • 45. SQL Server Data Mining Algoritmos Continuado Clasificar • Decision Trees • Logistic Regression • Naïve Bayes • Neural Networks Estimar • Decision Trees • Linear Regression • Logistic Regression • Neural Networks Cluster • Clustering Forecast • Time Series Asociación • Association Rules • Decision Trees
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54. ARIMA  ARIMA (p, d, q): Auto-Regresivo Integrado de Promedios  p es el número de términos autorregresivos  d es el número de diferencias no estacionales  q es el número de errores de pronóstico rezagados en la ecuación de predicción  Ecuación general ARIMA 17    q i t i i p i t di i LYLL 11 *)*1(*)1)(*1( 
  • 55. ARIMA Ejemplos  ARIMA (0,1,0) - paseo aleatorio  ARIMA (1,1,0) - differenced modelo autorregresivo de primer orden  ARIMA (0,1,1) con constante = suavización exponencial simple con un crecimiento  ARIMA (1,1,1) 18 1 tt YY  )( 21 1     tt tt YY YY   11 *   ttt YY  1 21 1 * )(       t tt tt YY YY   
  • 56. tiemp o venta¿Qué algoritmo es mejor? Venta real Las medias móviles suavizada s a la regresión lineal simple Regresión lineal por tramos Nota: ajuste mejor no siempre significa mejor predicción!
  • 57. El arte de la Previsión tiempo venta Las ventas reales (dos productos) Las medias móviles suavizadas a la regresión lineal simple -todos los tiempos Regresión lineal simple - la última vez Regresión lineal por tramos ¿Qué algoritmo es mejor? Nota: ajuste mejor no siempre significa mejor predicción!
  • 58. Minería de datos para Excel  Construido para Office 2010: 32-bit o 64-bit Add-In  Requiere Analysis Services  SQL Server 2012 Data Mining  Enterprise o  Inteligencia de Negocios o  Revelador
  • 59. Minería de datos para Excel  Minería de datos cliente para Excel  Construir, validar y gestionar los modelos de datos  Examinar y modelos de minería de datos de consulta • Herramientas de tabla de análisis para Excel  Lleve a cabo una serie de análisis de mesa  No se requieren conocimientos de la minería de datos
  • 60. PowerPivot para Excel  Características  Libros de Excel  Aprovecha la memoria: Procesamiento rápido  Carga los grandes conjuntos de datos (especialmente de 64 bits)  Analytics a través DAX  Aprovecha los procesadores Multi-Core
  • 62. Los datos de demostración  Contoso Retail conjunto de datos de demostración  http://www.microsoft.com/en- us/download/details.aspx?id=18279  De Windows Azure Marketplace  https://datamarket.azure.com/
  • 64. Errores comunes en el análisis predictivo
  • 66. Cómo empezar  Excel Data Mining Add-In (gratuito)  http://www.microsoft.com/en-us/download/details.aspx?id=29061  PowerPivot (Free)  http://www.microsoft.com / en-us / bi / powerpivot.aspx  Windows 7  http://windows.microsoft.com/en-US/windows/shop/windows-7  SQL Server 2012  http://www.microsoft.com / sqlserver / es / es / default.aspx  Microsoft Office  http://office.microsoft.com/en-us/
  • 67. Conclusión  SQL Server Analysis Services proporciona la minería de datos de nivel empresarial para Excel 2013 con PowerPivot