SlideShare uma empresa Scribd logo
1 de 67
Análisis
Predicitivo con
Microsoft Azure
Machine
Learning
Dr. Eduardo Castro, MATI
IEEE Computer Society ViceChair
Microsoft SQL Server MVP
PASS Regional Mentor
Introducción para BI & Big Data
DAX
MDX
Minería de Datos
Excel BI
Recursos adicionales
http://www.youtube.com/eduardocastrom
Canal en YouTube
Definiciones
Frase Objetivo
"La minería de datos" Toma de decisiones
"Machine Learning" Determinar el algoritmo de mejor desempeño
Introducción al Análisis predictivo
Predictive Analytics
Predictive ModelingData Mining
Análisis predictivo
• ¿Qué porcentaje de las aplicaciones analíticas
utilizará las capacidades predictivas en 2014?
Análisis predictivo
• ¿Qué porcentaje de las aplicaciones analíticas
utilizará las capacidades predictivas en 2014?
¿Por qué el resurgimiento en el análisis predictivo?
Científico de datos
Un científico de datos incorpora técnicas y teorías de
muchos campos, incluyendo las matemáticas, la estadística,
la ingeniería de datos, reconocimiento de patrones,
aprendizaje avanzado , visualización, modelado de la
incertidumbre, almacenamiento de datos y la computación
de alto rendimiento con el objetivo de extraer el significado
de datos.
Ciencia de datos: un término
utilizado indistintamente con
inteligencia de negocio o análitica
empresarial
¿Qué es el análisis predictivo?
• El análisis de datos con técnicas matemáticas de
estadística, minería de datos y aprendizaje
automático. Se utiliza para descubrir patrones
ocultos, que da una ventaja competitiva.
Qué es el análisis predictivo?
Predictive Analytics es el descubrimiento de información
predictiva, a veces oculta, de las bases de datos
utilizando atributos de datos relacionados y no
relacionados con la aplicación de algoritmos de análisis,
y la creación de modelos que generan resultados
predictivos.
Modelaje Predictivo es el proceso de creación de un
modelo para predecir mejor la probabilidad de un
resultado.
Minería de datos habilita Analítica Predictiva
Análisis predictivo
Presentación Exploración Descubrim
iento
Pasivo
Interactivo
Proactive
Insight
Negocios
Informes en
conserva
Ad hoc Reporting
Modelo de Datos
Data Mining
Papel de
Software
¿Qué es el análisis predictivo?
Escenarios comunes de clientes por análisis predictivo
Principales fuentes de datos
• Redes sociales y medios de comunicación
• 700 millones de usuarios de Facebook, 250 millones de usuarios de Twitter y 156
millones de blogs públicos
• Dispositivos móviles
• Más de 5 mil millones de teléfonos móviles en uso en todo el mundo
• Transacciones en Internet
• miles de millones de compras en línea, operaciones de bolsa y otras
transacciones ocurren todos los días
• Dispositivos de red y sensores
Casos de uso
Sentiment Analysis
• Utilizado junto con Hadoop, herramientas avanzadas de análisis de
texto analizan el texto no estructurado de las redes sociales y
mensajes de redes sociales
• Incluyendo los Tweets y mensajes de Facebook, para determinar la
confianza del usuario en relación con determinadas empresas, marcas
o productos.
• El análisis puede centrarse en el sentimiento a nivel macro hasta el
sentimiento usuario individual.
Casos de uso
Modelado de riesgo
• Las empresas financieras, bancos y otros utilizan Hadoop y Next
Generation Data Warehouse para analizar grandes volúmenes de
datos transaccionales para determinar el riesgo y la exposición de los
activos financieros
• Para preparar la posible "qué pasaría si" los escenarios basados ​​en el
comportamiento del mercado simulado, y para puntuación de
clientes potenciales por el riesgo.
Casos de uso
Motor de recomendación
• Los minoristas en línea utilizan Hadoop para igualar y recomendar a
los usuarios entre sí o con los productos y servicios basados ​​en el
análisis del perfil de usuario y los datos de comportamiento.
• LinkedIn utiliza este enfoque para potenciar su función de "la gente
puede saber", mientras que Amazon utiliza para sugerir productos a
la venta a los consumidores en línea.
Casos de uso
Detección de Fraude
• Utilizar técnicas de Big Data para combinar el comportamiento
del cliente, históricos y datos de transacciones para detectar la
actividad fraudulenta.
• Las compañías de tarjetas de crédito, por ejemplo, utilizan
tecnologías de Big Data para identificar el comportamiento
transaccional que indica una alta probabilidad de una tarjeta
robada.
Casos de uso
Análisis de la campaña de marketing
• Los departamentos de marketing a través de industrias han
utilizado durante mucho tiempo la tecnología para monitorear y
determinar la efectividad de las campañas de marketing.
• Big Data permite a los equipos de marketing para incorporar
mayores volúmenes de datos cada vez más granulares, como los
datos de click-stream y registros detallados de llamadas, para
aumentar la precisión de los análisis.
Casos de uso
Análisis Social Graph
• Junto con Hadoop los datos de redes sociales se extraen
para determinar qué clientes representan la mayor
influencia sobre los demás dentro de las redes sociales.
• Esto ayuda a determinar las empresas que son sus
clientes "más importantes", que no siempre son los que
compran la mayoría de los productos o de los que más
gastan, pero los que tienden a influir en el
comportamiento de compra de la mayoría de los
demás.
Casos de uso
Customer Experience Analytics
• Empresas orientadas al consumidor utilizan Hadoop y
tecnologías relacionadas con Big Data para integrar los
datos de antes silos canales de interacción con clientes
• Tales como centros de llamadas, chat en línea, Twitter, etc,
para obtener una visión completa de la experiencia del
cliente.
El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
Datos de crédito del Banco.
Los datos del historial de pago de la
oficina de crédito.
Los datos demográficos de terceros.
Hacer frente a los valores extremos y
valores perdidos.
Preparar las variables continuas y
categóricas.
El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
Representar al modelo como una fórmula.
Implementar el modelo en la herramienta de puntuación del banco.
Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o
los socios del banco.
El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
Utilice Microsoft o una solución de
terceros (por ejemplo, SAS). O ...
Programe su propio algoritmo.
Entrenar el modelo con gran subconjunto
de los datos y probado en subconjunto
más pequeño.
La regresión logística es un estándar de
facto.
Monitorear continuamente el rendimiento del cuadro de mando
de los nuevos clientes.
Revisar el modelo una vez que comienza bajo rendimiento.
Representar al modelo como una fórmula.
Implementar el modelo en la herramienta de puntuación del banco.
Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o
los socios del banco.
• La automatización de la automatización
• Utilizar computadoras para programar
computadoras
• Escribir software es el cuello de botella
• Deje que los datos hagan el trabajo!
Qué es el aprendizaje autómático o Machine Learning
2
¿Por qué "Aprender"?
• El aprendizaje automático es la programación de
computadoras para optimizar un criterio de desempeño
usando datos como ejemplo o experiencia previa.
• El aprendizaje se utiliza cuando:
• Experiencia humana no existe (la navegación en Marte),
• Los seres humanos son incapaces de explicar su experiencia (reconocimiento de
voz)
• Solución cambios en el tiempo (el enrutamiento en una red informática)
• Solución necesita ser adaptada a los casos particulares (biométrica de usuario)
Cumpliendo con uno de los viejos sueños
del co-fundador de Microsoft, Bill Gates:
Computadoras que podemos ver, oír
y entender.
John Platt
Científico distinguido en
Microsoft Research
¿Qué es
Aprendizaje
Automático?
Sistemas informáticos de
predicción se vuelven más
inteligentes, con
experiencia
"
"
3
De qué hablamos cuando hablamos de "Aprendizaje"
• Aprender modelos generales a partir de ejemplos de
datos particulares
• Los datos son baratos y abundantes (data warehouses,
data marts); el conocimiento es caro y escaso.
• Ejemplo para comercio minorista: las transacciones de los
clientes y la conducta del consumidor:
Las personas que compraron "Código Da Vinci" también compraron "Las cinco personas que
conoces en el cielo" (www.amazon.com)
• Construir un modelo que es una aproximación buena y
útil de los datos.
Computadora
Datos
Programa
Salida
Computadora
Datos
Salida
Programa
Programación tradicional vs machine learning
Analytics Vision
Utilizando los datos del pasado para predecir el futuro
Motores
recomenda-ción
Análisis
Publicidad
El pronóstico del
tiempo para la
planificación de
negocios
Análisis de redes
sociales
Legal
descubrimiento y
archivo de
documentos
Análisis de
precios
Fraude
detección
Mantequera
análisis
Supervisión de
equipos
Seguimiento y
servicios
basados ​​en
localización
Seguros
personalizada
El aprendizaje automático y
el análisis predictivo son
capacidades básicas que se
necesitan en toda la
empresa
• Búsqueda Web
• Biología computacional
• Finanzas
• E-commerce
• La exploración espacial
• Robótica
• Extracción de información
• Redes sociales
• Depuración
Aplicaciones de ejemplo
• Muchos algoritmos de aprendizaje automático
• Cientos nuevas cada año
• Cada algoritmo de aprendizaje automático tiene
tres componentes:
• Representación
• Evaluación
• Optimización
ML en resumen
• Los árboles de decisión
• Conjuntos de reglas / Programas de Logica
• Instancias
• Modelos gráficos (Bayes / redes de Markov)
• Las redes neuronales
• Máquinas de vectores
Representación de Algoritmos de ML
• Precisión
• Precisión y recuperación
• Error cuadrado
• Probabilidad
• Posterior probabilidad
• Costo / Utilidad
• Margen
• Entropía
• K-L divergencia
• Etcétera
Evaluación de algoritmos de ML
• Optimización combinatoria
• Por ejemplo .: búsqueda Greedy
• Optimización convexa
• Por ejemplo .: descenso de gradiente
• Optimización con restricciones
• Por ejemplo .: programación lineal
Optimización de algoritmos de ML
• Aprendizaje por análisis de asociación
• Aprendizaje Supervisado (inductivo)
• Los datos de entrenamiento incluye salidas deseadas
• Clasificación
• Regresión/ Predicción
• Aprendizaje no supervisado
• Los datos de entrenamiento no incluye salidas deseadas
• Aprendizaje semisupervisado
• Los datos de entrenamiento incluye un par de productos deseados
• Aprendizaje por refuerzo
• Recompensas con base en secuencia de acciones
Tipos de aprendizaje
• Dado ejemplos de una función (X, F (X))
• Predecir función F (X) para nuevos ejemplos X
• Discreto F (X): Clasificación
• Continuo F (X): Regresión
• F (X) = Probabilidad (X): Estimación de Probabilidad
Apredizaje inductivo
• El aprendizaje supervisado
• Inducción por Árbol de decisiones
• Inducción por reglas
• Aprendizaje basado en Instancias
• Aprendizaje bayesiano
• Las redes neuronales
• Máquinas de vectores
• Aprendizaje no supervisado
• Clustering
• Reducción de dimensionalidad
Clasificación de aprendizajes
Aprendizaje por asociación
• Análisis de la carrito de compras:
P(Y|X) La probabilidad de que alguien que compra X También compra Y donde X y Y
son productos / servicios.
Ejemplo: P(Frijoles molidos | Tortillitas) = 0,7
Transacciones de carrito de compras
ID Producto
1 Arroz, Coca Cola
2 Arroz, Coca Cola, Frijoles
3 Arroz, Frijoles
4 Tortillitas, Frijoles
Molidos
5 Arroz, Coca Cola, Frijoles
Molidos, Tortillitas
Aprendizaje por clasificación
9
• Ejemplo: El puntaje de crédito
• Diferenciar entre bajo riesgo y de
riesgo alto con base en los
ingresos y ahorros de los clientes
Discriminante: IF ingresos > Θ1 Y ahorros > Θ2
ENTONCES bajo riesgo ELSE
riesgo alto
Modelo
Regresión lineal
• La regresión lineal es una de las técnicas de predicción
más antiguos de estadística. El objetivo de la regresión
lineal es ajustar un modelo lineal entre las variables de
respuesta e independientes, y lo utilizan para predecir el
resultado dado un conjunto de variables independientes
observados . Un modelo de regresión lineal simple es una
fórmula con la estructura:
Regresión lineal
• Y es la variable de respuesta (es decir, el resultado que usted está tratando
de predecir), como las millas por galón.
• X1,X2, X3, etc., son las variables independientes que se utilizan para
predecir el resultado.
• b0 es una constante que es la intersección de la línea de regresión.
• b1, b2, b3, etc., son los coeficientes de las variables independientes.
Estos se refieren a las pistas parciales de cada variable.
• e es el error o ruido asociado con la variable de respuesta que
no se puede explicar por la variables independientes X1, X2, X3 y.
Un modelo
de regresión
lineal simple
que predice
millas de un
carro por
galón de su
potencia de
motor
Redes Neuronales
• Las redes neuronales artificiales son un conjunto de algoritmos
que imitan el funcionamiento del cerebro.
• Hay muchos algoritmos de redes neuronales diferentes, incluidas
las redes de retropropagación, redes de Hopfield, Redes de
Kohonen (también conocidos como mapas auto-organizados) y
Redes ART (o ART) redes.
• Sin embargo, el más común es el algoritmo de back-propagation,
también conocido como multilayered perceptron.
Árboles de decisión
• Algoritmos de árboles de decisión son técnicas
jerárquicas que funcionan mediante la división del
conjunto de datos de forma iterativa en base a
ciertos criterios estadísticos.
• El objetivo de los árboles de decisión es maximizar
la varianza entre los diferentes nodos en el árbol, y
minimizar la varianza dentro de cada nodo
Ejemplo de árbol de decisión
• La comprensión de dominio, conocimiento previo, y las metas
deseadas
• La integración de datos, selección, limpieza, pre-procesamiento,
etc.
• Modelos de aprendizaje
• Interpretación de los resultados
• La consolidación y el despliegue de conocimiento descubierto
Machine Learning en la práctica
¿Cómo utilizo Azure Machine Learning?
Importar datos
Constuir un
modelo
Combinar el
Modelo con el
API
Una solución de Aprendizaje Automático – obtener resultados a partir de
los datos
Azure Portal
Operaciones
Azure Equipo
ML Studio
Científico de
Datos
HDInsight
Almacenamiento
En Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Equipo de operaciones de
Azure
PowerBI/ DashboardsAplicaciones MóvilesAplicaciones Web
Servicio API ML Desarrollador
Una solución de Aprendizaje Automático - obtener resultados a partir de los datos
Azure Portal
Operaciones
Azure Equipo
ML Estudio
Datos Científico
HDInsight
Almacenamiento
Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Operaciones
Azure Equipo
PowerBI/ DashboardsAplicaciones MóvilesAplicaciones Web
Servicio API ML Revelador
ML Studio
y el científico de datos
• Acceso y preparación de
datos
• Crear, modelos de prueba
• Con un solo clic pasar a la
etapa de producción a través
de la API de Servicios
Servicio API Azure Portal y
ML
• Crear ML Studio Workplace
• Asignar cuenta de almacenamiento
(s)
• Monitor Consumo ML
• Ver alertas cuando el modelo es listo
• Publicar WebServices
API ML servicio y el desarrollador
• Modelos disponibles como una url que se puede invocar
Los usuarios pueden acceder
fácilmente a los resultados: desde
cualquier lugar,en cualquier dispositivo
Hola, Machine Learning
Studio!
Machine Learning Studio
Experimentos: Los experimentos que se han creado, ejecutado, y
guardado como borradores. Estos incluyen un conjunto de experimentos de
ejemplo que se incluyen con el servicio que le ayudará en sus proyectos.
Servicios Web Servicios: Una lista de los experimentos que se han publicado
como servicios web. Esta lista estará vacía hasta que publique su primer
experimento.
Settings: Una colección de parámetros que puede utilizar para configurar
su cuenta y recursos. Puede utilizar esta opción para invitar otros usuarios
compartir su espacio de trabajo en Azure Machine Learning.
Componentes de un experimento
• Un experimento consta de los componentes clave necesarios para
construir, probar y evaluar un modelo predictivo. En Azure Machine
Learning, un experimento contiene dos componentes principales:
los conjuntos de datos y módulos.
• Un conjunto de datos contiene datos que se han subido a Machine
Learning Studio. El conjunto de datos se utiliza al crear un modelo
predictivo. Machine Learning Studio también ofrece varios
conjuntos de datos de demostración para ayudarle a reactivar la
creación de sus primeros experimentos.
• Un módulo es un algoritmo que va a utilizar en la construcción de
su modelo predictivo.
Módulos
• Reader: Este módulo se utiliza para leer los datos de varias fuentes,
incluyendo la Web, base de datos SQL Azure, almacenamiento Blob Azure,
o mesas Hive.
• Split: Este módulo se divide un conjunto de datos en dos partes.
Normalmente se utiliza para dividir un conjunto de datos de aprendizaje y
prueba de datos separadas.
• Elementary Statistics: Calcula estadísticas elementales como la media, la
desviación estándar, etc., de un determinado conjunto de datos.
• Regresión lineal: se puede utilizar para crear un modelo predictivo con un
algoritmo de regresión lineal.
Módulos
• Train Model: Este módulo entrena un algoritmo de clasificación o regresión
seleccionado con un conjunto de datos de entrenamiento dado.
• Evaluate Model: Este módulo se utiliza para evaluar el desempeño de un
modelo de clasificación o regresión entrenado.
• Cross Validate Model: Este módulo se utiliza para llevar a cabo validación
cruzada para evitar el exceso de ajuste. Por defecto, este módulo usa 10
veces la validación cruzada.
• Score Model: Puntúa un modelo de clasificación o regresión entrenado.
Pasos para la creación de un experimento
• Crear un modelo
• Paso 1: Obtener datos
• Paso 2: Preproceso de datos
• Paso 3: Definir las características
• Entrenar el modelo
• Paso 4: Seleccionar y aplicar un algoritmo de aprendizaje
• Pruebe el Modelo
• Paso 5: Predecir sobre nuevos datos
Flujo en Azure Machine Learning
Flujo en Azure Machine Learning
Flujo en Azure Machine Learning
Flujo en Azure Machine Learning
Errores comunes en el análisis predictivo
Preguntas y respuestas
67 |
Eduardo
Castro
ecastro@simsasys.com ecastrom.blogspot.com
edocastro

Mais conteúdo relacionado

Mais procurados

Bases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneasBases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneasJuan Anaya
 
PresentacióN De Microsoft Power Point Seguridad InformáTica
PresentacióN De Microsoft Power Point Seguridad InformáTicaPresentacióN De Microsoft Power Point Seguridad InformáTica
PresentacióN De Microsoft Power Point Seguridad InformáTicacarmelacaballero
 
Caracteristicas importantes de Centos
Caracteristicas importantes de CentosCaracteristicas importantes de Centos
Caracteristicas importantes de Centosjulyuladech
 
Principios de la Seguridad Informática
Principios de la Seguridad InformáticaPrincipios de la Seguridad Informática
Principios de la Seguridad Informáticafranka99
 
ESR II - Modulo 1 - Codigo Malicioso
ESR II - Modulo 1 - Codigo MaliciosoESR II - Modulo 1 - Codigo Malicioso
ESR II - Modulo 1 - Codigo Maliciosofoalonso
 
Administrador del sistema
Administrador del sistemaAdministrador del sistema
Administrador del sistemaejemploufps
 
Diapositivas ofimaticas
Diapositivas ofimaticasDiapositivas ofimaticas
Diapositivas ofimaticasbravomema
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidosJaziel Torres
 
1 tutorial de mongo db
1 tutorial de mongo db1 tutorial de mongo db
1 tutorial de mongo db.. ..
 
Servidores, tipos de servidores
Servidores, tipos de servidoresServidores, tipos de servidores
Servidores, tipos de servidoresEnya Loboguerrero
 
Auditoria de base de datos
Auditoria de base de datosAuditoria de base de datos
Auditoria de base de datosMohamed Noo Noo
 
Informe de Sistemas Expertos
Informe de Sistemas ExpertosInforme de Sistemas Expertos
Informe de Sistemas ExpertosAlexis Toribio
 
Seguridad Informatica y Gestión de Riesgos
Seguridad Informatica y Gestión de RiesgosSeguridad Informatica y Gestión de Riesgos
Seguridad Informatica y Gestión de Riesgosdaylisyfran
 

Mais procurados (20)

Bases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneasBases de datos distribuidas heterogéneas
Bases de datos distribuidas heterogéneas
 
PresentacióN De Microsoft Power Point Seguridad InformáTica
PresentacióN De Microsoft Power Point Seguridad InformáTicaPresentacióN De Microsoft Power Point Seguridad InformáTica
PresentacióN De Microsoft Power Point Seguridad InformáTica
 
Gestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativosGestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativos
 
Caracteristicas importantes de Centos
Caracteristicas importantes de CentosCaracteristicas importantes de Centos
Caracteristicas importantes de Centos
 
3.1.6 espacio para objetos
3.1.6 espacio  para objetos3.1.6 espacio  para objetos
3.1.6 espacio para objetos
 
Principios de la Seguridad Informática
Principios de la Seguridad InformáticaPrincipios de la Seguridad Informática
Principios de la Seguridad Informática
 
ESR II - Modulo 1 - Codigo Malicioso
ESR II - Modulo 1 - Codigo MaliciosoESR II - Modulo 1 - Codigo Malicioso
ESR II - Modulo 1 - Codigo Malicioso
 
Administrador del sistema
Administrador del sistemaAdministrador del sistema
Administrador del sistema
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
Diapositivas ofimaticas
Diapositivas ofimaticasDiapositivas ofimaticas
Diapositivas ofimaticas
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
1 tutorial de mongo db
1 tutorial de mongo db1 tutorial de mongo db
1 tutorial de mongo db
 
Que es SaaS?
Que es SaaS?Que es SaaS?
Que es SaaS?
 
Servidores, tipos de servidores
Servidores, tipos de servidoresServidores, tipos de servidores
Servidores, tipos de servidores
 
Internet
InternetInternet
Internet
 
Google Chrome
Google ChromeGoogle Chrome
Google Chrome
 
Auditoria de base de datos
Auditoria de base de datosAuditoria de base de datos
Auditoria de base de datos
 
Informe de Sistemas Expertos
Informe de Sistemas ExpertosInforme de Sistemas Expertos
Informe de Sistemas Expertos
 
Seguridad Informatica y Gestión de Riesgos
Seguridad Informatica y Gestión de RiesgosSeguridad Informatica y Gestión de Riesgos
Seguridad Informatica y Gestión de Riesgos
 
Seguridad logica 1
Seguridad logica 1Seguridad logica 1
Seguridad logica 1
 

Destaque

Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Eduardo Castro
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
La Práctica de Machine Learning en la empresa
La Práctica de Machine Learning en la empresaLa Práctica de Machine Learning en la empresa
La Práctica de Machine Learning en la empresaSoftware Guru
 
SQL Server Query Processor
SQL Server Query ProcessorSQL Server Query Processor
SQL Server Query ProcessorEduardo Castro
 
Smart Grid Big Data e IoT
Smart Grid Big Data e IoTSmart Grid Big Data e IoT
Smart Grid Big Data e IoTEduardo Castro
 
Introduccion a Azure Machine Learning
Introduccion a Azure Machine LearningIntroduccion a Azure Machine Learning
Introduccion a Azure Machine LearningEduardo Castro
 

Destaque (8)

Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
080827 abramson inmon vs kimball
080827 abramson   inmon vs kimball080827 abramson   inmon vs kimball
080827 abramson inmon vs kimball
 
La Práctica de Machine Learning en la empresa
La Práctica de Machine Learning en la empresaLa Práctica de Machine Learning en la empresa
La Práctica de Machine Learning en la empresa
 
SQL Server Query Processor
SQL Server Query ProcessorSQL Server Query Processor
SQL Server Query Processor
 
Smart Grid Big Data e IoT
Smart Grid Big Data e IoTSmart Grid Big Data e IoT
Smart Grid Big Data e IoT
 
Introduccion a Azure Machine Learning
Introduccion a Azure Machine LearningIntroduccion a Azure Machine Learning
Introduccion a Azure Machine Learning
 
Microsoft R Server
Microsoft R ServerMicrosoft R Server
Microsoft R Server
 

Semelhante a Analisis predictivo con microsoft azure

Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stackEduardo Castro
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
datatons en Women Techmakers
datatons en Women Techmakersdatatons en Women Techmakers
datatons en Women TechmakersDatatons
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Analytics10
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Big data vs expertos - Adrián Plattner @adrianplattner
Big data vs expertos - Adrián Plattner  @adrianplattnerBig data vs expertos - Adrián Plattner  @adrianplattner
Big data vs expertos - Adrián Plattner @adrianplattnerRefresh Maracaibo
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesStratebi
 

Semelhante a Analisis predictivo con microsoft azure (20)

Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
datatons en Women Techmakers
datatons en Women Techmakersdatatons en Women Techmakers
datatons en Women Techmakers
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Copy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.pptCopy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.ppt
 
Big data vs expertos - Adrián Plattner @adrianplattner
Big data vs expertos - Adrián Plattner  @adrianplattnerBig data vs expertos - Adrián Plattner  @adrianplattner
Big data vs expertos - Adrián Plattner @adrianplattner
 
Big Data
Big DataBig Data
Big Data
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 

Mais de Eduardo Castro

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL ServerEduardo Castro
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerEduardo Castro
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL AzureEduardo Castro
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflowEduardo Castro
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022Eduardo Castro
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022Eduardo Castro
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Eduardo Castro
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceEduardo Castro
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022Eduardo Castro
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Eduardo Castro
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricksEduardo Castro
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql serverEduardo Castro
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsEduardo Castro
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Eduardo Castro
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsEduardo Castro
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en AzureEduardo Castro
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL ServerEduardo Castro
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Eduardo Castro
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesEduardo Castro
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesEduardo Castro
 

Mais de Eduardo Castro (20)

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL Server
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL Azure
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflow
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed Instance
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricks
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql server
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analytics
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse Analytics
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en Azure
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL Server
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure Enclaves
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure Enclaves
 

Último

pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 

Último (11)

pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

Analisis predictivo con microsoft azure

  • 1. Análisis Predicitivo con Microsoft Azure Machine Learning Dr. Eduardo Castro, MATI IEEE Computer Society ViceChair Microsoft SQL Server MVP PASS Regional Mentor
  • 2. Introducción para BI & Big Data DAX MDX Minería de Datos Excel BI Recursos adicionales
  • 4. Definiciones Frase Objetivo "La minería de datos" Toma de decisiones "Machine Learning" Determinar el algoritmo de mejor desempeño
  • 5. Introducción al Análisis predictivo Predictive Analytics Predictive ModelingData Mining
  • 6. Análisis predictivo • ¿Qué porcentaje de las aplicaciones analíticas utilizará las capacidades predictivas en 2014?
  • 7. Análisis predictivo • ¿Qué porcentaje de las aplicaciones analíticas utilizará las capacidades predictivas en 2014?
  • 8. ¿Por qué el resurgimiento en el análisis predictivo?
  • 9. Científico de datos Un científico de datos incorpora técnicas y teorías de muchos campos, incluyendo las matemáticas, la estadística, la ingeniería de datos, reconocimiento de patrones, aprendizaje avanzado , visualización, modelado de la incertidumbre, almacenamiento de datos y la computación de alto rendimiento con el objetivo de extraer el significado de datos. Ciencia de datos: un término utilizado indistintamente con inteligencia de negocio o análitica empresarial
  • 10. ¿Qué es el análisis predictivo? • El análisis de datos con técnicas matemáticas de estadística, minería de datos y aprendizaje automático. Se utiliza para descubrir patrones ocultos, que da una ventaja competitiva.
  • 11. Qué es el análisis predictivo? Predictive Analytics es el descubrimiento de información predictiva, a veces oculta, de las bases de datos utilizando atributos de datos relacionados y no relacionados con la aplicación de algoritmos de análisis, y la creación de modelos que generan resultados predictivos. Modelaje Predictivo es el proceso de creación de un modelo para predecir mejor la probabilidad de un resultado.
  • 12. Minería de datos habilita Analítica Predictiva Análisis predictivo Presentación Exploración Descubrim iento Pasivo Interactivo Proactive Insight Negocios Informes en conserva Ad hoc Reporting Modelo de Datos Data Mining Papel de Software
  • 13. ¿Qué es el análisis predictivo?
  • 14. Escenarios comunes de clientes por análisis predictivo
  • 15. Principales fuentes de datos • Redes sociales y medios de comunicación • 700 millones de usuarios de Facebook, 250 millones de usuarios de Twitter y 156 millones de blogs públicos • Dispositivos móviles • Más de 5 mil millones de teléfonos móviles en uso en todo el mundo • Transacciones en Internet • miles de millones de compras en línea, operaciones de bolsa y otras transacciones ocurren todos los días • Dispositivos de red y sensores
  • 16. Casos de uso Sentiment Analysis • Utilizado junto con Hadoop, herramientas avanzadas de análisis de texto analizan el texto no estructurado de las redes sociales y mensajes de redes sociales • Incluyendo los Tweets y mensajes de Facebook, para determinar la confianza del usuario en relación con determinadas empresas, marcas o productos. • El análisis puede centrarse en el sentimiento a nivel macro hasta el sentimiento usuario individual.
  • 17. Casos de uso Modelado de riesgo • Las empresas financieras, bancos y otros utilizan Hadoop y Next Generation Data Warehouse para analizar grandes volúmenes de datos transaccionales para determinar el riesgo y la exposición de los activos financieros • Para preparar la posible "qué pasaría si" los escenarios basados ​​en el comportamiento del mercado simulado, y para puntuación de clientes potenciales por el riesgo.
  • 18. Casos de uso Motor de recomendación • Los minoristas en línea utilizan Hadoop para igualar y recomendar a los usuarios entre sí o con los productos y servicios basados ​​en el análisis del perfil de usuario y los datos de comportamiento. • LinkedIn utiliza este enfoque para potenciar su función de "la gente puede saber", mientras que Amazon utiliza para sugerir productos a la venta a los consumidores en línea.
  • 19. Casos de uso Detección de Fraude • Utilizar técnicas de Big Data para combinar el comportamiento del cliente, históricos y datos de transacciones para detectar la actividad fraudulenta. • Las compañías de tarjetas de crédito, por ejemplo, utilizan tecnologías de Big Data para identificar el comportamiento transaccional que indica una alta probabilidad de una tarjeta robada.
  • 20. Casos de uso Análisis de la campaña de marketing • Los departamentos de marketing a través de industrias han utilizado durante mucho tiempo la tecnología para monitorear y determinar la efectividad de las campañas de marketing. • Big Data permite a los equipos de marketing para incorporar mayores volúmenes de datos cada vez más granulares, como los datos de click-stream y registros detallados de llamadas, para aumentar la precisión de los análisis.
  • 21. Casos de uso Análisis Social Graph • Junto con Hadoop los datos de redes sociales se extraen para determinar qué clientes representan la mayor influencia sobre los demás dentro de las redes sociales. • Esto ayuda a determinar las empresas que son sus clientes "más importantes", que no siempre son los que compran la mayoría de los productos o de los que más gastan, pero los que tienden a influir en el comportamiento de compra de la mayoría de los demás.
  • 22. Casos de uso Customer Experience Analytics • Empresas orientadas al consumidor utilizan Hadoop y tecnologías relacionadas con Big Data para integrar los datos de antes silos canales de interacción con clientes • Tales como centros de llamadas, chat en línea, Twitter, etc, para obtener una visión completa de la experiencia del cliente.
  • 23. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito
  • 24. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Datos de crédito del Banco. Los datos del historial de pago de la oficina de crédito. Los datos demográficos de terceros. Hacer frente a los valores extremos y valores perdidos. Preparar las variables continuas y categóricas.
  • 25. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto.
  • 26. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto. Representar al modelo como una fórmula. Implementar el modelo en la herramienta de puntuación del banco. Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o los socios del banco.
  • 27. El análisis predictivo ejemplo de flujo de trabajo: tarjetas de crédito Utilice Microsoft o una solución de terceros (por ejemplo, SAS). O ... Programe su propio algoritmo. Entrenar el modelo con gran subconjunto de los datos y probado en subconjunto más pequeño. La regresión logística es un estándar de facto. Monitorear continuamente el rendimiento del cuadro de mando de los nuevos clientes. Revisar el modelo una vez que comienza bajo rendimiento. Representar al modelo como una fórmula. Implementar el modelo en la herramienta de puntuación del banco. Integrar los resultados del modelo en aplicaciones para el uso por parte del personal o los socios del banco.
  • 28. • La automatización de la automatización • Utilizar computadoras para programar computadoras • Escribir software es el cuello de botella • Deje que los datos hagan el trabajo! Qué es el aprendizaje autómático o Machine Learning
  • 29. 2 ¿Por qué "Aprender"? • El aprendizaje automático es la programación de computadoras para optimizar un criterio de desempeño usando datos como ejemplo o experiencia previa. • El aprendizaje se utiliza cuando: • Experiencia humana no existe (la navegación en Marte), • Los seres humanos son incapaces de explicar su experiencia (reconocimiento de voz) • Solución cambios en el tiempo (el enrutamiento en una red informática) • Solución necesita ser adaptada a los casos particulares (biométrica de usuario)
  • 30. Cumpliendo con uno de los viejos sueños del co-fundador de Microsoft, Bill Gates: Computadoras que podemos ver, oír y entender. John Platt Científico distinguido en Microsoft Research ¿Qué es Aprendizaje Automático? Sistemas informáticos de predicción se vuelven más inteligentes, con experiencia " "
  • 31. 3 De qué hablamos cuando hablamos de "Aprendizaje" • Aprender modelos generales a partir de ejemplos de datos particulares • Los datos son baratos y abundantes (data warehouses, data marts); el conocimiento es caro y escaso. • Ejemplo para comercio minorista: las transacciones de los clientes y la conducta del consumidor: Las personas que compraron "Código Da Vinci" también compraron "Las cinco personas que conoces en el cielo" (www.amazon.com) • Construir un modelo que es una aproximación buena y útil de los datos.
  • 33. Analytics Vision Utilizando los datos del pasado para predecir el futuro Motores recomenda-ción Análisis Publicidad El pronóstico del tiempo para la planificación de negocios Análisis de redes sociales Legal descubrimiento y archivo de documentos Análisis de precios Fraude detección Mantequera análisis Supervisión de equipos Seguimiento y servicios basados ​​en localización Seguros personalizada El aprendizaje automático y el análisis predictivo son capacidades básicas que se necesitan en toda la empresa
  • 34. • Búsqueda Web • Biología computacional • Finanzas • E-commerce • La exploración espacial • Robótica • Extracción de información • Redes sociales • Depuración Aplicaciones de ejemplo
  • 35. • Muchos algoritmos de aprendizaje automático • Cientos nuevas cada año • Cada algoritmo de aprendizaje automático tiene tres componentes: • Representación • Evaluación • Optimización ML en resumen
  • 36. • Los árboles de decisión • Conjuntos de reglas / Programas de Logica • Instancias • Modelos gráficos (Bayes / redes de Markov) • Las redes neuronales • Máquinas de vectores Representación de Algoritmos de ML
  • 37. • Precisión • Precisión y recuperación • Error cuadrado • Probabilidad • Posterior probabilidad • Costo / Utilidad • Margen • Entropía • K-L divergencia • Etcétera Evaluación de algoritmos de ML
  • 38. • Optimización combinatoria • Por ejemplo .: búsqueda Greedy • Optimización convexa • Por ejemplo .: descenso de gradiente • Optimización con restricciones • Por ejemplo .: programación lineal Optimización de algoritmos de ML
  • 39. • Aprendizaje por análisis de asociación • Aprendizaje Supervisado (inductivo) • Los datos de entrenamiento incluye salidas deseadas • Clasificación • Regresión/ Predicción • Aprendizaje no supervisado • Los datos de entrenamiento no incluye salidas deseadas • Aprendizaje semisupervisado • Los datos de entrenamiento incluye un par de productos deseados • Aprendizaje por refuerzo • Recompensas con base en secuencia de acciones Tipos de aprendizaje
  • 40. • Dado ejemplos de una función (X, F (X)) • Predecir función F (X) para nuevos ejemplos X • Discreto F (X): Clasificación • Continuo F (X): Regresión • F (X) = Probabilidad (X): Estimación de Probabilidad Apredizaje inductivo
  • 41. • El aprendizaje supervisado • Inducción por Árbol de decisiones • Inducción por reglas • Aprendizaje basado en Instancias • Aprendizaje bayesiano • Las redes neuronales • Máquinas de vectores • Aprendizaje no supervisado • Clustering • Reducción de dimensionalidad Clasificación de aprendizajes
  • 42. Aprendizaje por asociación • Análisis de la carrito de compras: P(Y|X) La probabilidad de que alguien que compra X También compra Y donde X y Y son productos / servicios. Ejemplo: P(Frijoles molidos | Tortillitas) = 0,7 Transacciones de carrito de compras ID Producto 1 Arroz, Coca Cola 2 Arroz, Coca Cola, Frijoles 3 Arroz, Frijoles 4 Tortillitas, Frijoles Molidos 5 Arroz, Coca Cola, Frijoles Molidos, Tortillitas
  • 43. Aprendizaje por clasificación 9 • Ejemplo: El puntaje de crédito • Diferenciar entre bajo riesgo y de riesgo alto con base en los ingresos y ahorros de los clientes Discriminante: IF ingresos > Θ1 Y ahorros > Θ2 ENTONCES bajo riesgo ELSE riesgo alto Modelo
  • 44. Regresión lineal • La regresión lineal es una de las técnicas de predicción más antiguos de estadística. El objetivo de la regresión lineal es ajustar un modelo lineal entre las variables de respuesta e independientes, y lo utilizan para predecir el resultado dado un conjunto de variables independientes observados . Un modelo de regresión lineal simple es una fórmula con la estructura:
  • 45. Regresión lineal • Y es la variable de respuesta (es decir, el resultado que usted está tratando de predecir), como las millas por galón. • X1,X2, X3, etc., son las variables independientes que se utilizan para predecir el resultado. • b0 es una constante que es la intersección de la línea de regresión. • b1, b2, b3, etc., son los coeficientes de las variables independientes. Estos se refieren a las pistas parciales de cada variable. • e es el error o ruido asociado con la variable de respuesta que no se puede explicar por la variables independientes X1, X2, X3 y.
  • 46. Un modelo de regresión lineal simple que predice millas de un carro por galón de su potencia de motor
  • 47. Redes Neuronales • Las redes neuronales artificiales son un conjunto de algoritmos que imitan el funcionamiento del cerebro. • Hay muchos algoritmos de redes neuronales diferentes, incluidas las redes de retropropagación, redes de Hopfield, Redes de Kohonen (también conocidos como mapas auto-organizados) y Redes ART (o ART) redes. • Sin embargo, el más común es el algoritmo de back-propagation, también conocido como multilayered perceptron.
  • 48. Árboles de decisión • Algoritmos de árboles de decisión son técnicas jerárquicas que funcionan mediante la división del conjunto de datos de forma iterativa en base a ciertos criterios estadísticos. • El objetivo de los árboles de decisión es maximizar la varianza entre los diferentes nodos en el árbol, y minimizar la varianza dentro de cada nodo
  • 49. Ejemplo de árbol de decisión
  • 50. • La comprensión de dominio, conocimiento previo, y las metas deseadas • La integración de datos, selección, limpieza, pre-procesamiento, etc. • Modelos de aprendizaje • Interpretación de los resultados • La consolidación y el despliegue de conocimiento descubierto Machine Learning en la práctica
  • 51. ¿Cómo utilizo Azure Machine Learning? Importar datos Constuir un modelo Combinar el Modelo con el API
  • 52. Una solución de Aprendizaje Automático – obtener resultados a partir de los datos Azure Portal Operaciones Azure Equipo ML Studio Científico de Datos HDInsight Almacenamiento En Azure Datos de escritorio Azure Portal y Servicio API ML Equipo de operaciones de Azure PowerBI/ DashboardsAplicaciones MóvilesAplicaciones Web Servicio API ML Desarrollador
  • 53. Una solución de Aprendizaje Automático - obtener resultados a partir de los datos Azure Portal Operaciones Azure Equipo ML Estudio Datos Científico HDInsight Almacenamiento Azure Datos de escritorio Azure Portal y Servicio API ML Operaciones Azure Equipo PowerBI/ DashboardsAplicaciones MóvilesAplicaciones Web Servicio API ML Revelador ML Studio y el científico de datos • Acceso y preparación de datos • Crear, modelos de prueba • Con un solo clic pasar a la etapa de producción a través de la API de Servicios Servicio API Azure Portal y ML • Crear ML Studio Workplace • Asignar cuenta de almacenamiento (s) • Monitor Consumo ML • Ver alertas cuando el modelo es listo • Publicar WebServices API ML servicio y el desarrollador • Modelos disponibles como una url que se puede invocar Los usuarios pueden acceder fácilmente a los resultados: desde cualquier lugar,en cualquier dispositivo
  • 55.
  • 56. Machine Learning Studio Experimentos: Los experimentos que se han creado, ejecutado, y guardado como borradores. Estos incluyen un conjunto de experimentos de ejemplo que se incluyen con el servicio que le ayudará en sus proyectos. Servicios Web Servicios: Una lista de los experimentos que se han publicado como servicios web. Esta lista estará vacía hasta que publique su primer experimento. Settings: Una colección de parámetros que puede utilizar para configurar su cuenta y recursos. Puede utilizar esta opción para invitar otros usuarios compartir su espacio de trabajo en Azure Machine Learning.
  • 57. Componentes de un experimento • Un experimento consta de los componentes clave necesarios para construir, probar y evaluar un modelo predictivo. En Azure Machine Learning, un experimento contiene dos componentes principales: los conjuntos de datos y módulos. • Un conjunto de datos contiene datos que se han subido a Machine Learning Studio. El conjunto de datos se utiliza al crear un modelo predictivo. Machine Learning Studio también ofrece varios conjuntos de datos de demostración para ayudarle a reactivar la creación de sus primeros experimentos. • Un módulo es un algoritmo que va a utilizar en la construcción de su modelo predictivo.
  • 58. Módulos • Reader: Este módulo se utiliza para leer los datos de varias fuentes, incluyendo la Web, base de datos SQL Azure, almacenamiento Blob Azure, o mesas Hive. • Split: Este módulo se divide un conjunto de datos en dos partes. Normalmente se utiliza para dividir un conjunto de datos de aprendizaje y prueba de datos separadas. • Elementary Statistics: Calcula estadísticas elementales como la media, la desviación estándar, etc., de un determinado conjunto de datos. • Regresión lineal: se puede utilizar para crear un modelo predictivo con un algoritmo de regresión lineal.
  • 59. Módulos • Train Model: Este módulo entrena un algoritmo de clasificación o regresión seleccionado con un conjunto de datos de entrenamiento dado. • Evaluate Model: Este módulo se utiliza para evaluar el desempeño de un modelo de clasificación o regresión entrenado. • Cross Validate Model: Este módulo se utiliza para llevar a cabo validación cruzada para evitar el exceso de ajuste. Por defecto, este módulo usa 10 veces la validación cruzada. • Score Model: Puntúa un modelo de clasificación o regresión entrenado.
  • 60. Pasos para la creación de un experimento • Crear un modelo • Paso 1: Obtener datos • Paso 2: Preproceso de datos • Paso 3: Definir las características • Entrenar el modelo • Paso 4: Seleccionar y aplicar un algoritmo de aprendizaje • Pruebe el Modelo • Paso 5: Predecir sobre nuevos datos
  • 61. Flujo en Azure Machine Learning
  • 62. Flujo en Azure Machine Learning
  • 63. Flujo en Azure Machine Learning
  • 64. Flujo en Azure Machine Learning
  • 65.
  • 66. Errores comunes en el análisis predictivo
  • 67. Preguntas y respuestas 67 | Eduardo Castro ecastro@simsasys.com ecastrom.blogspot.com edocastro