1. 12/11/2016
1
Data-base decisions 4 value innovation
Diego Vallarino
VP of Operations
dvallarino@overactiveinc.com
@diego_vallarino
Steve Tadelis (eBay)
Susan Athey (Microsoft)
Hal Varian (Google)
Preston McAfee (Yahoo)
6. 12/11/2016
6
“El objetivo de un Sistema de Recomendación es generar sugerencias de
nuevos ítems o predecir la utilidad de un ítem específico para un usuario
particular.”
Recomendación
Predicción
Datos de contenido
Datos demográficos
Ratings
Basado en contenido
Filtrado Colaborativo
Híbrido
Entradas
Sistema de Recomendación
Salidas
Película 1 Película 2 Similitud
Ghost Pretty Woman 0.3458
Ghost Sister Act 0.3364
Ghost Dirty Dancing 0.3226
Ghost Titanic 0.283
Ghost What Women Want 0.2751
Ghost Mrs. Doubtfire 0.2637
Película
Puntuación
real
Puntuación
estimada
Pretty Woman 5 4,08250
Sister Act 3 3,56380
Dirty Dancing 5 4,14410
Titanic 5 4,07080
What Women Want 3 3,48420
Mrs. Doubtfire 4 3,56380
Tabla I. Ghost y sus 6 películas más similares. Tabla II. Puntuaciones Reales vs. Estimadas.
Usemos la pelicula Ghost para probar la exactitud de los resultados
de la Matriz de Similitudes.
13. 12/11/2016
13
¿Cómo se comporta(rá) cada cliente?
Variable a explicar
Clientes que se dieron de baja
en t / Clientes al inicio de t.
(Two-Class Logistic Regression)
Variables explicativas
(Correlación o Causalidad)
• # Clientes perdidos en el periodo
• # Clientes ganados en el periodo
• Promedio de tiempo del cliente
en la empresa
• Cantidad de garantías
• Costo de garantías
• Cantidad de Quejas
• % Satisfacción de Cliente
• Promedio de tiempo de entrega
del producto/servicio
14. 12/11/2016
14
¿Esta persona es(será) sujeto de crédito?
Variable a explicar
Pagará el crédito
contraído
Variables explicativas
(Correlación o Causalidad)
• Uso de tarjeta de crédito
• Monto de pagos de facturas
• Antigüedad como cliente
• Antigüedad en empleo
• Edad
• Formación
• Sexo
• # Hijos
(Two-Class Boosted Decision Tree)
¿Qué de factor de aglutinamiento tiene(tendremos)?
Variable a explicar
Comportamiento que
definan economía de
cercanía
(Cluster = k-means)
Variables explicativas
(Correlación o Causalidad)
• Compras
• Edad
• Sexo
• Momento de compra
• Lugar de compra
• Desempleo
• Inflación