Se presenta el caso de estudio de cómo el equipo de Analítica Avanzada de Arca Continental, en colaboración con el MIT.
Presentado por: Raúl Castro y David Puente
2. Producción, distribución y
comercialización de bebidas
no alcohólicas de marcas de
The Coca-Cola Company
home delivery
>120 K Máquinas Vending#1 Marca
Área Metropolitana NY
3era marca
En México
>600 K Hogares
#1 Marca
Ecuador
#1 Marca
Ecuador
5. Según CIO Dive, sólo el 13% de los proyectos
de data science alcanzan a ser completados, y
en ellos sólo el 8% de los líderes reportan estar
completamente satisfechos
8. 2do
340 250k
Mercado mas
grande
De Bebidas No alcohólicas
del mundo
Productos
Disponibles en más de 25
categorías de Bebidas No
alcohólicas
Tiendas
De canal tradicional
en territorios AC
México
Méxicoencifras
9. Definir y recomendar el portafolio óptimo
para cada uno de los 250 mil clientes
dentro de canal tradicional
11. Preguntasdenegocio
Cuáles son las variables internas y externas que influyen en los
productos que maneja un tendero?
Basado en esas variables, ¿Es posible inferir el portafolio que cada
cliente debe manejar?
Podemos incrementar ventas a nivel cliente a través de una
sugerencia en portafolio y cantidad para cada cliente
¿Potencial de Venta?
12. Colectar información de
clientes y entorno.
Enriquecimiento de
Desagregación de
sugerencia e integración a
sistemas AC
Analizar variables e
impacto en cliente.
Reducción de Variables
Sugerencia de todos los
productos en función al
potencial de venta de
cada cliente
Determinación de
Potencial de Ventas por
Segmento
Determinación de
portafolio por cliente en
función a sus
características
Determinación de Cantidad
en base a forecast,
oportunidad de venta y
externos
13. 25˚40´32.6”N 100 ˚21¨41.9”W
Abarrotes Doña Julia
r=300 m
Externa
380 Variables
1,100 Variables - 450 mil puntos de venta
Ingreso, Población, Gasto,
NSE, Actividad Económica
y Financiera, Flujo
Vehicular, Peatonal, etc
Entorno
25 Variables
Censo Internas
Tiendas de conveniencia,
Hospitales, Parques,
Escuelas, Clubes
Deportivos.
Manejantes de
competencia por categoría
y SKU, Retornabilidad,
Características Físicas,
Activos, Saturación.
416 Variables
Datos Maestros,
Indicadores de servicio,
métricas de ejecución,
auditorías, preventa y
liquidación.
300 Variables
Enriquecimiento de Datos
14. Potencial de Ventas
Ventas Internas
Venta Competencia
Censo
+
Tamaño IndustriaDe:
NSE
Oficinas
PDM
Tráfico
Densidad
Hogares
Parques
gym
Potencial de MercadoA:
15. 5
3 2 1 0 0 0 2 1 1
Árbol 1 Árbol 2 50 Arboles
2130000103211100212…
Código clientes elite
Random Forest
10 CU
Cliente Elite
Potencial de Ventas
16. Cliente Regular
…
CE25 CE34 CE326 CE262 CE325
Scoring de Similitud Cálculo de Volumen
Potencial
10 9
10
Cliente con potencial
alcanzado
Cliente con potencial
de 4 CU
6 10
10
Potencial de Ventas
18. Captura la probabilidad de compra
de un SKU basado en su historial
Modelo Multonomial Logit
Productos Recomendados a
cada tienda
Collaborative Filtering Ajuste de Probabilidad
Similitudes entre clientes nos
permite identificar oportunidades.
Agregar características de las tiendas
y de los productos
Recommended products by store
X Modified probabilities
Ajustar las probabilidades después de
agregar productos y características de
la tienda ayuda en el aprendizaje
cruzado
Frecuencia de compra para
entender patrones de compra del
cliente
Integración de Datos
Modelo de Recomendación de Portafolio
19. Collaborative Filtering Single Value Decomposition
Σ
mxn
𝑀
mxm
𝑉 𝑇
nxn
𝑀 𝑢
m x (m+c)
𝑀 𝑈
𝑇
(m+c) x m
𝑆 𝑈
𝑇
n x (n+t)
=
=
𝑆 𝑈
(n+t) x n
x x x x
P1 P2 P3
Tienda 1 90% 30% 40%
Tienda 2 10% 20% 70%
Tienda 3 10% 40% 70%
Tienda 4 90% 30% 60%
x x
Farias, V.F., & Li, A.A. (2019). Learning Preferences with Side
Information. Management Science, 65, 3131-3149.
P1 P2 P3
Tienda 1 94% 20% 40%
Tienda 2 20% 40% 90%
Tienda 3 30% 20% 75%
Tienda 4 70% 30% 60%
𝐶𝑜𝑒𝑓 𝑂𝑟𝑖𝑔
𝐶𝑜𝑒𝑓 𝑂𝑟𝑖𝑔
𝐶𝑜𝑒𝑓 𝑎𝑐𝑡𝑢𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑠
Caract
Cliente
Features
Producto
20. Comparativo del portafolio actual vs Nuevas sugerencias. Análisis
Frecuencia mensual de venta de productos. La mayor parte del
portafolio actual
permanece y los
nuevos productos son
añadidos en base a lo
que clientes similares
están comprando.
La especificidad de
cada producto se tiene
en cuenta cuando se
recomiendan nuevos
productos
- Cliente «Mediano»
- NSE AB
- Población Joven
- Tráfico Alto 10 pm
- Ingreso bajo
- Población que
labora baja
- Cliente «Grande»
- NSE AB
- Población Joven
- Tráfico Alto 10 pm
- Ingreso bajo
- Población que
labora baja
Modelo de Recomendación de Portafolio
21. Comparativo del portafolio entre dos clientes Análisis
Modelo de Recomendación de Portafolio
Las dos tiendas
“grandes” tienen
similitudes en la curva
de probabilidad, sin
embargo existen
diferencias en el
portafolio a sugerir.
El corte de
probabilidad del 62%
eliminará de la
sugerencia 1-2
productos y empujará
7-8 nuevos productos.
22. Modelo de Cantidad
Demanda esperada dado el potencial de venta Demanda esperada dadas las ventas anteriores
Ventas Históricas
Pronóstico
Ventas
Semanas
80 cajas
100
cajas
Empujar
ventas al
potencial
Ventas altas
Ventas bajas
Ventas: 100 cajas
¿Qué características del
cliente impulsan las
ventas?
¿Cuál es la demanda
esperada?
Modelo: Gradient boosting en árboles de decisión
Variables: 800+ de clientes y entorno, 120 seleccionadas para el
modelo final
Modelo: Gradient boosting en árboles de decisión
Variables: 50+ integrando ventas históricas, clima, tendencia
PARK
MARKET SIZE
25. Aprendizajes
• Los datos son un activo para la empresa
• El negocio es el que debe liderar la
transformación analítica.
• La matemática es un componente de la
solución, el cambio en la cultura es el
verdadero reto.
• El trabajo en conjunto con universidades
permite nuevas ideas para aplicar MIT &
Tecnológico de Monterrey.
So basically you will have a 2 to the 340th power problem in your hands, you will be free to propose new and state of the art solutions to this problem.
Although is seem like a lot