BigDataSummit2017: Innovación con datos en Silicon Valley y Latam

BIG DATA
Agosto 25 y 26 | Lima – Perú 2017
ANALYTICS SUMMIT
#BIGDATASUMMIT2017

www.DataLatam.com
diego@ixpantia.com
Twitter: @diegomay

Innovación con base en
datos en Silicon Valley
y Latino América
Diego May
Casos y
Mejores prácticas

Source: Matt Turck, Jim Hao & First Mark Capital

Data Science
Machine Learning
SVM
Cross validation
Random forest
R Studio
Linear regression
Logistic regression
Hadoop
Python
Neural networks
Deep learning
K-means
Statistical significance
Boosting

1)Sentimiento de
estar abrumados

3) Implica un
salto al vacío
(y habrá resistencia)

¿Cuales problemas son prioritarios?
¿Con que datos contamos?

¿Cuales problemas son prioritarios?
Productos con
base en datos
¿Con que datos contamos?

Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Enfoque Largo plazo Corto plazo
Facebook

Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Impacto al negocio
Facebook

Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Facebook
Objetivos y
Métricas
(1) Engagement (2) Growth
(3) Core (4) Utility
Impacto al negocio

Facebook
Expedia
AirBnB
Stitch Fix

Facebook
Expedia
AirBnB
Stitch Fix
Procesos

Colaboración e
Innovación Abierta
Facebook
Expedia
AirBnB
Stitch Fix

● 60 Data Scientists
● Modelo distribuído híbrido
● En equipos de producto
● Branding para atraer talento
● Open Source tools
Data Team
+
Facebook
Expedia
AirBnB
Stitch Fix
Products → sprints, A/B tests, prediction, algorithms
Search → new models, evolution
Talent → policies, recruiting, processes
Hosts preferences → understand, model, ML, prediction
User experience → metrics, evaluation, patterns
Split testing → experimentation
Planning → modeling, prediction, dashboards

● 60 Data Scientists
● Modelo distribuído híbrido
● En equipos de producto
● Branding para atraer talento
● Open Source tools
Data Team
+ Products → sprints, A/B tests, prediction, algorithms
Search → new models, evolution
Talent → policies, recruiting, processes
Hosts preferences → understand, model, ML, prediction
User experience → metrics, evaluation, patterns
Split testing → experimentation
Planning → modeling, prediction, dashboards
Experimentación
Facebook
Expedia
AirBnB
Stitch Fix

Facebook
Expedia
AirBnB
Stitch Fix EL diferenciador
Algoritmos son

Big Data
Data Science
General
Caso 1
Caso 2
En Latam

Existencia
de datos
General
Caso 1
Caso 2

Existencia
de datos
Acceso a
datos
General
Caso 1
Caso 2

Existencia
de datos
Acceso a
datos
Cultura
de datos
General
Caso 1
Caso 2

Existencia
de datos
Acceso a
datos
Cultura de
innovación
Cultura
de datos
General
Caso 1
Caso 2

Existencia
de datos
Acceso a
datos
Cultura de
innovación
Cultura
de datos
Habilidades
con datos
General
Caso 1
Caso 2

Tomar procesos en los que DATA
puede generar eficiencia
Procesos existentes
General
Caso 1
Caso 2

Tomar procesos en los que DATA
puede generar eficiencia
Procesos existentes
Nueva
Lógica
General
Caso 1
Caso 2

General
Caso 1
Caso 2
Procesos en Atención Telefónica

General
Caso 1
Caso 2
IVR
Ruteo
Agentes
Ventas
Cliente
Llamados

General
Caso 1
Caso 2
JSON
input
Modelo de
Matching
(API)
JSON
output
IVR
Ruteo
Agentes
Ventas
Cliente
Llamados

Proceso de
Innovación con Datos
Los 8 pasos

Tengo datos,
¿ahora?
1. Data Dive
2. Pregunta
3. Hipótesis
1. Data Dive
2. Pregunta
3. Hipótesis

1. Data Dive
2. Pregunta
3. Hipótesis
1. Data Dive
2. Pregunta
3. Hipótesis
Tengo datos,
¿ahora?

1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Pipeline
Tengo datos,
¿ahora?

No
Estructurados
Semi
Estructurados
Estructurados
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Pipeline
Tengo datos,
¿ahora?

1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Tengo datos,
¿ahora?

Fuente: E. de Jonge & M. van der Loo, 2013. An introduction to data cleaning with R. Technical report, Statistics Netherlands.
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Data Cleaning
Data Cleansing
Data Scrubbing
Tidy Data
Interpretación
Comunicación
Tengo datos,
¿ahora?

Visualizaciones
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Datos
Reportes
Modelos
[
{
"Nombre": "Frans",
"Apellido": "van Dunné",
"score": 0.68
},
{
"Nombre": "Diego",
"Apellido": "May",
"score": 0.68
}
]
Tengo datos,
¿ahora?

Data Pipeline
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
7
Tengo datos,
¿ahora?

Analizar y
Modelar
Ingerir y
Almacenar
Organizar
y Limpiar
Data Pipeline
Integrar y
Validar
Incremento de valor de datos
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
7
Call
Center
Online behaviors
Twitter
Past sales
Industry
Data
Facebook
Client
profiles
Employee
profiles
Data
Model
Visualization
Report
Tengo datos,
¿ahora?

Medir y aprender
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
8. Medición
Tengo datos,
¿ahora?

¿Cómo incorporamos
Data Science
en la organización?

Incorporando
Data Science
en la
organización IT
Innovación
BI
Nueva
Organización
?

Incorporando
Data Science
en la
organización
?

Gracias!
Diego May
diego@ixpantia.com
@diegomay

BigDataSummit2017: Innovación con datos en Silicon Valley y Latam

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (8)

Semelhante a BigDataSummit2017: Innovación con datos en Silicon Valley y Latam

Semelhante a BigDataSummit2017: Innovación con datos en Silicon Valley y Latam (20)

Mais de Big-Data-Summit

Mais de Big-Data-Summit (13)

Último

Último (20)

BigDataSummit2017: Innovación con datos en Silicon Valley y Latam

Notas do Editor