SlideShare uma empresa Scribd logo
1 de 40
Ya eres parte de la evolución
Solid Day
#MachineLearning para
Organizaciones
Jesus Ramos
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos
#sgnext
Y éste qué?
- Ingeniero de Software de nacimiento (ITESM).
- Econometrista Financiero por azar (Unottingham +
UWashington).
- Estadístico Computacional por convicción (Coursera, a mucha
honra).
- Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc)
para levantar sus capacidades analíticas.
- Co fundador de @TheDataPub, comunidad dedicada a reventar
la burbuja y detener el tren del m*** del ML y del Pig Data.
- Gamer los sábados (PSN: xuxoramos).
- Foodie los domingos.
En qué ando?
Lo feo del
#MachineLearning…
#MachineLearning Bubble
Machine
Learning
Montaña rusa sin freno…
$232mmdd
Gran Inversión
4%
Stats/Maths/Prog
Poco skill Mala cultura
Governance:
Datos rehenes
de cabal de IT
…y sin cinturón!
El freno para esta montaña
rusa…
Roadmap+Riesgos para la
banda
Skill
Si eres dev,
métele a stats+maths.
Si eres de maths+stats,
métele a dev.
Biz Intimacy
Olvídate de la
Herramienta.
Enfócate en el
lenguaje de negocio.
Operational
No entregues reportes,
entrega APIs.
Sin contexto
==
Hacer la pregunta
equivocada
No hay
escalamiento
Mala predicción +
Alto sesgo
==
Perder dinero/
lastimar personas
Etapa
Riesgo
Roadmap+Riesgos para orgs
Etapa
Riesgo
DWH
Todos los datos
en 1 solo lugar.
Gov’nance
Total apertura y
con conexiones
SelfServ-BI
Que gente de negocio
se sirva reportes sola.
Mayor sesgo
+
sin
observer
effect
DataScience
==
Reporteo/BI
Correlación
==
Causalidad
Cómo desaceleramos?
Con definiciones (ni peiper).
#MachineLearning para todos
SW Dev
Máquina
(de estados, no la
compu)
Datos
Función/
Programa
Salida
Machine/Statistical Learning Supervisado
Máquina
(de estados, no la
compu)
Salida*
Datos
Función/
Programa**
Contexto
Contexto
* No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
#MachineLearning para todos
Objetivo 1: identificar patrones
Error Total
#MachineLearning para todos
Objetivo 2: reducir el error de la función
Error de Predicción
Error del Fenómeno
(Varianza)
Sesgo/Bias
Reducción: más/menos
variables
Reducción: más datos/
observaciones.
Reducción:
CONTEXTO!
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Tipos: Clasificación
#MachineLearning para todos
Tipos: Regresión
#MachineLearning para todos
Tipos: Clustering == Clasificación Sin Output
#MachineLearning para todos
Tipos: Dimensionality Redux/Feature Engineering
#MachineLearning para todos
Y cuál uso?
(Los que me den menos varianza y menos bias)
#MachineLearning para todos
Metodología
Describir
Qué me parece
interesante de
mi dataset?
Explorar
Qué research
question quiero
Hacerle a mi
dataset?
Inferir
La respuesta
puede
generalizarse?
Predecir
La respuesta
aplica a nuevas
observaciones?
- Distribuciones
- Media
- Moda
- Kurtosis
- Clustering
- Kohonen
- DBSCAN
- Multidim
Scaling
- Hypo Test
- GLM
- ANOVA
- MSE
- Random
Forest
- Boosting
- Bagging
- Deep
Learning
ML ML
Cross Validation
Data
Training Test Validation
70% 20% 10%
N veces: TestValidation TestValidation TestValidation
Ya le quitamos el m*me al
tren. Ahora...?
Aplicaciones!
B*n*m*x
• Conversión de cliente de nómina a TC en 29%.
• $2.7mmdp en revenue al año desde 2010.
• Cómo lo hizo?
• Clasificación!
f(edad, género, monto, antigüedad, …) = tiene TC
Predictores / variables independientes variable respuesta /
dependiente
UPS
• Ahorro de combustible haciendo que camiones
sólo den vuelta a la derecha.
• Ahorro de $47mdd al año.
• Cómo lo hicieron?
• Diseño de experimentos!
Exploratorio -> Recolección de datos -> Hypothesis
Testing -> GLMs -> Clasificación
T*lc*l
• Identificación de usrs consumiendo $7K MXN
semanales de tiempo aire en prepago.
• Creación de producto de crédito de tiempo aire
de hasta $2K.
• $4mmdp al año de revenue.
• Cómo lo hicieron?
• Clustering!
Multidimensional Scaling + K-means/DBSCAN
Western Union
• Prevención de fraude en remesas en
automático y personalizado.
• $32mdd en ahorro operativo en 2012. $21mdd
son de transacciones detenidas al momento.
• Cómo le hicieron?
• Clasificación!
• Similar a algoritmos de spam/ham.
Gr*p* *xp*ns**n
• Bajar bounce rate y mantener al visitante en
sitios de las marcas del grupo.
• Aumentar ad impressions.
• Cómo lo están haciendo?
• Recommender Systems!
Clasif 1 + Clasif 2 + … + Clasif N
Qué
música
prefiere?
Qué
comida
prefiere?
Qué
pelis
ha visto?
Y las startups?
En la delantera!
• Konfio, Kueski, Prestadero + ensemble
learning = credit scoring.
• Piggo + multidimensional scaling + DBSCAN =
recomendación de inversiones.
• Klustera + Filtros Kalman (un tipo de
regresión) = ubicación exacta de gente en
centros comerciales.
• HolaGus + deep convolutional neural networks
= clasificación de texto.
Caso interesante: FullHarvest
• Time Series de granjas y huertos en tiempo de
cosecha.
• Clasificación para planeación de recolecciones.
• Optimización heurística para trazo de rutas.
• Regresión múltiple para planeación de demanda y
pricing.
• Ensemble para transformación y saber qué
producir.
• Optimización para ruta de entrega.
Bottomline:
El ML ayuda a escalar
servicios para el 99%!
Qué puede salir mal?
Todo!
#MachineLearning Flops
• Google Flu Trends – Contexto = predicción
fallida de AH1N1 en Francia.
• Google Image Classifier – Contexto = 2
afroamericanos taggeados como ‘gorilas’.
• Walmart + Modelo complejo de alta varianza =
productos en mal estado vendidos a clientes.
• Wall Street + Model simple de alto bias = crisis
hipotecaria de 2008
• T*lc*l – Contexto = Préstamos a sospechosos.
Concluyendo…
Soy dev…cómo le entro al
ML?
• Comienza por prepararte en mates y estadística. Leete
“Think Stats” de Allen Downey.
• Acércate al depto de mates de tu universidad. Seguro
encuentras diplomados en mates.
• MOOCs: “Data Science Specialization” de Coursera es la
opción.
• Síguele con el de Andrew Ng de Stanford. Piérdele el miedo
a la notación formal.
• No te cases ni con Python ni con R. Usa ambos.
• No te cases con ningún algoritmo. Primero pregunta “qué
quiero lograr?”
• Context is KING!
Y si ya le se al ML?
• Platícanos tu proyecto en ramos.cardona@gmail.com
para que lo presentes en @thedatapub.
• Mándame un correo. Andamos reclutando!
• Sé humilde ante lo que te falta por aprender.
• Acércate a disciplinas complementarias de la ciencia
de datos: topología, diseño de experimentos,
optimización, visualización y storytelling.
• Comparte tu conocimiento. Ojalá seas tú el próximo
acá arriba!
¿Preguntas?
Grax!
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos

Mais conteúdo relacionado

Destaque

Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big DisappointmentJesus Ramos
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsJesus Ramos
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AIJesus Ramos
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsJesus Ramos
 
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosHector Cuesta Arvizu
 
Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)zaherdouri
 
A CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsA CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsRandy Shoup
 
Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Data Blueprint
 

Destaque (10)

Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Coursera_MachineLearning
Coursera_MachineLearningCoursera_MachineLearning
Coursera_MachineLearning
 
Articulo de cuda
Articulo de cudaArticulo de cuda
Articulo de cuda
 
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
 
Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)
 
A CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsA CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling Organizations
 
Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?
 

Semelhante a Machine Learning For Organizations

Machine Learning para Organizaciones
Machine Learning para OrganizacionesMachine Learning para Organizaciones
Machine Learning para OrganizacionesSoftware Guru
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSoftware Guru
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AISoftware Guru
 
Ultrapersonalización en la Web
Ultrapersonalización en la WebUltrapersonalización en la Web
Ultrapersonalización en la Webamdia
 
El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)Esteban Kolsky
 
With Big Data comes Great Power
With Big Data comes Great PowerWith Big Data comes Great Power
With Big Data comes Great PowerMarco Casalino
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...eCommerce Institute
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Gerard Alba
 
Globalstar simplex services (logistic summit)
Globalstar   simplex services (logistic summit)Globalstar   simplex services (logistic summit)
Globalstar simplex services (logistic summit)Carlos Veracoechea
 
El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceAlex Rayón Jerez
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Gerard Alba
 

Semelhante a Machine Learning For Organizations (20)

Machine Learning para Organizaciones
Machine Learning para OrganizacionesMachine Learning para Organizaciones
Machine Learning para Organizaciones
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizaciones
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AI
 
EMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine LearningEMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine Learning
 
Data Mining
Data MiningData Mining
Data Mining
 
Ultrapersonalización en la Web
Ultrapersonalización en la WebUltrapersonalización en la Web
Ultrapersonalización en la Web
 
Intl
IntlIntl
Intl
 
Big data centrologic 2016
Big data centrologic 2016Big data centrologic 2016
Big data centrologic 2016
 
El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)
 
With Big Data comes Great Power
With Big Data comes Great PowerWith Big Data comes Great Power
With Big Data comes Great Power
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Globalstar simplex services (logistic summit)
Globalstar   simplex services (logistic summit)Globalstar   simplex services (logistic summit)
Globalstar simplex services (logistic summit)
 
El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligence
 
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptxTransformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
 

Último

Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfsmilagrossmedina23
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024OBSERVATORIOREGIONAL
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeklebersky23
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,EmmanuelDelJessGonza
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024analiticaydatos
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointaria66611782972
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfJC Díaz Herrera
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfJC Díaz Herrera
 

Último (20)

Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 

Machine Learning For Organizations

  • 1. Ya eres parte de la evolución Solid Day #MachineLearning para Organizaciones Jesus Ramos @xuxoramos ramos.cardona@gmail.com linkedin.com/in/xuxoramos #sgnext
  • 2. Y éste qué? - Ingeniero de Software de nacimiento (ITESM). - Econometrista Financiero por azar (Unottingham + UWashington). - Estadístico Computacional por convicción (Coursera, a mucha honra). - Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc) para levantar sus capacidades analíticas. - Co fundador de @TheDataPub, comunidad dedicada a reventar la burbuja y detener el tren del m*** del ML y del Pig Data. - Gamer los sábados (PSN: xuxoramos). - Foodie los domingos.
  • 6. Montaña rusa sin freno… $232mmdd Gran Inversión 4% Stats/Maths/Prog Poco skill Mala cultura Governance: Datos rehenes de cabal de IT
  • 8. El freno para esta montaña rusa…
  • 9. Roadmap+Riesgos para la banda Skill Si eres dev, métele a stats+maths. Si eres de maths+stats, métele a dev. Biz Intimacy Olvídate de la Herramienta. Enfócate en el lenguaje de negocio. Operational No entregues reportes, entrega APIs. Sin contexto == Hacer la pregunta equivocada No hay escalamiento Mala predicción + Alto sesgo == Perder dinero/ lastimar personas Etapa Riesgo
  • 10. Roadmap+Riesgos para orgs Etapa Riesgo DWH Todos los datos en 1 solo lugar. Gov’nance Total apertura y con conexiones SelfServ-BI Que gente de negocio se sirva reportes sola. Mayor sesgo + sin observer effect DataScience == Reporteo/BI Correlación == Causalidad
  • 12. #MachineLearning para todos SW Dev Máquina (de estados, no la compu) Datos Función/ Programa Salida Machine/Statistical Learning Supervisado Máquina (de estados, no la compu) Salida* Datos Función/ Programa** Contexto Contexto * No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
  • 13. #MachineLearning para todos Objetivo 1: identificar patrones
  • 14. Error Total #MachineLearning para todos Objetivo 2: reducir el error de la función Error de Predicción Error del Fenómeno (Varianza) Sesgo/Bias Reducción: más/menos variables Reducción: más datos/ observaciones. Reducción: CONTEXTO!
  • 19. #MachineLearning para todos Tipos: Clustering == Clasificación Sin Output
  • 20. #MachineLearning para todos Tipos: Dimensionality Redux/Feature Engineering
  • 21. #MachineLearning para todos Y cuál uso? (Los que me den menos varianza y menos bias)
  • 22. #MachineLearning para todos Metodología Describir Qué me parece interesante de mi dataset? Explorar Qué research question quiero Hacerle a mi dataset? Inferir La respuesta puede generalizarse? Predecir La respuesta aplica a nuevas observaciones? - Distribuciones - Media - Moda - Kurtosis - Clustering - Kohonen - DBSCAN - Multidim Scaling - Hypo Test - GLM - ANOVA - MSE - Random Forest - Boosting - Bagging - Deep Learning ML ML
  • 23. Cross Validation Data Training Test Validation 70% 20% 10% N veces: TestValidation TestValidation TestValidation
  • 24. Ya le quitamos el m*me al tren. Ahora...? Aplicaciones!
  • 25. B*n*m*x • Conversión de cliente de nómina a TC en 29%. • $2.7mmdp en revenue al año desde 2010. • Cómo lo hizo? • Clasificación! f(edad, género, monto, antigüedad, …) = tiene TC Predictores / variables independientes variable respuesta / dependiente
  • 26. UPS • Ahorro de combustible haciendo que camiones sólo den vuelta a la derecha. • Ahorro de $47mdd al año. • Cómo lo hicieron? • Diseño de experimentos! Exploratorio -> Recolección de datos -> Hypothesis Testing -> GLMs -> Clasificación
  • 27. T*lc*l • Identificación de usrs consumiendo $7K MXN semanales de tiempo aire en prepago. • Creación de producto de crédito de tiempo aire de hasta $2K. • $4mmdp al año de revenue. • Cómo lo hicieron? • Clustering! Multidimensional Scaling + K-means/DBSCAN
  • 28. Western Union • Prevención de fraude en remesas en automático y personalizado. • $32mdd en ahorro operativo en 2012. $21mdd son de transacciones detenidas al momento. • Cómo le hicieron? • Clasificación! • Similar a algoritmos de spam/ham.
  • 29. Gr*p* *xp*ns**n • Bajar bounce rate y mantener al visitante en sitios de las marcas del grupo. • Aumentar ad impressions. • Cómo lo están haciendo? • Recommender Systems! Clasif 1 + Clasif 2 + … + Clasif N Qué música prefiere? Qué comida prefiere? Qué pelis ha visto?
  • 31. En la delantera! • Konfio, Kueski, Prestadero + ensemble learning = credit scoring. • Piggo + multidimensional scaling + DBSCAN = recomendación de inversiones. • Klustera + Filtros Kalman (un tipo de regresión) = ubicación exacta de gente en centros comerciales. • HolaGus + deep convolutional neural networks = clasificación de texto.
  • 32. Caso interesante: FullHarvest • Time Series de granjas y huertos en tiempo de cosecha. • Clasificación para planeación de recolecciones. • Optimización heurística para trazo de rutas. • Regresión múltiple para planeación de demanda y pricing. • Ensemble para transformación y saber qué producir. • Optimización para ruta de entrega.
  • 33. Bottomline: El ML ayuda a escalar servicios para el 99%!
  • 34. Qué puede salir mal? Todo!
  • 35. #MachineLearning Flops • Google Flu Trends – Contexto = predicción fallida de AH1N1 en Francia. • Google Image Classifier – Contexto = 2 afroamericanos taggeados como ‘gorilas’. • Walmart + Modelo complejo de alta varianza = productos en mal estado vendidos a clientes. • Wall Street + Model simple de alto bias = crisis hipotecaria de 2008 • T*lc*l – Contexto = Préstamos a sospechosos.
  • 37. Soy dev…cómo le entro al ML? • Comienza por prepararte en mates y estadística. Leete “Think Stats” de Allen Downey. • Acércate al depto de mates de tu universidad. Seguro encuentras diplomados en mates. • MOOCs: “Data Science Specialization” de Coursera es la opción. • Síguele con el de Andrew Ng de Stanford. Piérdele el miedo a la notación formal. • No te cases ni con Python ni con R. Usa ambos. • No te cases con ningún algoritmo. Primero pregunta “qué quiero lograr?” • Context is KING!
  • 38. Y si ya le se al ML? • Platícanos tu proyecto en ramos.cardona@gmail.com para que lo presentes en @thedatapub. • Mándame un correo. Andamos reclutando! • Sé humilde ante lo que te falta por aprender. • Acércate a disciplinas complementarias de la ciencia de datos: topología, diseño de experimentos, optimización, visualización y storytelling. • Comparte tu conocimiento. Ojalá seas tú el próximo acá arriba!

Notas do Editor

  1. fdsfds