SlideShare una empresa de Scribd logo
1 de 4
Descargar para leer sin conexión
LAS TÉCNICAS EN LA MINERÍA
DE DATOS
Editor: Lic. Marco Antonio Cubillo Murray
SET. 2019 EDICIÓN 1
Se pretendemos resolver cualquier problema debemos tener muy
claro que no existe una única técnica y que deben ser abordados
utilizando la técnica que mejor se adapte para hacerle frente.
La cantidad de técnicas con la aplicación del enfoque de la Minería
de Datos es grande y se espera que en un futuro las mismas
crezcan.
Es aquí donde debemos tener bien claro la naturaleza del problema
que vamos a analizar, así podremos seleccionar de una forma más
precisa cuál técnica se adapta mejor en la búsqueda de una
solución más eficiente y exacta.
Vamos entonces a repasar algunas de las técnicas que en la
actualidad podemos usar y que están incorporadas en la mayoría de
los programas que nos permiten llevar a cabo una Minería de Datos
de forma óptima.
LAS TÉCNICAS
Lic. Marco A. Cubillo M. Análisis Factoriales
Descriptivos
Market Basket Analysis
(Análisis de la Cesta de la
Compra)
Técnicas de Clustering
Series Temporales
Redes Bayesianas
Modelos Lineales
Generalizados
Previsión Local
Redes Neuronales
Árboles de Decisión
Algoritmos Genéticos
Poder de Generalización
Escalabilidad
CONTENIDO DE LA EDICIÓN
“Los datos son el activo
estratégico de las
compañías por
excelencia».
Christian Gardiner.
«Los datos son el petróleo
del siglo XXI. El despliegue
de sensores y el
incremento de la capacidad
del procesamiento, son
claves en la transformación
de muchos sectores y en la
creación de un mundo más
medible y programable”.
Cesar Alierta.
Este tipo de análisis nos permite
crear visualizaciones de realidades
multivariantes complejas de
manera que podremos revelar las
regularidades estadísticas y las
ANÁLISIS FACTORIALES DESCRIPTIVOS
Lic. Marco A. Cubillo M.
eventuales discrepancias con
respecto de aquella y por supuesto
podremos sugerir hipótesis de
explicación.
Análisis de la canasta de la
compra, como se le conoce en
español, nos permite detectar que
productos se compran de forma
conjunta, agregando información
técnicas para poder interpretar los
datos como: día, semana,
MARKET BASKET ANALYSIS
Lic. Marco A. Cubillo M.
localización y la forma de pago
entre otros, sobre el
comportamiento de la compra.
También nos ayuda aplicarse en
contextos variados como el e-
comercio e incorporarle el factor
temporal.
Son las técnicas que inician con
una medida de aproximidad entre
individuos para buscar los grupos
TÉCNICAS DE CLUSTERING
Lic. Marco A. Cubillo M.
de individuos más semejantes entre
sí, claro según una serie de
variables medibles.
A partir de la serie de
comportamiento histórico podemos
modelizar las componentes básicas
de la serie, tendencia, ciclo y
estacionalidad, con el fin de
SERIES TEMPORALES
Lic. Marco A. Cubillo M.
predecir el futuro, tales como cifre
de ventas, previsión de consumo de
un producto o un servicio.
Tradicionalmente el
objetivo de la minería era la
obtención de carbón. No
obstante, una nueva
generación de mineros ha
aparecido en el inicio de
esta cuarta revolución
industrial. Son los mineros
o exploradores de datos,
que cuales en lugar de
buscar carbón intentan
descubrir patrones en
enormes volúmenes de
datos. Los métodos
utilizados de estos nuevos
profesionales son
la inteligencia artificial, el
aprendizaje automático, la
estadística y sistemas de
base de datos.
Sirven para representar todos los
posibles sucesos en que estamos
interesados mediante un grafo de
probabilidades condicionales de
transición entre los posibles
REDES BAYESIANAS
Lic. Marco A. Cubillo M.
sucesos. Se puede codificar a partir
del conocimiento de un experto o se
puede inferir a partir de los datos.
También nos permite poder
establecer relaciones causales.
Son modelos que permiten el
manejo de distintos tipos de
variables de respuesta, por
ejemplo la preferencia entre ciertos
productos concurrentes en el
mercado.
MODELOS LINEALES GENERALIZADOS
Lic. Marco A. Cubillo M.
Además los modelos estadísticos
se enriquecen cada vez más y se
hacen más flexibles y adaptativos,
lo que permite abordar los
problemas cada vez más complejos
de una forma más eficiente.
Se trata de que individuos
parecidos tendrán
comportamientos similares
respecto de una cierta variable de
respuesta.
PREVISIÓN LOCAL
Lic. Marco A. Cubillo M.
La técnica es situar los individuos
en un espacio euclídeo y hacer las
predicciones de su comportamiento
a partir del comportamiento
observado en sus vecinos.
Se inspiran en un modelo
biológico, consisten en modelos
estadísticos clásicos. Si diferencia
radica en el aprendizaje
secuencial, en el hecho de utilizar
transformaciones de las variables
originales para la predicción y la no
REDES NEURONALES
Lic. Marco A. Cubillo M.
linealidad del modelo.Nos permite
aprender en contextos difíciles, sin
necesidad de precisar la
formulación de un modelo en
concreto. Su principal
inconveniente es que para el
usuario son una caja negra.
Tradicionalmente el
objetivo de la minería era la
obtención de carbón. No
obstante, una nueva
generación de mineros ha
aparecido en el inicio de
esta cuarta revolución
industrial. Son los mineros
o exploradores de datos,
que cuales en lugar de
buscar carbón intentan
descubrir patrones en
enormes volúmenes de
datos. Los métodos
utilizados de estos nuevos
profesionales son
la inteligencia artificial, el
aprendizaje automático, la
estadística y sistemas de
base de datos.
Obtenemos las reglas de decisión
bajo las cuales operan los
consumidores,
ARBÓLES DE DECISIÓN
Lic. Marco A. Cubillo M.
comparado con datos históricos,
brindando una facilidad de
interpretacion.
Simulamos el modelo biológico de
la evolución de las especies, claro
a velocidades muy grandes.
Su principio es que cualquier
problema que se nos presente,
como la optimización de una
combinación entre distintas
componentes, estando claro
sujetas a restricciones, puede
ALGORÍTMOS GENÉTICOS
Lic. Marco A. Cubillo M.
resolverse mediante algorítmos
genéticos. Una opción es mezclar
los análisis en sistemas híbridos, o
sea combinando la eficiencia en la
resolución de un problema, por
ejemplo usar un algorítmo genético
para iniciar una red neuronal o usar
un árbol de decisión como variable
de entrada en una regresión
logística.
Implica implementar técnicas
eficientes de validación de
resultados, a partir del
conocimiento de la distribución
muestral de los estadísticos del
PODER DE GENERALIZACIÓN
Lic. Marco A. Cubillo M.
modelo o por métodos
computacionales como la validación
cruzada.
Dado el volumen de datos a tratar,
el costo de los algorítmos ha de
ser todo líneal que sea posible
ESCALABILIDAD
Lic. Marco A. Cubillo M.
respecto de los parámetros que
definen el costo, en particular
respecto del número de individuos.

Más contenido relacionado

Similar a Edicion 1 mineria de datos

ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
Quevin Crisostomo
 
Clase de i.o.
Clase de i.o.Clase de i.o.
Clase de i.o.
Clacri8
 
Clase 1 Marco Estrategico Cadena De Suministros
Clase 1 Marco Estrategico Cadena De SuministrosClase 1 Marco Estrategico Cadena De Suministros
Clase 1 Marco Estrategico Cadena De Suministros
Juliana
 

Similar a Edicion 1 mineria de datos (20)

Esta di stica_descriptiva_ppt completa dr gilberto lopez
Esta di stica_descriptiva_ppt completa dr gilberto lopezEsta di stica_descriptiva_ppt completa dr gilberto lopez
Esta di stica_descriptiva_ppt completa dr gilberto lopez
 
27009 26933-1-pb
27009 26933-1-pb27009 26933-1-pb
27009 26933-1-pb
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
aplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operacionesaplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operaciones
 
ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
ESTADÍSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL "CAPITULO 1"
 
Clase de i.o.
Clase de i.o.Clase de i.o.
Clase de i.o.
 
I.o.
I.o.I.o.
I.o.
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
ALGORITMOS GENETICOS - BUSQUEDA TABÚ
ALGORITMOS GENETICOS - BUSQUEDA TABÚALGORITMOS GENETICOS - BUSQUEDA TABÚ
ALGORITMOS GENETICOS - BUSQUEDA TABÚ
 
Trabajo de Investigación.docx
Trabajo de Investigación.docxTrabajo de Investigación.docx
Trabajo de Investigación.docx
 
Business analytics (modulo_1)
Business analytics (modulo_1)Business analytics (modulo_1)
Business analytics (modulo_1)
 
Clase 1 Marco Estrategico Cadena De Suministros
Clase 1 Marco Estrategico Cadena De SuministrosClase 1 Marco Estrategico Cadena De Suministros
Clase 1 Marco Estrategico Cadena De Suministros
 
Big Data y Centros Comerciales. Entrega 2
Big Data y Centros Comerciales. Entrega 2Big Data y Centros Comerciales. Entrega 2
Big Data y Centros Comerciales. Entrega 2
 
Bricio
BricioBricio
Bricio
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Bioestadistica carrillo moreno_investigacion_docsalpubg1_zitacuaro
Bioestadistica carrillo moreno_investigacion_docsalpubg1_zitacuaroBioestadistica carrillo moreno_investigacion_docsalpubg1_zitacuaro
Bioestadistica carrillo moreno_investigacion_docsalpubg1_zitacuaro
 
Objeto del estudio
Objeto del estudioObjeto del estudio
Objeto del estudio
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion (1)
Exposicion (1)Exposicion (1)
Exposicion (1)
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 

Más de MCMurray

Más de MCMurray (20)

Coaching con dt
Coaching con dtCoaching con dt
Coaching con dt
 
Lectura aprender de la derrota
Lectura aprender de la derrotaLectura aprender de la derrota
Lectura aprender de la derrota
 
El analisis de pareto
El analisis de paretoEl analisis de pareto
El analisis de pareto
 
Octava parte del resumen de probabilidad
Octava parte del resumen de probabilidadOctava parte del resumen de probabilidad
Octava parte del resumen de probabilidad
 
Setima parte del resumen de probabilidad
Setima parte del resumen de probabilidadSetima parte del resumen de probabilidad
Setima parte del resumen de probabilidad
 
Quinta parte del resumen de probabilidad
Quinta parte del resumen de probabilidadQuinta parte del resumen de probabilidad
Quinta parte del resumen de probabilidad
 
Cuarta parte del resumen de probabilidad 1
Cuarta parte del resumen de probabilidad 1Cuarta parte del resumen de probabilidad 1
Cuarta parte del resumen de probabilidad 1
 
Clase 13 calculo uc 2018
Clase 13 calculo uc 2018Clase 13 calculo uc 2018
Clase 13 calculo uc 2018
 
Tercera parte del resumen de probabilidad
Tercera parte del resumen de probabilidadTercera parte del resumen de probabilidad
Tercera parte del resumen de probabilidad
 
Segunda parte del resumen de probabilidad
Segunda parte del resumen de probabilidadSegunda parte del resumen de probabilidad
Segunda parte del resumen de probabilidad
 
Primera parte del resumen de probabilidad
Primera parte del resumen de probabilidadPrimera parte del resumen de probabilidad
Primera parte del resumen de probabilidad
 
Clase 11 calculo uc 2018
Clase 11 calculo uc 2018Clase 11 calculo uc 2018
Clase 11 calculo uc 2018
 
Persuasion subliminal
Persuasion subliminalPersuasion subliminal
Persuasion subliminal
 
Flujo de efectivo 2 planteo del ejercicio
Flujo de efectivo 2 planteo del ejercicioFlujo de efectivo 2 planteo del ejercicio
Flujo de efectivo 2 planteo del ejercicio
 
Flujo de efectivo de la Universidad Central
Flujo de efectivo de la Universidad CentralFlujo de efectivo de la Universidad Central
Flujo de efectivo de la Universidad Central
 
Lectura de valor ganado
Lectura de valor ganadoLectura de valor ganado
Lectura de valor ganado
 
Lectura de matriz de plan
Lectura de matriz de planLectura de matriz de plan
Lectura de matriz de plan
 
Lectura de matriz de comunicaciones
Lectura de matriz de comunicacionesLectura de matriz de comunicaciones
Lectura de matriz de comunicaciones
 
Lectura de matriz de responsabilidades
Lectura de matriz de responsabilidadesLectura de matriz de responsabilidades
Lectura de matriz de responsabilidades
 
Ejercicio para escala likert
Ejercicio para escala likertEjercicio para escala likert
Ejercicio para escala likert
 

Último

TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
NadiaMartnez11
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
patriciaines1993
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
Wilian24
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 

Último (20)

Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 

Edicion 1 mineria de datos

  • 1. LAS TÉCNICAS EN LA MINERÍA DE DATOS Editor: Lic. Marco Antonio Cubillo Murray SET. 2019 EDICIÓN 1 Se pretendemos resolver cualquier problema debemos tener muy claro que no existe una única técnica y que deben ser abordados utilizando la técnica que mejor se adapte para hacerle frente. La cantidad de técnicas con la aplicación del enfoque de la Minería de Datos es grande y se espera que en un futuro las mismas crezcan. Es aquí donde debemos tener bien claro la naturaleza del problema que vamos a analizar, así podremos seleccionar de una forma más precisa cuál técnica se adapta mejor en la búsqueda de una solución más eficiente y exacta. Vamos entonces a repasar algunas de las técnicas que en la actualidad podemos usar y que están incorporadas en la mayoría de los programas que nos permiten llevar a cabo una Minería de Datos de forma óptima. LAS TÉCNICAS Lic. Marco A. Cubillo M. Análisis Factoriales Descriptivos Market Basket Analysis (Análisis de la Cesta de la Compra) Técnicas de Clustering Series Temporales Redes Bayesianas Modelos Lineales Generalizados Previsión Local Redes Neuronales Árboles de Decisión Algoritmos Genéticos Poder de Generalización Escalabilidad CONTENIDO DE LA EDICIÓN
  • 2. “Los datos son el activo estratégico de las compañías por excelencia». Christian Gardiner. «Los datos son el petróleo del siglo XXI. El despliegue de sensores y el incremento de la capacidad del procesamiento, son claves en la transformación de muchos sectores y en la creación de un mundo más medible y programable”. Cesar Alierta. Este tipo de análisis nos permite crear visualizaciones de realidades multivariantes complejas de manera que podremos revelar las regularidades estadísticas y las ANÁLISIS FACTORIALES DESCRIPTIVOS Lic. Marco A. Cubillo M. eventuales discrepancias con respecto de aquella y por supuesto podremos sugerir hipótesis de explicación. Análisis de la canasta de la compra, como se le conoce en español, nos permite detectar que productos se compran de forma conjunta, agregando información técnicas para poder interpretar los datos como: día, semana, MARKET BASKET ANALYSIS Lic. Marco A. Cubillo M. localización y la forma de pago entre otros, sobre el comportamiento de la compra. También nos ayuda aplicarse en contextos variados como el e- comercio e incorporarle el factor temporal. Son las técnicas que inician con una medida de aproximidad entre individuos para buscar los grupos TÉCNICAS DE CLUSTERING Lic. Marco A. Cubillo M. de individuos más semejantes entre sí, claro según una serie de variables medibles. A partir de la serie de comportamiento histórico podemos modelizar las componentes básicas de la serie, tendencia, ciclo y estacionalidad, con el fin de SERIES TEMPORALES Lic. Marco A. Cubillo M. predecir el futuro, tales como cifre de ventas, previsión de consumo de un producto o un servicio.
  • 3. Tradicionalmente el objetivo de la minería era la obtención de carbón. No obstante, una nueva generación de mineros ha aparecido en el inicio de esta cuarta revolución industrial. Son los mineros o exploradores de datos, que cuales en lugar de buscar carbón intentan descubrir patrones en enormes volúmenes de datos. Los métodos utilizados de estos nuevos profesionales son la inteligencia artificial, el aprendizaje automático, la estadística y sistemas de base de datos. Sirven para representar todos los posibles sucesos en que estamos interesados mediante un grafo de probabilidades condicionales de transición entre los posibles REDES BAYESIANAS Lic. Marco A. Cubillo M. sucesos. Se puede codificar a partir del conocimiento de un experto o se puede inferir a partir de los datos. También nos permite poder establecer relaciones causales. Son modelos que permiten el manejo de distintos tipos de variables de respuesta, por ejemplo la preferencia entre ciertos productos concurrentes en el mercado. MODELOS LINEALES GENERALIZADOS Lic. Marco A. Cubillo M. Además los modelos estadísticos se enriquecen cada vez más y se hacen más flexibles y adaptativos, lo que permite abordar los problemas cada vez más complejos de una forma más eficiente. Se trata de que individuos parecidos tendrán comportamientos similares respecto de una cierta variable de respuesta. PREVISIÓN LOCAL Lic. Marco A. Cubillo M. La técnica es situar los individuos en un espacio euclídeo y hacer las predicciones de su comportamiento a partir del comportamiento observado en sus vecinos. Se inspiran en un modelo biológico, consisten en modelos estadísticos clásicos. Si diferencia radica en el aprendizaje secuencial, en el hecho de utilizar transformaciones de las variables originales para la predicción y la no REDES NEURONALES Lic. Marco A. Cubillo M. linealidad del modelo.Nos permite aprender en contextos difíciles, sin necesidad de precisar la formulación de un modelo en concreto. Su principal inconveniente es que para el usuario son una caja negra.
  • 4. Tradicionalmente el objetivo de la minería era la obtención de carbón. No obstante, una nueva generación de mineros ha aparecido en el inicio de esta cuarta revolución industrial. Son los mineros o exploradores de datos, que cuales en lugar de buscar carbón intentan descubrir patrones en enormes volúmenes de datos. Los métodos utilizados de estos nuevos profesionales son la inteligencia artificial, el aprendizaje automático, la estadística y sistemas de base de datos. Obtenemos las reglas de decisión bajo las cuales operan los consumidores, ARBÓLES DE DECISIÓN Lic. Marco A. Cubillo M. comparado con datos históricos, brindando una facilidad de interpretacion. Simulamos el modelo biológico de la evolución de las especies, claro a velocidades muy grandes. Su principio es que cualquier problema que se nos presente, como la optimización de una combinación entre distintas componentes, estando claro sujetas a restricciones, puede ALGORÍTMOS GENÉTICOS Lic. Marco A. Cubillo M. resolverse mediante algorítmos genéticos. Una opción es mezclar los análisis en sistemas híbridos, o sea combinando la eficiencia en la resolución de un problema, por ejemplo usar un algorítmo genético para iniciar una red neuronal o usar un árbol de decisión como variable de entrada en una regresión logística. Implica implementar técnicas eficientes de validación de resultados, a partir del conocimiento de la distribución muestral de los estadísticos del PODER DE GENERALIZACIÓN Lic. Marco A. Cubillo M. modelo o por métodos computacionales como la validación cruzada. Dado el volumen de datos a tratar, el costo de los algorítmos ha de ser todo líneal que sea posible ESCALABILIDAD Lic. Marco A. Cubillo M. respecto de los parámetros que definen el costo, en particular respecto del número de individuos.