SlideShare uma empresa Scribd logo
1 de 6
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
La Minería de Datos es el proceso de descubrimiento de patrones, tendencias y comportamientos de los datos en
grandes volúmenes con la ayuda de las computadoras y aplicaciones de Inteligencia Artificial, Aprendizaje de
Máquina, Estadística y Sistemas de Administración de Datos.
El propósito de la Minería de Datos también conocida como KDD (Knowledge Discovery in Database) es convertir
grandes volúmenes de datos desorganizadas en información estructurada para análisis posteriores. El proceso de
Minería de Datos es un proceso de análisis multidisciplinario que debe ser realizadopor matemáticos, estadísticos
y programadores de computadoras.
La profesión del analista de datos es una de las más buscadas en los portales de empleo y no en vano, fue definida
en 2012 por «HarvardBusiness Review» como «la más sexi del siglo XXI». Grandes compañías como Google, IBM,
Facebook, HP, Oracle, Amazon o LinkedIn utilizan a diario las ventajas que ofrece el «Big Data»y en consecuencia,
destacan la importancia de este nuevo perfil profesional.
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva
La minería de datos también se conoce con el nombre de Data Discovery, y engloba diversos procesos entre los
cuales están: recolección, extracción, almacenamiento o datawarehousing, limpieza y estandarización,
transformación, análisis, estadística, inteligencia artificial, aprendizaje de maquina y business intelligence. Antes
que los datos sean explorados es decir sometidos al proceso de análisis estadistico requieren ser limpiados y
transformados, para eliminar los errores e inconsistencias.
La estadística proporciona herramientas para el análisis y establece patrones y tendencias en los datos y el
aprendizaje de maquina administra las diferentes metodologías de aprendizaje.
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva
Las técnicas de análisis estadístico son procedimientos matemáticos que buscan establecer patrones, tendencias
o relaciones individuales o grupales en los datos de una población o muestra. Diversos son los métodos o técnicas
estadísticas de análisis de minería de datos; entre los mas importantes se encuentran: generalización,
caracterización, clasificación, clustering, asociación, evolución, secuencia de patrones, arboles de decisión,
visualización de datos y minería guiada por reglas.
Los proyectos de minería de datos comprenden un esfuerzo enorme de análisis que es apoyado por diversos
estándares metodológicos.
Una de las metodologías mas usadas para proyectos de minería de datos es CRISP-DM (Cross Industry Standard
Process for Data Mining) que es un modelo de procesos estándares que describe métodos generales usados por
expertos en minería de datos.
CRISP-DM fue concebido en 1996 y se convirtió en un proyecto de la Unión Europea bajo la iniciativa de
financiamiento ESPRIT en 1997. El proyecto estaba liderado por 5 empresas: Integral Solutions Ltd
(ISL), Teradata, Daimler AG, NCR Corporation y OHRA, una compañía de seguros.
CRISP-DM divide el proceso de minería de datos en 6 grandes etapas: Entendimiento del negocio, entendimiento
de los datos, preparación de los datos, modelamiento, evaluación e implementación.
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva
Estas etapas se desarrollan de una manera no necesariamente secuencial y que se implementan según las
condiciones y necesidades del modelo en particular. Las flechas en el diagrama muestran las más importantes
dependencias entre las fases del modelo y el circulo exterior muestra el ciclo natural de desarrollo del proceso de
minería de datos. El proceso de minería de datos no se detiene y continua después de que se ha obtenido una
solución. La lección aprendida durante el proceso puede disparar un nuevo proceso de minería de datos
frecuentemente con preguntas más enfocadas en el negocio y consiguientemente una nueva solución de minería
que ha aprovechado las experiencias anteriores.
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva
Técnicas de análisis en minería dedatos
Las tareas de análisis de grandes volúmenes en minería de datos pueden ser realizadas en forma automática o
semiautomática y buscan encontrar patrones interesantes en los datos anteriormente desconocidos. Estas
técnicas de análisis en forma general pueden describirse como: análisis de cluster, detección de anomalías y
registros no usuales y análisis de dependencias utilizando reglas de asociación. Los patrones detectados pueden
ser entonces utilizados en análisis mas avanzados empleando aplicaciones de inteligencia artificial, aprendizaje de
máquina y analítica predictiva. Las técnicas de minería de datos se emplean en diferentes tipos de bases de datos
que incluyen bases de datos relacionales, transaccionales, espaciales, orientadas a objetos, etc.
La minería de datos en forma general involucra 6 tipos de técnicas de análisis:
1. Detección de anomalías: es la detección de desviaciones o valores atípicos, que requieren ser
identificados y verificados.
2. Aprendizaje basado en reglas de asociación: También denominado modelamiento dependiente debido a
que busca relaciones entre las variables. También se le conoce como Análisis de la Canasta de Mercado.
3. Clustering: Es el proceso de descubrimiento de grupos y estructuras en los datos que son de alguna
manera similares sin usar estructuras conocidas en los datos.
4. Clasificaciones: Es la tarea de generalizaruna estructura de datos conocida para aplicarla a nuevos datos.
5. Regresiones: Es la búsqueda de una función de representación que modelo los datos con el mínimo de
error.
6. Resúmenes y visualizaciones: Proporciona una representación consolidada de los datos a través de
graficas y reportes.
Elaborado por: Pedro Chávez F. Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Minería de Datos en la Analítica Predictiva

Mais conteúdo relacionado

Mais procurados

Data Mining
Data MiningData Mining
Data Mining
brobelo
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
ufrj
 

Mais procurados (19)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Md session1
Md session1Md session1
Md session1
 
Data Mining
Data MiningData Mining
Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Mineria de datos - UAGRM
Mineria de datos - UAGRMMineria de datos - UAGRM
Mineria de datos - UAGRM
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 

Semelhante a La Minería de Datos en la Analítica Predictiva

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21
Daniela Bedascarrasbure
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
CarlosTenelema1
 

Semelhante a La Minería de Datos en la Analítica Predictiva (20)

Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Procesos de Analítica Predictiva
Procesos de Analítica PredictivaProcesos de Analítica Predictiva
Procesos de Analítica Predictiva
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Tecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.pptTecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.ppt
 
02 extraccion de conocimiento
02 extraccion de conocimiento02 extraccion de conocimiento
02 extraccion de conocimiento
 

Mais de LPI ONG

Mais de LPI ONG (20)

Dashboards y paneles - CP Home - Area de Operaciones
Dashboards y paneles - CP Home - Area de OperacionesDashboards y paneles - CP Home - Area de Operaciones
Dashboards y paneles - CP Home - Area de Operaciones
 
Modelo de Datos CP Home - Area de Operaciones
Modelo de Datos CP Home - Area de OperacionesModelo de Datos CP Home - Area de Operaciones
Modelo de Datos CP Home - Area de Operaciones
 
Documento de Proyecto CP Home - Area Operaciones
Documento de Proyecto CP Home - Area OperacionesDocumento de Proyecto CP Home - Area Operaciones
Documento de Proyecto CP Home - Area Operaciones
 
Inversiones Costa Palma Homes Modelo de análisis basado en PowerBI
Inversiones Costa Palma Homes Modelo de análisis basado en PowerBIInversiones Costa Palma Homes Modelo de análisis basado en PowerBI
Inversiones Costa Palma Homes Modelo de análisis basado en PowerBI
 
Manual SAP Analytics Cloud Diseño de Historias
Manual SAP Analytics Cloud Diseño de HistoriasManual SAP Analytics Cloud Diseño de Historias
Manual SAP Analytics Cloud Diseño de Historias
 
Diagnostico del Area de Cobros de Ron Santa Teresa
Diagnostico del Area de Cobros de  Ron Santa TeresaDiagnostico del Area de Cobros de  Ron Santa Teresa
Diagnostico del Area de Cobros de Ron Santa Teresa
 
Laboratorio Funciones DAX
Laboratorio Funciones DAXLaboratorio Funciones DAX
Laboratorio Funciones DAX
 
Convenio en investigación y formación ONG LPI - Convenio generico
Convenio en investigación y formación ONG LPI - Convenio genericoConvenio en investigación y formación ONG LPI - Convenio generico
Convenio en investigación y formación ONG LPI - Convenio generico
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
Análisis Estadístico en la Analítica Predictiva
Análisis Estadístico en la Analítica PredictivaAnálisis Estadístico en la Analítica Predictiva
Análisis Estadístico en la Analítica Predictiva
 
El Análisis de Datos en la Analítica Predictiva
El Análisis de Datos en la Analítica PredictivaEl Análisis de Datos en la Analítica Predictiva
El Análisis de Datos en la Analítica Predictiva
 
Modelos Predictivos basados en Arboles de Decisiones
Modelos Predictivos basados en Arboles de DecisionesModelos Predictivos basados en Arboles de Decisiones
Modelos Predictivos basados en Arboles de Decisiones
 
Implementación de CMI en SCC
Implementación de CMI en SCCImplementación de CMI en SCC
Implementación de CMI en SCC
 
Cloud Analytics - Perspectivas
Cloud Analytics - PerspectivasCloud Analytics - Perspectivas
Cloud Analytics - Perspectivas
 
Convenio de cooperacion en investigación y formación ONG LPI - Convenio generico
Convenio de cooperacion en investigación y formación ONG LPI - Convenio genericoConvenio de cooperacion en investigación y formación ONG LPI - Convenio generico
Convenio de cooperacion en investigación y formación ONG LPI - Convenio generico
 
Especialista en SAP Lumira 2.0
Especialista en SAP Lumira 2.0Especialista en SAP Lumira 2.0
Especialista en SAP Lumira 2.0
 
Especialista en Implementacion de Cuadros de Mando con SAP Dashboard 2016
Especialista en Implementacion de Cuadros de Mando con SAP Dashboard 2016Especialista en Implementacion de Cuadros de Mando con SAP Dashboard 2016
Especialista en Implementacion de Cuadros de Mando con SAP Dashboard 2016
 
Programa de Especialización en Analisis de Negocios con SAP Crystal Reports 2016
Programa de Especialización en Analisis de Negocios con SAP Crystal Reports 2016Programa de Especialización en Analisis de Negocios con SAP Crystal Reports 2016
Programa de Especialización en Analisis de Negocios con SAP Crystal Reports 2016
 
SAP Cloud Analytics - Processess
SAP Cloud Analytics - ProcessessSAP Cloud Analytics - Processess
SAP Cloud Analytics - Processess
 
SAP Cloud Analytics - definiciones.
SAP Cloud Analytics - definiciones.SAP Cloud Analytics - definiciones.
SAP Cloud Analytics - definiciones.
 

Último

NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
BRAYANJOSEPTSANJINEZ
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
bcondort
 

Último (20)

Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5
 
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
 
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
 
UNIDAD II 2.pdf ingenieria civil lima upn
UNIDAD  II 2.pdf ingenieria civil lima upnUNIDAD  II 2.pdf ingenieria civil lima upn
UNIDAD II 2.pdf ingenieria civil lima upn
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdf
 
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptxCALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
 
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf  PARA TRABAJO SEGUROATS-FORMATO cara.pdf  PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiología
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelosFicha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
 
Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo process
 
Ejemplos aplicados de flip flops para la ingenieria
Ejemplos aplicados de flip flops para la ingenieriaEjemplos aplicados de flip flops para la ingenieria
Ejemplos aplicados de flip flops para la ingenieria
 
Desigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdfDesigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdf
 
PostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCDPostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCD
 
nomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestacionesnomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestaciones
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
 
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHTAPORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
 
Presentacion de la ganaderia en la región
Presentacion de la ganaderia en la regiónPresentacion de la ganaderia en la región
Presentacion de la ganaderia en la región
 

La Minería de Datos en la Analítica Predictiva

  • 1. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva La Minería de Datos en la Analítica Predictiva La Minería de Datos es el proceso de descubrimiento de patrones, tendencias y comportamientos de los datos en grandes volúmenes con la ayuda de las computadoras y aplicaciones de Inteligencia Artificial, Aprendizaje de Máquina, Estadística y Sistemas de Administración de Datos. El propósito de la Minería de Datos también conocida como KDD (Knowledge Discovery in Database) es convertir grandes volúmenes de datos desorganizadas en información estructurada para análisis posteriores. El proceso de Minería de Datos es un proceso de análisis multidisciplinario que debe ser realizadopor matemáticos, estadísticos y programadores de computadoras. La profesión del analista de datos es una de las más buscadas en los portales de empleo y no en vano, fue definida en 2012 por «HarvardBusiness Review» como «la más sexi del siglo XXI». Grandes compañías como Google, IBM, Facebook, HP, Oracle, Amazon o LinkedIn utilizan a diario las ventajas que ofrece el «Big Data»y en consecuencia, destacan la importancia de este nuevo perfil profesional.
  • 2. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva La minería de datos también se conoce con el nombre de Data Discovery, y engloba diversos procesos entre los cuales están: recolección, extracción, almacenamiento o datawarehousing, limpieza y estandarización, transformación, análisis, estadística, inteligencia artificial, aprendizaje de maquina y business intelligence. Antes que los datos sean explorados es decir sometidos al proceso de análisis estadistico requieren ser limpiados y transformados, para eliminar los errores e inconsistencias. La estadística proporciona herramientas para el análisis y establece patrones y tendencias en los datos y el aprendizaje de maquina administra las diferentes metodologías de aprendizaje.
  • 3. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva Las técnicas de análisis estadístico son procedimientos matemáticos que buscan establecer patrones, tendencias o relaciones individuales o grupales en los datos de una población o muestra. Diversos son los métodos o técnicas estadísticas de análisis de minería de datos; entre los mas importantes se encuentran: generalización, caracterización, clasificación, clustering, asociación, evolución, secuencia de patrones, arboles de decisión, visualización de datos y minería guiada por reglas. Los proyectos de minería de datos comprenden un esfuerzo enorme de análisis que es apoyado por diversos estándares metodológicos. Una de las metodologías mas usadas para proyectos de minería de datos es CRISP-DM (Cross Industry Standard Process for Data Mining) que es un modelo de procesos estándares que describe métodos generales usados por expertos en minería de datos. CRISP-DM fue concebido en 1996 y se convirtió en un proyecto de la Unión Europea bajo la iniciativa de financiamiento ESPRIT en 1997. El proyecto estaba liderado por 5 empresas: Integral Solutions Ltd (ISL), Teradata, Daimler AG, NCR Corporation y OHRA, una compañía de seguros. CRISP-DM divide el proceso de minería de datos en 6 grandes etapas: Entendimiento del negocio, entendimiento de los datos, preparación de los datos, modelamiento, evaluación e implementación.
  • 4. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva Estas etapas se desarrollan de una manera no necesariamente secuencial y que se implementan según las condiciones y necesidades del modelo en particular. Las flechas en el diagrama muestran las más importantes dependencias entre las fases del modelo y el circulo exterior muestra el ciclo natural de desarrollo del proceso de minería de datos. El proceso de minería de datos no se detiene y continua después de que se ha obtenido una solución. La lección aprendida durante el proceso puede disparar un nuevo proceso de minería de datos frecuentemente con preguntas más enfocadas en el negocio y consiguientemente una nueva solución de minería que ha aprovechado las experiencias anteriores.
  • 5. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva Técnicas de análisis en minería dedatos Las tareas de análisis de grandes volúmenes en minería de datos pueden ser realizadas en forma automática o semiautomática y buscan encontrar patrones interesantes en los datos anteriormente desconocidos. Estas técnicas de análisis en forma general pueden describirse como: análisis de cluster, detección de anomalías y registros no usuales y análisis de dependencias utilizando reglas de asociación. Los patrones detectados pueden ser entonces utilizados en análisis mas avanzados empleando aplicaciones de inteligencia artificial, aprendizaje de máquina y analítica predictiva. Las técnicas de minería de datos se emplean en diferentes tipos de bases de datos que incluyen bases de datos relacionales, transaccionales, espaciales, orientadas a objetos, etc. La minería de datos en forma general involucra 6 tipos de técnicas de análisis: 1. Detección de anomalías: es la detección de desviaciones o valores atípicos, que requieren ser identificados y verificados. 2. Aprendizaje basado en reglas de asociación: También denominado modelamiento dependiente debido a que busca relaciones entre las variables. También se le conoce como Análisis de la Canasta de Mercado. 3. Clustering: Es el proceso de descubrimiento de grupos y estructuras en los datos que son de alguna manera similares sin usar estructuras conocidas en los datos. 4. Clasificaciones: Es la tarea de generalizaruna estructura de datos conocida para aplicarla a nuevos datos. 5. Regresiones: Es la búsqueda de una función de representación que modelo los datos con el mínimo de error. 6. Resúmenes y visualizaciones: Proporciona una representación consolidada de los datos a través de graficas y reportes.
  • 6. Elaborado por: Pedro Chávez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Minería de Datos en la Analítica Predictiva