SlideShare uma empresa Scribd logo
1 de 9
DATA MINING
KAROL PARDO
MIGUEL VALCERO
CORPORACION UNIVERSITARIA MINUTO DE DIOS
DATA MINING (MINERIA DE DATOS)
 Es un campo de las ciencias de la
computación referido al proceso que
intenta descubrir patrones en grandes
volúmenes de conjuntos de datos.1 Utiliza
los métodos de la inteligencia artificial,
aprendizaje automático, estadística y
sistemas de bases de datos.
OBJETIVO DEL DATA MINING
 El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior. Además de la etapa de
análisis en bruto, que involucra aspectos de bases de datos y de
gestión de datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de métricas de Intereses, de
consideraciones de la Teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la
visualización y de la actualización en línea
FUNCIÓN
 La tarea de minería de datos real es el análisis automático
o semi-automático de grandes cantidades de datos para
extraer patrones interesantes hasta ahora desconocidos,
como los grupos de registros de datos (análisis clúster),
registros poco usuales (la detección de anomalías) y
dependencias (minería por reglas de asociación). Esto
generalmente implica el uso de técnicas de bases de datos
como los índices espaciales. Estos patrones pueden
entonces ser vistos como una especie de resumen de los
datos de entrada, y pueden ser utilizados en el análisis
adicional o, por ejemplo, en la máquina de aprendizaje y
análisis predictivo.
PROCESO
 Selección del conjunto de datos
 Análisis de las propiedades de los datos
 Transformación del conjunto de datos de entrada
 Seleccionar y aplicar la técnica de minería de datos
 Extracción de conocimiento
 Interpretación y evaluación de datos
Protocolo de un proyecto de minería de
datos
Un proyecto de minería de datos tiene varias fases necesarias que son,
esencialmente:
 Comprensión: del negocio y del problema que se quiere resolver.
 Determinación, obtención y limpieza: de los datos necesarios.
 Creación de modelos matemáticos.
 Validación, comunicación: de los resultados obtenidos.
 Integración: si procede, de los resultados en un sistema transaccional o
similar
Técnicas de minería de datos
Las técnicas más representativas son:
 Redes neuronales.- Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el sistema nervioso de los
animales.
 Regresión lineal.- Es la más utilizada para formar relaciones entre datos.
Rápida y eficaz pero insuficiente en espacios multidimensionales donde
puedan relacionarse más de 2 variables.
 Árboles de decisión.- Un árbol de decisión es un modelo de predicción
utilizado en el ámbito de la inteligencia artificial, sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolución de un problema.
 Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la variable de respuesta.
 Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie
de vectores según criterios habitualmente de distancia; se tratará de disponer
los vectores de entrada de forma que estén más cercanos aquellos que tengan
características comunes.
 Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en
común dentro de un determinado conjunto de datos.
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican
en supervisados y no supervisados (Weiss y Indurkhya, 1998):
 Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de
ellos) desconocido a priori, a partir de otros conocidos.
 Algoritmos no supervisados (o del descubrimiento del conocimiento): se
descubren patrones y tendencias en los datos.
¿PREGUNTAS?
 ¿Qué es Data mining?
 ¿Cuál es su función importante?
 ¿Cuales son los tipos de técnica del Data mining
que hay?

Mais conteúdo relacionado

Mais procurados

Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
viktor93
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
Marilyn Jaramillo
 
Data mining
Data miningData mining
Data mining
rubza
 
Data mining
Data miningData mining
Data mining
rubzabet
 

Mais procurados (17)

Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Datamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias BiológicasDatamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias Biológicas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data mining
Data miningData mining
Data mining
 
Mapa
MapaMapa
Mapa
 
Data mining
Data miningData mining
Data mining
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 

Destaque (9)

Netiquetas
NetiquetasNetiquetas
Netiquetas
 
Presentación netiqueta
Presentación netiquetaPresentación netiqueta
Presentación netiqueta
 
Netiqueta (diapositivas)
Netiqueta (diapositivas)Netiqueta (diapositivas)
Netiqueta (diapositivas)
 
Diapositivas de netiqueta
Diapositivas de netiquetaDiapositivas de netiqueta
Diapositivas de netiqueta
 
E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.
E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.
E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.
 
Diapositivas de Netiquetas- MODIFICADAS
Diapositivas de Netiquetas- MODIFICADASDiapositivas de Netiquetas- MODIFICADAS
Diapositivas de Netiquetas- MODIFICADAS
 
Tendencias Recientes en Data Mining
Tendencias Recientes en Data MiningTendencias Recientes en Data Mining
Tendencias Recientes en Data Mining
 
Ejemplos de netiqueta
Ejemplos de netiquetaEjemplos de netiqueta
Ejemplos de netiqueta
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 

Semelhante a Data mining

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
KamZee1
 
Act 2.1 grupal blog actividad 2.1
Act  2.1 grupal blog actividad 2.1Act  2.1 grupal blog actividad 2.1
Act 2.1 grupal blog actividad 2.1
Mario Moreno
 

Semelhante a Data mining (19)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Tecnicas de Mineria de Datos
Tecnicas de Mineria de DatosTecnicas de Mineria de Datos
Tecnicas de Mineria de Datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Técnicas de minería de datos.
Técnicas de minería de datos. Técnicas de minería de datos.
Técnicas de minería de datos.
 
Machine learning
Machine learningMachine learning
Machine learning
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos-una_introduccion
Mineria de datos-una_introduccionMineria de datos-una_introduccion
Mineria de datos-una_introduccion
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
Act 2.1 grupal blog actividad 2.1
Act  2.1 grupal blog actividad 2.1Act  2.1 grupal blog actividad 2.1
Act 2.1 grupal blog actividad 2.1
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Trabajo de sistemas de informacion analistas de sistemas
Trabajo de sistemas de informacion  analistas de sistemasTrabajo de sistemas de informacion  analistas de sistemas
Trabajo de sistemas de informacion analistas de sistemas
 

Mais de contaduria1234 (18)

Redes sociales (1)
Redes sociales (1)Redes sociales (1)
Redes sociales (1)
 
Derechos de autor
Derechos de autorDerechos de autor
Derechos de autor
 
Gbi modding
Gbi moddingGbi modding
Gbi modding
 
Presentación deep web
Presentación deep web  Presentación deep web
Presentación deep web
 
DEEP WEB
DEEP WEBDEEP WEB
DEEP WEB
 
Spam
SpamSpam
Spam
 
Presentacion antivirus
Presentacion antivirusPresentacion antivirus
Presentacion antivirus
 
Los virus
Los virusLos virus
Los virus
 
Comercio electronico exposición
Comercio electronico exposiciónComercio electronico exposición
Comercio electronico exposición
 
Voki exposición
Voki exposiciónVoki exposición
Voki exposición
 
Gbi delitos informaticos exposición
Gbi  delitos informaticos exposiciónGbi  delitos informaticos exposición
Gbi delitos informaticos exposición
 
Crackers y hackers exposición
Crackers y hackers exposición Crackers y hackers exposición
Crackers y hackers exposición
 
aulas virtuales exposición
aulas virtuales exposición  aulas virtuales exposición
aulas virtuales exposición
 
Aulas virtuales
Aulas virtualesAulas virtuales
Aulas virtuales
 
Crackers y hackers
Crackers y hackersCrackers y hackers
Crackers y hackers
 
Gbi delitos informaticos
Gbi  delitos informaticosGbi  delitos informaticos
Gbi delitos informaticos
 
Voki
VokiVoki
Voki
 
Comercio electronico
Comercio electronicoComercio electronico
Comercio electronico
 

Último

Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Francisco158360
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
JonathanCovena1
 

Último (20)

TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdf
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 

Data mining

  • 1. DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS
  • 2. DATA MINING (MINERIA DE DATOS)  Es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.1 Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
  • 3. OBJETIVO DEL DATA MINING  El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y de gestión de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea
  • 4. FUNCIÓN  La tarea de minería de datos real es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación). Esto generalmente implica el uso de técnicas de bases de datos como los índices espaciales. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en la máquina de aprendizaje y análisis predictivo.
  • 5. PROCESO  Selección del conjunto de datos  Análisis de las propiedades de los datos  Transformación del conjunto de datos de entrada  Seleccionar y aplicar la técnica de minería de datos  Extracción de conocimiento  Interpretación y evaluación de datos
  • 6. Protocolo de un proyecto de minería de datos Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:  Comprensión: del negocio y del problema que se quiere resolver.  Determinación, obtención y limpieza: de los datos necesarios.  Creación de modelos matemáticos.  Validación, comunicación: de los resultados obtenidos.  Integración: si procede, de los resultados en un sistema transaccional o similar
  • 7. Técnicas de minería de datos Las técnicas más representativas son:  Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales.  Regresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.  Árboles de decisión.- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.  Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
  • 8.  Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes.  Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):  Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos.  Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.
  • 9. ¿PREGUNTAS?  ¿Qué es Data mining?  ¿Cuál es su función importante?  ¿Cuales son los tipos de técnica del Data mining que hay?