SlideShare una empresa de Scribd logo
1 de 27
Trabajo de Investigación
 ICI344- Bases de datos.
Minería de datos.
  Enzo Barbaguelatta D.
   Fernando Püschel A.
    Nicolas Zárate G.
Bases de datos
• Mundo actual muy dependiente de la
  información.
• Generación de datos en masa.
• Rápidas consultas de rápida respuesta.
• Empleo de bases de datos.
Pero…
• Éstas consultas son superficiales.
• Principalmente no se ve mas allá de los datos
  en “crudo”.
• Datos podrían aprovecharse aun mas de lo
  que ya se esta aprovechando actualmente.
Definición general
Introducción a la minería de Datos.
Minería de datos
   (Data mining).
            Muchas definiciones.
     • Un mecanismo de explotación
       consistente en la búsqueda de
       información valiosa en grandes
       volúmenes de datos.

     • Análisis de bitácoras y archivos,
       buscando relaciones, patrones,
       reglas, las cuales pueden ser
       útiles para la toma de decisiones.

     • Y mas…
En el entorno comercial


• Una de las etapas de descubrimiento de la
  extracción de conocimiento en la información.



              KDD
Historia de la minería de datos
Extracción del conocimiento de la
información.
KDD
                     Knowledge Discovery in Databases


• Los datos son la materia prima bruta.

• En el momento que el usuario les atribuye algún
  significado especial pasan a convertirse en
  información.

• Cuando los especialistas elaboran o encuentran
  un modelo, haciendo que la interpretación de la
  información y ese modelo representen un valor
  agregado, entonces nos referimos al
  conocimiento.
KDD
                          Knowledge Discovery in Databases


• El proceso de KDD           • Se estima que la
  consiste en usar              extracción de
  métodos de                    patrones
  minería de datos              (minería) de los
  (algoritmos) para             datos ocupa solo
  extraer (identificar)         el 15% - 20% del
  lo que se considera           esfuerzo total.
  como
  conocimiento.
• Determinar las fuentes de información:
       Que pueden ser útiles y dónde
       conseguirlas.


     • Diseñar el esquema de un almacén de
       datos (Data Warehouse): Que consiga
       unificar de manera operativa toda la
       información recogida.



Pasos del KDD
Selección, limpieza y
                          transformación de los
                          datos que se van a
                          analizar.
 Implantación del
 almacén de datos.        • La limpieza y pre-
                            procesamiento de datos
 • Permitir la              se logra diseñando una
   visualización de         estrategia adecuada
   datos para discernir     para manejar ruido,
   cuales estudiar.         valores incompletos,
                            secuencias de tiempo,
Pasos del KDD               casos extremos (si es
                            necesario), etc.
• Seleccionar y aplicar el
 método de minería de
 datos apropiado: Se
 selecciona lo que se desea
 buscar, utilizando            Búsqueda de patrones y su
 algoritmos y técnicas        representación en
 apropiadas para ello.        modelos(dependiendo del
                              algoritmo de minería).

Pasos del KDD
• Evaluación, interpretación,
            transformación y representación de los
            patrones extraídos.
• Interpretar los resultados y posiblemente regresar a los
  pasos anteriores.
• Involucrar repetir el proceso, quizás con otros datos,
  otros algoritmos, otras metas y otras estrategias.
• Requiere tener conocimiento del dominio.
• La interpretación puede beneficiarse de procesos de
  visualización, y sirve también para borrar patrones
  redundantes o irrelevantes.

Pasos del KDD
• Difusión y uso del nuevo conocimiento.

   • Incorporar el conocimiento descubierto al
     sistema (normalmente para mejorarlo) lo
     cual puede incluir resolver conflictos
     potenciales con el conocimiento existente.



Pasos del KDD
Tipos, técnicas, algoritmos.
Funcionamiento de la minería de datos.
• Minería de datos para
                           el descubrimiento de
                           la información
• Minería de datos         (MMDC).
  predictiva (MDP).      Uso de diversas técnicas
Emplea uso de técnicas   de inteligencia artificial
estadísticas.            para obtener datos.


              2 tipos esenciales
Funcionamiento


• Emplean técnicas de diversas ciencias para
  lograr su trabajo.
• Muchas veces se mezclan éstas para reforzar las
  técnicas.
• Han estado en constante evolución.
Sub-procesos data mining
            • Extracción de datos.
          • Interpretación de éstos.
     • Generación de nuevo conocimiento.




• La interpretación de los datos generalmente es apoyado por
   herramientas y personas no profesionales en los campos.
  • Todo este proceso está basado en el método científico.
Procesos y Técnicas


          • Técnicas de Visualización: Se utiliza para
                     determinar calidad en los datos.
• Reglas de Asociación: Permite realizar asociaciones
                          entre perfiles de los clientes.
  • Descripción: Análisis preliminar de los datos, para
                 aumentar el conocimiento posterior.
Extensiones de la MD
• WEB Mining: Aplicación
  de las técnicas de la MD
  a documentos y servicios
  webs.

• Text Mining:
  Examinación de las
  colecciones de
  documentos con el fin de
  encontrar información
  no contenida en ningún
  documento individual.
Resultados

• La minería de datos añade a la situación inicial nuevo
  conocimiento de calidad.
• Permite tener visión global de los datos, inclusive ocultos.
• Ayuda a una mejor toma de decisiones, y a hacer
  pronósticos de tendencias.
• Todo lo anterior puede trabajarse en masas grandes de
  datos, automáticamente.
• No necesariamente requiere de equipamiento
  especializado.
Pero también…

• Altos costos, tanto infraestructura como
  implementación.
• Personal especializado.
• Puesta en marcha de largo plazo. Difícil.
• No existen estandarizaciones respecto a la
  minería de datos.
Casos de uso, presente y futuro
Minería de datos en la actualidad.
Aplicaciones de la MD
 • FBI. Trata de buscar a
   potenciales terroristas, con
   antelación antes de que puedan
   cometer un atentado.
 • Tiendas Comerciales. Busca
   conocer los hábitos de los
   clientes con respecto a los
   productos que compran.
 • Deportes. La NBA utiliza la MD
   para apoyar a su cuerpo técnico
   en la toma de decisiones en las
   futuras tácticas.
Aplicaciones de la MD
    • Televisión: Se puede
      estimar el rating de los
      programas.
    • Entrevistas de
      trabajo: Se ocupa la
      MD para identificar las
      características de los
      empleados.
    • Y más…
Futuro de la minería de datos.




 • Muy bien aprovechado en el presente.
• Tecnología aún emergente, aún falta más
               investigación.
       • No hay estandarización.
     • Nuevas técnicas emergentes.
Trabajo de Investigación
 ICI344- Bases de datos.
Minería de datos.

Más contenido relacionado

La actualidad más candente

Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datosiloylan
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpenAnalytics Spain
 

La actualidad más candente (20)

Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Parte1
Parte1Parte1
Parte1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 

Destacado

Destacado (8)

Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 

Similar a Mineria de datos

Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Pedro Aaron
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOSLosMorales
 
5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatos5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatosJulio Pari
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BIfabian fernandez
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehousedagmalu
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datosVictoriaPilco
 
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptINTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptChemyTacza
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD travon1
 

Similar a Mineria de datos (20)

Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatos5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatos
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
ppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdfppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdf
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Md session1
Md session1Md session1
Md session1
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptINTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 

Último

Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 

Último (11)

Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 

Mineria de datos

  • 1. Trabajo de Investigación ICI344- Bases de datos. Minería de datos. Enzo Barbaguelatta D. Fernando Püschel A. Nicolas Zárate G.
  • 2. Bases de datos • Mundo actual muy dependiente de la información. • Generación de datos en masa. • Rápidas consultas de rápida respuesta. • Empleo de bases de datos.
  • 3. Pero… • Éstas consultas son superficiales. • Principalmente no se ve mas allá de los datos en “crudo”. • Datos podrían aprovecharse aun mas de lo que ya se esta aprovechando actualmente.
  • 4. Definición general Introducción a la minería de Datos.
  • 5. Minería de datos (Data mining). Muchas definiciones. • Un mecanismo de explotación consistente en la búsqueda de información valiosa en grandes volúmenes de datos. • Análisis de bitácoras y archivos, buscando relaciones, patrones, reglas, las cuales pueden ser útiles para la toma de decisiones. • Y mas…
  • 6. En el entorno comercial • Una de las etapas de descubrimiento de la extracción de conocimiento en la información. KDD
  • 7. Historia de la minería de datos Extracción del conocimiento de la información.
  • 8. KDD Knowledge Discovery in Databases • Los datos son la materia prima bruta. • En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. • Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento.
  • 9. KDD Knowledge Discovery in Databases • El proceso de KDD • Se estima que la consiste en usar extracción de métodos de patrones minería de datos (minería) de los (algoritmos) para datos ocupa solo extraer (identificar) el 15% - 20% del lo que se considera esfuerzo total. como conocimiento.
  • 10. • Determinar las fuentes de información: Que pueden ser útiles y dónde conseguirlas. • Diseñar el esquema de un almacén de datos (Data Warehouse): Que consiga unificar de manera operativa toda la información recogida. Pasos del KDD
  • 11. Selección, limpieza y transformación de los datos que se van a analizar. Implantación del almacén de datos. • La limpieza y pre- procesamiento de datos • Permitir la se logra diseñando una visualización de estrategia adecuada datos para discernir para manejar ruido, cuales estudiar. valores incompletos, secuencias de tiempo, Pasos del KDD casos extremos (si es necesario), etc.
  • 12. • Seleccionar y aplicar el método de minería de datos apropiado: Se selecciona lo que se desea buscar, utilizando Búsqueda de patrones y su algoritmos y técnicas representación en apropiadas para ello. modelos(dependiendo del algoritmo de minería). Pasos del KDD
  • 13. • Evaluación, interpretación, transformación y representación de los patrones extraídos. • Interpretar los resultados y posiblemente regresar a los pasos anteriores. • Involucrar repetir el proceso, quizás con otros datos, otros algoritmos, otras metas y otras estrategias. • Requiere tener conocimiento del dominio. • La interpretación puede beneficiarse de procesos de visualización, y sirve también para borrar patrones redundantes o irrelevantes. Pasos del KDD
  • 14. • Difusión y uso del nuevo conocimiento. • Incorporar el conocimiento descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente. Pasos del KDD
  • 16. • Minería de datos para el descubrimiento de la información • Minería de datos (MMDC). predictiva (MDP). Uso de diversas técnicas Emplea uso de técnicas de inteligencia artificial estadísticas. para obtener datos. 2 tipos esenciales
  • 17. Funcionamiento • Emplean técnicas de diversas ciencias para lograr su trabajo. • Muchas veces se mezclan éstas para reforzar las técnicas. • Han estado en constante evolución.
  • 18. Sub-procesos data mining • Extracción de datos. • Interpretación de éstos. • Generación de nuevo conocimiento. • La interpretación de los datos generalmente es apoyado por herramientas y personas no profesionales en los campos. • Todo este proceso está basado en el método científico.
  • 19. Procesos y Técnicas • Técnicas de Visualización: Se utiliza para determinar calidad en los datos. • Reglas de Asociación: Permite realizar asociaciones entre perfiles de los clientes. • Descripción: Análisis preliminar de los datos, para aumentar el conocimiento posterior.
  • 20. Extensiones de la MD • WEB Mining: Aplicación de las técnicas de la MD a documentos y servicios webs. • Text Mining: Examinación de las colecciones de documentos con el fin de encontrar información no contenida en ningún documento individual.
  • 21. Resultados • La minería de datos añade a la situación inicial nuevo conocimiento de calidad. • Permite tener visión global de los datos, inclusive ocultos. • Ayuda a una mejor toma de decisiones, y a hacer pronósticos de tendencias. • Todo lo anterior puede trabajarse en masas grandes de datos, automáticamente. • No necesariamente requiere de equipamiento especializado.
  • 22. Pero también… • Altos costos, tanto infraestructura como implementación. • Personal especializado. • Puesta en marcha de largo plazo. Difícil. • No existen estandarizaciones respecto a la minería de datos.
  • 23. Casos de uso, presente y futuro Minería de datos en la actualidad.
  • 24. Aplicaciones de la MD • FBI. Trata de buscar a potenciales terroristas, con antelación antes de que puedan cometer un atentado. • Tiendas Comerciales. Busca conocer los hábitos de los clientes con respecto a los productos que compran. • Deportes. La NBA utiliza la MD para apoyar a su cuerpo técnico en la toma de decisiones en las futuras tácticas.
  • 25. Aplicaciones de la MD • Televisión: Se puede estimar el rating de los programas. • Entrevistas de trabajo: Se ocupa la MD para identificar las características de los empleados. • Y más…
  • 26. Futuro de la minería de datos. • Muy bien aprovechado en el presente. • Tecnología aún emergente, aún falta más investigación. • No hay estandarización. • Nuevas técnicas emergentes.
  • 27. Trabajo de Investigación ICI344- Bases de datos. Minería de datos.