SlideShare uma empresa Scribd logo
1 de 27
Baixar para ler offline
DATAWAREHOUSE




              Datawarehouse




               Minería de Datos
                    Fundamentos
CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Agenda
     ●       Introducción.
     ●       Data Mining.
     ●       Fases de un Proyecto Data Mining.
     ●       Arquitectura de un Data Mining.
     ●       Funcionamiento del Data Mining.
     ●       Tipos de problemas.
     ●       Técnicas de Minería de Datos.
     ●       Almacenes de datos.
     ●       Ventajas de Almacenes de Datos.
CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Introducción
     ●       El desarrollo de varias tecnologías enfocadas
             a aprovechar los datos que se encuentran
             escondidos en estos grandes volúmenes de
             información.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Introducción
     ●       Las BDR, DW, Data Mart (DM), OLAP y OLTP
             obtienen conclusiones en base a consultas
             deductivas, en tiempos cortos y enormes
             volúmenes de información, imposibles en un
             proceso manual.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Introducción
     ●       Debido al gran volumen de datos el análisis
             de los datos ya no puede ser manual (ni
             incluso facilitado por herramientas de
             almacenes de datos y OLAP) sino que ha de
             ser (semi-)automático.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Introducción
     ●       Se define el data mining partiendo de la
             distinción entre datos, información y
             conocimiento.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Introducción
     ●       La minería de datos se diferencia en que no
             solo transforma y facilita el acceso a la
             información para que el usuario la analice más
             fácilmente.
     ●       La minería de datos analiza los datos.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Data Mining
     ●       La Minería de Datos es un conjunto de
             técnicas de análisis de datos que permiten:
                –   Extraer patrones, tendencias y regularidades
                     para describir y comprender mejor los datos.
                –   Extraer patrones y tendencias para predecir
                     comportamientos futuros.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Data Mining
     ●       Los patrones válidos son un conjunto de datos,
             deben ser útiles para el proceso de
             prospección de datos y comprensibles para el
             usuario (KDD).




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Data Mining
     ●       La prospección de datos ( data mining ) se
             inscribe en un proceso más amplio como es el
             del descubrimiento de conocimiento dentro
             de grandes bases de datos (KDD o knowledge
             discovery in databases ).




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Data Mining
     ●       La minería de datos es sólo una etapa del
             proceso de extracción de conocimiento a
             partir de datos.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Data Mining
     ●       Este proceso consta de varias fases:
                –   Preparación de Datos (selección, limpieza, y
                     transformación), Minería de Datos,
                     Evaluación, Difusión y Uso de Modelos.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Fases de un proyecto de Data Mining
     ●       Los pasos a seguir son:
                –   Filtrado de datos:
                        ●   El formato de las fuentes de datos no es el
                             idóneo. No es posible aplicar minería de datos
                             en datos en bruto. Actividad de
                             Preprocesamietno
                –   Selección de Variables:
                        ●   La selección de características reduce el
                             tamaño de los datos eligiendo las variables
                             mas influyentes en el modelo de
                             conocimiento.

CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Fases de un proyecto de Data Mining
     ●       Los pasos a seguir son:
                –   Extracción del conocimiento:
                        ●   Mediante técnicas se obtiene un modelo de
                             conocimiento, que representa patrones de
                             comportamiento observados.
                –   Interpretación y evaluación:
                        ●   Se valida el resultado, comprobando las
                             conclusiones sean satisfactorias. Comprobar
                             los modelos obtenidos. Modificar los pasos
                             para los modelos si ninguno es satisfactorio.


CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Arquitectura de Minería de Datos




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


          Funcionamiento del Data Mining
      ●      El data mining trabaja en un nivel superior
             buscando:
                 –   patrones de conducta,
                 –   agrupaciones,
                 –   secuencias,
                 –   tendencias o
                 –   asociaciones de datos
      ●      que puedan generar algún modelo que
             permita entender mejor el dominio con el
             objetivo de facilitar la toma de decisiones.
CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


         Funcionamiento del Data Mining
     ●       El data mining es reunir las ventajas de varias
             áreas como:




     ●       principalmente usando como materia prima las
             bases de datos.
CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Tipos de problemas
     ●       Existe una variada tipología de problemas:
                –   Clasificación,
                –   Categorización,
                –   Estimación / regresión,
                –   Agrupamiento,
                –   Etc.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Técnicas de Minería de Datos
     ●       Entre las técnicas tenemos:
                –   Arboles de decisión.
                –   Regresión lineal.
                –   Redes neuronales artificiales.
                –   Técnicas bayesianas.
                –   Maquina de soporte vectorial.
                –   Reglas de asociación.
                –   Reglas de clasificación.

CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Técnicas de Minería de Datos
     ●       Modelo de agregación ( clustering ), si nos
             proponemos encontrar similitudes y agrupar
             modelos semejantes . Un ejemplo sería
             localizar grupos de datos similares.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Técnicas de Minería de Datos
     ●       Árboles de decisión, tanto si nuestro objetivo
             es clasificar objetos como si nos interesa
             obtener conocimiento para poder hacer
             predicciones.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Técnicas de Minería de Datos
     ●       Redes neuronales y las reglas de
             clasificación, si nuestro objetivo es clasificar
             objetos, estudiar las diferencias entre grupos,
             sus características particulares.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Técnicas de Minería de Datos
     ●       Modelos predictivos clásicos de la
             estadística, en el caso de que nuestro interés
             sea obtener conocimiento a partir de los datos
             que nos permita predecir acciones,
             comportamientos, etc.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


     Técnicas de Minería de Datos
     ●       Modelos descriptivos como, las redes
             bayesianas y, en menor grado, las reglas de
             asociación, si nos proponemos encontrar y
             expresar asociaciones significativas o
             causales entre diversas variables, hacer
             descripciones.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Almacenes de datos
     ●       ¿Es necesario tener almacenes de datos
             para realizar minería de datos?
                –   Los almacenes de datos no son
                     imprescindibles para hacer extracción de
                     conocimiento a partir de datos.
                        ●   Se puede hacer minería de datos sobre un
                             simple fichero de datos.




CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Ventajas de Almacenes de datos
     ●       Las ventajas de almacén de datos se amortizan
             sobradamente a medio y largo plazo cuando:
                –   tenemos grandes volúmenes de datos, o
                –   éstos aumentan con el tiempo, o
                –   provienen de fuentes heterogéneas o
                –   se van a combinar de maneras arbitrarias y
                      no predefinidas.



CARRERA DE
INGENIERÍA
DE SISTEMAS
DATAWAREHOUSE


    Otras Minerías de Datos
     ●       Existen otros …minings, como:
                –   TextMining
                –   WebMining.




CARRERA DE
INGENIERÍA
DE SISTEMAS

Mais conteúdo relacionado

Mais procurados

Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con RSoftware Guru
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?Scoremind
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 

Mais procurados (19)

aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 

Destaque

Data mining
Data miningData mining
Data miningrubzabet
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouseJulio Pari
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouseJulio Pari
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegociosJulio Pari
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolapJulio Pari
 
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presente
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presenteUnmsm fisi-05-ingeniería económica -capitulo 5-valor presente
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presenteJulio Pari
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1nestor
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Indice General Tesis Sistemas UPC
Indice General Tesis Sistemas UPCIndice General Tesis Sistemas UPC
Indice General Tesis Sistemas UPCJulio Pari
 

Destaque (13)

Data mining
Data miningData mining
Data mining
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolap
 
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presente
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presenteUnmsm fisi-05-ingeniería económica -capitulo 5-valor presente
Unmsm fisi-05-ingeniería económica -capitulo 5-valor presente
 
Data Mining en Forman
Data Mining en FormanData Mining en Forman
Data Mining en Forman
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Indice General Tesis Sistemas UPC
Indice General Tesis Sistemas UPCIndice General Tesis Sistemas UPC
Indice General Tesis Sistemas UPC
 

Semelhante a 5 t218162dw t_mineriadatos

Semelhante a 5 t218162dw t_mineriadatos (20)

Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Md session1
Md session1Md session1
Md session1
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Sap bi conceptos
Sap bi conceptosSap bi conceptos
Sap bi conceptos
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Big Data Analytics: Automatización de Modelos Predictivos
Big Data Analytics: Automatización de Modelos PredictivosBig Data Analytics: Automatización de Modelos Predictivos
Big Data Analytics: Automatización de Modelos Predictivos
 
Tema 2 parte ii datawarehouse y-datamining 2018
Tema 2  parte ii datawarehouse y-datamining 2018Tema 2  parte ii datawarehouse y-datamining 2018
Tema 2 parte ii datawarehouse y-datamining 2018
 
Herramientas Software Para Vigilancia Tecnologica
Herramientas Software Para Vigilancia TecnologicaHerramientas Software Para Vigilancia Tecnologica
Herramientas Software Para Vigilancia Tecnologica
 

Mais de Julio Pari

Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...
Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...
Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...Julio Pari
 
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesLinks kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesJulio Pari
 
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesComandos - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesJulio Pari
 
Arquitectura Web FISI UNMSM
Arquitectura Web FISI UNMSMArquitectura Web FISI UNMSM
Arquitectura Web FISI UNMSMJulio Pari
 
Jelastic Enterprise
Jelastic EnterpriseJelastic Enterprise
Jelastic EnterpriseJulio Pari
 
Marketing Examen Parcial Profesor Osorio
Marketing Examen Parcial Profesor OsorioMarketing Examen Parcial Profesor Osorio
Marketing Examen Parcial Profesor OsorioJulio Pari
 
Ingenieria Software Examen Parcial 2013 2 Profesor Cordero
Ingenieria Software Examen Parcial 2013 2 Profesor CorderoIngenieria Software Examen Parcial 2013 2 Profesor Cordero
Ingenieria Software Examen Parcial 2013 2 Profesor CorderoJulio Pari
 
Documento de Arquitectura
Documento de ArquitecturaDocumento de Arquitectura
Documento de ArquitecturaJulio Pari
 
Solucion Examen Parcial Sistemas Digitales UNMSM FISI
Solucion Examen Parcial Sistemas Digitales UNMSM FISISolucion Examen Parcial Sistemas Digitales UNMSM FISI
Solucion Examen Parcial Sistemas Digitales UNMSM FISIJulio Pari
 
Práctica de Inventarios - Investigación Operativa II
Práctica de Inventarios - Investigación Operativa IIPráctica de Inventarios - Investigación Operativa II
Práctica de Inventarios - Investigación Operativa IIJulio Pari
 
Armas silenciosas para guerras tranquilas
Armas silenciosas para guerras tranquilasArmas silenciosas para guerras tranquilas
Armas silenciosas para guerras tranquilasJulio Pari
 
Formato de presentación de Proyecto UNMSM FISI
Formato de presentación de Proyecto UNMSM FISIFormato de presentación de Proyecto UNMSM FISI
Formato de presentación de Proyecto UNMSM FISIJulio Pari
 
Cuento para nuestro hijo y nuestra hija
Cuento para nuestro hijo y nuestra hijaCuento para nuestro hijo y nuestra hija
Cuento para nuestro hijo y nuestra hijaJulio Pari
 
Ingeniería de Software Examen Parcial
Ingeniería de Software Examen ParcialIngeniería de Software Examen Parcial
Ingeniería de Software Examen ParcialJulio Pari
 
Sistemas Distribuidos Examen Parcial
Sistemas Distribuidos Examen ParcialSistemas Distribuidos Examen Parcial
Sistemas Distribuidos Examen ParcialJulio Pari
 
Php07 consultas bd
Php07 consultas bdPhp07 consultas bd
Php07 consultas bdJulio Pari
 
Php06 instalacion my_sql
Php06 instalacion my_sqlPhp06 instalacion my_sql
Php06 instalacion my_sqlJulio Pari
 
Php05 funciones usuario
Php05 funciones usuarioPhp05 funciones usuario
Php05 funciones usuarioJulio Pari
 
Php04 estructuras control
Php04 estructuras controlPhp04 estructuras control
Php04 estructuras controlJulio Pari
 

Mais de Julio Pari (20)

Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...
Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...
Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes #Ibm virtual la...
 
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesLinks kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Links kubernetes - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
 
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en KubernetesComandos - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
Comandos - Evento - Virtual Lab Despliegue de aplicaciones en Kubernetes
 
Arquitectura Web FISI UNMSM
Arquitectura Web FISI UNMSMArquitectura Web FISI UNMSM
Arquitectura Web FISI UNMSM
 
Jelastic Enterprise
Jelastic EnterpriseJelastic Enterprise
Jelastic Enterprise
 
Marketing Examen Parcial Profesor Osorio
Marketing Examen Parcial Profesor OsorioMarketing Examen Parcial Profesor Osorio
Marketing Examen Parcial Profesor Osorio
 
Ingenieria Software Examen Parcial 2013 2 Profesor Cordero
Ingenieria Software Examen Parcial 2013 2 Profesor CorderoIngenieria Software Examen Parcial 2013 2 Profesor Cordero
Ingenieria Software Examen Parcial 2013 2 Profesor Cordero
 
Documento de Arquitectura
Documento de ArquitecturaDocumento de Arquitectura
Documento de Arquitectura
 
Solucion Examen Parcial Sistemas Digitales UNMSM FISI
Solucion Examen Parcial Sistemas Digitales UNMSM FISISolucion Examen Parcial Sistemas Digitales UNMSM FISI
Solucion Examen Parcial Sistemas Digitales UNMSM FISI
 
Práctica de Inventarios - Investigación Operativa II
Práctica de Inventarios - Investigación Operativa IIPráctica de Inventarios - Investigación Operativa II
Práctica de Inventarios - Investigación Operativa II
 
Armas silenciosas para guerras tranquilas
Armas silenciosas para guerras tranquilasArmas silenciosas para guerras tranquilas
Armas silenciosas para guerras tranquilas
 
UML Java
UML JavaUML Java
UML Java
 
Formato de presentación de Proyecto UNMSM FISI
Formato de presentación de Proyecto UNMSM FISIFormato de presentación de Proyecto UNMSM FISI
Formato de presentación de Proyecto UNMSM FISI
 
Cuento para nuestro hijo y nuestra hija
Cuento para nuestro hijo y nuestra hijaCuento para nuestro hijo y nuestra hija
Cuento para nuestro hijo y nuestra hija
 
Ingeniería de Software Examen Parcial
Ingeniería de Software Examen ParcialIngeniería de Software Examen Parcial
Ingeniería de Software Examen Parcial
 
Sistemas Distribuidos Examen Parcial
Sistemas Distribuidos Examen ParcialSistemas Distribuidos Examen Parcial
Sistemas Distribuidos Examen Parcial
 
Php07 consultas bd
Php07 consultas bdPhp07 consultas bd
Php07 consultas bd
 
Php06 instalacion my_sql
Php06 instalacion my_sqlPhp06 instalacion my_sql
Php06 instalacion my_sql
 
Php05 funciones usuario
Php05 funciones usuarioPhp05 funciones usuario
Php05 funciones usuario
 
Php04 estructuras control
Php04 estructuras controlPhp04 estructuras control
Php04 estructuras control
 

5 t218162dw t_mineriadatos

  • 1. DATAWAREHOUSE Datawarehouse Minería de Datos Fundamentos CARRERA DE INGENIERÍA DE SISTEMAS
  • 2. DATAWAREHOUSE Agenda ● Introducción. ● Data Mining. ● Fases de un Proyecto Data Mining. ● Arquitectura de un Data Mining. ● Funcionamiento del Data Mining. ● Tipos de problemas. ● Técnicas de Minería de Datos. ● Almacenes de datos. ● Ventajas de Almacenes de Datos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 3. DATAWAREHOUSE Introducción ● El desarrollo de varias tecnologías enfocadas a aprovechar los datos que se encuentran escondidos en estos grandes volúmenes de información. CARRERA DE INGENIERÍA DE SISTEMAS
  • 4. DATAWAREHOUSE Introducción ● Las BDR, DW, Data Mart (DM), OLAP y OLTP obtienen conclusiones en base a consultas deductivas, en tiempos cortos y enormes volúmenes de información, imposibles en un proceso manual. CARRERA DE INGENIERÍA DE SISTEMAS
  • 5. DATAWAREHOUSE Introducción ● Debido al gran volumen de datos el análisis de los datos ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automático. CARRERA DE INGENIERÍA DE SISTEMAS
  • 6. DATAWAREHOUSE Introducción ● Se define el data mining partiendo de la distinción entre datos, información y conocimiento. CARRERA DE INGENIERÍA DE SISTEMAS
  • 7. DATAWAREHOUSE Introducción ● La minería de datos se diferencia en que no solo transforma y facilita el acceso a la información para que el usuario la analice más fácilmente. ● La minería de datos analiza los datos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 8. DATAWAREHOUSE Data Mining ● La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: – Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. – Extraer patrones y tendencias para predecir comportamientos futuros. CARRERA DE INGENIERÍA DE SISTEMAS
  • 9. DATAWAREHOUSE Data Mining ● Los patrones válidos son un conjunto de datos, deben ser útiles para el proceso de prospección de datos y comprensibles para el usuario (KDD). CARRERA DE INGENIERÍA DE SISTEMAS
  • 10. DATAWAREHOUSE Data Mining ● La prospección de datos ( data mining ) se inscribe en un proceso más amplio como es el del descubrimiento de conocimiento dentro de grandes bases de datos (KDD o knowledge discovery in databases ). CARRERA DE INGENIERÍA DE SISTEMAS
  • 11. DATAWAREHOUSE Data Mining ● La minería de datos es sólo una etapa del proceso de extracción de conocimiento a partir de datos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 12. DATAWAREHOUSE Data Mining ● Este proceso consta de varias fases: – Preparación de Datos (selección, limpieza, y transformación), Minería de Datos, Evaluación, Difusión y Uso de Modelos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 13. DATAWAREHOUSE Fases de un proyecto de Data Mining ● Los pasos a seguir son: – Filtrado de datos: ● El formato de las fuentes de datos no es el idóneo. No es posible aplicar minería de datos en datos en bruto. Actividad de Preprocesamietno – Selección de Variables: ● La selección de características reduce el tamaño de los datos eligiendo las variables mas influyentes en el modelo de conocimiento. CARRERA DE INGENIERÍA DE SISTEMAS
  • 14. DATAWAREHOUSE Fases de un proyecto de Data Mining ● Los pasos a seguir son: – Extracción del conocimiento: ● Mediante técnicas se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados. – Interpretación y evaluación: ● Se valida el resultado, comprobando las conclusiones sean satisfactorias. Comprobar los modelos obtenidos. Modificar los pasos para los modelos si ninguno es satisfactorio. CARRERA DE INGENIERÍA DE SISTEMAS
  • 15. DATAWAREHOUSE Arquitectura de Minería de Datos CARRERA DE INGENIERÍA DE SISTEMAS
  • 16. DATAWAREHOUSE Funcionamiento del Data Mining ● El data mining trabaja en un nivel superior buscando: – patrones de conducta, – agrupaciones, – secuencias, – tendencias o – asociaciones de datos ● que puedan generar algún modelo que permita entender mejor el dominio con el objetivo de facilitar la toma de decisiones. CARRERA DE INGENIERÍA DE SISTEMAS
  • 17. DATAWAREHOUSE Funcionamiento del Data Mining ● El data mining es reunir las ventajas de varias áreas como: ● principalmente usando como materia prima las bases de datos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 18. DATAWAREHOUSE Tipos de problemas ● Existe una variada tipología de problemas: – Clasificación, – Categorización, – Estimación / regresión, – Agrupamiento, – Etc. CARRERA DE INGENIERÍA DE SISTEMAS
  • 19. DATAWAREHOUSE Técnicas de Minería de Datos ● Entre las técnicas tenemos: – Arboles de decisión. – Regresión lineal. – Redes neuronales artificiales. – Técnicas bayesianas. – Maquina de soporte vectorial. – Reglas de asociación. – Reglas de clasificación. CARRERA DE INGENIERÍA DE SISTEMAS
  • 20. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelo de agregación ( clustering ), si nos proponemos encontrar similitudes y agrupar modelos semejantes . Un ejemplo sería localizar grupos de datos similares. CARRERA DE INGENIERÍA DE SISTEMAS
  • 21. DATAWAREHOUSE Técnicas de Minería de Datos ● Árboles de decisión, tanto si nuestro objetivo es clasificar objetos como si nos interesa obtener conocimiento para poder hacer predicciones. CARRERA DE INGENIERÍA DE SISTEMAS
  • 22. DATAWAREHOUSE Técnicas de Minería de Datos ● Redes neuronales y las reglas de clasificación, si nuestro objetivo es clasificar objetos, estudiar las diferencias entre grupos, sus características particulares. CARRERA DE INGENIERÍA DE SISTEMAS
  • 23. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelos predictivos clásicos de la estadística, en el caso de que nuestro interés sea obtener conocimiento a partir de los datos que nos permita predecir acciones, comportamientos, etc. CARRERA DE INGENIERÍA DE SISTEMAS
  • 24. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelos descriptivos como, las redes bayesianas y, en menor grado, las reglas de asociación, si nos proponemos encontrar y expresar asociaciones significativas o causales entre diversas variables, hacer descripciones. CARRERA DE INGENIERÍA DE SISTEMAS
  • 25. DATAWAREHOUSE Almacenes de datos ● ¿Es necesario tener almacenes de datos para realizar minería de datos? – Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos. ● Se puede hacer minería de datos sobre un simple fichero de datos. CARRERA DE INGENIERÍA DE SISTEMAS
  • 26. DATAWAREHOUSE Ventajas de Almacenes de datos ● Las ventajas de almacén de datos se amortizan sobradamente a medio y largo plazo cuando: – tenemos grandes volúmenes de datos, o – éstos aumentan con el tiempo, o – provienen de fuentes heterogéneas o – se van a combinar de maneras arbitrarias y no predefinidas. CARRERA DE INGENIERÍA DE SISTEMAS
  • 27. DATAWAREHOUSE Otras Minerías de Datos ● Existen otros …minings, como: – TextMining – WebMining. CARRERA DE INGENIERÍA DE SISTEMAS