2. Universidad de Oriente
Núcleo de Anzoátegui
Postgrado de Informática Gerencial
DATAWAREHOUSE Y DATA MINING
Realizado Por:
Alexis Ramos
Edgar Millán
Manuel Martínez
3. DATAWAREHOUSE Y MINERIA DE DATOS
Agenda
1. Introduccion
2. Datos, Informacion y Conocimiento
3. Negocios Inteligentes o Business Intelligent
4. Datawarehouse – Datamart
5. Datamining o Mineria de Datos
6. Conclusion
5. DATAWAREHOUSE Y MINERIA DE DATOS
DATOS, INFORMACIÓN Y CONOCIMIENTO
CONTEXTUALIZAN
COMPARA
CATEGORIZAN
PREDICE
CALCULAN
BUSQUEDA
CORRIGEN
COMPARTE
CONDENZAN
6. DATAWAREHOUSE Y MINERIA DE DATOS
DATOS, INFORMACIÓN Y CONOCIMIENTO
DATOS INFORMACION CONOCIMIENTO
23.42
3.55
100.000
7. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Optimización
Proceso de
Toma de
Decisiones
Factor Estratégico
Respuesta a
Problemas de
Negocios
Ventaja Competitiva
8. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Una Solución BI completa permite:
Observar - ¿Qué está Ocurriendo?
Comprender - ¿Por qué Ocurre?
Predecir - ¿Qué Ocurriría
Colaborar - ¿Qué Debería Hacer el Equipo?
Decidir - ¿Qué Camino se Debe Seguir?
9. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Importancia del Business Intelligent en la Toma de Decisiones
Sistemas de Planificación de Poseen estructuras muy
Recursos Empresariales inflexibles para servir de
Tradiciones (ERPs ) apoyo en toma de
decisiones de negocios
Limitaciones
Gran rigidez a la hora de extraer datos
Largos tiempos de respuesta
Datos erróneos, obsoletos o incompletos
Solución
Problemas para adecuar la información al BI
cargo del usuario
Ausencia de información histórica
10. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Sistemas de Soporte a la Decisión (DSS)
Sistemas de Información Ejecutiva (EIS)
Cuadros de Mando Integrales (CMI)
Datawarehouse
Datamart
11. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Sistemas de Soporte a la Decisión (DSS)
Herramienta de BI
enfocada al análisis
de los datos de una
organización.
Back
12. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Sistemas de Información Ejecutiva (EIS)
Herramienta basada en un
DSS, que provee a los
gerentes de un acceso
sencillo a información
interna y externa de su
compañía
Back
13. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Sistemas de Soporte a la Decisión (DSS)
El Cuadro de Mando Integral (CMI), también conocido como
Balanced Scorecard (BSC) o dashboard, es una herramienta de
control empresarial que permite establecer y monitorizar los
objetivos de una empresa y de sus diferentes áreas o unidades.
14. DATAWAREHOUSE Y MINERIA DE DATOS
NEGOCIOS INTELIGENTES (BUSINESS INTELLIGENT)
Ejemplo: Anuncio de Ariel (TV)
Aparece un niño que se mancha de helado, diciendo:
"Ariel te limpia todo. Todo menos la cartera, ya que
Ariel básico es un 20% más barato“.
Desde el punto de vista del BI
Palabra Clave = “Básico”
Ariel, gracias al análisis de datos, se dió cuenta de que el mayor porcentaje de
ventas lo sigue teniendo en su producto básico, y no en los típicos "con jabón
de marsella", "detergente del futuro", .. y cosas similares fruto de las modas
15. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
Concepto General
Primer Paso, desde el Consulta y Tratamiento
Información
punto de vista técnico, de Jerarquizado de la
Homogenea y Fiable
un Business Intelligent Información
16. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
DATAWAREHOUSE VS. DATAWAREHOUSING
Repositorio central de datos
(integra datos desde el
DATAWAREHOUSE punto de vista de usuario y
no de procesos)
Proceso Global para crear y
mantener un
Datawarehouse
DATAWAREHOUSING
17. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
CARACTERISTICAS
Estructura Consistente – Información Estructurada
en Distintos Niveles de Detalle
Datos Organizados por Tema para Facilitar Acceso y
Entendimiento por Usuario Finales
Almacenamiento de Distintos Valores que Toma una
Variable en el Tiempo – Análisis de Tendencias .
Información de tipo Permanente – Incorporación
de Actualizaciones de Valores sin Modificar la Data
Existente
18. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
METADATOS (Datos sobre Datos)
Permiten saber la procedencia, periodicidad
y fiabilidad de la información
19. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
ETL (EXTRACCION, TRANSFORMACION Y CARGA)
PROCESO DE CONSTRUCCION
• Extracción: obtención de
información de las distintas
fuentes tanto internas como
externas.
• Transformación: filtrado,
limpieza, depuración,
homogeneización y
agrupación de la información.
• Carga: organización y
actualización de los datos y
los metadatos en la base de
datos.
20. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
APORTES
Proporciona una herramienta para la toma de decisiones en cualquier área funcional,
basándose en información integrada y global del negocio.
Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar
relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio
de dicha información.
Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones
futuras en diversos escenarios.
Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la
relación con el cliente.
Supone una optimización tecnológica y económica en entornos de Centro de Información,
estadística o de generación de informes con retornos de la inversión espectaculares.
21. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
DATAMART En síntesis,
Se puede decir que los Datamarts
son pequeños Datawarehouse
centrados en un tema o un área
de negocio específico dentro de
una organización.
Sistema Orientado a la Consulta
de Información
Clases de Datamart
1.Dependientes
2.Independientes
22. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
RAZONES PARA CREAR UN DATAMART
Fácil acceso a los datos que se necesitan frecuentemente.
Crea vista colectiva para grupo de usuarios.
Mejora el tiempo de respuesta del usuario final.
Facilidad de creación.
Costo inferior al de la aplicación de un completo almacén de datos.
Los usuarios potenciales son más claramente identificables que en
un almacén de datos completo...
23. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
EJEMPLO: Compañía: Auto UNO, S.A.
Situación actual
• 28 Concesionarios a nivel Nacional.
• Venta de vehiculos Nuevos y Usados.
• Vehículos Comercializados: Autos, Camionetas y Camiones
• Todos los concesionarios utilizan un sistema de facturación Online
24. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
EJEMPLO: Compañía: Auto UNO, S.A.
Necesidades del Negocio
Usuarios y Capacitación
• Aprovechar al máximo el incremento de la
demanda del mercado (Aumento de
operaciones de compra/venta de vehículos). • Gerente de Ventas.
• Jefes de Sucursal (Cada Sucursal).
• Implementación de planes de premios para los • Capacitación vía internet (40 horas).
vendedores que cumplan los objetivos de
ventas.
• Conocer distribución de ventas entre
concesionarios .
• Conocer la diferencia entre cantidad de
presupuestos y ventas realizadas.
25. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
EJEMPLO: Compañía: Auto UNO, S.A.
Información requerida
Se ha solicitado contar con la posibilidad de generar una serie de reportes que
permitan analizar el comportamiento de las ventas a nivel nacional.
La información requerida comprende:
- Cantidad de presupuestos realizados por año, concesionario, marca, segmento.
- Cantidad de unidades vendidas por provincia, concesionario, marca, modelo.
- Cantidad de unidades vendidas por provincia, localidad, tipo de vehículo.
- Importe total facturado por año, concesionario.
- Importe total facturado por año, concesionario.
26. DATAWAREHOUSE Y MINERIA DE DATOS
DATAWAREHOUSE (ALMACEN DE DATOS)
EJEMPLO: Compañía: Auto UNO, S.A. Arquitectura
27. DATAWAREHOUSE Y MINERIA DE DATOS
¿QUE ES LA MINERIA DE DATOS?
Según Fayyad y Coautores, "La minería de datos es un
proceso no trivial de identificación válida, novedosa,
potencialmente útil y entendible de patrones
comprensibles que se encuentran ocultos en los
datos" (Fayyad y otros, 1996)
“Según Molina y Colaboradores: “Es la integración de un
conjunto de áreas que tienen como propósito la identificación de
un conocimiento obtenido a partir de las bases de datos que
aporten un sesgo hacia la toma de decisión" (Molina y otros,
2001)
Extracción de patrones de información (implícitos, no triviales,
desconocidos y potencialmente útiles) a partir de grandes
cantidades datos.
28. DATAWAREHOUSE Y MINERIA DE DATOS
PROCESO DE LA MINERIA DE DATOS
Selección del Análisis de las Transformación
conjunto de propiedades de los del conjunto de
datos datos datos de entrada
Seleccionar y
Interpretación y
Extracción de aplicar la técnica
evaluación de
conocimiento de minería de
datos
datos
29. DATAWAREHOUSE Y MINERIA DE DATOS
PROTOCOLO DE UN PROYECTO DE MINERIA DE DATOS
Comprensión del
Determinación, Creación de
negocio y del
obtención y limpieza modelos
problema que se
de los datos necesarios matemáticos
quiere resolver
Integración, si procede, de Validación,
los resultados en un comunicación, etc. de
sistema transaccional o los resultados
similar obtenidos
30. DATAWAREHOUSE Y MINERIA DE DATOS
APLICACIONES MINERIA DE DATOS
MARKETING
ANALISIS DE GASES
FRAUDE
INGENIERIA
ELECTRICA NEGOCIOS
INGENIERIA RECURSOS
Y CIENCIA HUMANOS
APLICACIONES
GENETICA PATRONES DE FUGA
TERRORISMO INTERNET