SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
UNIVERSIDAD CENTRAL DE VENEZUELA
           FACULTAD DE CIENCIAS
         ESCUELA DE COMPUTACION


´




       Sistemas de Información



        Tema 6: Inteligencia de Negocio.
          Modelado Multidimensional



                                                1
                             Prof. Wilfredo Rangel
Agenda


 Introducción
 Origen y Definición
 Soluciones Analíticas
 ¿Qué es OLAP?
 Características de las Soluciones analíticas
 Modelaje Multidimensional
 ETL
 Metodología de desarrollo de soluciones analíticas




                                                                     2
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Objetivos de Aprendizaje



   Al finalizar este capitulo, usted estará en capacidad de:

   • Los conceptos básicos de OLAP

   • Entender los aspectos relacionados al desarrollo de
        soluciones               analíticas             basadas      en   OLAP   (Online
        Analitycal Processing)

   • La arquitectura y módulos de las soluciones analíticas

   • emplear metodologías de desarrollo de estándares de
        la industria de BI
                                                                                       3
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Introducción
                                     Origen y definición
                                     ¿Qué es OLAP?
                                     Características de las Soluciones
                                    Analíticas
                                     Modelaje     Multidimensional   –
                                    Esquema Estrella




                                                                     4
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Modelaje Dimensional


 Mejores practicas para el diseño de base de datos para
 OLAP
       Kimball, Ralph; et al. (1998). The Data Warehouse Lifecycle Toolkit.


 Técnica de modelaje NO implementación de base de datos
       Tablas de base de datos estándares


 Optimizada para agregaciones masivas y dinámicas

 Importante en MOLAP; Realmente Importante en ROLAP

                                                                          5
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Tercera Forma Normal


 En la mayoría de los cursos de BDD:
       Base de datos relacionales
       3NF = IDEAL
       Claves, Uniones, Roles, Flexibilidad
 OLTP        (OnLine                  Transaction
 Processing)
       BDdatos para soporte de aplicaciónes
       MODELO IDEAL PARA:
          Muchos      usuarios,  pequeños
          pedazos de data
          Ej: Debito # 1002 $40.00 retirada
          en el cajero (ATM) # 33354
       MODELO MALO PARA:
          Pocos Usuarios y grandes
          pedazos de data
          Sumas, agregación y cálculos


© 2010, Universidad Central de Venezuela. Sistemas de Información.
Esquema Estrella – (MODELO)

                                                                     Tabla Fact (Hechos)

                                                                        Una tabla fact contiene elementos que
                                                                     se quieren medir. Las Transacciones:
                                                                             Ingreso (Bs. $)
                                                                             Cantidad Vendida (unidades)
                                                                             Precio Promedio
                                                                        Las Medidas son los valores que se
                    FACT                                             tratan de reportar: El “Qué”


                                                                     Tabla Dimensión

                                                                       Las Dimensiones son las formas como
                                                                     se quieren ver las medidas. Por ejemplo:
                                                                             Por cliente
                                                                             Por fecha
                                                                             Por producto
                                                                       Las dimensiones dan contexto, significado
                                                                     a la información en los reportes
                                                                     (agrupaciones, etiquetas, filtros, etc.). El
                                                                     “Por”                                      7
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Esquema estrella – QUÉ y POR (REPORTE)




                                                                     8
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Esquema Estrella – QUÉ y POR (LENGUAJE)


 Usa un “lenguaje” durante el análisis para encontrar medidas y dimensiones

 QUE = HECHO (medidas)

 QUIEN = DIMENSIONES

 Ejemplos:

       Quisiera saber cuales son las proporciones de Ventas por mis tipos de
       producto y tipos de cliente.

       Cual es la proporción de ganancia que proviene de clientes actuales vs
       clientes nuevos.

       Cual es el perfil de los clientes (perfil = Localidad, Ingreso, y Genero) que
       hace el 80% de mi ganancia actual opuesto al 80% de mis ingresos.


                                                                                   9
© 2010, Universidad Central de Venezuela. Sistemas de Información.
3NF vs Esquema Estrella

¿ Como es el query para obtener las ventas por año, mes y departamento?
¿ Cuantos Joins son necesarios para obtener la data que quiero?
¿ Estos querys sobrecargan el sistema transaccional? ¿Qué tal OLAP?




                                                                          10
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Hechos y Dimensiones


 Consideremos un ejemplo de una operación de ventas, en
 la cual el tiempo, producto, región, tienda y cliente son las
 dimensiones de la base de datos, y se busca medir la
 transacción de venta en la tabla fact.




                                                                     11
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Tabla Dimensión


 Jerarquías y niveles
       Las jerarquías pueden existir en una dimensión en la cual sirven como
       navegaciones predefinidas
       Una jerarquía esta compuesta de uno o más niveles
       Una dimensión puede tener una o más jerarquías

 Propiedades
       Cada nivel de dimensión tiene un atributo primario que provee un
       “identificador único de usuario” para ese nivel
       Atributos y propiedades adicionales pueden existir para cada nivel que
       provee un valor descriptivo




                                                                           12
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Jerarquías y niveles – Notación lógica


                                                     TABLA “tiempo_dim”
Dimensión Tiempo                                      ( CAL_AÑO / integer
                                                      CAL_TRIM / integer
     Jerarquía del calendario                         CAL_MES / integer
       Año                                            FIS_AÑO / integer
           Trimestre                                  FIS_TRIM / integer
               Mes
                                                      FIS_MES / integer )

     Jerarquía Fiscal
                                                     Es una Tabla plana
      Año Fiscal
           Trimestre Fiscal
                                                        Las Columnas son estandares
               Mes Fiscal                               El significado y metodos de
                                                        agregación (drill up/down, etc) se
                                                        implementan en el servidor OLAP

                                                                                        13
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Dimensiones Conformadas (Compartidas)



•   Son aquellas que son compartidas entre esquemas estrella
•   Permite el diseño escalable de bases de datos analíticas
•   Permite el análisis y agregación por área entre distintos sujetos


                                            Geografía dim
                                                                         Empleado dim
     Cliente dim
                                            Ventas Fact

         Producto dim
                                                                           Fecha dim



    Almacén dim                          Inventarios Fact

                                                                                        14
    © 2010, Universidad Central de Venezuela. Sistemas de Información.
Dimensiones Degeneradas y Combinadas


  Una dimensión degenerada es representada con un solo
  atributo.
  Al menos que el tipo de dato sea grande, estas
  dimensiones son almacenadas como una columna en la
  tabla hecho
Estrategia:
  Si hay más de una dimensión degenerada
        tienen algún grado de relación
        sus cardinalidades son relativamente pequeñas, de forma tal que un producto
        cartesiano no produce muchas filas

  Entonces, se puede crear una dimensión combinada
        Una columna por atributo/dimensión
        Una fila por cada combinación

                                                                                 15
 © 2010, Universidad Central de Venezuela. Sistemas de Información.
Dimensiones Combinadas


 También llamadas dimensiones basura
 Antes de tener muchas columnas de 0 y 1 en la tabla de hechos
      Crea una dimensión que sea el producto cartesiano de dos dimensiones
      degeneradas
      Las búsquedas deben hacerse por los atributos
Dimensiones Degeneradas                                 Dimensión Combinada
  Sexo                                                       Dimensión ID / Sexo / Tipo de Orden
     M/F/I                                                        1     /M      / Nuevo
                                      Todas las                   2     /M      / Retornado
   Tipo de Orden                    combinaciones                 3     /F      / Nuevo
      Nuevo / Retornado                                           4     /F      / Retornado
                                                                  5     /I      / Nuevo
                                                                  6     /I      / Retornado
                                                                                              16
 © 2010, Universidad Central de Venezuela. Sistemas de Información.
Dimensiones que cambian lentamente (SCD)


 Dimensión “Tipo 1”:
       Nueva información sobrescribe la información vieja.
       La información vieja es perdida, no se guarda.
       Solo se puede usar en aplicaciones en las cuales mantener un histórico de la data no
       es esencial; solo se usa para actualizaciones.
 Dimensión “Tipo 2”:
       La información nueva es adjuntada a la información vieja.
       La información vieja se guarda y es versionada.
       Se puede usar en aplicaciones en las cuales mantener un histórico de los datos es
       requerido de forma tal que cambios en el data warehouse pueden ser rastreados.
 Dimensión “Tipo 3”:
       La nueva información se guarda junto con la información vieja.
       La información vieja es guardada parcialmente.
       Se crean columnas adicionales para mostrar el momento a partir del cual la nueva
       información ha tomado efecto.
       Habilita una vista de hechos tanto en el estado actual como una vista tentativa del
       escenario utilizando valores dimensionales viejos.
                                                                                        17
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Hechos aditivos vs. semi-aditivos


 Los hechos aditivos se agregan a través de todas las dimensiones
       E.j. Ingreso por ventas
 Los hechos semi-aditivos agregan a través de dimensionalidad parcial,
 generalmente no agregan en la dimensión tiempo
       E.j. Artículos a mano

  Pregunta válida: ¿Cuántos ítems habían en el inventario el primero de julio?
  Pregunta Inválida: ¿Cuántos ítems habían en el inventario en Julio?

La segunda pregunta no tiene sentido. ¿El usuario quiere la cantidad promedio
por día para julio? ¿La cantidad al comienzo del mes? ¿Al final?
Los hechos semi-aditivos generalmente se miden en un punto del tiempo (como
una foto del estado en un momento determinado).
Los hechos aditivos generalmente se usan para marcar un evento transaccional.
                                                                                 18
© 2010, Universidad Central de Venezuela. Sistemas de Información.
Modelo SnowFlake


• Modelo estrella es el más puro
  acercamiento al modelado
  dimensional
   – Mejores practicas
   – Es el más utilizado




                                                                       Normalization
                                                                       Normalization
• El copo de nieve es un modelo
  más normalizado
   – Más espacio físico/ Problemas
     de performance




                                                                                       19
  © 2010, Universidad Central de Venezuela. Sistemas de Información.
Esquema Estrella vs. Copa de Nieve

                                                                    Snowflake
    Star




•   Todos los niveles dimensionales están                         Niveles dimensionales son
    contenidos en una sola tabla                                  normalizados a tablas separadas
•   Introduce redundancia en los datos
                                                                  Elimina redundancia en los datos
•   Indexación y consultas simplificadas
•   Generalmente el método preferido                              Reutilización simplificada de
                                                                  dimensiones de alto nivel en agregados


                                                                                                     20
    © 2010, Universidad Central de Venezuela. Sistemas de Información.
Ejemplo de Esquema Copa de Nieve



  Mfr                         Mfrid    Marca Prodid
Nombre         Mfrid                                  Día     Prodid      Unid.   Bs   Pago   Clientid

         Mfr
                                      Producto



   Mfr es un diseño en copa                                                 Ventas
   de nieve



               Año     Trim      Mes     Día                                                  Estado     Ciudad    Clientid




                       Tiempo
                                                                                                         Cliente


                                                                                                                        21
     © 2010, Universidad Central de Venezuela. Sistemas de Información.
Conclusiones                                             Conclusiones




•   Hemos realizado un estudio de …..
•   Hemos hecho una discusión sobre….
•   Se han desarrollado demostraciones de




                                                                                    22
© 2010, Universidad Central de Venezuela. Sistemas de Información.

Más contenido relacionado

Destacado

Activism x Technology
Activism x TechnologyActivism x Technology
Activism x TechnologyWebVisions
 
The Near Future of CSS
The Near Future of CSSThe Near Future of CSS
The Near Future of CSSRachel Andrew
 
How to Battle Bad Reviews
How to Battle Bad ReviewsHow to Battle Bad Reviews
How to Battle Bad ReviewsGlassdoor
 
Classroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsClassroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsShelly Sanchez Terrell
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaChris Lema
 
The Presentation Come-Back Kid
The Presentation Come-Back KidThe Presentation Come-Back Kid
The Presentation Come-Back KidEthos3
 

Destacado (6)

Activism x Technology
Activism x TechnologyActivism x Technology
Activism x Technology
 
The Near Future of CSS
The Near Future of CSSThe Near Future of CSS
The Near Future of CSS
 
How to Battle Bad Reviews
How to Battle Bad ReviewsHow to Battle Bad Reviews
How to Battle Bad Reviews
 
Classroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsClassroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and Adolescents
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris Lema
 
The Presentation Come-Back Kid
The Presentation Come-Back KidThe Presentation Come-Back Kid
The Presentation Come-Back Kid
 

Similar a Inteligencia de Negocios

Inteligencia de negocio - Soluciones Analíticas
Inteligencia de negocio - Soluciones AnalíticasInteligencia de negocio - Soluciones Analíticas
Inteligencia de negocio - Soluciones AnalíticasWilfredo Rangel
 
Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3CarlosTenelema1
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosSebastian Rodriguez Robotham
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Climanfef
 
Lenguaje de programacion orientado a eventos
Lenguaje de programacion orientado a eventosLenguaje de programacion orientado a eventos
Lenguaje de programacion orientado a eventosJairo Velasquez Rivera
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.docaldair441257
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acLuis Jherry
 
Análisis y diseño de sistemas sesion 12 - diagrama de secuencia
Análisis y diseño de sistemas   sesion 12 - diagrama de secuenciaAnálisis y diseño de sistemas   sesion 12 - diagrama de secuencia
Análisis y diseño de sistemas sesion 12 - diagrama de secuenciaGianfrancoEduardoBra
 
Cuadro comparativo jesus
Cuadro comparativo jesusCuadro comparativo jesus
Cuadro comparativo jesusjesulopez
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorJomicast
 

Similar a Inteligencia de Negocios (20)

Inteligencia de negocio - Soluciones Analíticas
Inteligencia de negocio - Soluciones AnalíticasInteligencia de negocio - Soluciones Analíticas
Inteligencia de negocio - Soluciones Analíticas
 
Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de Negocios
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
01 introduccion (1)my sql
01 introduccion (1)my sql01 introduccion (1)my sql
01 introduccion (1)my sql
 
Tarea 3 Ayudantía
Tarea 3 AyudantíaTarea 3 Ayudantía
Tarea 3 Ayudantía
 
Lenguaje de programacion orientado a eventos
Lenguaje de programacion orientado a eventosLenguaje de programacion orientado a eventos
Lenguaje de programacion orientado a eventos
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
 
Bases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y GeneralidadesBases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y Generalidades
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd ac
 
Modulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptxModulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptx
 
Análisis y diseño de sistemas sesion 12 - diagrama de secuencia
Análisis y diseño de sistemas   sesion 12 - diagrama de secuenciaAnálisis y diseño de sistemas   sesion 12 - diagrama de secuencia
Análisis y diseño de sistemas sesion 12 - diagrama de secuencia
 
Cuadro comparativo jesus
Cuadro comparativo jesusCuadro comparativo jesus
Cuadro comparativo jesus
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidor
 
aplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operacionesaplicacion_de_la_investigacion_de_operaciones
aplicacion_de_la_investigacion_de_operaciones
 

Inteligencia de Negocios

  • 1. UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ESCUELA DE COMPUTACION ´ Sistemas de Información Tema 6: Inteligencia de Negocio. Modelado Multidimensional 1 Prof. Wilfredo Rangel
  • 2. Agenda Introducción Origen y Definición Soluciones Analíticas ¿Qué es OLAP? Características de las Soluciones analíticas Modelaje Multidimensional ETL Metodología de desarrollo de soluciones analíticas 2 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 3. Objetivos de Aprendizaje Al finalizar este capitulo, usted estará en capacidad de: • Los conceptos básicos de OLAP • Entender los aspectos relacionados al desarrollo de soluciones analíticas basadas en OLAP (Online Analitycal Processing) • La arquitectura y módulos de las soluciones analíticas • emplear metodologías de desarrollo de estándares de la industria de BI 3 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 4. Introducción Origen y definición ¿Qué es OLAP? Características de las Soluciones Analíticas Modelaje Multidimensional – Esquema Estrella 4 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 5. Modelaje Dimensional Mejores practicas para el diseño de base de datos para OLAP Kimball, Ralph; et al. (1998). The Data Warehouse Lifecycle Toolkit. Técnica de modelaje NO implementación de base de datos Tablas de base de datos estándares Optimizada para agregaciones masivas y dinámicas Importante en MOLAP; Realmente Importante en ROLAP 5 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 6. Tercera Forma Normal En la mayoría de los cursos de BDD: Base de datos relacionales 3NF = IDEAL Claves, Uniones, Roles, Flexibilidad OLTP (OnLine Transaction Processing) BDdatos para soporte de aplicaciónes MODELO IDEAL PARA: Muchos usuarios, pequeños pedazos de data Ej: Debito # 1002 $40.00 retirada en el cajero (ATM) # 33354 MODELO MALO PARA: Pocos Usuarios y grandes pedazos de data Sumas, agregación y cálculos © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 7. Esquema Estrella – (MODELO) Tabla Fact (Hechos) Una tabla fact contiene elementos que se quieren medir. Las Transacciones: Ingreso (Bs. $) Cantidad Vendida (unidades) Precio Promedio Las Medidas son los valores que se FACT tratan de reportar: El “Qué” Tabla Dimensión Las Dimensiones son las formas como se quieren ver las medidas. Por ejemplo: Por cliente Por fecha Por producto Las dimensiones dan contexto, significado a la información en los reportes (agrupaciones, etiquetas, filtros, etc.). El “Por” 7 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 8. Esquema estrella – QUÉ y POR (REPORTE) 8 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 9. Esquema Estrella – QUÉ y POR (LENGUAJE) Usa un “lenguaje” durante el análisis para encontrar medidas y dimensiones QUE = HECHO (medidas) QUIEN = DIMENSIONES Ejemplos: Quisiera saber cuales son las proporciones de Ventas por mis tipos de producto y tipos de cliente. Cual es la proporción de ganancia que proviene de clientes actuales vs clientes nuevos. Cual es el perfil de los clientes (perfil = Localidad, Ingreso, y Genero) que hace el 80% de mi ganancia actual opuesto al 80% de mis ingresos. 9 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 10. 3NF vs Esquema Estrella ¿ Como es el query para obtener las ventas por año, mes y departamento? ¿ Cuantos Joins son necesarios para obtener la data que quiero? ¿ Estos querys sobrecargan el sistema transaccional? ¿Qué tal OLAP? 10 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 11. Hechos y Dimensiones Consideremos un ejemplo de una operación de ventas, en la cual el tiempo, producto, región, tienda y cliente son las dimensiones de la base de datos, y se busca medir la transacción de venta en la tabla fact. 11 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 12. Tabla Dimensión Jerarquías y niveles Las jerarquías pueden existir en una dimensión en la cual sirven como navegaciones predefinidas Una jerarquía esta compuesta de uno o más niveles Una dimensión puede tener una o más jerarquías Propiedades Cada nivel de dimensión tiene un atributo primario que provee un “identificador único de usuario” para ese nivel Atributos y propiedades adicionales pueden existir para cada nivel que provee un valor descriptivo 12 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 13. Jerarquías y niveles – Notación lógica TABLA “tiempo_dim” Dimensión Tiempo ( CAL_AÑO / integer CAL_TRIM / integer Jerarquía del calendario CAL_MES / integer Año FIS_AÑO / integer Trimestre FIS_TRIM / integer Mes FIS_MES / integer ) Jerarquía Fiscal Es una Tabla plana Año Fiscal Trimestre Fiscal Las Columnas son estandares Mes Fiscal El significado y metodos de agregación (drill up/down, etc) se implementan en el servidor OLAP 13 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 14. Dimensiones Conformadas (Compartidas) • Son aquellas que son compartidas entre esquemas estrella • Permite el diseño escalable de bases de datos analíticas • Permite el análisis y agregación por área entre distintos sujetos Geografía dim Empleado dim Cliente dim Ventas Fact Producto dim Fecha dim Almacén dim Inventarios Fact 14 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 15. Dimensiones Degeneradas y Combinadas Una dimensión degenerada es representada con un solo atributo. Al menos que el tipo de dato sea grande, estas dimensiones son almacenadas como una columna en la tabla hecho Estrategia: Si hay más de una dimensión degenerada tienen algún grado de relación sus cardinalidades son relativamente pequeñas, de forma tal que un producto cartesiano no produce muchas filas Entonces, se puede crear una dimensión combinada Una columna por atributo/dimensión Una fila por cada combinación 15 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 16. Dimensiones Combinadas También llamadas dimensiones basura Antes de tener muchas columnas de 0 y 1 en la tabla de hechos Crea una dimensión que sea el producto cartesiano de dos dimensiones degeneradas Las búsquedas deben hacerse por los atributos Dimensiones Degeneradas Dimensión Combinada Sexo Dimensión ID / Sexo / Tipo de Orden M/F/I 1 /M / Nuevo Todas las 2 /M / Retornado Tipo de Orden combinaciones 3 /F / Nuevo Nuevo / Retornado 4 /F / Retornado 5 /I / Nuevo 6 /I / Retornado 16 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 17. Dimensiones que cambian lentamente (SCD) Dimensión “Tipo 1”: Nueva información sobrescribe la información vieja. La información vieja es perdida, no se guarda. Solo se puede usar en aplicaciones en las cuales mantener un histórico de la data no es esencial; solo se usa para actualizaciones. Dimensión “Tipo 2”: La información nueva es adjuntada a la información vieja. La información vieja se guarda y es versionada. Se puede usar en aplicaciones en las cuales mantener un histórico de los datos es requerido de forma tal que cambios en el data warehouse pueden ser rastreados. Dimensión “Tipo 3”: La nueva información se guarda junto con la información vieja. La información vieja es guardada parcialmente. Se crean columnas adicionales para mostrar el momento a partir del cual la nueva información ha tomado efecto. Habilita una vista de hechos tanto en el estado actual como una vista tentativa del escenario utilizando valores dimensionales viejos. 17 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 18. Hechos aditivos vs. semi-aditivos Los hechos aditivos se agregan a través de todas las dimensiones E.j. Ingreso por ventas Los hechos semi-aditivos agregan a través de dimensionalidad parcial, generalmente no agregan en la dimensión tiempo E.j. Artículos a mano Pregunta válida: ¿Cuántos ítems habían en el inventario el primero de julio? Pregunta Inválida: ¿Cuántos ítems habían en el inventario en Julio? La segunda pregunta no tiene sentido. ¿El usuario quiere la cantidad promedio por día para julio? ¿La cantidad al comienzo del mes? ¿Al final? Los hechos semi-aditivos generalmente se miden en un punto del tiempo (como una foto del estado en un momento determinado). Los hechos aditivos generalmente se usan para marcar un evento transaccional. 18 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 19. Modelo SnowFlake • Modelo estrella es el más puro acercamiento al modelado dimensional – Mejores practicas – Es el más utilizado Normalization Normalization • El copo de nieve es un modelo más normalizado – Más espacio físico/ Problemas de performance 19 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 20. Esquema Estrella vs. Copa de Nieve Snowflake Star • Todos los niveles dimensionales están Niveles dimensionales son contenidos en una sola tabla normalizados a tablas separadas • Introduce redundancia en los datos Elimina redundancia en los datos • Indexación y consultas simplificadas • Generalmente el método preferido Reutilización simplificada de dimensiones de alto nivel en agregados 20 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 21. Ejemplo de Esquema Copa de Nieve Mfr Mfrid Marca Prodid Nombre Mfrid Día Prodid Unid. Bs Pago Clientid Mfr Producto Mfr es un diseño en copa Ventas de nieve Año Trim Mes Día Estado Ciudad Clientid Tiempo Cliente 21 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  • 22. Conclusiones Conclusiones • Hemos realizado un estudio de ….. • Hemos hecho una discusión sobre…. • Se han desarrollado demostraciones de 22 © 2010, Universidad Central de Venezuela. Sistemas de Información.