El documento presenta información sobre varios conceptos clave relacionados con la gestión de bases de datos y sistemas de información empresariales. Brevemente describe los siguientes conceptos:
1. Business Intelligence y sus características principales como la accesibilidad a la información y el apoyo a la toma de decisiones.
2. Los sistemas ERP y sus funciones como la integración de procesos y automatización.
3. El proceso ETL que permite extraer, transformar y cargar datos entre sistemas para su uso posterior.
4
1. Universidad Austral de Chile
Facultad de Ciencias Económicas y Administrativas
Ingeniería Comercial
Tarea Ayudantía.
Investigación de Terminos.
Integrantes: Denisse Heuser E.
Yessica Gomez O.
Jaime Puchi R.
Sergio Yañez V.
Asignatura: Sistemas de Información
Empresarial
Ayudante: José Luis Carrasco V.
06 de junio de 2010
2. Contenido
Introducción.......................................................................................................................................3
1.- Business Inteligence:.....................................................................................................................4
2.- ERPs...............................................................................................................................................6
3.- ETL.................................................................................................................................................8
4.- Interfaz web................................................................................................................................10
5.- Interfase Cliente-Servidor...........................................................................................................11
6.- Modelo de datos entidad-relación..............................................................................................12
7.- Base de datos Modelo de Lenguaje Unificado............................................................................14
8.- Base de datos Orientados a Objetos...........................................................................................15
9.- Descripción de cada etapa del diseño de un Datawarehouse.....................................................17
10.- Modelo Star Schema.................................................................................................................18
11.- Modelo Snowflake Schema.......................................................................................................19
Conclusión........................................................................................................................................20
Bibliografía:......................................................................................................................................21
2
3. Introducción.
Para competir en un entorno tan cambiante las organizaciones de hoy
en día necesitan recolectar y almacenar datos con el fin de usar estos
datos para la buena toma de decisiones. Para trabajar de forma eficiente
se necesita realizar un buen análisis de inteligencia de negocios, para
esto existen muchas herramientas que ayudan a las organizaciones a
tener una mayor visibilidad del negocio y manejar los elementos claves
que conducen a alcanzar buenos resultados. Dentro de este trabajo se
darán a conocer las herramientas, modelos y procesos más relevantes
sobre la gestión de bases de datos. El conocimiento y la aplicación de
los conceptos analizados a continuación son de gran importancia para
las organizaciones actuales para mantener una ventaja competitiva y
tener un mejor desempeño.
3
4. 1.- Business Inteligence:
Business Intelligence es la habilidad para transformar los datos
en información, y la información en conocimiento, de forma que se
pueda optimizar el proceso de toma de decisiones en los negocios.
Desde un punto de vista más pragmático, y asociándolo directamente
con las tecnologías de la información, podemos definir Business
Intelligence como el conjunto de metodologías, aplicaciones y
tecnologías que permiten reunir, depurar y transformar datos de los
sistemas transaccionales e información desestructurada (interna y
externa a la compañía) en información estructurada, para su
explotación directa (reporting, análisis OLTP / OLAP, alertas...) o para
su análisis y conversión en conocimiento, dando así soporte a la toma
de decisiones sobre el negocio.
La inteligencia de negocio actúa como un factor estratégico para una
empresa u organización, generando una potencial ventaja competitiva,
que no es otra que proporcionar información privilegiada para
responder a los problemas de negocio: entrada a nuevos mercados,
promociones u ofertas de productos, eliminación de islas de
información, control financiero, optimización de costes, planificación de
la producción, análisis de perfiles de clientes, rentabilidad de un
producto concreto. (Sinnexus)
El monitoreo continuo de las señales del entorno es ejercido por
un conjunto de capacidades que la empresa debe poner en marcha, y
que entenderemos como inteligencia empresarial.
La inteligencia empresarial, designa, en nuestro entender, aquel
conjunto de capacidades propias o movilizables por una entidad
lucrativa, destinadas a asegurar el acceso, capturar, interpretar y
preparar conocimiento e información con alto valor agregado para
apoyar la toma de decisiones requeridas por el diseño y ejecución de
su estrategia competitiva. (Cubillo 1997)
En definitiva, una solución BI completa permite:
• Observar ¿qué está ocurriendo?
• Comprender ¿por qué ocurre?
• Predecir ¿qué ocurriría?
• Colaborar ¿qué debería hacer el equipo?
• Decidir ¿qué camino se debe seguir?
4
5. Características:
Este conjunto de herramientas y metodologías tienen en común
las siguientes características:
• Accesibilidad a la información. Los datos son la fuente principal de
este concepto. Lo primero que deben garantizar este tipo de
herramientas y técnicas será el acceso de los usuarios a los datos
con independencia de la procedencia de estos.
• Apoyo en la toma de decisiones. Se busca ir más allá en la
presentación de la información, de manera que los usuarios
tengan acceso a herramientas de análisis que les permitan
seleccionar y manipular sólo aquellos datos que les interesen.
• Orientación al usuario final. Se busca independencia entre los
conocimientos técnicos de los usuarios y su capacidad para utilizar
estas herramientas.
EJEMPLO:
Operador de telecomunicaciones
Este ejemplo hace referencia a uno de los mayores operadores de
telecomunicación del mundo, con más de 91 millones de clientes en 220
países de los cinco continentes. Esta organización cuenta con 190.000
empleados y ofrece una gama completa de servicios de
telecomunicaciones: telefonía local, internacional y móvil; internet y
multimedia; transporte de datos; y difusión de TV por cable.
En los últimos años, la empresa ha venido utilizando los sistemas
informáticos como un arma estratégica fundamental en la batalla entre
operadores de telecomunicaciones. El objetivo de una de sus principales
iniciativas ha sido reducir las inconsistencias en los datos y compartir la
información de manera más eficaz entre las diferentes áreas de negocio,
implementando en toda la organización estándares en el campo del
software de gestión.
5
6. 2.- ERPs.
Los sistemas de gestión empresarial (en inglés ERP, acrónimo de
Enterprise Resource Planning) son sistemas de gestión de información
que integran y automatizan muchas de las prácticas de negocio
asociadas con los aspectos operativos o productivos de una empresa,
eliminando complejas conexiones entre sistemas de distintos
proveedores.
Por lo general este tipo de sistemas esta compuesto de módulos
como Recursos Humanos, Ventas, Contabilidad y Finazas, Compras,
Producción entre otros, brindado información cruzada e integrada de
todos los procesos del negocio. Este software debe ser parametrizado y
adaptado para responder a las necesidades especificas de cada
organización. Una vez implementado un ERP permite a los empleados de
una empresa administrar los recursos de todas las áreas, simular
distintos escenarios y obtener información consolidada en tiempo real.
La implementación de esta herramienta en una empresa conlleva
un proceso de transformación y redefinición de sus procesos. Su ciclo de
vida consiste en varias etapas empezando por la fase en la que se
decide implementar un sistema ERP y no otro tipo de sistema. Le sigue
el proceso de decidir qué ERP se implementará y qué consultora llevará
adelante el proyecto. Una vez seleccionados comienza la fase de
implementación en la que se parametrizará el sistema; para esta fase la
consultora que lleva el proyecto propone una metodología de trabajo,
experiencia en implementaciones y capacitación. Luego le sigue la etapa
de uso y mantenimiento del sistema. Finalmente se retira el producto
cuando se considera que debe ser reemplazado por otra tecnología o
que el enfoque que le da a los procesos del negocio ya no son los
adecuados.
6
7. Funciones Principales de ERP:
• Organizar y estandarizar procesos o datos internos de la
empresa.
• Administrar de manera integrada y eficiente la información de la
empresa.
• Comunicar diferentes áreas de las empresas mediante procesos y
datos electrónicos.
• Procesar la información convirtiéndola en conocimientos para su
aplicación en la toma de decisiones.
• Automatizar una gran parte de los procesos básicos de las
empresas.
EJEMPLOS DE EMPRESAS INTERNACIONALES QUE USAN ERPs:
www.nestle.com
Cierta información está organizada de manera muy compleja lo
que hace poco práctico y difícil el acceso y la interpretación de dichos
datos. Dicho de otra manera, no es visible el manejo de ERP en la
organización aunque el sitio Web maneja bastante información.
www.diesel.com
DIESEL DREAMS es una forma de organizar parte de los datos
internos de la organización, indagando a los consumidores sobre sus
preferencias, se procesa la información para automatizar los procesos
básicos de DIESEL, como producción, ventas, mercadotecnia.
www.kfc.com
El manejo de ERP dentro de una empresa de mas de 60 años
como KFC es notable, actualmente presenta cambios tecnológicos en su
sitio web, para hacer los negocios más rápidos con empresas como
TACO BELL, PIZZA HUT, servicios online, sin necesidad de estar
presente.
Ejemplos de ERPs: SAP, Oracle, Softland, Informat, Manager.
7
8. 3.- ETL.
ETL son las siglas en inglés que representan Extract, Transform
and Load (Extraer, Transformar, Cargar). Este proceso permite a una
organización mover datos desde diferentes fuentes, transformarlos y
arreglarlos a medida, y guardarlos en otra base de datos o en otro
sistema para su posterior utilización por el negocio.
Los procesos ETL también se pueden utilizar para integrar
sistemas legacy a los nuevos sistemas emergentes en la organización.
La latencia de los procesos ETL varía desde los lotes (a veces, de
forma mensual o semanal, pero en la mayoría de los casos
diariamente), al tiempo casi real con actualizaciones más frecuentes
(cada hora, cada pocos minutos, etc.).
PROCESOS DEL ETL:
1.- Extraer:
La primera parte del proceso ETL consiste en extraer los datos
desde los sistemas de origen. Es común que se utilice un ETL para
fusionar datos provenientes de diferentes sistemas.
Cada sistema puede usar una configuración o formato distinto de
los datos (bases de datos relacionales / no relacionales, ficheros planos,
etc.) por lo que el proceso de extracción deberá convertir los datos a un
formato apto para iniciar el proceso de transformación.
En sistemas de grandes empresas la extracción de datos suele
programarse en horarios donde el sistema es menos utilizado por los
usuarios ya que si los datos a extraer son muchos, el sistema de origen
se podría ralentizar e incluso colapsar, provocando que éste no pueda
utilizarse con normalidad para su uso cotidiano.
2.- Transformar:
El proceso de transformación aplica reglas de negocio a los datos
extraídos para transformarlos en los datos que serán cargados.
Generalmente, en la transformación de los datos se seleccionan
sólo ciertas columnas para su carga, se traducen/agregan códigos, se
obtienen nuevos valores calculados, se unen datos de múltiples fuentes,
se divide una columna en varias, se validan los datos, etc.
3.- Carga:
El proceso de carga es el momento en el cual los datos del proceso
de transformación son cargados en el sistema de destino. La fase de
carga interactúa directamente con la base de datos de destino.
Existen dos formas básicas de desarrollar el proceso de carga:
8
9. 1. Acumulación simple: Se realiza un resumen de todas las
transacciones comprendidas en el período de tiempo seleccionado
y se transporta el resultado calculado como una única transacción
hacia la base de datos.
2. Rolling: Se aplica cuando se desean mantener varios niveles de
granularidad. Para ello se almacena información resumida a
distintos niveles, correspondientes a distintas agrupaciones de la
unidad de tiempo o diferentes niveles jerárquicos en alguna o
varias de las dimensiones de la magnitud almacenada (por
ejemplo, totales diarios, totales semanales, totales mensuales,
etc.).
Existen muchos motivos para implementar procesos ETL.
• Los volúmenes de datos en el sistema se incrementan de forma
exponencial, y se deben procesar y granular grandes cantidades
de datos (productos vendidos, llamadas telefónicas, transacciones
bancarias) para su posterior auditoria.
• Se fusionan empresas y se debe hacer un matching de los datos
de los distintos sistemas legacy para generar una única salida de
datos equivalentes.
• La inteligencia de negocio requiere que se almacenen las
estructuras de datos históricos en aplicaciones OLAP, para el
análisis, notificación y cuadros de mando operacional y táctico
(dashboarding) y estratégico (scorecarding).
Entre muchas otras posibilidades que día a día se presentan y
resultaría mucho más ágil y prolijo resolverlo con esta solución.
EJEMPLOS:
El proceso ETL organiza el flujo de los datos entre diferentes
sistemas en una organización y esta fase de importar y cargar datos se
suele realizar con una herramienta ETL (como por ejemplo Informatica
Powercenter, Datastage). También es posible y ocurre a menudo
programar el proceso ETL en el lenguaje dedicado a la base de datos
(PL/SQL por ejemplo).
9
10. 4.- Interfaz web.
La Real Academia Española define el término como una conexión
física y funcional entre dos aparatos o sistemas independientes. Dados
dos sistemas cualesquiera que se deben comunicar entre ellos la interfaz
será el mecanismo, entorno o herramienta que hace posible dicha
comunicación.
Con la aparición de la web se hizo posible que cualquier persona
pudiera ofrecer información particularizada a los demás y encontrar
documentos interactivos sobre cualquier tema, relacionados unos con
otros mediante enlaces que permitían saltar de página en página
alrededor del mundo.
Las páginas web supusieron la aparición de las interfaces web,
interfaces gráficas de usuario con unos elementos comunes de
presentación y navegación que pronto se convirtieron en estándares de
facto. Este tipo de interfaces deben servir de intermediarias entre unos
usuarios genéricos, no acostumbrados generalmente al uso de
aplicaciones informáticas, y unos sistemas de información y procesos
transaccionales que corren por debajo, debiendo posibilitar la
localización de la información deseada, el entendimiento claro de las
funcionalidades ofrecidas, la realización práctica de tareas específicas
por parte de los usuarios y la navegación intuitiva por las diferentes
páginas que forman el sitio web.
Buscando una homogeneidad entre los millones de páginas web
que existen actualmente en Internet, el diseño de las mismas ha
evolucionado con el tiempo hacia un esquema general perfectamente
definido, ofreciendo unas interfaces bien definidas, con un conjunto de
componentes gráficos y funcionales similares que hacen posible que sea
cual sea el usuario que accede a un sitio web cualquiera la comunicación
entre ellos sea posible y efectiva.
De esta forma se han definido elementos y agrupaciones de estos
que han demostrado su utilidad y su comprensión por los usuarios,
entre los que podemos destacar los sistemas de navegación, los
dinteles, los pies de página, los formularios de entrada de datos, etc.,
que normalmente encontraremos en todas las páginas web y cuyo
diseño y funcionalidad son similares en todas ellas.
Ejemplo:
10
11. 5.- Interfase Cliente-Servidor.
Hoy en día la Internet, es una herramienta que tiene múltiples
ventajas, dentro de las cuales esta la implementación de herramientas
derivadas de esta como es el e-business, e-commerce, entre otras.
Donde los clientes y servidores pasan a estar conectados dentro de la
red. Es aquí donde el Interfase Cliente-Servidor, como elemento de
conexión, facilita el intercambio de datos.
El cliente es quien requiere un servicio, el cual este, puede
convertirse en múltiples requerimientos de trabajo a través de redes
LAN o WAN. El servidor es cualquier plataforma dedicada a responder
los requerimientos de los clientes. Los servidores están conectados con
los clientes a través de redes LANs o WANs, para proveer de múltiples
servicios a los clientes.
Las funciones Cliente/Servidor pueden ser dinámicas. Ejemplo, un
servidor puede convertirse en cliente cuando realiza la solicitud de
servicios a otras plataformas dentro de la red.
A través del Interfase Cliente-Servidor, accede e integra
información, aporta capacidad de almacenamiento, procesos no tan
complejos (cultura de PC), bajos costos y una amplia oferta de
productos y aplicaciones. Esta incluye múltiples plataformas, base de
datos, redes y sistemas operativos. Estos pueden ser de distintos
proveedores, en sistemas informáticos de propietarios y no propietarios
y funcionando todos al mismo tiempo.
Ejemplo:
En la plataforma YouTube es el servidor, y aquellos usuarios que
acceden para observar videos son los clientes.
11
12. 6.- Modelo de datos entidad-relación.
Es el más utilizado para el diseño conceptual de bases de datos.
Está formado por un conjunto de conceptos (entidades, relaciones,
atributos, etc.) que permiten describir la realidad mediante un conjunto
de representaciones gráficas y lingüísticas.
Entidades:
Se refiere a cualquier objeto, real o abstracto, que existe en un
contexto determinado o puede llegar a existir y del cual deseamos
guardar información. Se pueden clasificar como regulares y débiles;
donde las regulares son aquellas que existen por sí mismas y que la
existencia de un ejemplar en la entidad no depende de la existencia de
otros ejemplares en otra entidad. Débiles aquellas entidades en las que
se hace necesaria la existencia de ejemplares de otras entidades
distintas para que puedan existir ejemplares en esta entidad.
Atributos:
Las entidades se componen de atributos que son cada una de las
propiedades o características que tienen las entidades. Cada ejemplar
de una misma entidad posee los mismos atributos, tanto en nombre
como en número, diferenciándose cada uno de los ejemplares por los
valores que toman dichos atributos.
Dominios:
Es un conjunto de valores que puede tomar un determinado
atributo dentro de una entidad, de igual forma es un concepto de
restricción para un atributo, ya que, cada atributo puede adoptar una
serie de valores de un dominio restringiendo determinados valores.
Claves:
Es un identificador, donde cada atributo o conjunto de atributos se
identifican de forma única a cada uno de los ejemplares de la entidad.
De tal forma que ningún par de ejemplares de la entidad puedan tener
el mismo valor en ese identificador. Estos identificadores reciben en
nombre de Identificador Principal (IP) o Clave Primaria (PK - Primary
Key). Se puede dar el caso de existir algún identificador más en la
entidad, a estos identificadores se les denomina Identificadores
Candidatos (IC) o Clave Foránea (FK - Foreign Key).
12
13. Interrelaciones y restricciones:
Interrelación es la asociación, vinculación o correspondencia entre
entidades.
Restricciones es un impedimento o limite entre una entidad y otra, que
pueden ser:
• Restricción de Exclusividad
• Restricción de Exclusión
• Restricción de Inclusividad
• Restricción de Inclusión
Ejemplo: A través de Microsoft Access, se puede realizar un modelo de
entidad-relación donde las entidades son: Alumno, Asignatura y
Matricula, con sus respectivos atributos, claves y relaciones.
13
14. 7.- Base de datos Modelo de Lenguaje Unificado.
Es un lenguaje estándar para escribir planos de software. UML
puede utilizarse para visualizar, especificar, construir y documentar los
artefactos de un sistema que involucra gran cantidad de software. Una
de las ventajas del UML es una forma de modelar cosas conceptuales
como lo son procesos de negocio y funciones de sistema, además de
cosas concretas como lo son escribir clases en un lenguaje determinado,
esquemas de base de datos y componentes de software reusables.
El UML emplea procesos unificados para dar soluciones adecuadas
a las necesidades de los clientes. El desarrollo de sistemas con UML, de
acuerdo a estos procesos unificados, incluyen actividades específicas, y
estas a su vez contienen otras subactividades las cuales sirven como
una guía de cómo deben ser las actividades desarrolladas y
secuenciadas con el fin de obtener sistemas exitosos;
consecuentemente el desarrollo de los sistemas puede variar de
desarrollador en desarrollador, de proyecto en proyecto, de empresa en
empresa adoptando siempre un Proceso de Desarrollo.
Los elementos de UML se muestran mediante diagramas que
presentan múltiples vistas del sistema, ese conjunto de vistas son
conocidos como modelos.
Los diagramas son donde cada uno representa un aspecto del
sistema. Los diagramas utilizados en el desarrollo de los sistemas de
información, van a depender de los criterios requeridos, para luego
proponer un diagrama en especifico, para finalmente brindarle una
solución. Por lo tanto, es fundamental organizarlos según las fases del
Proceso Unificado.
Ejemplos de uso de UML:
1. Definir un problema que afecta a una organización (análisis).
2. Plantear procesos de negocio (optimización de flujos de trabajo).
3. Construir un producto de software (concreción de una
abstracción).
4. Certificar la coherencia, completitud y usabilidad del producto
(calidad).
5. Evaluar los sistemas de información de una organización
(conocimiento).
14
15. 8.- Base de datos Orientados a Objetos.
El modelo de bases de datos orientado a objetos es una
adaptación a los sistemas de bases de datos. Se basa en el concepto de
encapsulamiento de datos y código que opera sobre estos en un objeto.
Los objetos estructurados se agrupan en clases. El conjunto de clases
esta estructurado en sub y superclases basado en una extensión del
concepto ISA (Industry Standard Architecture - Arquitectura Estándar
Industrial) del modelo Entidad - Relación. Puesto que el valor de un dato
en un objeto también es un objeto, es posible representar el contenido
del objeto dando como resultado un objeto compuesto.
El propósito es la gestión de grandes cantidades de información.
Las primeras bases de datos surgieron del desarrollo de los sistemas de
gestión de archivos. Estos sistemas primero evolucionaron en bases de
datos de red o en bases de datos jerárquicas y, más tarde, en bases de
datos relacionales.
Estructura de objetos.
El modelo orientado a objetos se basa en encapsular códigos y
datos en una única unidad, llamada objeto. El interfaz entre un objeto y
el resto del sistema se define mediante un conjunto de mensajes.
Un objeto tiene asociado:
• Una variable que contiene los datos del objeto. El valor de cada
variable es un objeto.
• Un conjunto de mensajes a los que el objeto responde.
• Un método, que es un trozo de código para implementar cada
mensaje. Un método devuelve un valor como respuesta al
mensaje.
El término mensaje se refiere al traspaso de solicitudes entre
objetos sin tener en cuenta detalles específicos de implementación.
La capacidad de modificar la definición de un objeto sin afectar al resto
del sistema está considerada como una de las mayores ventajas del
modelo de programación orientado a objetos.
Las bases de datos orientados a objetos tienen la finalidad de
agrupar aquellos elementos que sean semejantes en las entidades para
formar un clase, dejando por separado aquellas que no lo son en otra
clase.
Las clases en un sistema orientado a objetos se representan en
forma jerárquica. Se pueden crear muchas agrupaciones (clases) para
simplificar un modelo, así que una jerarquía (en forma gráfica) puede
quedar muy extensa, en esos casos se debe tener bien delimitados los
elementos que intervienen en una clase y aquellos objetos que las
heredan.
15
16. Los lenguajes de programación orientados a objetos requieren que
toda la interacción con objetos se realiza mediante el envío de
mensajes. Por lo cual, un sistema debe incluir tanto el modelo de pasar
el mensaje de objeto a objeto como el modelo de pasar el mensaje de
conjunto en conjunto.
En sí la estructuración de modelos orientados a objetos simplifica
una estructura evitando elementos o variables repetidas en diversas
entidades, sin embargo el precio de esto es dedicarle un minucioso
cuidado a las relaciones entre las clases cuando en modelo es complejo,
la dificultad del manejo de objetos radica en la complejidad de las
modificaciones y eliminaciones de clases, ya que de tener variables que
heredan otros objetos se tiene que realizar una reestructuración que
involucra una serie de pasos complejos.
Ejemplo:
-Entidad que se
encarga de
administrar la
información
general común a
las segundas dos
clases. A esta se le
llamó Maestro.
-Entidad que obtiene lotes de
tarjetas y los envía a la máquina
esclava, así como también se
asegura de que la máquina
esclava siga trabajando. Esta
clase se llamó Esclavo.
-Una clase que recolecta los
trabajos al mínimo tiempo, es
decir, justo cuando la máquina
esclava los termine de crear, y
que además se encargue de generar e insertar la información completa en la
base de datos. Su nombre es Recolector
La clase Maestro tiene los datos comúnes a todos los esclavos,
como lo es la localización de las imágenes en alguna máquina remota, y
la dirección de cada esclavo. Además es ésta clase la que tiene el poder
de crear múltiples instancias de la clase esclavo, para que cada una de
ellas trabaje con una máquina esclava diferente.
La clase esclavo, a su vez, se encarga de obtener una lista de
trabajo, la cual tiene que procesar, primeramente transportando los
archivos de su sitio original hacia la máquina esclavo de la que él se
encarga. Mientras envía los archivos a la máquina esclava, la clase
16
17. esclavo crea una instancia de la clase recolector, específicamente para
recolectar los resultados del OCR de la máquina esclava. Este recolector
se encarga de permanecer activo hasta obtener todos los resultados, de
no hacerlo, espera un tiempo razonable y continúa trabajando.
Después el esclavo se asegura de la terminación del trabajo y
envía un nuevo lote de imágenes, comenzando de nuevo el ciclo de
trabajo.
9.- Descripción de cada etapa del diseño de un Datawarehouse.
Se comienza por un análisis de requisitos de consultas para
conocer bien las necesidades a satisfacer.
El diseño conceptual se construye a partir de los requisitos
analizados, tiene por objetivo la construcción de una descripción
abstracta y completa del problema. Empieza con el análisis de
requerimientos de los usuarios y de reglas de negocio, y finaliza con la
construcción de un esquema conceptual expresado en términos de un
modelo conceptual. Para esto hay dos grandes enfoques, uno basado en
el análisis de requerimientos y otro basado en un análisis de las bases
de datos fuentes. En el primer enfoque se analizan los requerimientos
de los usuarios para modelar un cubo multidimensional de acuerdo a los
hechos, dimensiones y medidas definidas. En el segundo enfoque se
construyen cubos multidimensionales transformando un esquema
conceptual de las bases fuentes. Se comienza por identificar en el
esquema fuente los hechos relevantes para la toma de decisiones, para
luego determinar la jerarquía de las dimensiones.
En el diseño lógico se toma el diseño conceptual para formar un
esquema lógico relacional o multidimensional, otros métodos pasan por
alto el diseño lógico pasando del análisis de requisitos al diseño lógico.
El diseño lógico de un almacén de datos se basa en la determinación de
las dimensiones y medidas; las cuales, desde el punto de vista lógico,
pueden organizarse o estructurarse como: un esquema estrella,
esquema copo de nieve y constelación de hechos. El diseño lógico define
los lineamientos, los mapeos a la base fuente y abarca la transformación
del esquema fuente. Hay enfoques que incluyen materialización de
vistas, modelos basados en el modelo relacional y optimizados para
consultas OLAP, e implementaciones multidimencionales. En el enfoque
basado en vistas se centran en materializar algunas vistas de las bases
fuentes para lograr performance en un conjunto dado de consultas. En
el segundo enfoque, donde se busca definir estructuras para optimizar
las consultas del DW, las consultas contienen gran número de joins y
sumarizaciones que degradan la performance del sistema. Un enfoque
17
18. diferente consiste en aplicar sucesivas transformaciones a una base
fuente integrada hasta obtener el esquema lógico deseado para el DW.
El diseño físico consiste en implementar el esquema lógico en el
manejador de bases de datos elegido, teniendo en cuenta técnicas de
optimización física. Durante la etapa de diseño físico se incorporan
elementos específicos de almacenamiento y performance, como son la
elección de índices, almacenamiento especializado, parámetros de
sistemas, etc.
Finalmente la implementación de un Data Warehouse consiste
en la extracción de los datos del sistema operacional y transformación
de los mismos, carga de los datos validados en el Data Warehouse, y
explotación del Data Warehouse mediante diversas técnicas
dependiendo del tipo de aplicación que se de a los datos.
Con la finalización de esta fase se obtendrá un Data Warehouse
disponible para su uso por parte de los usuarios finales y el
departamento de informática. La construcción del Data Warehouse es
una tarea reiterada en la que se trata de incrementar su alcance
aprendiendo de las experiencias anteriores.
10.- Modelo Star Schema.
Un esquema en estrella está formado por una tabla por
cada dimensión y una tabla principal de hechos (tabla fact o central) que
contiene los datos para el análisis. En la tabla principal cada uno de los
atributos es a una llave foránea hacia cada tabla de dimensión. Las
tablas de dimensiones tendrán una llave primaria simple, mientras que
en la tabla central la clave principal estará compuesta por las claves
principales de las tablas dimensionales. Se destaca por su simplicidad y
velocidad en análisis multidimensionales. Desde el punto de vista del
usuario final, las cosultas son simples, ya que las condiciones y uniones
(JOIN) sólo involucran a la tabla principal y a las dimendiones, sin
considerar encadenamientos de uniones y más niveles de condiciones
como en el modelo snowflake schema.
18
19. 11.- Modelo Snowflake Schema.
Un esquema copo de nieve se da cuando alguna de las dimensiones se
implementa con más de una tabla de datos, las tablas de dimensiones
están normalizadas (aplicar una serie de reglas a las relaciones
obtenidas tras el paso del modelo entidad-relación al modelo relacional),
esto evita redundancia en los datos; pero tiene la contrapartida de
generar peores rendimientos al tener que crear más tablas de
dimensiones y más relaciones entre las tablas (JOINS) lo que tiene un
impacto directo sobre el rendimiento. Al tener un acceso más directo a
los datos, este esquema representa mejor la semántica de las
dimensiones del ambiente de los negocios. El problema es que para
extraer datos de las tablas en esquema de copo de nieve, a veces hay
que vincular muchas tablas en las sentencias SQL que puede llegar a ser
muy complejo y difícil para mantener.
Un ejemplo sería: si una tabla dimensional de los clientes (CUSTOMERS)
contiene un millión de filas, seria una idea buena crear una tabla con
grupos de clientes (CUSTOMER_GROUPS) y mover los datos comunes
para cada grupo de clientes a esta tabla. El tamaño de estas dos tablas
será mucho menor que de una tabla no normalizada con todos los datos
de clientes.
19
20. Conclusión.
Con base en este trabajo, hemos concluido cual es la
importancia que tienen las bases de datos y su manejo en el
desarrollo de las actividades empresariales. El desarrollo que tiene la
base de datos, se deben implementar siguiendo determinados pasos
y normas, lo cual las hace más confiables y eficientes al seguir sus
aspectos de seguridad.
Una de las principales ventajas que entregan los data
warehouse además de disminuir costos para la organización,
almacenar los datos con eficiencia y eficacia para el logro de los
objetivos, es que también disminuye las distancias de información
entre empresas, ya sea ciudad, país y continente.
Cada modelo de Base de Datos tiene su aplicación y su uso
respectivo lo importante es saber cómo, cuándo y dónde aplicarlo,
esto lo que le da una gran importancia a la capacitación del personal.
20