2. Son tecnologías que nos permitirán tratar y
visualizar la información que reside en un
datawarehouse.
Existen distintas
tecnologías que nos
permiten analizar la
información
que reside en un
datawarehouse, pero la
más extendida es el OLAP
3. Los usuarios necesitan analizar información a distintos niveles de
agregación y sobre múltiples dimensiones: Por ejemplo,
• ventas de productos
• por zona de ventas
• por tiempo
• por clientes o tipo de cliente
• y por región geográfica.
Los usuarios pueden hacer este análisis al máximo nivel de agregación o al
máximo nivel de detalle.
OLAP provee de estas funcionalidades y algunas más, con la flexibilidad
necesaria para descubrir las relaciones y las tendencias que otras
herramientas menos flexibles no pueden aportar.
A estos tipos de análisis les llamamos multidimensionales, porque nos
facilitan el análisis de un hecho desde distintas perspectivas o dimensiones.
4. El OLAP Councilsumarizó las 12 reglas de Codd en lo que ellos
llamaban el concepto FASMI que los productos OLAP deben cumplir.
El concepto FASMI proviene de las siglas de las iniciales en inglés:
• FAST (Rápido): Debe ser rápido, necesitamos lanzar
consultas y ver los resultados inmediatamente.
• ANALYSIS (Análisis): Debe soportar la lógica de negocio
y análisis estadísticos que sean necesarios para los
usuarios.
• SHARED (Compartido): Tiene que manejar múltiples
actualizaciones de forma segura y rápida.
• MULTIDIMENSIONAL (Multidimensional): Tiene que
proveer de una visión conceptual de la información a través
de distintas dimensiones.
• INFORMATION (Información): Debe poder manejar toda
la información relevante y la información derivada.
5. La representación gráfica del OLAP son los cubos
Como ejemplo en el cubo tenemos las
unidades vendidas de cada uno de los
libros, para los distintos clientes y en los
distintos años.
• Disponemos de las unidades vendidas de
cada uno de los libros para cada uno de los
clientes y en cada uno de los años:
• El contenido de un cubo individual son las
ventas de un libro a un cliente en un año.
• Los contenidos de cada uno de los cubos
individuales del cubo recogen lo que
llamamos “hechos” (en nuestro ejemplo las
unidades vendidas).
• En la actualidad, las soluciones OLAP
permiten que cada una de los cubos
individuales pueda contener más de un
hecho.
6. Las herramientas OLAP nos permiten “rotar” (en inglés “slicing”) los
cubos, es decir, cambiar el orden de las distintas dimensiones:
Como vemos en el ejemplo
hemos cambiado la
dimensión
“clientes” por la de “libros”.
También podemos
seleccionar (en inglés
“dicing”) sólo algunas de las
celdas,
por ejemplo: ¿Cuáles son las
ventas al cliente 2, de los
libros 1 y 2, en el año 1?
7. Existen distintos tipos de herramientas OLAP. La diferencia entra
ellas, básicamente, depende de cómo acceden a los datos:
• ROLAP: Relational OLAP
Las capacidades OLAP acceden directamente a la base de datos relacional.
Se accede por tanto a una base de datos relacional (RDBMS). Accede
habitualmente sobre un modelo “estrella”. La principal ventaja es que no tiene
limitaciones en cuanto al tamaño, pero es más lento que el MOLAP, aunque
algunos productos comerciales nos permiten cargar cubos virtuales para
acelerar los tiempos de acceso.
• MOLAP: Multimensional OLAP
La implementación OLAP accede directamente sobre una base de datos
multidimensional (MDDB). La ventaja principal de esta alternativa es que es
muy rápida en los tiempos de respuesta y la principal desventaja es que, si
queremos cambiar las dimensiones, debemos cargar de nuevo el cubo.
8. • HOLAP: Hybrid OLAP
Accede a los datos de alto nivel en una base de datos multidimensional y
a los atómicos directamente sobre la base de datos relacional. En esencia
utiliza las ventajas del ROLAP y del MOLAP.
Las formas de acceso de las herramientas OLAP
pueden ser:
• Cliente/Servidor: lo que significa tener las instalaciones
locales en los ordenadores de los usuarios.
• Acceso web: cliente, cliente ligero, o sólo con el navegador.
En este tipo de acceso el navegador comunica con un
servidor web, el cual habla con la aplicación del servidor, que
es la que conecta con el datawarehouse.
9. Las principales herramientas de Business
Intelligence son:
• Generadores de informes: Utilizadas por desarrolladores
profesionales para crear informes estándar para grupos
departamentos o la organización.
• Herramientas de usuario final de consultas e informes:
Empleadas por usuarios finales para crear informes para ellos
mismos o para otros no requieren programación.
• Herramientas OLAP: Permiten a los usuarios finales tratar la
información de forma multidimensional para explorarla desde
distintas perspectivas y periodos de tiempo.
• Herramientas de Dashboardy Scorecard: Permiten a los
usuarios finales ver información crítica para el rendimiento
con un simple vistazo utilizando iconos gráficos y con la
posibilidad de ver más detalle para analizar información detallada
e informes, si lo desean
10. • Herramientas de planificación, modelización y consolidación:
Permite a los analistas y a los usuarios finales crear planes
de negocio y simulaciones con la información de Business
Intelligence. Pueden ser para elaborar la planificación, los
presupuestos, las previsiones.
Estas herramientas proveen a los dashboards y los scorecards con
los objetivos y los umbrales de las métricas.
• Herramientas datamining: Permiten a estadísticos o analistas
de negocio crear modelos estadísticos de las actividades
de los negocios. Datamining es el proceso para descubrir e
interpretar patrones desconocidos en la información mediante
los cuales resolver problemas de negocio.
Los usos más habituales del datamining son:
segmentación, venta cruzada, sendas de consumo, clasificación,
previsiones, optimizaciones, etc.
11. Ejemplos de pantallas que se obtienen con las
herramientas de datamining:
A este conjunto de herramientas se pueden añadir en la actualidad herramientas de
Text mining, que nos permiten trabajar con información no estructurada y
herramientas de visualización avanzada que nos facilitan la interpretación de la
información que producen las otras herramientas de Business Intelligence.
12. Visualización
La visualización de la información del datawarehouse se puede hacer
utilizando hojas de cálculo, herramientas específicas o desde un simple
navegador. Depende en cada caso de las características del producto
seleccionado
Ejemplos
La siguiente pantalla nos
muestra un ejemplo de
Analysis Services de
MicrosoftSQL Server 2000:
13. Un ejemplo de acceso a una herramienta OLAP vía web accediendo
tan sólo con un navegador es: http://www.Fedscope.opm.gov en la
que encontraremos información sobre la contratación de funcionarios
en EE.UU. y podremos navegar a través de dimensiones como
la edad, el sexo, el nivel salarial o el departamento en el que están
trabajando.
14. Otro ejemplo de visualización es el que se desarrolla sobre la herramienta
de Business Intelligence de QlikView utilizando las bases de
datos de un supermercado del libro The datawarehouse Toolkit. En
la pantalla hemos seleccionado una marca y, utilizando lógica asociativa,
nos muestra los valores de las ventas, el margen y las unidades,
teniendo en cuenta la selección