Anúncio

DeciLogic, les modélisations décisionnelles

Chef d'entreprise, Decilogic em DeciLogic
23 de Oct de 2013
Anúncio

Mais conteúdo relacionado

Apresentações para você(20)

Similar a DeciLogic, les modélisations décisionnelles(20)

Anúncio

DeciLogic, les modélisations décisionnelles

  1. Les modélisations décisionnelles Eric Mauvais Directeur eric.mauvais@decilogic.fr DeciLogic – Les modélisations décisionnelles
  2. Pourquoi mettre en place un SID ? Les enjeux du Système d’Information Décisionnel Définition des modèles de données décisionnels Vues, Faits et Dimensions Intégration des vues Normalisation des contextes La forme dimensionnelle normales et ses conséquences Formes dimensionnelles complexes Etats et flux Les représentations du temps Dérives dimensionnelles Indicateurs qualifiés Méthodes de consolidation DeciLogic – Les modélisations décisionnelles
  3. Définition des modèles de données décisionnels Vues, Faits et Dimensions L’analyse multidimensionnelle est une approche naturelle : L’utilisateur raisonne instinctivement suivant l’expression d’un contexte (les dimensions) et de mesures (les faits) : « Je souhaiterais connaitre mon chiffre d’affaires, par produit, par agence pour le mois de décembre ? » Les clauses « Pour » et « Par » (respectivement « Where » et « Group By » de vos requêtes) correspondent à vos dimensions, ou axes d’analyse. Le chiffre d’affaires lui correspond à la mesure, ou au fait. DeciLogic – Les modélisations décisionnelles
  4. Définition des modèles de données décisionnels Vues, Faits et Dimensions Une méthode de modélisation faits/dimensions part du processus métier analysé vers l’analyse : 1 . Identification du processus métier analysé 2. Établissement du niveau de granularité de l’analyse 3. Établissement des dimensions qui s’appliquent à chaque ligne de fait 4. Identification des caractéristiques numériques qui s’appliquent à chaque ligne de fait Cette méthode demande une vision complète et décrite du processus métier et de son implémentation. Elle permet de construire le tableau qui croise les processus métier et les dimensions : Approche de type matricielle ou « Bus » DeciLogic – Les modélisations décisionnelles
  5. Définition des modèles de données décisionnels Vues, Faits et Dimensions 1 . Identification du processus métier analysé : Il s’agit bien de processus et non de départements ou de services Quels sont les exemples concrets des décisions qui seraient pris ? Quels gains ? Meilleure réactivité, hausse de productivité, optimistaion des couts, accroissement de part de marché… La mise en place d’un DW a un coût ! Le processus choisi doit être judicieux 2. Établissement du niveau de granularité de l’analyse : Pour un ticket de caisse, vous souhaitez conserver chaque ligne de produit d’achat ? Chaque produit différent ? Regrouper un montant par famille ?... « Je veux tout stocker », mais il faut faire des compromis… DeciLogic – Les modélisations décisionnelles
  6. Définition des modèles de données décisionnels Vues, Faits et Dimensions 3. Établissement des dimensions qui s’appliquent à chaque ligne de fait : Quelques questions pour cerner vos axes d’analyse : « A qui ces données pourraient-elles être utiles ? » « Comment les analystes regrouperaient-ils les données ? » « Comment les filtreraient-ils ? » « Quels sont les titres de colonnes des rapports existants ? »… Cette étape doit être faite obligatoirement par une équipe hétérogène. 4. Identification des caractéristiques numériques qui s’appliquent à chaque ligne de fait : « Ce qui compte ne peut pas toujours être compté, et ce qui peut être compté ne compte pas forcément. » Comment mesurer la satisfaction client ? Suivre une mesure à un coût qu’il faut juger par rapport à sa pertinence. DeciLogic – Les modélisations décisionnelles
  7. Définition des modèles de données décisionnels Vues, Faits et Dimensions Deux type d’informations caractérisent les faits : Des mesures numériques propre à chaque instance de faits (quantité, prix, …) Des dimensions caractéristiques plus ou moins complexes (fournisseur, produit, …) Les mesures numériques propres à chaque fait sont l’objet de calculs d’analyse (montant global, moyenne globale, …) et les dimensions constituent des facteurs de sélection des faits étudiés (produits de telle ou telle marque, …). Un processus d’entreprise peut être représenté à l’aide d’une ou plusieurs tables de fait. On peut distinguer 3 types de table de faits : Table de fait de transaction Table de fait périodique Table de fait récapitulatif DeciLogic – Les modélisations décisionnelles
  8. Définition des modèles de données décisionnels Vues, Faits et Dimensions Table de fait de transaction : Définir les clés des dimensions de chacune des transactions opérationnelles et extraire les mesures intéressantes. Définir la granularité en fonction du contexte, cad de l’ensemble des clés de dimension Table de fait périodique : Construite à partir de la table de fait de transaction. Image de synthèse à un instant « T ». Une approche peut être de proposer une table de transaction très détaillée sur 6 mois et une table de fait périodique avec des dimensions moins profondes sur 36 mois. Table de fait récapitulatif : Complémentaire mais difficile à maintenir. Ex : Processus vente = dimension : Temps/Magasin Employé/Produit/Client Ex : Processus réclamation = dimensions : Temps/Produit La table de fait récapitulative « Mesure produit » peut avoir du sens pour intégrer les notions de ventes et réclamation. DeciLogic – Les modélisations décisionnelles
  9. Définition des modèles de données décisionnels Vues, Faits et Dimensions « Quels ont été les frais de déplacement et le kilométrage des commerciaux de la région Midi-Pyrénées ayant des véhicules de 4 à 8 CV en juillet 2012 ? » Vue : Frais/Employé/Véhicule/Région/Mois : Frais de déplacement, kilométrage par Employé (fonction) par Véhicule (puissance) par Région par Mois DeciLogic – Les modélisations décisionnelles
  10. Définition des modèles de données décisionnels Vues, Faits et Dimensions Les propriétés centrales, dont la valeur est déterminée par la combinaison des quatre entités, sont des faits, et toutes les autres propriétés sont des conditions. Un fait, une mesure, ou encore un indicateur, est une information déterminée par la combinaison de deux ou plusieurs entités, susceptible de constituer le résultat ou un élément du résultat d’une requête. Une condition est une caractéristique d’entité susceptible d’intervenir comme critère de définition d’une requête. Structurellement, une vue comporte donc toujours une association et deux ou plusieurs entités. DeciLogic – Les modélisations décisionnelles
  11. Définition des modèles de données décisionnels Vues, Faits et Dimensions « Je veux la liste des noms des commerciaux de la région Midi-Pyrénées ayant des véhicules de 4 à 8 CV avec, pour chacun, les frais de déplacement, le kilométrage et la marque du véhicule, pour juillet 2012. » Vue enrichie par les nouvelles propriétés : Frais de déplacement, kilométrage / Employé (nom, fonction) / Véhicule (marque, puissance) / Région / Mois DeciLogic – Les modélisations décisionnelles
  12. Définition des modèles de données décisionnels Vues, Faits et Dimensions Dimension ou axe d’analyse Dimensions stables, il s’agit d’une dimension qui n’évolue globalement pas. Par exemple, la liste des départements français est une « dimension stable » du fait d’une évolution quasi nulle. Dimensions à évolution lente, il s’agit d’une dimension dont l’évolution est limitée. Par exemple, la liste des catégories de produits vendus. (voir schéma) Dimensions dégénérées, il s’agit d’une table qui ne contenait comme élément que la clé elle-même, dans ce cas, cette dimension a été supprimée et la dimension est intégrée directement dans la table de faits. Dimensions conformes, dans ce cas il s’agit de deux dimensions dont la seconde est un sous-ensemble de la première. On rencontre ce type de dimension dans le cas de la modélisation en flocon. DeciLogic – Les modélisations décisionnelles
  13. Définition des modèles de données décisionnels Vues, Faits et Dimensions 3 types d’évolution lente 1 : Les anciennes valeurs ne sont pas conservées. 2 : Les anciennes valeurs sont conservées, et on rajoute une occurrence pour les nouvelles valeurs. Une nouvelle clé est créée. 3 : La nouvelle valeur est insérée en tant que nouveau champ, une date d’effet est stipulée. Le champ d’origine n’est jamais modifié. DeciLogic – Les modélisations décisionnelles
  14. Définition des modèles de données décisionnels Vues, Faits et Dimensions « Combien de commerciaux de la région Midi-Pyrénées se sont-ils déplacés avec des véhicules de 4 à 8 CV en juillet 2012? » Reformulation : « Pour combien de commerciaux de la région Midi-Pyrénées existe-t-il un kilométrage et/ou des frais de déplacement non nuls avec des véhicules de 4 à 8 CV en juillet 2012? » Pour se donner une idée intuitive des notions de faits et de conditions, il suffit d’imaginer la configuration des états de sortie correspondant aux requêtes. Les conditions ont naturellement tendance à y apparaître comme libellés des lignes et des colonnes d’un tableau, alors que les faits remplissent plutôt les cellules internes du tableau. DeciLogic – Les modélisations décisionnelles
  15. Définition des modèles de données décisionnels Vues, Faits et Dimensions Un exemple d’acquisition de données : Que voulez vous analyser (la dernière ligne du tableau) ? -> les faits Quels sont vos critères d'analyse (la première ligne du tableau) ? -> les dimensions Jusqu'à quel niveau de détail voulez-vous aller (les cellules à l'intérieur) ? Analyse Employe   Nom   Fonction Frais déplacement,  Kilométrage, Nombre de  déplacement   Véhicule Marque Puissance Date Années Mois Géographie Region         DeciLogic – Les modélisations décisionnelles
  16. Définition des modèles de données décisionnels Intégration des vues L’objectif du SID est de fournir une structure informationnelle intégrée et non de préparer l’exécution d’un jeu prédéfini de requêtes. Ne jamais introduire de chemin complexe ou ambigu. Rester capable d’intégrer une nouvelle vue sans remise en cause de la structure. La notion de contexte : Une consolidation directe des vues dans la réalité risque d’avoir un impact important sur la structure. Le contexte est une solution pour fournir un niveau de modélisation intermédiaire. Il permet de regrouper un ensemble de faits et de dimensions en cohérence. DeciLogic – Les modélisations décisionnelles
  17. Définition des modèles de données décisionnels Intégration des vues Certaines informations sont dans plusieurs vues. Certaines entités appartenant à plusieurs vues sont fonctionnellement liées les unes aux autres. DeciLogic – Les modélisations décisionnelles
  18. Définition des modèles de données décisionnels Intégration des vues La notion de hiérarchies Représentent pour l’utilisateur des chemins de consolidation DeciLogic – Les modélisations décisionnelles
  19. Définition des modèles de données décisionnels Intégration des vues Ex : 3 modes de consolidation possible pour l’entité client CSP = catégorie socio-professionnelle Lieu de résidence Structure commerciale DeciLogic – Les modélisations décisionnelles
  20. Définition des modèles de données décisionnels Intégration des vues Synthèse des contextes 5 dimensions pour 10 entités Activité : marge, revenu, ventes / Canal : Canal / Client : Client / Territoire : Région - Pays / Temps : Jour - Mois - Trimestre / Produit : Produit - Gamme - Marque Vues par expansion : marge / Canal / Pays / Produit / Trimestre revenu / Région / Mois / Produit / Client / Canal ventes / Client / Gamme / Jour revenu / Marque / Gamme / Mois / Région DeciLogic – Les modélisations décisionnelles
  21. Définition des modèles de données décisionnels Normalisation des contextes Par expérience, un contexte « raisonnable » possède entre 4 et 12 dimensions. L’assemblage des vues reste spécifiques à chaque projet, mais le critère suivant reste un bon guide : « Un contexte est cohérent si toutes les vues qu’il autorise ont une signification pour l’utilisateur » Ne pas interdire de combinaisons à priori. Le rapprochement de variables pas forcément liées est intéressant Par contre des dimensions trop liées est problématique. DeciLogic – Les modélisations décisionnelles
  22. Définition des modèles de données décisionnels Normalisation des contextes Dépendances et influences Règle 1 : Il ne doit pas y avoir de dépendance fonctionnelle entre 2 entités appartenant à des dimensions différentes dans un même contexte. Dans la pratique on se rend compte qu’une base décisionnelle contient une forte proportion de valeur nulle. Le SID met en œuvre des contextes valides, à l’utilisateur de formuler des requêtes pertinentes. DeciLogic – Les modélisations décisionnelles
  23. Définition des modèles de données décisionnels Normalisation des contextes Définition des faits Règle 2 : Tous les faits d’un contexte doivent être définis d’une manière cohérente pour toutes les combinaisons dimensionnelles de ce contexte. Cohérence des grains Le grain d’une dimension est le niveau de sélection le plus fin possible de cette dimension. Règle 3 : Tous les faits d’un contexte doivent être définis pour le grain de ce contexte. Navigation hiérarchique Règle 4 : Le graphe de chaque dimension doit être acyclique. DeciLogic – Les modélisations décisionnelles
  24. Définition des modèles de données décisionnels La forme dimensionnelle normales et ses conséquences Si un contexte respecte les 4 règles, il est FDN : forme dimensionnelle normale. Représentation « en galaxie » d’un domaine : DeciLogic – Les modélisations décisionnelles
  25. Formes dimensionnelles complexes Etats et flux 2 types de d’indicateur cohabitent dans un DW : les indicateurs dynamiques et statiques. Dynamique : représente un flux associé à un événement. Il s’agit d’un agrégat au cours d’une période. Ex : Plus ou moins value d’un placement. Statique : représente un indication de situation à un instant donné. Ex : Solde d’un compte bancaire. Les flux statiques sont intéressants pour : Conserver un état sans pouvoir reconstituer ses flux. Accélérer la consultation d’un état plutôt que reconstituer sa mémoire. Figer un état pour le comparer. DeciLogic – Les modélisations décisionnelles
  26. Formes dimensionnelles complexes Les représentations du temps Forte distinction entre le SIO et le SID dans ce domaine. Autant de grain que de situation : journée, mois…seconde… Irrégularité périodique : Une période élémentaire d’un contexte est l’intervalle de temps à l’intérieur duquel il n’est pas utile de tenir compte des variations. Une période possède au moins 2 attributs : date de début, date de fin. Trouver un compromis avec les bases sources pour charger des données cohérentes par rapport à la période de base du contexte. Les utilisateurs ont souvent un axe temporel différent : exercice comptable / exploitation. Il est conseillé d’avoir une seule période de base qui est ensuite consolidée ou filtrée pour présenter les résultats. DeciLogic – Les modélisations décisionnelles
  27. Formes dimensionnelles complexes Les représentations du temps Périodes et évènements Le temps n’est pas seulement une période, il peut être perçu également comme un évènement. Ex : Mémoriser une série de succession d’évènement Il peut être judicieux de conserver un état pour des besoins de comparaison. DeciLogic – Les modélisations décisionnelles
  28. Formes dimensionnelles complexes Dérives dimensionnelles L’écoulement du temps à des incidences sur les faits et les dimensions. Les clients apparaissent, vieillissent, disparaissent, se marient, déménagent, ont des enfants… L’entreprise lance de nouveaux produits, en abandonne d’anciens, modifie son découpage géographique, opère des fusionsacquisition… 2 types de changements potentiels : le contenu et la structure. DeciLogic – Les modélisations décisionnelles
  29. Formes dimensionnelles complexes Dérives dimensionnelles Le contenu : Gérer les changement d’état par l’ajout d’entité pour ne pas compliquer le modèle. Associer des occurrences permanentes et mouvantes. A noter l’évolution législatif en ce qui concerne l’immatriculation. DeciLogic – Les modélisations décisionnelles
  30. Formes dimensionnelles complexes Dérives dimensionnelles Le contenu : Rattacher des dimensions à des changements d’états. En fait le SID est intéressé par un client mais par « un client dans un certain état » DeciLogic – Les modélisations décisionnelles
  31. Formes dimensionnelles complexes Dérives dimensionnelles Le périmètre : Au cours d’une période une zone géographique commerciale peut changer, il faut alors pouvoir consolider les données à périmètre constant. Prise en compte des dimensions changeantes : Commune de naissance et de résidence appartiennent-elles au même contexte ? La commune de naissance est-elle une entité à part entière ? Invoque-t-on les mêmes attributs conditionnels dans la commune de naissance et de résidence ? DeciLogic – Les modélisations décisionnelles
  32. Formes dimensionnelles complexes Dérives dimensionnelles Le périmètre : Au cours d’une période une zone géographique commerciale peut changer, il faut alors pouvoir consolider les données à périmètre constant. Prise en compte des dimensions changeantes : Commune de naissance et de résidence appartiennent-elles au même contexte ? La commune de naissance est-elle une entité à part entière ? Invoque-t-on les mêmes attributs conditionnels dans la commune de naissance et de résidence ? DeciLogic – Les modélisations décisionnelles
  33. Formes dimensionnelles complexes Dérives dimensionnelles Une solution possible, la redondance des informations pour éviter les boucles et conserver une structure évolutive : DeciLogic – Les modélisations décisionnelles
  34. Formes dimensionnelles complexes Indicateurs qualifiés Distinguer un indicateur fondamental d’un indicateur qualifié : HT et TTC En francs, en dollars En valeur prévue, en valeur réalisée Selon plusieurs unités de mesure… DeciLogic – Les modélisations décisionnelles
  35. Formes dimensionnelles complexes Méthodes de consolidation Un indicateur peut être : Additif (ex : chiffre d’affaires, quantité, chiffre) Non additif (ex précédent : la moyenne des ventes, niveau de stock ) Semi-additif (cumulable par addition dans certaines hiérarchie seulement) Un contexte est donc complètement abouti lorsque la consolidation de chaque fait dans chaque hiérarchie est spécifiée. DeciLogic – Les modélisations décisionnelles
  36. DeciLogic, votre partenaire Une expertise mise à l’épreuve d’un engagement total DeciLogic – Les modélisations décisionnelles

Notas do Editor

  1. {}
Anúncio