La première partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions, n' hésitez pas de me les envoyer via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture
2. Historique de l'aide à la décision
Introduction à l’aide à la décision
Étapes de prise de décision
Processus décisionnel
Définition du Business Intelligence
Pourquoi construire un système décisionnel ?
A qui s'adresse l'informatique décisionnelle ?
Bénéfices pour les entreprises
Métriques d’aide à la décision
Chaîne décisionnelle
Architecture du Business Intelligence
Utilisation des systèmes décisionnels
Influence du cloud computing et Big Data
Métiers du BI
Suites BI Open source
Q & A
Historique de l'aide à la décision
Introduction à l’aide à la décision
Étapes de prise de décision
Processus décisionnel
Définition du Business Intelligence
Pourquoi construire un système décisionnel ?
A qui s'adresse l'informatique décisionnelle ?
Bénéfices pour les entreprises
Métriques d’aide à la décision
Chaîne décisionnelle
Architecture du Business Intelligence
Utilisation des systèmes décisionnels
Influence du cloud computing et Big Data
Métiers du BI
Suites BI Open source
Q & A
Partie 1: Introduction au Business Intelligence
2
3. Historique de l'aide à la décision
3
Expérience individuelle,
Le savoir,
L'expérience des conseillers,
L'expérience des décideurs, ainsi que sur l'analyse historique.
4. Historique de l'aide à la décision
4
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des probabilités:
En mathématiques, la théorie des probabilités est l'étude
des phénomènes caractérisés par le hasard et l'incertitude.
Elle forme avec la statistique les deux sciences du
hasard qui sont partie intégrante des mathématiques.
5. 5
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des graphes (ordonnancement):
La théorie des graphes est la discipline mathématique et
informatique qui étudie les graphes, lesquels sont des
modèles abstraits de dessins de réseaux reliant des objets.
Ces modèles sont constitués par la donnée de « points »,
appelés des sommets, et de « liens » entre ces points ; ces
liens sont souvent symétriques (les graphes sont alors
dits non orientés) et sont appelés des arêtes.
La théorie de l'ordonnancement: l'ordonnancement,
consiste à décider dans quel ordre exécuter les tâches, c'est-
à-dire quelle tâche se fera avant une autre. C'est un domaine
de la recherche opérationnelle.
Historique de l'aide à la décision
6. 6
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des graphes:
Historique de l'aide à la décision
7. 7
Au xxe siècle, des outils mathématiques sont introduits:
la recherche opérationnelle:
Pour résumer, la discipline des méthodes scientifiques,
telles que les mathématiques ou encore
l’informatique utilisables pour élaborer de meilleures
décisions.
Historique de l'aide à la décision
8. 8
Au xxe siècle, des outils mathématiques sont introduits:
les arbres de décisions:
Un arbre de décision est un outil d'aide à
la décision représentant un ensemble de choix sous la
forme graphique d'un arbre.
Les différentes décisions possibles sont situées aux extrémités
des branches (les « feuilles » de l'arbre), et sont atteints en
fonction de décisions prises à chaque étape.
L'arbre de décision est un outil utilisé dans des domaines
variés tels que la sécurité, le data mining (fouille de
données), la médecine, etc. Il a l'avantage d'être lisible et
rapide à exécuter. Il s'agit de plus d'une représentation
calculable automatiquement par des algorithmes
d'apprentissage supervisé.
…
Historique de l'aide à la décision
9. 9
Apparition des systèmes informatiques d'aide à la décision
Systèmes d'Aide à la Décision (DSS):
Les systèmes d’aide à la décision (DSS) sont destinés à faciliter
les prises de décision au niveau de l’entreprise.
Un système d'aide à la décision bien conçu est un logiciel
interactif qui aide les décideurs à dégager des informations utiles
à partir de données brutes, de documents, de connaissances
personnelles et de modèles métier, afin d’identifier et résoudre
des incidents et prendre des décisions.
Business Intelligence (ETL, OLAP, et DW).
Internet,
Big Data, cloud computing, IoT,…
Historique de l'aide à la décision
10. Introduction à l’aide à la décision
10
Exemple:
Un touriste souhaite programmer son prochain déplacement afin de se
rendre sur son lieu de vacances. Le calcul de son itinéraire repose sur
l'analyse de la carte qui lui permet d'envisager les différents trajets
possibles. Et comme il a le choix, il faut aussi qu’il spécifie le critère à
retenir : est-ce le plus rapide qu’il cherche ou celui passant par le plus
de lieux touristiques ?
Cet exemple met en évidence un problème qui consiste à sélectionner
une décision parmi un ensemble de décisions possibles, de manière à
optimiser un certain critère.
Ce type de problème de décision est un problème d'optimisation.
Un problème est une question que l'on se pose.
Analyser le problème, c'est préciser clairement :
ce que l'on veut faire : le type de décision,
ce que l'on peut faire : les décisions possibles,
comment on choisit : le critère de sélection.
11. 11
Si on représente :
une décision par " " : représente un chemin,
l'ensemble des décisions possibles par : peut être par
exemple l'ensemble des parcours qui vous intéresse ou
l'ensemble des menus possibles,
le critère par une application qui à une décision associe son
évaluation ( ) :
• ( ) représente la longueur du parcours .
• la forme très générale d'un problème d'optimisation est :
min
∈
( )
Introduction à l’aide à la décision
12. 12
L’aide à la décision est l’ensemble des techniques permettant,
pour une personne donnée, d’opter pour la meilleure prise
de décision possible. L’aide à la décision est principalement
utilisée dans des domaines tels que la finance et la banque,
l’informatique ou la politique.
L'informatique décisionnelle ou Business intelligence (BI)
couvre un ensemble de technologies et d'outils qui permettent de
traiter une somme importante d'informations pour, à la fin du
processus, présenter aux décideurs des indicateurs fiables et
pertinents.
Introduction à l’aide à la décision
13. Aide à la Décision: Mise en situation
13
Besoin des entreprises
accéder à toutes les données de l’entreprise
regrouper les informations disséminées
analyser et prendre des décisions rapidement
Exemples d’applications concernées
Grande distribution : marketing, maintenance, …
Bancaire : suivi des clients, gestion de portefeuilles,…
Télécommunications : pannes, fraudes, mobiles, …
Commercial, marketing : amélioration du ciblage et du coût des
campagnes de communication, de recrutement et de fidélisation des clients.
Administration, finances : analyse de la marge et des coûts, contrôle de
gestion et reporting, simulations et prévisions, évaluation budgétaire.
14. 14
Le chiffre d’affaires (CA) a baissé en octobre. Pour y remédier,
des décisions sont à prendre. Mais pour prendre la bonne décision,
il faut savoir:
Pourquoi le chiffre d’affaires a-t-il baissé?
Comment a-t-il baissé?
Dans quelle gamme de produits ?
Dans quels pays, quelles régions ?
Dans le portefeuille de clientèle de quels commerciaux
Dans quel segment de distribution ?
N’avait-on pas une baisse semblable en octobre chaque année ?
Aide à la Décision: Mise en situation
15. La prise de décision
15
Une décision est le résultat d'un processus comportant le choix
conscient entre plusieurs solutions, en vue d'atteindre un objectif.
L'efficacité des services d'une entreprise dépend de la qualité de
ses décisions.
Améliorer l'habilité à prendre des décisions, c'est faire usage des
ressources dont dispose l'entreprise.
16. Étapes de prise de décision
Définir le problème
Construire un modèle
Identifier et évaluer les solutions possibles
Comparer, choisir et recommander une solution potentielle au
problème
17. Processus décisionnel
17
Peut être découpé en cinq étapes
1. Définir le problème
2. Rassembler les faits et données
3. Evaluer et interpréter les faits et données
4. Etablir plusieurs solutions
5. Choisir une solution (décider)
19. Business Intelligence
19
Définition 1:
Terme générique qui englobe les applications, l’infrastructure,
les outils et les meilleures pratiques permettant l’accès et
l’analyse de l’information afin d’améliorer et d’optimiser les
décisions et les performances.
Source : Gartner
20. 20
Définition 2:
Un ensemble de solutions informatiques permettant l’analyse des
données de l’entreprise, afin d’en dégager les informations
qualitatives nouvelles qui vont fonder des décisions, qu’elles soient
tactiques ou stratégiques.
Source : Smile (Open Source Solutions)
Business Intelligence
21. 21
Définition 3:
Un ensemble des outils et méthodes informatiques permettant de
prendre des décisions dans de bonnes conditions.
Business Intelligence
22. 22
Définition 4:
L’informatique décisionnelle désigne les moyens, les outils et les méthodes
qui permettent de collecter, consolider, modéliser et restituer les données,
matérielles ou immatérielles, d’une entreprise en vue d’offrir une aide à la
décision et de permettre aux responsables de la stratégie d’entreprise d’avoir
une vue d’ensemble de l’activité traitée.
Ce type d’application utilise en règle générale un entrepôt de données (ou
data warehouse en anglais) pour stocker des données transverses provenant de
plusieurs sources hétérogènes et fait appel à des traitements par lots pour la
collecte de ces informations.
Source: Wikipédia
Business Intelligence
23. 23
Définition 5:
Un SID (système d’information décisionnel) est un système
permettant aux utilisateurs de l’entreprise de disposer d’informations
pertinentes et d’outils d’analyse puissants pour les aider à prendre les
bonnes décisions au bon moment. (Bill Inmon)
Business Intelligence
24. 24
En conclusion:
C’est le processus d’exploitation des données de l’entreprise dirigé
par la technologie dans le but de faciliter la prise de décision.
Business Intelligence
25. Pourquoi construire un système décisionnel?
25
Objectifs et enjeux
1. Servir une information considérée comme stratégique.
2. Définir un référentiel.
3. Gagner du temps dans la prise de décision
4. Les besoins justifiant un système décisionnel.
5. Les principaux défis des projets décisionnels.
26. 1. Servir une information considérée comme stratégique
26
Un des actifs les plus importants des sociétés, c’est leur capital
d’informations qu’elles collectent au jour le jour.
Généralement, la plupart de ces informations sont inaccessibles, ou
réparties dans une multitude de systèmes.
Le Système d'Information Décisionnel (SID) résulte d’un processus
qui consiste à extraire les données à partir des systèmes opérationnels
et d’autres sources externes à l’entreprise, de les transformer en
information de pilotage et de les rendre accessibles aux utilisateurs.
La Base Décisionnelle est aujourd’hui reconnue comme un actif
stratégique par beaucoup d’entreprises.
Pourquoi construire un système décisionnel?
27. 2. Définir un référentiel
27
L’information existante est souvent très riche mais il est difficile
d’avoir une vision globale homogène et cohérente des
informations manipulées par l’ensemble des départements.
Il n’est pas facile d’accéder directement à l’information
nécessaire : il existe des données multi-sources utilisant des
supports différents (papier, ERP, CRM, base de données, fichiers
Excel,…).
Pourquoi construire un système décisionnel?
28. 2. Définir un référentiel
28
Avoir une définition commune des indicateurs de l’entreprise.
En effet en alignant son organisation autour d’un ensemble
unique et cohérent d’indicateurs clés (KPI) et de mesures, on
définit un référentiel commun d’analyse. Les données de
gestion peuvent avoir des significations différentes selon
l’utilisation qui en est faite, exemples : la marge, le CA. Mais le
reporting de Direction Générale n’accepte qu’un seul sens à une
valeur restituée.
L’objectif est bien de créer une vue unique dans l’entreprise
pour vos données comptables, clients ou de production.
Pourquoi construire un système décisionnel?
29. 3. Gagner du temps dans la prise de décision
29
En définissant un système décisionnel, vous automatisez le
traitement de vos données dans l’entreprise.
Les utilisateurs de la data ne passent plus ainsi leur temps à
créer des tableaux de bords. Ils deviennent plus performant et
plus rapide dans l’analyse et dans la prise de décision.
Nombreux outils de dataviz facilitent le partage de la donnée de
l’entreprise.
Les prises de décisions sont plus rapides et plus éclairées.
Pourquoi construire un système décisionnel?
30. 4. Les besoins justifiant un système décisionnel
30
Meilleur accès aux données
Amélioration de la qualité des informations.
Intégration des données provenant de systèmes différents.
Définition commune des informations.
Meilleur accès aux données historiques.
Donner aux collaborateurs les informations dont ils ont besoin
Pourquoi construire un système décisionnel?
31. 5. Les principaux défis d’un système décisionnel
31
Compréhension des besoins utilisateurs:
Comprendre les besoins des utilisateurs est indispensable pour la réussite d’un
projet.
Les analyser et les décrire n’est pas une tâche aisée, exprimer un concept
capable de satisfaire à ces attentes l’est encore moins.
Intégrité des données, c'est-à-dire la cohérence, la fiabilité, et la
pertinence des données.
Coût des alimentations en données
Pourquoi construire un système décisionnel?
32. 5. Les principaux défis d’un système décisionnel.
32
Définition du périmètre du projet:
Le périmètre du projet correspond à la délimitation précise du projet.
Concernant un projet lié aux Systèmes d’Information (mise en place d'un nouvel
ERP, évolution d'un SI en fonction d'une nouvelle organisation ...), le périmètre
total est l’identification et le recensement des applications/modules impactés
par le projet.
Le projet peut être ensuite subdivisé en sous-projets possédant chacun son propre
périmètre.
Performance du système:
« ... est performance du projet tout ce qui, et seulement ce qui, contribue à
atteindre les objectifs du projet ».
Pour assurer la recherche de performance il faut prendre en compte trois
facteurs qui entrent dans la composition du triangle d'or de la performance :
• L'efficience
• L'efficacité
• La compétence
Pourquoi construire un système décisionnel?
33. 5. Les principaux défis d’un système décisionnel.
33
Règles de gestion commune:
Les règles de gestion (ou règles métiers, ou « business rules » en
anglais) sont des déclarations de haut niveau structurées, qui
permettent de contraindre, contrôler et influencer un aspect
du métier.
Ces règles peuvent diminuer ou augmenter l'impact de risque, et
encore prendre des décisions rationnelles.
Une règle de gestion permet d'influencer une prise de décision.
L'objectif est de disposer de règles claires, c'est-à-dire non
ambiguës et compréhensibles par tous, notamment par les non
informaticiens.
Pourquoi construire un système décisionnel?
34. 34
Le but du BI est d'aider à la prise de décision et de permettre des
analyses précises, complexes et de grandes envergure dans les
entreprises.
Les systèmes décisionnels permettent de générer de la
connaissance à partir des données produites par les systèmes
opérationnels (comme les bases de données relationnelles).
Le BI permet de connaître les tendances des clients pour ainsi
bien anticiper les réactions de ses derniers. Il permet donc de
fidéliser les clients.
Pourquoi construire un système décisionnel?
35. 35
La mise en place d’un BI a pour objectif de faciliter le décideur
dans son processus de prise de décision.
L’informatique permet d’accélérer drastiquement le temps de
rassemblement des faits et données et leur interprétation
C’est un ensemble d’outils qui ne remplace en aucun cas le
décideur.
Le BI ne s'adresse ni aux informaticiens ni aux statisticiens.
A qui s'adresse le Business Intelligence ?
36. 36
Le BI s'adresse aux décideurs. Ces derniers utilisent les solutions
de BI pour mieux comprendre le fonctionnement actuel de
l'activité et d'anticiper des actions pour un pilotage éclairé de
l'entreprise.
Le système décisionnel a pour objet d’aider les décideurs à
effectuer des choix pertinents à partir de données historiques.
A qui s'adresse le Business Intelligence ?
38. 38
Accélérer et améliorer la prise de décision,
Optimiser les processus internes,
Augmenter l’efficience d’exploitation,
Générer de nouveaux revenus,
Améliorer la satisfaction des clients, des fournisseurs et des employés,
Prendre l’avantage sur la concurrence.
Les systèmes BI aident également les entreprises à identifier les
tendances du marché et à repérer les problèmes qui doivent être résolus.
Bénéfices pour les entreprises
41. Concepts clefs : Donnée
41
Donnée:
Résultat direct d’une mesure ou d’une observation
Peut être collectée par un outil de mesure, ou être présente
dans une base de données
Ne permet pas de prendre de décision sur une action à lancer
Exemple
Le mois dernier, on a enregistré 1217 incidents au centre de
services
10 nouveaux prestataires ont été employés à la direction
informatique
Donnée
42. Concepts clefs : Information
42
Information:
Donnée à laquelle un sens et une interprétation ont été donnés
Permet au responsable de prendre une décision sur une action
Exemple
Le mois dernier, on a enregistré une augmentation de 240% du
nombre d’incidents par rapport au mois précédent
L’emploi des 10 prestataires est lié à une augmentation
temporaire de la charge de travail
Donnée
Information
43. Concepts clefs : Connaissance
43
Connaissance:
Résultat d’une réflexion sur les informations analysées
Se base sur les expériences, les idées, valeurs, avis des
personnes consultées
Exemple
Le gestionnaire de changement peut établir une corrélation
entre l’arrivée des nouveaux prestataires et l’augmentation du
nombre d’incidents en ayant connaissance de certains
éléments
Donnée
Information
Connaissance
44. Concepts clefs : Sagesse
44
Sagesse:
État d’esprit général de discernement final sur le contenu et de
jugement de bon sens
Permet de lancer des actions d’adaptation de l’organisation,
des personnes, des processus et outils
Exemple
Le top manager de l’organisation prend des décisions à long
terme et des décisions stratégiques pour l’organisation
informatique.
Donnée
Information
Connaissance
Sagesse
50. Planification
50
Définition de la planification de projet
C’est l’activité qui consiste à déterminer et à ordonnancer les tâches du
projet, à estimer leurs charges et, à déterminer les profils et ressources
nécessaires à leur réalisation.
L’outil requis est le planning.
Les objectifs du planning sont les suivants :
déterminer si les objectifs sont réalisés ou dépassés
suivre et communiquer l’avancement du projet
affecter les ressources aux tâches
Le respect de ce planning décidera de la réussite ou non du projet, de
votre image auprès de votre client, et de la santé financière de votre
société.
Planification Collecte Stockage Distribution Restitution
51. 51
Pour mettre en place une plate-forme décisionnelle d'entreprise
intégrée, la première étape est donc la planification de ce projet.
La planification de projet est une étape clé dans la gestion d’un
projet. C’est le moment crucial où va se décider le découpage et
la répartition des tâches, les besoins en ressources et la date
prévisionnelle de fin.
Un tel projet nécessite une administration solide.
Exemple: les ressources humaines
Un responsable peut voir le salaire des personnes de son équipe.
Mais ne peut pas voir celui de son chef.
Nécessité d'une stratégie de sécurité rigoureuse.
Planification Collecte Stockage Distribution RestitutionPlanification
52. Collecte des données
52
Sources : les informations utiles aux décideurs peuvent être stockées
sur des sites de natures diverses (sites web, BDR, fichiers, ERP, SAP,
autre système opérationnel). Les langages de codification, les
structures de données sont généralement hétérogènes, ce qui rend
délicate l’extraction des données en vue d’alimenter le data
warehouse (entrepôt de données).
La collecte s’effectue à partir de données appelées : données
sources. Ces données peuvent se présenter sous différents formats.
Il peut s’agir de fichiers "plats" (fichiers CSV avec séparateurs,
fichiers XML, fichiers ASCII...) mais aussi de SGBDs (export de
base MySQL, PostgreSQL, IBM DB2, ORACLE...).
Planification Collecte Stockage Distribution Restitution
53. 53
Ces sources de données sont donc en général hétérogènes c’est
pourquoi il va falloir passer par une phase dites d’intégration pour
pouvoir les manipuler avant de les stocker dans notre système
d’aide à la décision.
La collecte des données est assuré par des outils ETL (Extract,
Transform, Load) permettant de récupérer les données quelque
soient leurs sources et les systèmes qui les supportent.
Planification Collecte Stockage Distribution Restitution
Collecte des données
54. 54
ETL Process
ETL : Extract, Transform, Load
ETL est un processus de data warehousing chargé de retirer des données des
systèmes sources et de les placer dans un data warehouse (entrepôt de
données).
ETL implique les trois phases suivantes :
Extraction des données à partir d’une ou plusieurs sources de données hétérogènes
et disparates : fichiers, base de données, applications, …
Transformation des données: il s’agit de donner une présentation homogène et
fiable pour l’analyse à l’aide de nettoyage, alignement, filtrage, calcul, suppression
des doublons,…
Chargement des données dans la banque de données de destination, i.e. data
warehouse.
La phase d’ETL est ici incontournable car elle conditionne et influence la
qualité du projet par la suite.
Planification Collecte Stockage Distribution Restitution
Collecte des données
60. Stockage
60
Cette zone de données est le lieu où les données sont organisées,
stockées et offertes aux requêtes des utilisateurs, aux
programmes de reporting et autres applications d’analyses.
Plusieurs manières de stocker les données dans des bases de
données spécialisées : Data warehouse et Data mart.
Chacune ayant ses avantages et ses inconvénients.
L'administrateur DW pourra notamment choisir entre : DDS
(Dimensional Data Store), les schémas en : étoile, flocon…
Planification Collecte Stockage Distribution Restitution
61. Distribution de données
61
La fonction de diffusion a pour objectif de mettre les données à la
disposition des utilisateurs. Elle permet la gestion de droits d’accès selon
les schémas correspondant au profil ou au métier de chacun.
L’objectif principal de la diffusion est de segmenter les données
collectées en contextes cohérents, simples à utiliser et qui correspondent
à une activité particulière. Chaque contexte peut correspondre à un
Datamart, il est modélisable sous la forme d’un hyper cube et peut être
mis à disposition des utilisateurs via un outil OLAP.
Le mot OLAP (On-Line Analytical Processing), désigne l’ensemble des
technologies permettant le calcul et l’analyse de données commerciales
ou de production, fondée sur des requêtes structurées suivant des critères
combinés, appelés dimensions.
Planification Collecte Stockage Distribution Restitution
62. 62
Les outils OLAP disponibles :
Planification Collecte Stockage Distribution Restitution
Distribution de données
63. Restitution
63
La fonction d’exploitation ou de restitution se charge de présenter
les informations aux utilisateurs permettant la mise en place de
tableaux de bord qui présentent les indicateurs clés de gestion.
La génération de tableau de bord, est la partie émergée de l'iceberg :
l'informatique décisionnelle.
Les outils de restitution permettent aux analystes de manipuler les
données contenues dans les entrepôts, éditer des rapports et naviguer
dans les cubes.
C'est la partie que voient la plupart des utilisateurs.
Planification Collecte Stockage Distribution Restitution
65. 65
Ce sont généralement de jolies interfaces intuitives permettant à un
utilisateur lambda, en fonction de ses droits, de consulter des rapports,
des tableaux de bord, de les annoter, voire de les créer lui-même.
C’est dans cette phase que les différents outils de restitution vont
intervenir. Nous trouverons des :
outils de requêtage,
outils de reporting,
portails d’accès à des tableaux de bord,
outils de navigation dans des cubes ou hypercubes multidimensionnels,
outils de statistiques,
data mining
Planification Collecte Stockage Distribution Restitution
Restitution
67. Outils de Restitution
67
Outils de Reporting et de Requêtage
Le principe du reporting est d'agréger et de synthétiser des
données nombreuses et complexes sous forme d'indicateurs, de
tableaux, de graphiques permettant d'en avoir une appréhension
globale et simplifiée.
Le reporting s'appuie principalement sur les agrégats afin de faire
apparaître des comptages, sommes ou moyennes en fonction de
critères d'analyses.
68. 68
Outils de Reporting et de Requêtage
Les outils de reporting et de requêtes permettent la mise à
disposition de rapports périodiques, préformatés et paramétrables
par les opérationnels.
Ils offrent une couche d’abstraction orientée métier pour faciliter
la création de rapports par les utilisateurs eux-mêmes en
interrogeant le data warehouse grâce à des analyses croisées.
Ils permettent également la production de tableaux de bord avec
des indicateurs de haut niveau pour les managers, synthétisant
différents critères de performance.
Le reporting est généralement récurrent, le même rapport sera
produit à intervalles réguliers pour contrôler les variations des
indicateurs.
Outils de Restitution
69. 69
Outils d’Analyse
Les outils d’analyse OLAP permettent de traiter des données
et de les afficher sous forme de cubes multidimensionnels et de
naviguer dans les différentes dimensions.
Cet agencement des données permet d’obtenir immédiatement
plusieurs représentations d’un même résultat, en une seule
requête sous une approche descendante des niveaux agrégés
vers les niveaux détaillés (Drill-down, Roll-up).
Voici la liste des opérations OLAP :
Slice / Dice
Drill down / Roll up
Pivot / Rotate
…
Outils de Restitution
71. 71
Data Mining
Les outils de Datamining offrent une analyse plus poussée des
données historisées permettant de découvrir des connaissances
cachées dans les données comme la détection de corrélations et
de tendances, l’établissement de typologies et de segmentations
ou encore des prévisions.
Le Datamining est basé sur des algorithmes statistiques et
mathématiques, et sur des hypothèses métier.
Outils de Restitution
77. Pourquoi les alimentations sont-elles difficiles?
77
Sur le plan des données
Sources diverses et disparates;
Sources sur différentes plateformes et OS;
Qualité de données douteuse et changeante dans le temps;
Incohérence entre les différentes sources;
Données dans un format difficilement interprétable ou ambigu.
Définir un langage commun
Localiser les données utiles dans les systèmes sources
Harmoniser les nomenclatures
78. 78
Sur le plan technique
Structure des systèmes sources changeante dans le temps;
Applications utilisant des BDs et autres technologies obsolètes
Les règles d’alimentation changent sans cesse
Développements modulaires, auto-documentés, et traçabilité
des données
Temps de chargement compatibles avec la fenêtre
d'exploitation
Pourquoi les alimentations sont-elles difficiles?
79. Risques et facteurs de succès
79
L’implication des utilisateurs est indispensable
81. Les principaux risques d'un projet décisionnel
81
Orientation technologique du projet, plutôt qu’utilisateur
Mise en cause de la fiabilité et/ou cohérence des informations
Alimentations trop longues et irrégulières
Outils et architecture technique inadaptés
Fraîcheur insuffisante des informations
Qualité de données incertaine dans les sources de données
Difficile de construire un data warehouse évolutif (scalable)
Pas d’administrateur du système
82. Quelques facteurs clefs de succès
82
Pour la conduite de projet :
Adopter une démarche incrémentale avec des objectifs précis et
quantifiés à l’avance
Miser dès le départ sur un socle informatique stable, puis
coordonner des itérations courtes avec des résultats tangibles
Dans la conception fonctionnelle :
Préférer des états figés mais utiles à des analyses libres mais
compliquées
Raisonner en flux amont-aval et en échanges transverses entre
utilisateurs
83. 83
Dans la mise en œuvre technique :
S’assurer de l’évolutivité de la solution technique
Privilégier les solutions paramétrables par un administrateur
fonctionnel
Insérer dans la recette technique des tests de montée en charge
Pour la prise en compte des impacts organisationnels :
Préparer le changement et l’insérer dans le plan de projet,
Fonder et associer le plus tôt possible le futur administrateur du
système.
Quelques facteurs clefs de succès
84. Utilisations du système décisionnel
84
Domaine Applications clés
Banque Risques d’un prêt,
Prime plus précise
Assurance Risque lié à un contrat d’assurance
Évaluation des risques, conception des produits,
détection des fraudes
Santé Épidémiologie,
Risque alimentaire
Commerce Ciblage de clientèle,
Déterminer des promotions
85. 85
Domaine Applications clés
Télécommunications Pannes, fraudes, mobiles,
Retenue des clients, conception du
réseau
Compagnie aérienne Gestion des rendements,
Évaluation d'itinéraire
Retail (Vente au
détail)
Marketing cible, gestion de la chaîne
d'approvisionnement
Utilisations du système décisionnel
86. 86
Domaine Applications clés
Logistique Adéquation demande/production
Analyse des fournisseurs, anticipation des
commandes et des stocks,
Pilotage des achats
RH Suivi de l’évolution des compétences, du
recrutement,
Analyse de la masse salariale, anticipation des
rotations de personnel, gestion de la pyramide
des âges
Production Optimisation des coûts de production,
Contrôle des coûts
Marketing, Finance,
Mailing,…
Utilisations du système décisionnel
87. Influence du cloud computing
Réduit les compétences locales pour acquérir des technologies et gérer un
entrepôt de données
Économies d'échelle pour les petites organisations
Amélioration de scalabilité
Des coûts variables plus élevés mais des coûts fixes plus bas
87
88. Modèles de services Cloud
Infrastructure
(IaaS)
Platform
(PaaS)
Application
(SaaS)
Cloud Vendor
Infrastructure
User
Organization
Development
88
91. Métiers du BI
• Recommend technology solutions
• Define user interfaces
• Collaborate with business analysts and DW managers
DW Analyst
• Design, develop, and maintain data warehouses
• Ensure conformance to enterprise standards
• Develop and implement data integration procedures
DW Manager
• Develop data analysis and reporting solutions
• Mine and analyze data from multiple sources
• Communicate results to management
• Prepare data (reduction and missing values)
BI Analyst
• Document data elements
• Use reporting tools
• Collaborate with business analysts and data architects
• Develop data extraction procedures
Data Analyst
91
Consultant BI
• Analyser les besoins fonctionnels et techniques,
• Définir l’architecture,
• Développer l’ensemble des processus d’intégration,
• Accompagner le client tout au long de la réalisation du projet.
97. La suite décisionnelle JasperSoft
97
Historique de JasperSoft
2001: Jaspersoft a vu le jour suite au besoin grandissant pour un
développeur Java à Bucarest (Teodor Danciu) d'intégrer une
fonction de création de rapports dans une application.
2002: Un utilisateur du nouveeau-né JasperReports exprime à
son tour le besoin d'améliorer sa méthode de conception de
rapports. Giulio Toffoli développe un projet immédiatement
soutenu par la communauté JasperReports.
2004: les deux fondateurs décident de créer une entreprise à San
Francisco. Jaspersoft voit le jour.
Mai 2018: Sortie de la version TIBCO Jaspersoft 7.1.0
98. 98
Présentation de JasperSoft
Jaspersoft a été développé par Tibco Software, spécialiste depuis
près de 20 ans du développement d’outils d’analyse et de prise de
décision en temps réel.
Jaspersoft est aujourd’hui la plateforme Open Source de Business
Intelligence la plus utilisée au monde grâce à son architecture
flexible et à ses fonctionnalités complètes:
reporting,
tableaux de bord,
requêtes ad-hoc,
analyses OLAP ,
et intégration de données.
La suite décisionnelle JasperSoft
100. 100
Avantages
Les avantages clés de la plateforme décisionnelle sont :
des fonctionnalités complètes de reporting, de tableaux de bord et
d’analyse faciles à utiliser,
une architecture Web flexible facile à intégrer à une autre
application,
un modèle de licence abordable pour toucher plus d’utilisateurs à
moindre coût.
les produits Jaspersoft BI sont disponibles en trois éditions
Community, Professional et Entreprise pour répondre aux
exigences variées des entreprises en terme de fonctionnalités ou
performances.
La suite décisionnelle JasperSoft
101. 101
Avantages
Analyse Big Data: Grâce à sa capacité d’accès en temps réel à
Hadoop, MongoDB, Cassandra et aux principaux systèmes de
bases de données analytiques, Jaspersoft se connecte à un
environnement Big Data pour créer les rapports et les analyses
dont votre entreprise a besoin.
Analyse Cloud: Les solutions décisionnelles cloud offrent aux
entreprises la possibilité d’apporter une réponse aux besoins ad
hoc imprévus ou à la nécessité de configurer rapidement un
environnement de démonstration de faisabilité.
Analyse mobile: Conçu dans un environnement Cloud et doté
d’une vaste panoplie d’interfaces de programmation (API),
Jaspersoft Open Source permet de créer des applications
décisionnelles mobiles natives Android et iOS.
La suite décisionnelle JasperSoft
102. 102
Avantages
Embedded BI ou BI embarqué consiste à intégrer des rapports,
des tableaux de bord et des vues analytiques dans une application.
Les informations sont généralement affichées et gérées par une
plateforme de BI et sont placées directement dans l'interface
utilisateur de l'application afin d'améliorer le contexte et la
convivialité des données. L'utilisation d'une plateforme de BI
intégrée fournit des rapports et des analyses de pointe, sans le
temps et les coûts liés à la création de celle-ci.
L’interface utilisateur peut être adaptée à l’univers graphique de
votre entreprise au moyen de thèmes et de feuilles de style (css).
JasperReports Server constitue le cœur de la suite décisionnelle
Jaspersoft.
La suite décisionnelle JasperSoft
103. 103
Produits
La suite décisionnelle Jaspersoft est composée des cinq éléments
suivants :
JasperReports Library
Jaspersoft Studio
JasperReports Server
Jaspersoft ETL
Jaspersoft OLAP
La suite décisionnelle JasperSoft
106. La suite décisionnelle Pentaho
106
Historique de Pentaho
2004: Pentaho, édité par une société indépendante fondée en
2004, est une suite BI qui permet la distribution de fonctionnalités
et documents décisionnels à un grand nombre de personnes..
2015: Pentaho a été racheté par Hitachi Data Systems (HDS) en
2015.
19 septembre 2017: Pentaho a rejoint Hitachi Vantara, une
nouvelle société qui unifie les activités de Pentaho, Hitachi Data
Systems et Hitachi Insight Group (Iot platform Lumada).
2017: Pentaho 8 est sorti par Hitachi Vantara.
29 août 2019: sorti de la dernière version Pentaho 8.3 par
Hitachi Vantara.
107. 107
Fonctionnalités
Reporting,
Tableaux de bord,
Analyse ad hoc,
Analyse multidimensionnelle (OLAP),
Intégration de données,
Machine learning,
Analyse Cloud,
Analyse Big Data,
IA,
IoT,
Data Mining.
La suite décisionnelle Pentaho
110. Bibliographie
110
Michael Mannino, Business School, University of Colorado Denver: « Data Warehouse Concepts,
Design, and Data Integration ».
Jahangir Karimi, Information Systems University of Colorado Denver: «Business Intelligence
Concepts, Tools, and Applications ».
Lilia Sfaxi, « Introduction à l’Informatique Décisionnelle » - Cours
Smile, Open Source Solutions :« Décisionnel, le meilleur des solutions open-source », Livre blanc
https://www.jaspersoft.com/fr
https://community.jaspersoft.com/
https://www.hitachivantara.com/go/pentaho.html
https://community.hitachivantara.com/s/pentaho
https://forums.pentaho.com/
https://support.pentaho.com/hc/en-us/categories/200888603
https://www.cs.waikato.ac.nz/ml/weka/
http://eric.univ-lyon2.fr/~ricco/tanagra/fr/tanagra.html
https://rapidminer.com/
https://orange.biolab.si/