SlideShare uma empresa Scribd logo
1 de 23
Baixar para ler offline
Arbres de
décision
Motivation
Pour certains domaines d’application, il est essentiel de produire des
classifications compréhensibles pour l’utilisateur
Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron
multi-couches), l’information est perdue dans les classes
Arbres de décision
Arbres de
décision
Exemple
Décider si un patient est malade ou bien portant selon sa température et s’il a la
gorge irritée
Arbre de décision
2 classes (malade, bien portant)
2 variables (température, gorge irritée)
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Arbres de
décision
Généralités
Arbre de décision :
Algorithme de classification supervisée
Méthode statistique non-paramétrique
Permet de classer un ensemble d’individus décrits par des variables qualitatives
et quantitatives
Produit des classes les plus homogènes possibles
Arbres de
décision
Un peu de vocabulaire
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Noeud terminal ou feuille
Noeud intermediaire ou test
(chaque noeud intermediaire
est defini par un test construit
a partir d’une variable)
Arbres de
décision
Données et notations
Algorithme CART ←→ Algorithme d’apprentissage
Entrées :
n individus
p variables continues ou discrètes
une variable supplémentaire contenant la classe de chaque individu (c classes)
Sortie :
l’arbre de décision T
Arbres de
décision
Données et notations
N (p) = nombre d’individus associés à la position (noeud) p
N (k|p) = nombre d’individus appartenant à la classe k en sachant
qu’ils sont associés à la position p
P (k|p) =
N(k|p)
N(p)
= proportion des individus appartenant à la classe k
parmi ceux de la position p
Remarque :
Un noeud est pur si tous les individus associés appartiennent à la même classe !
Arbres de
décision
Construction de l’algorithme - exemple
But → construire un arbre de décision qui classe et détermine les caractéristiques des
clients qui consultent leurs comptes sur internet
Variables
M : moyenne des montants sur le compte
A : âge du client
R : lieu de résidence du client
E : le client à des études supérieures ?
I : le client consulte ses comptes sur internet ?
Arbres de
décision
Construction de l’algorithme - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
Arbres de
décision
Construction de l’algorithme - exemple
La construction est descendante
Au début tous les individus sont regroupés
Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut
construire un test sur une variable qui permettra de mieux discriminer les
individus ?
Quatre constructions possibles, suivant les variables Montant (M), Age (A),
Résidence (R) et Etudes (E)
Arbres de
décision
Construction de l’algorithme - exemple
1. Construction selon la variable Montant (M)
Client M I
1 moyen oui
2 élevé non
3 faible non
4 faible oui
5 moyen oui
6 élevé non
7 moyen non
8 faible non
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Arbres de
décision
Construction de l’algorithme - exemple
2. Construction selon la variable Age (A)
Client A I
1 moyen oui
2 moyen non
3 âgé non
4 moyen oui
5 jeune oui
6 âgé non
7 âgé non
8 moyen non
(3,5)
Moyen
Age
Jeune Age
(1,0) (2,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
3. Construction selon la variable Résidence (R)
Client R I
1 village oui
2 bourg non
3 bourg non
4 bourg oui
5 ville oui
6 ville non
7 ville non
8 village non
(3,5)
Residence
Ville Bourg Village
(1,2) (1,2) (1,1)
Arbres de
décision
Construction de l’algorithme - exemple
4. Construction selon la variable Etudes (E)
Client E I
1 oui oui
2 non non
3 non non
4 oui oui
5 oui oui
6 oui non
7 oui non
8 non non
(3,5)
Oui Non
Etudes
(3,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,2),(2,1),(0,2)
Age (A) (1,0),(2,2),(0,3)
Résidence (R) (1,2),(1,2),(1,1)
Etudes (E) (3,2),(0,3)
Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce
test !
Sur A, deux noeuds sur trois sont “purs” !
Comment tout écrire mathématiquement ?
Arbres de
décision
Degré de mélangeance
On a besoin de comparer les différents choix possibles
On introduit des fonctions qui permettent de mesurer le degré de mélangeance
dans les différentes classes
Propriétés des fonctions :
Le minimum est atteint lorsque tous les noeuds sont “purs”
Le maximum est atteint lorsque les individus sont équirepartis entre les classes
Arbres de
décision
Degré de mélangeance
Exemples de fonctions
Fonction d’entropie :
Entropie (p) = −
C
k=1
P (k|p) ln P (k|p)
Fonction de Gini :
Gini (p) = 1 −
C
k=1
P2
(k|p) = 2
k<k′
P (k|p) P k′
|p
Arbres de
décision
Degré de mélangeance
p p. . .
p
p
1 2 n
Test t a n modalites
t = le test (la variable)
n = le nombre de modalités
de t
i = la fonction pour mesurer
le degré de mélangeance
On introduit la fonction de gain :
Gain (p, t) = i (p) −
n
j=1
Pj i pj
Pj = la proportion des individus de la position p qui vont en position pj
La position p est fixée !
On cherche le test qui maximise le gain !
Arbres de
décision
Calcul du degré de mélangeance - exemple
Tester sur la variable Montant (M)
On considère le noeud 0 : (3,5)
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Gain (0, M) = i (0) − 3
8
i (1) + 3
8
i (2) + 2
8
i (3)
On choisit i = l’entropie !
Entropie (1) = −
1
3
ln
1
3
−
2
3
ln
2
3
= 0.64
Entropie (2) = −
2
3
ln
2
3
−
1
3
ln
1
3
= 0.64
Entropie (3) = −
2
2
ln
2
2
= 0
Arbres de
décision
Calcul du degré de mélangeance - exemple
On considère le noeud 0 : (3,5)
Variable test Gain
Montant (M) Gain (0, M) = Entropie (0) − 0.48
Age (A) Gain (0, A) = Entropie (0) − 0.35
Résidence (R) Gain (0, R) = Entropie (0) − 0.65
Etudes (E) Gain (0, R) = Entropie (0) − 0.42
Arbres de
décision
Calcul du degré de mélangeance - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
On continue!
(2,2)
(3,5)
Arbres de
décision
Suite de la construction - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
⇓
Client M R E I
1 moyen village oui oui
2 élevé bourg non non
4 faible bourg oui oui
8 faible village non non
Arbres de
décision
Suite de la construction - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,1),(1,0),(0,1)
Résidence (R) (1,1),(1,1)
Etudes (E) (2,0),(0,2)
Calculer le gain pour chaque test ?
Arbres de
décision
Suite de la construction - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
(2,2)
(3,5)
(2,0) (0,2)
Etudes
oui non
OUI NON

Mais conteúdo relacionado

Mais procurados

the naive bayesien classifier
the naive bayesien classifierthe naive bayesien classifier
the naive bayesien classifierAmrane Alik
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdfhanamettali
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
Perceptron monocouche en français
Perceptron monocouche en françaisPerceptron monocouche en français
Perceptron monocouche en françaisHakim Nasaoui
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionARIJ BenHarrath
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfnesrinetaamallah
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5Amal Abid
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning Niji
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoiresBoris Guarisma
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationHajer Trabelsi
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesJaouad Dabounou
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 
Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neuronesMed Zaibi
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 

Mais procurados (20)

the naive bayesien classifier
the naive bayesien classifierthe naive bayesien classifier
the naive bayesien classifier
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
Perceptron monocouche en français
Perceptron monocouche en françaisPerceptron monocouche en français
Perceptron monocouche en français
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
 
Bi
BiBi
Bi
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d association
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neurones
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 

Destaque

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Pierrick REVOL
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexitéSana Aroussi
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshopaymenli
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintesOrochi Krizalid
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql Yassine Badri
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite completChahrawoods Dmz
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercisePeter Antman
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Thiga
 

Destaque (11)

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
 
Methodes agile
Methodes agileMethodes agile
Methodes agile
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
 

Semelhante a Arbre de décision

Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaXL Formation
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression Mariem Chaaben
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Jean-Michel POU
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016ibtissam el hassani
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big DataJeremy Greze
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringFranck Dernoncourt
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlibebiznext
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptMohamed EL KIHEL
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreGroupe ARTICQUE
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...Adad Med Chérif
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et FiabiliteRémi Bachelet
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisionsJean-Michel POU
 
Cours statistiques
Cours statistiquesCours statistiques
Cours statistiquesvauzelle
 

Semelhante a Arbre de décision (20)

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 
Cours statistiques
Cours statistiquesCours statistiques
Cours statistiques
 

Mais de Yassine Badri

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de donnéesYassine Badri
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationellesYassine Badri
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du meriseYassine Badri
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesYassine Badri
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours Yassine Badri
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentationYassine Badri
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock Yassine Badri
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php Yassine Badri
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EEYassine Badri
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock Yassine Badri
 
cours base de données
cours base de donnéescours base de données
cours base de donnéesYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Yassine Badri
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2Yassine Badri
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1Yassine Badri
 

Mais de Yassine Badri (20)

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Cours php
Cours php Cours php
Cours php
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 

Último

Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfssuser40e112
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 

Último (20)

Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 

Arbre de décision

  • 1. Arbres de décision Motivation Pour certains domaines d’application, il est essentiel de produire des classifications compréhensibles pour l’utilisateur Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron multi-couches), l’information est perdue dans les classes Arbres de décision
  • 2. Arbres de décision Exemple Décider si un patient est malade ou bien portant selon sa température et s’il a la gorge irritée Arbre de décision 2 classes (malade, bien portant) 2 variables (température, gorge irritée) malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON
  • 3. Arbres de décision Généralités Arbre de décision : Algorithme de classification supervisée Méthode statistique non-paramétrique Permet de classer un ensemble d’individus décrits par des variables qualitatives et quantitatives Produit des classes les plus homogènes possibles
  • 4. Arbres de décision Un peu de vocabulaire malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON Noeud terminal ou feuille Noeud intermediaire ou test (chaque noeud intermediaire est defini par un test construit a partir d’une variable)
  • 5. Arbres de décision Données et notations Algorithme CART ←→ Algorithme d’apprentissage Entrées : n individus p variables continues ou discrètes une variable supplémentaire contenant la classe de chaque individu (c classes) Sortie : l’arbre de décision T
  • 6. Arbres de décision Données et notations N (p) = nombre d’individus associés à la position (noeud) p N (k|p) = nombre d’individus appartenant à la classe k en sachant qu’ils sont associés à la position p P (k|p) = N(k|p) N(p) = proportion des individus appartenant à la classe k parmi ceux de la position p Remarque : Un noeud est pur si tous les individus associés appartiennent à la même classe !
  • 7. Arbres de décision Construction de l’algorithme - exemple But → construire un arbre de décision qui classe et détermine les caractéristiques des clients qui consultent leurs comptes sur internet Variables M : moyenne des montants sur le compte A : âge du client R : lieu de résidence du client E : le client à des études supérieures ? I : le client consulte ses comptes sur internet ?
  • 8. Arbres de décision Construction de l’algorithme - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non
  • 9. Arbres de décision Construction de l’algorithme - exemple La construction est descendante Au début tous les individus sont regroupés Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut construire un test sur une variable qui permettra de mieux discriminer les individus ? Quatre constructions possibles, suivant les variables Montant (M), Age (A), Résidence (R) et Etudes (E)
  • 10. Arbres de décision Construction de l’algorithme - exemple 1. Construction selon la variable Montant (M) Client M I 1 moyen oui 2 élevé non 3 faible non 4 faible oui 5 moyen oui 6 élevé non 7 moyen non 8 faible non Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen
  • 11. Arbres de décision Construction de l’algorithme - exemple 2. Construction selon la variable Age (A) Client A I 1 moyen oui 2 moyen non 3 âgé non 4 moyen oui 5 jeune oui 6 âgé non 7 âgé non 8 moyen non (3,5) Moyen Age Jeune Age (1,0) (2,2) (0,3)
  • 12. Arbres de décision Construction de l’algorithme - exemple 3. Construction selon la variable Résidence (R) Client R I 1 village oui 2 bourg non 3 bourg non 4 bourg oui 5 ville oui 6 ville non 7 ville non 8 village non (3,5) Residence Ville Bourg Village (1,2) (1,2) (1,1)
  • 13. Arbres de décision Construction de l’algorithme - exemple 4. Construction selon la variable Etudes (E) Client E I 1 oui oui 2 non non 3 non non 4 oui oui 5 oui oui 6 oui non 7 oui non 8 non non (3,5) Oui Non Etudes (3,2) (0,3)
  • 14. Arbres de décision Construction de l’algorithme - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,2),(2,1),(0,2) Age (A) (1,0),(2,2),(0,3) Résidence (R) (1,2),(1,2),(1,1) Etudes (E) (3,2),(0,3) Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce test ! Sur A, deux noeuds sur trois sont “purs” ! Comment tout écrire mathématiquement ?
  • 15. Arbres de décision Degré de mélangeance On a besoin de comparer les différents choix possibles On introduit des fonctions qui permettent de mesurer le degré de mélangeance dans les différentes classes Propriétés des fonctions : Le minimum est atteint lorsque tous les noeuds sont “purs” Le maximum est atteint lorsque les individus sont équirepartis entre les classes
  • 16. Arbres de décision Degré de mélangeance Exemples de fonctions Fonction d’entropie : Entropie (p) = − C k=1 P (k|p) ln P (k|p) Fonction de Gini : Gini (p) = 1 − C k=1 P2 (k|p) = 2 k<k′ P (k|p) P k′ |p
  • 17. Arbres de décision Degré de mélangeance p p. . . p p 1 2 n Test t a n modalites t = le test (la variable) n = le nombre de modalités de t i = la fonction pour mesurer le degré de mélangeance On introduit la fonction de gain : Gain (p, t) = i (p) − n j=1 Pj i pj Pj = la proportion des individus de la position p qui vont en position pj La position p est fixée ! On cherche le test qui maximise le gain !
  • 18. Arbres de décision Calcul du degré de mélangeance - exemple Tester sur la variable Montant (M) On considère le noeud 0 : (3,5) Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen Gain (0, M) = i (0) − 3 8 i (1) + 3 8 i (2) + 2 8 i (3) On choisit i = l’entropie ! Entropie (1) = − 1 3 ln 1 3 − 2 3 ln 2 3 = 0.64 Entropie (2) = − 2 3 ln 2 3 − 1 3 ln 1 3 = 0.64 Entropie (3) = − 2 2 ln 2 2 = 0
  • 19. Arbres de décision Calcul du degré de mélangeance - exemple On considère le noeud 0 : (3,5) Variable test Gain Montant (M) Gain (0, M) = Entropie (0) − 0.48 Age (A) Gain (0, A) = Entropie (0) − 0.35 Résidence (R) Gain (0, R) = Entropie (0) − 0.65 Etudes (E) Gain (0, R) = Entropie (0) − 0.42
  • 20. Arbres de décision Calcul du degré de mélangeance - exemple (1,0) Age jeune moyen age (0,3) OUI NON On continue! (2,2) (3,5)
  • 21. Arbres de décision Suite de la construction - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non ⇓ Client M R E I 1 moyen village oui oui 2 élevé bourg non non 4 faible bourg oui oui 8 faible village non non
  • 22. Arbres de décision Suite de la construction - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,1),(1,0),(0,1) Résidence (R) (1,1),(1,1) Etudes (E) (2,0),(0,2) Calculer le gain pour chaque test ?
  • 23. Arbres de décision Suite de la construction - exemple (1,0) Age jeune moyen age (0,3) OUI NON (2,2) (3,5) (2,0) (0,2) Etudes oui non OUI NON