SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
TP n°3 : Règles d’associations
Ben harrath arij 4infini
Note
Ce TP est à rendre en fin de séance.
Objectifs généraux
Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire
des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés
dans le cours (support, confidence, lift)
I. Etude des profils de demandes de Crédits
library : arules
//voir la description du dataset en pièce jointe (credit-german.doc)
1. Chargement du package :
2. Importation des données :
3. Transformation des données :
library(arules)
credit<-read.table(file="credit-german.txt",sep="t",header=T)
#transformer les données attributs-variables en données transactionnelles
cerdit1=as(credit,"transactions")
cerdit1
On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
4. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.25
- confiance 0.75
5. Affichage des dix premières règles :
#extraction des règles
rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule"))
inspect(head(sort(rules ),10))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Affichages des cinq premiers lift :
#afficher les 5 règles avec le lift le + élevé
inspect(head(sort(rules,by="lift"),5))
On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une
coloration négative
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
II. Etude des relations entre les produits vendus dans une épicerie
library : arules, arulesViz
Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec
169 catégories de produits, prises durant un mois.
1. Chargement du package :
2. Importation des données :
3. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.001
- confiance 0.5
#charger les packages
library(arulesViz)
data("Groceries")
#affichage des transactions
LIST(Groceries)
#statistiques descriptives
…
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift
de 1.957 à 18.996
On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive
Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles
Interpréter les résultats :
rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules"))
on a changé les valeurs de support et de confiance
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Si on change les valeurs de support et de confiance les règles diminuent plus précisément :
Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles
augmente.
Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles
diminue.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le
nombre des règles varient .
4. Affichages des dix premiers lift :
On remarque que lift est toujours positive donc il s’agit une forte corrélation
5. Interprétation
Proposer un nouveau rangement des produits dans l’épicerie.
Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles
diminue.
inspect(head(sort(rules, by="lift"),10))
On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé
ensemble ensemble.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Visualisation des Règles d’Association :
plot(rules)
#Paramétrage avancé de la visualisation
sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Le résultat de l'interaction. En utilisant une sélection de boîte les règles
avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées
dans la borne-dessous du dispositif de traçage
plot(rules, method="matrix", measure=c("lift", "confidence"))
plot(rules, method="matrix", measure=c("lift", "confidence"),
control=list(reorder=TRUE))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
plot(rules, method="grouped")
Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents.
La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes
selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent
des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est
hamburger meat
plot(rules, method="matrix", measure=c("lift", "confidence"))
La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs.
En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la
fois, le support et la confidence
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
III. Market Basket Analyse
Importation des données :
market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2));
market_basket<-read.table(file="market_basket.txt",sep="t",header=T)
market <- as(as.matrix(market_basket), "transactions")
basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules"))
summary(basket_rules )
On Remarque que le nombre deS règles est 23058938
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules"))
summary(rules)
inspect(head(sort(basket_rules),10))
Les valeurs de lift sont égaux a 1 donc on peut rien remarquer
On va varier les valeurs de confiance et de support
Après la variance on remarque que le nombre des règles est 50
plot(basket_rules, method="graph", control=list(type="items"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
. Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des
spectacles qui partagent les règles.
plot(basket_rules, method="matrix3D", measure="lift")
Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les
antécédents en fonction des lifts
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)

Contenu connexe

Tendances

Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionAmal Brioual
 
Ibm spss decision trees
Ibm spss decision treesIbm spss decision trees
Ibm spss decision treesisamil
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
Système D’information II - Diagramme de Flux.pptx
Système D’information II - Diagramme de Flux.pptxSystème D’information II - Diagramme de Flux.pptx
Système D’information II - Diagramme de Flux.pptxanisanima1
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Bases de données réparties par la pratique
Bases de données réparties par la pratiqueBases de données réparties par la pratique
Bases de données réparties par la pratiqueAbdelouahed Abdou
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdfhanamettali
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big DataTechnofutur TIC
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReportLilia Sfaxi
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 

Tendances (20)

Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
Ibm spss decision trees
Ibm spss decision treesIbm spss decision trees
Ibm spss decision trees
 
Bi
BiBi
Bi
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
Arbre de décision
Arbre de décisionArbre de décision
Arbre de décision
 
Système D’information II - Diagramme de Flux.pptx
Système D’information II - Diagramme de Flux.pptxSystème D’information II - Diagramme de Flux.pptx
Système D’information II - Diagramme de Flux.pptx
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Bases de données réparties par la pratique
Bases de données réparties par la pratiqueBases de données réparties par la pratique
Bases de données réparties par la pratique
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big Data
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Reporting avec JasperServer & iReport
Reporting avec JasperServer & iReportReporting avec JasperServer & iReport
Reporting avec JasperServer & iReport
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 

En vedette

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013CollectifEtc
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erikaErikaHorcajo
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelairemanubusta03
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingConnected-Blog
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Françoise Grave
 
Vivre en France
Vivre en France Vivre en France
Vivre en France Denis Papy
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateriayulissalizz
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmokss23
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizajeramirez34
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivakportilla
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaadaniela4562
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenConnected-Blog
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du mondeVictor REIBEL
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
AbwasserförderschneckenBittorf
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Nicolas Gillet
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundoAngelitaNR
 

En vedette (20)

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erika
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelaire
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
 
Presentación1
Presentación1Presentación1
Presentación1
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015
 
Vivre en France
Vivre en France Vivre en France
Vivre en France
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateria
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmo
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectiva
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaa
 
Hecho bebes
Hecho bebesHecho bebes
Hecho bebes
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-Systemen
 
Lync Conference France – avril 2014
Lync Conference France – avril 2014Lync Conference France – avril 2014
Lync Conference France – avril 2014
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du monde
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
Abwasserförderschnecken
 
eReserve Produktpräsentation
eReserve ProduktpräsentationeReserve Produktpräsentation
eReserve Produktpräsentation
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundo
 

Similaire à Ben harrath arijtp3 les règles d'association

TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineBoubaker KHMILI
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Aichétou Djimé Gallédou
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 

Similaire à Ben harrath arijtp3 les règles d'association (8)

Analyzing a churn data set
Analyzing a churn data set Analyzing a churn data set
Analyzing a churn data set
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage Machine
 
Data Mining
Data MiningData Mining
Data Mining
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
P15 Eda05 V D
P15 Eda05 V DP15 Eda05 V D
P15 Eda05 V D
 

Dernier

BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleuridelewebmestre
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvreidelewebmestre
 
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineBOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineidelewebmestre
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...idelewebmestre
 
La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0ourssoula
 
BOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresBOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresidelewebmestre
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresidelewebmestre
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...maach1
 
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLBOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLidelewebmestre
 
Agrivoltaïsme et filière ovine en Dordogne
Agrivoltaïsme et filière ovine en DordogneAgrivoltaïsme et filière ovine en Dordogne
Agrivoltaïsme et filière ovine en Dordogneidelewebmestre
 
Cadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en FranceCadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en Franceidelewebmestre
 
Support de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxSupport de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxdocteurgyneco1
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasidelewebmestre
 
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsBow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsidelewebmestre
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).FatimaEzzahra753100
 
Chapitre 2 : fondations et analyses de données géotechniques
Chapitre 2 : fondations et analyses de données géotechniquesChapitre 2 : fondations et analyses de données géotechniques
Chapitre 2 : fondations et analyses de données géotechniquesangevaleryn
 
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsidelewebmestre
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfalainfahed961
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...idelewebmestre
 

Dernier (20)

BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
 
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineBOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
 
La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0
 
BOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresBOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitières
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
 
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLBOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
 
Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024
 
Agrivoltaïsme et filière ovine en Dordogne
Agrivoltaïsme et filière ovine en DordogneAgrivoltaïsme et filière ovine en Dordogne
Agrivoltaïsme et filière ovine en Dordogne
 
Cadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en FranceCadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en France
 
Support de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxSupport de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptx
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
 
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsBow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).
 
Chapitre 2 : fondations et analyses de données géotechniques
Chapitre 2 : fondations et analyses de données géotechniquesChapitre 2 : fondations et analyses de données géotechniques
Chapitre 2 : fondations et analyses de données géotechniques
 
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
 

Ben harrath arijtp3 les règles d'association

  • 1. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 TP n°3 : Règles d’associations Ben harrath arij 4infini Note Ce TP est à rendre en fin de séance. Objectifs généraux Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés dans le cours (support, confidence, lift) I. Etude des profils de demandes de Crédits library : arules //voir la description du dataset en pièce jointe (credit-german.doc) 1. Chargement du package : 2. Importation des données : 3. Transformation des données : library(arules) credit<-read.table(file="credit-german.txt",sep="t",header=T) #transformer les données attributs-variables en données transactionnelles cerdit1=as(credit,"transactions") cerdit1 On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
  • 2. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 4. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.25 - confiance 0.75 5. Affichage des dix premières règles : #extraction des règles rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule")) inspect(head(sort(rules ),10))
  • 3. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Affichages des cinq premiers lift : #afficher les 5 règles avec le lift le + élevé inspect(head(sort(rules,by="lift"),5)) On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une coloration négative
  • 4. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 II. Etude des relations entre les produits vendus dans une épicerie library : arules, arulesViz Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec 169 catégories de produits, prises durant un mois. 1. Chargement du package : 2. Importation des données : 3. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.001 - confiance 0.5 #charger les packages library(arulesViz) data("Groceries") #affichage des transactions LIST(Groceries) #statistiques descriptives … rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
  • 5. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift de 1.957 à 18.996 On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles Interpréter les résultats : rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules")) on a changé les valeurs de support et de confiance
  • 6. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Si on change les valeurs de support et de confiance les règles diminuent plus précisément : Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles augmente. Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles diminue.
  • 7. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le nombre des règles varient . 4. Affichages des dix premiers lift : On remarque que lift est toujours positive donc il s’agit une forte corrélation 5. Interprétation Proposer un nouveau rangement des produits dans l’épicerie. Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles diminue. inspect(head(sort(rules, by="lift"),10)) On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé ensemble ensemble.
  • 8. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Visualisation des Règles d’Association : plot(rules) #Paramétrage avancé de la visualisation sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
  • 9. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Le résultat de l'interaction. En utilisant une sélection de boîte les règles avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées dans la borne-dessous du dispositif de traçage plot(rules, method="matrix", measure=c("lift", "confidence")) plot(rules, method="matrix", measure=c("lift", "confidence"), control=list(reorder=TRUE))
  • 10. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 plot(rules, method="grouped") Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents. La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est hamburger meat plot(rules, method="matrix", measure=c("lift", "confidence")) La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs. En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la fois, le support et la confidence
  • 11. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 III. Market Basket Analyse Importation des données : market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2)); market_basket<-read.table(file="market_basket.txt",sep="t",header=T) market <- as(as.matrix(market_basket), "transactions") basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules")) summary(basket_rules ) On Remarque que le nombre deS règles est 23058938
  • 12. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules")) summary(rules) inspect(head(sort(basket_rules),10)) Les valeurs de lift sont égaux a 1 donc on peut rien remarquer On va varier les valeurs de confiance et de support Après la variance on remarque que le nombre des règles est 50 plot(basket_rules, method="graph", control=list(type="items"))
  • 13. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 . Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des spectacles qui partagent les règles. plot(basket_rules, method="matrix3D", measure="lift") Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les antécédents en fonction des lifts
  • 14. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)