SlideShare une entreprise Scribd logo
1  sur  11
Comment ça marche ?


Un Système Expert Probabiliste reposant sur un
              Réseau Bayésien
Les réseaux Bayésiens sont constitués de deux parties distinctes


            Structure
                 Graphe orienté sans cycle

                     Les noeuds représentent les variables du problème modélisé (e.g.: URU-
                   FRA pour modéliser le match de l’Uruguay contre la France)

                      Chaque noeud a des états exclusifs (e.g.: FRA, Nul, URU)

                     Les arcs représentent les dépendances probabilistes directes entre les
                   variables (éventuellement causales), e.g.: les résultats des matchs de l’équipe
                   de France ont un impact direct sur le nombre de point de l’équipe

           Paramètres

                    Des distributions de probabilités sont associées à chaque noeud, généralement
                    en utilisant des tables

                                                                    DISTRIBUTION DE                           On considère ici que si la
                                                          PROBABILITES CONDITIONNELLES                   France perd son premier match
              DISTRIBUTION DE
                                                       Le résultat du premier match a un impact sur le     contre l’Uruguay, elle n’a que
        PROBABILITES MARGINALES
                                                      moral de l’équipe et donc sur la distribution de    45% de chance de gagner son
 On considère ici que l’Uruguay a 15% de chance
                                                              probabilités du second match.              second match face au Mexique,
de gagner face à la France, qu’il y a 60% de chance
  que cela fasse un score nul, et enfin, 25% de                                                           40% de chance de faire nul et
        chance que la France l’emporte                                                                       15% de chance de perdre.
                                                                                                           Par contre, en cas de victoire
                                                                                                          face l’Uruguay, nous estimons
                                                                                                            que ses chances de victoire
                                                                                                          sont de 85%, contre 10% pour
                                                                                                           le nul et 5% pour une défaite.
Les réseaux Bayésiens sont de puissants moteurs de calcul
                             probabiliste



On exploite les informations disponibles sur un sous-ensemble de variables pour
mettre à jour, de manière exacte, les distributions de probabilités des autres variables

Tous les types de calculs sont possibles :

    Simulation : des “causes” vers les “effets”

 “Quel est l’impact d’une défaite au premier match sur la probabilité de qualification
 au second tour ?”

    Diagnostic : des “effets” vers les “causes”

 “En cas de qualification au second tour, quelle est la probabilité que l’équipe ait
 perdu son premier match ?”

    N’importe quelle combinaison de ces deux types d’inférence :

 “En cas de qualification au second tour et de match nul au premier match, quelle est
 la probabilité que l’équipe ait gagné son second match ?”
Réseau Bayésien utilisé dans l’application
La structure : 3 strates




                                                         Les 6 matchs du
                                                            groupe A
                      Les points de chaque
                             équipe




La qualification de
 chaque équipe
Les paramètres



            Distribution de probabilités marginales définies
                               équiprobables.
           C’est l’utilisateur qui va définir sa distribution dans
        l’application en fonction de ses propres connaissances




                                 Relations
                          déterministes entre les
                         résultats des 3 matchs et la
                         somme des points du 1er
                                    tour




                                          Une équation
                                        probabiliste décrit les
                                       différents scénarios de
                                            qualification
Les calculs probabilistes : Simulation

“Quel est l’impact d’une défaite au premier match sur la probabilité de qualification au second tour ?”



                                        Initialement, sans changer la
                                      distribution équiprobable sur l’issue
                                          des matchs, la probabilité de
                                       qualification est naturellement de
                                                      50%




                                  Une défaite de l’Uruguay au
                                  premier match réduit donc les
                                chances de qualification de 50% à
                               23,59% (sans nouvelles informations
                                     sur les autres matchs)
Les calculs probabilistes : Diagnostic

“En cas de qualification au second tour, quelle est la probabilité que l’équipe ait perdu son premier match ?”

                                                                Sachant que la France est
                                                               qualifiée au second tour .....




       ... il y a 15,73% de risque qu’elle ait
              perdu son premier match
Les calculs probabilistes

“En cas de qualification au second tour et de match nul au premier match, quelle est la probabilité que
                                l’équipe ait gagné son second match ?”


     Sachant que la France a
 fait match nul lors de son premier
               match ....

                                                                        ... et que la France est qualifiée
                                                                                au second tour .....

  ... il y a alors 58,49% de
chance qu’elle ait remporté son
          second match
Les calculs probabilistes


                                   “Est-ce possible de se qualifier avec 2 points ?”


  Sachant que l’Afrique sur Sud
       totalise 2 points ....




... il y a alors 1,23% de chance
           qu’elle se qualifie
Bonnes simulations ...
et bonne Coupe du Monde
     http://worldcup.bayesialab.com

Contenu connexe

En vedette

En vedette (11)

Id3
Id3Id3
Id3
 
Algorithme knn
Algorithme knnAlgorithme knn
Algorithme knn
 
Data Mining
Data MiningData Mining
Data Mining
 
Réseaux de neurones
Réseaux de neurones Réseaux de neurones
Réseaux de neurones
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neurones
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Resume de BI
Resume de BIResume de BI
Resume de BI
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 

Pronostics Coupe du monde 2010 - comment ça marche théoriquement ?

  • 1. Comment ça marche ? Un Système Expert Probabiliste reposant sur un Réseau Bayésien
  • 2. Les réseaux Bayésiens sont constitués de deux parties distinctes Structure Graphe orienté sans cycle Les noeuds représentent les variables du problème modélisé (e.g.: URU- FRA pour modéliser le match de l’Uruguay contre la France) Chaque noeud a des états exclusifs (e.g.: FRA, Nul, URU) Les arcs représentent les dépendances probabilistes directes entre les variables (éventuellement causales), e.g.: les résultats des matchs de l’équipe de France ont un impact direct sur le nombre de point de l’équipe Paramètres Des distributions de probabilités sont associées à chaque noeud, généralement en utilisant des tables DISTRIBUTION DE On considère ici que si la PROBABILITES CONDITIONNELLES France perd son premier match DISTRIBUTION DE Le résultat du premier match a un impact sur le contre l’Uruguay, elle n’a que PROBABILITES MARGINALES moral de l’équipe et donc sur la distribution de 45% de chance de gagner son On considère ici que l’Uruguay a 15% de chance probabilités du second match. second match face au Mexique, de gagner face à la France, qu’il y a 60% de chance que cela fasse un score nul, et enfin, 25% de 40% de chance de faire nul et chance que la France l’emporte 15% de chance de perdre. Par contre, en cas de victoire face l’Uruguay, nous estimons que ses chances de victoire sont de 85%, contre 10% pour le nul et 5% pour une défaite.
  • 3. Les réseaux Bayésiens sont de puissants moteurs de calcul probabiliste On exploite les informations disponibles sur un sous-ensemble de variables pour mettre à jour, de manière exacte, les distributions de probabilités des autres variables Tous les types de calculs sont possibles : Simulation : des “causes” vers les “effets” “Quel est l’impact d’une défaite au premier match sur la probabilité de qualification au second tour ?” Diagnostic : des “effets” vers les “causes” “En cas de qualification au second tour, quelle est la probabilité que l’équipe ait perdu son premier match ?” N’importe quelle combinaison de ces deux types d’inférence : “En cas de qualification au second tour et de match nul au premier match, quelle est la probabilité que l’équipe ait gagné son second match ?”
  • 4. Réseau Bayésien utilisé dans l’application
  • 5. La structure : 3 strates Les 6 matchs du groupe A Les points de chaque équipe La qualification de chaque équipe
  • 6. Les paramètres Distribution de probabilités marginales définies équiprobables. C’est l’utilisateur qui va définir sa distribution dans l’application en fonction de ses propres connaissances Relations déterministes entre les résultats des 3 matchs et la somme des points du 1er tour Une équation probabiliste décrit les différents scénarios de qualification
  • 7. Les calculs probabilistes : Simulation “Quel est l’impact d’une défaite au premier match sur la probabilité de qualification au second tour ?” Initialement, sans changer la distribution équiprobable sur l’issue des matchs, la probabilité de qualification est naturellement de 50% Une défaite de l’Uruguay au premier match réduit donc les chances de qualification de 50% à 23,59% (sans nouvelles informations sur les autres matchs)
  • 8. Les calculs probabilistes : Diagnostic “En cas de qualification au second tour, quelle est la probabilité que l’équipe ait perdu son premier match ?” Sachant que la France est qualifiée au second tour ..... ... il y a 15,73% de risque qu’elle ait perdu son premier match
  • 9. Les calculs probabilistes “En cas de qualification au second tour et de match nul au premier match, quelle est la probabilité que l’équipe ait gagné son second match ?” Sachant que la France a fait match nul lors de son premier match .... ... et que la France est qualifiée au second tour ..... ... il y a alors 58,49% de chance qu’elle ait remporté son second match
  • 10. Les calculs probabilistes “Est-ce possible de se qualifier avec 2 points ?” Sachant que l’Afrique sur Sud totalise 2 points .... ... il y a alors 1,23% de chance qu’elle se qualifie
  • 11. Bonnes simulations ... et bonne Coupe du Monde http://worldcup.bayesialab.com