2. Indicateurs statistiques de fraude électorale
1. Loi de Benford
2. Modèle binomial robuste surdispersé
3. Autre indicateur
4. Propositions
3. 1. Loi de Benford
● Surprenant : en mesurant de
nombreuses choses dans la
nature, les nombres commencent
plus souvent par 1 que par 2 etc.
jusqu’à 9
● Exemples : population des pays
ou longueur des fleuves
● C’est vrai aussi pour le deuxième
digit
4. Test statistique “Loi de Benford”
● Pour la détection de fraude on
utilise le 2ème digit, car trop de
locaux ont ~ 1000 votants
● le “ test du χ² ” vérifie si le
deuxième chiffre du nombre de
oui / non des locaux de vote
obéit à la loi de Benford
● si le résultat est < 16.92 on est
sur à 95% que oui
5. Critique du test de Benford
Si le résultat est > 16.92 on ne sait
pas grand chose car:
1. ça arrive “normalement” dans
5% des cas
2. on ne sait pas quel(s) bureau(x)
de vote sont concernés
La validité du test est fortement
contestée dans la littérature lorsqu’il
y a peu de bureaux de taille trop
similaire
Seule cas de fraude que ce test est
vraiment capable de détecter:
Si quelqu’un génère les résultats à
l’aide de la fonction RAND() d’Excel
au lieu d’utiliser
POWER(10;RAND()) / 10
Ah zut je l’ai dit…
Donc ce test est désormais inutile.
6. 2. Modèle binomial robuste surdispersé
1. On a comparé les votes OUI /
NON (binomial) des communes
pendant 10 ans
2. On a construit un “modèle
robuste” de ces relations selon
deux “variables indépendantes”
vote
comme
A B C D
A 100% 80% 12% 3%
B 80% 100% 36% 22%
C 12% 36% 100% 42%
D 3% 22% 42% 100%
A
B
C
D
7. ( Politique à 2 dimensions )
1. Représentation de plus en plus
courante en analyse politique
2. http://smartvote.ch/
3. “Wie sich die SVP aus dem
Bürgerblock verabschiedet hat”
Tages Anzeiger, 21. April 2014
http://sotomo.ch/
8. Modèle binomial robuste surdispersé
3. Le modèle permet de prévoir les
résultats dans une commune
d’après les résultats dans les
autres (surdispersion):
A B C D
OUI 48% ? 80% 52%
A
B
C
D
Oui
9. Modèle binomial robuste surdispersé
4. Les poids mesurent
la correspondance
avec la tendance
générale.
5. Les résidus sont les
écarts entre le
résultat réel et celui
prévu par le
modèle.
10. Critique du MBRS
1. “Effectivement, les modèles
avec surdispersion sont
une très bonne idée !!”
(Arthur Charpentier,
prof de stats Montréal
http://freakonometrics.
hypotheses.org/12142
2. “Lorsque l'objet concerne des
questions d'ordre géographique, les profils
ne seront peut-être pas suffisants pour expliquer les résultats.”
3. Le modèle a été établi sur 10 années (199x-200x)
Comment le remettre à jour ? Faut-il le faire en permanence ?
11. Autre indicateur de détection de fraude
● Klimek & all (2012). It’s
not the voting that’s
democracy, it’s the
counting: Statistical
detection of systematic
election irregularities
10.1073/pnas.1210722109
● La participation est une
donnée disponible et
importante
12. Propositions
1. Représenter les résultats
du MBRS en couleur sur
une carte du Canton
2. Ajouter les graphiques
résultat / participation
3. (Supprimer Benford)
4. Etudier comment “resetter”
ou faire évoluer le MBRS