Tato prezentace byla proslovena Kamilem Gregorem, datovým analytikem KohoVolit.eu, na konferenci New Media Inspiration na Univerzitě Karlově v Praze v roce 2013. Video z prezentace najdete zde: http://www.youtube.com/watch?v=PyPIQIuHQAc
12. Předpoklady modelů
• Populace obou pozorovaných
proměnných je totožná
• Neexistuje prostorová autokorelace
nepozorovaných proměnných
• Rozdělení nepozorovaných proměnných
odpovídá námi zvolenému rozdělení
15. Bayesovské modelování
• Na začátku velmi obecné apriorní
rozdělení hodnot nepozorovaných
proměnných
• Podmíněné rozdělení je rozdělení hodnot
pozorovaných proměnných
• Aposteriorní rozdělení se použije
16. K čemu je to dobré?
• Pokaždé, když máme agregovaná data, ale ne
individuální data
• Tedy když známe hodnoty dvou proměnných v
populaci, ale ne hodnoty v jejich kontingenční
tabulce
A
B
C
?
?
?
α
?
?
?
β
?
?
?
γ
17. Například
• Sociální složení elektorátu (například podíl
katolíků versus podíl voličů strany)
• Voličské přesuny (podíl voličů strany ve
dvou volbách)
• Ticket-splitting
• Sociální složení populace (například
národnost versus náboženské vyznání,
nezaměstnanost versus vzdělání)
18. Nebo
• V řadě vědních oborů, jako je
– Sociologie
– Historie
– Ekonomie
– Marketing
– Geografie
– Epidemiologie
– Ekologie
19.
20.
21. Jak přesné jsou tyto výsledky?
• Pořád čekáme na ekvivalent testu statistické
signifikance
• Řešením je (zdá se) vyšetření robustnosti
použitých rozdělení a výpočetních algoritmů
• Ještě si nikdo nedal tu práci s modelováním
milionů simulovaných datových setů
• Ale existují rozsáhlé empirické studie (např. 113
švýcarských referend)
22. Jak přesné jsou tyto výsledky?
• Přesnost lze zatím měřit srovnáním s
výsledky exit pollu
• Příklad: Voličské přesuny v rakouských
parlamentních volbách mezi lety 2006 a
2008 (exit poll SORA)
23. Jak přesné jsou tyto výsledky?
model
minus exit
poll
SPÖ_08
FPÖ_08
ÖVP_08
G_08
BZÖ_08
ost._08
nev._08
SPÖ_06
2,31%
0,18%
-0,47%
-0,38%
-0,54%
-0,58%
-0,54%
ÖVP_06
-0,80%
1,23%
1,29%
-0,57%
-1,89%
0,88%
2,26%
G_06
-0,29%
-0,09%
-0,28%
1,21%
-0,08%
-0,24%
-0,46%
FPÖ_06
-0,35%
0,11%
-0,09%
0,08%
-0,14%
-0,07%
0,06%
BZÖ_06
-0,14%
-0,38%
-0,09%
-0,05%
1,44%
-0,03%
-0,11%
ost._06
-0,31%
-0,61%
-0,04%
0,13%
-0,32%
0,42%
0,71%
nev._06
-0,42%
-0,44%
-0,29%
-0,44%
1,53%
-0,38%
-1,92%
Zelená – model „přeceňuje“ voličské přesuny
Červená – model „podceňuje“ voličské přesuny
Závěr: Model je „konzervativnější“ než exit poll, vytváření falešný dojem stability
24. Jak přesné jsou tyto výsledky?
• P – přesnost, mi – výsledek model, ei –
výsledek exit pollu
• Udává podíl voličů, které model „správně
zařadil“
∑ m −e
P = 1−
i
2
i
25. Jak přesné jsou tyto výsledky?
• Voličské přesuny při volbách do
rakouského parlamentu:
– 1999 → 2002: P = 82,84%
– 2002 → 2006: P = 83,33%
– 2006 → 2008: P = 86,15%
26. Jak přesné jsou tyto výsledky?
• Voličské přesuny při volbách do
Poslanecké sněmovny Parlamentu ČR:
– 2006 → 2010: P = 87,89%
• Je to hodně nebo málo?
• Neví někdo, jaká je statistická odchylka
hodnot v buňkách kontingenční tabulky
voličských přesunů při exit pollu?