SlideShare uma empresa Scribd logo
1 de 27
Hierarchický bayesovský model
ekologické inference
Kamil Gregor
Otázka: Kolik procent
podnikatelů volí TOP09?
To je snadné!
TOP09 v PSP 2010 (%)

30
25
20
15
10
5
10

15

20

25

OSVČ v ORP (%)

Odpověď: (Asi) hodně.

30
Otázka: Kolik procent Romů volí
DSSS?
Taky asi hodně…

WTF?
Ekologický klam
černoši

běloši

600

400

?
?

?
?

celkem
1000
400
600

voliči
nevoliči
Ekologický klam
černoši

běloši

600

400

?
?

?
?

celkem
1000
400
600

voliči
nevoliči

černoši

běloši

600

400

0
0

400
0

celkem
1000
400
600

voliči
nevoliči
Ekologický klam
celkem
1000

černoši

běloši

600

400

0
0

400
0

černoši

běloši

400

400 voliči
600 nevoliči
celkem
1000

600

400

400 voliči
600 nevoliči
celkem
1000

0
400

400
600

200
400

200
200

400
600

černoši

běloši

600

400

?
?

?
?

černoši

běloši

600
400
200

voliči
nevoliči

celkem
1000

voliči
nevoliči
Základní statistická neurčitelnost
černoši

běloši

Pi

1 – Pi

Ai

Di – Ai

Di

voliči

Bi

(1 – Di) – Bi

1 – Di

nevoliči

Celkem
1

Pi = AiDi + Bi(1 – Di)
Jak řešit neřešitelný problém?
1. Dotazníková šetření
Jak řešit neřešitelný problém?
1. Dotazníková šetření
2. Statistické modelování
Předpoklady modelů
• Populace obou pozorovaných
proměnných je totožná
• Neexistuje prostorová autokorelace
nepozorovaných proměnných
• Rozdělení nepozorovaných proměnných
odpovídá námi zvolenému rozdělení
Dvourozměrné normální rozdělení
Bayesovské modelování
Bayesovské modelování
• Na začátku velmi obecné apriorní
rozdělení hodnot nepozorovaných
proměnných
• Podmíněné rozdělení je rozdělení hodnot
pozorovaných proměnných
• Aposteriorní rozdělení se použije
K čemu je to dobré?
• Pokaždé, když máme agregovaná data, ale ne
individuální data
• Tedy když známe hodnoty dvou proměnných v
populaci, ale ne hodnoty v jejich kontingenční
tabulce
A

B

C

?

?

?

α

?

?

?

β

?

?

?

γ
Například
• Sociální složení elektorátu (například podíl
katolíků versus podíl voličů strany)
• Voličské přesuny (podíl voličů strany ve
dvou volbách)
• Ticket-splitting
• Sociální složení populace (například
národnost versus náboženské vyznání,
nezaměstnanost versus vzdělání)
Nebo
• V řadě vědních oborů, jako je
– Sociologie
– Historie
– Ekonomie
– Marketing
– Geografie
– Epidemiologie
– Ekologie
Jak přesné jsou tyto výsledky?
• Pořád čekáme na ekvivalent testu statistické
signifikance
• Řešením je (zdá se) vyšetření robustnosti
použitých rozdělení a výpočetních algoritmů
• Ještě si nikdo nedal tu práci s modelováním
milionů simulovaných datových setů
• Ale existují rozsáhlé empirické studie (např. 113
švýcarských referend)
Jak přesné jsou tyto výsledky?
• Přesnost lze zatím měřit srovnáním s
výsledky exit pollu
• Příklad: Voličské přesuny v rakouských
parlamentních volbách mezi lety 2006 a
2008 (exit poll SORA)
Jak přesné jsou tyto výsledky?
model
minus exit
poll

SPÖ_08

FPÖ_08

ÖVP_08

G_08

BZÖ_08

ost._08

nev._08

SPÖ_06

2,31%

0,18%

-0,47%

-0,38%

-0,54%

-0,58%

-0,54%

ÖVP_06

-0,80%

1,23%

1,29%

-0,57%

-1,89%

0,88%

2,26%

G_06

-0,29%

-0,09%

-0,28%

1,21%

-0,08%

-0,24%

-0,46%

FPÖ_06

-0,35%

0,11%

-0,09%

0,08%

-0,14%

-0,07%

0,06%

BZÖ_06

-0,14%

-0,38%

-0,09%

-0,05%

1,44%

-0,03%

-0,11%

ost._06

-0,31%

-0,61%

-0,04%

0,13%

-0,32%

0,42%

0,71%

nev._06

-0,42%

-0,44%

-0,29%

-0,44%

1,53%

-0,38%

-1,92%

Zelená – model „přeceňuje“ voličské přesuny
Červená – model „podceňuje“ voličské přesuny
Závěr: Model je „konzervativnější“ než exit poll, vytváření falešný dojem stability
Jak přesné jsou tyto výsledky?
• P – přesnost, mi – výsledek model, ei –
výsledek exit pollu
• Udává podíl voličů, které model „správně
zařadil“

∑ m −e
P = 1−
i

2

i
Jak přesné jsou tyto výsledky?
• Voličské přesuny při volbách do
rakouského parlamentu:
– 1999 → 2002: P = 82,84%
– 2002 → 2006: P = 83,33%
– 2006 → 2008: P = 86,15%
Jak přesné jsou tyto výsledky?
• Voličské přesuny při volbách do
Poslanecké sněmovny Parlamentu ČR:
– 2006 → 2010: P = 87,89%

• Je to hodně nebo málo?
• Neví někdo, jaká je statistická odchylka
hodnot v buňkách kontingenční tabulky
voličských přesunů při exit pollu?
Děkuji za pozornost

Mais conteúdo relacionado

Mais de KohoVolitEU

Wdo a akademici 240911
Wdo a akademici 240911Wdo a akademici 240911
Wdo a akademici 240911KohoVolitEU
 
2011 09 ti trojmezí zkušenosti koalice
2011 09 ti trojmezí zkušenosti koalice2011 09 ti trojmezí zkušenosti koalice
2011 09 ti trojmezí zkušenosti koaliceKohoVolitEU
 
Grantový proces z pohledu osf final
Grantový proces z pohledu osf finalGrantový proces z pohledu osf final
Grantový proces z pohledu osf finalKohoVolitEU
 
20110924.ti prague
20110924.ti prague20110924.ti prague
20110924.ti pragueKohoVolitEU
 
Demagog.sk prezentacia srpen2011
Demagog.sk prezentacia srpen2011Demagog.sk prezentacia srpen2011
Demagog.sk prezentacia srpen2011KohoVolitEU
 
Naši politici 2011 np+kv
Naši politici 2011   np+kvNaši politici 2011   np+kv
Naši politici 2011 np+kvKohoVolitEU
 
Naši politici 2011 zindex
Naši politici 2011   zindexNaši politici 2011   zindex
Naši politici 2011 zindexKohoVolitEU
 
Prague 2011 marko rakar
Prague 2011 marko rakarPrague 2011 marko rakar
Prague 2011 marko rakarKohoVolitEU
 
Naši politici 2011 networking
Naši politici 2011   networkingNaši politici 2011   networking
Naši politici 2011 networkingKohoVolitEU
 
Prezentace datablog mapyhazardu_mucko
Prezentace datablog mapyhazardu_muckoPrezentace datablog mapyhazardu_mucko
Prezentace datablog mapyhazardu_muckoKohoVolitEU
 

Mais de KohoVolitEU (13)

Wdo a akademici 240911
Wdo a akademici 240911Wdo a akademici 240911
Wdo a akademici 240911
 
2011 09 ti trojmezí zkušenosti koalice
2011 09 ti trojmezí zkušenosti koalice2011 09 ti trojmezí zkušenosti koalice
2011 09 ti trojmezí zkušenosti koalice
 
Grantový proces z pohledu osf final
Grantový proces z pohledu osf finalGrantový proces z pohledu osf final
Grantový proces z pohledu osf final
 
Demagog praha
Demagog prahaDemagog praha
Demagog praha
 
20110924.ti prague
20110924.ti prague20110924.ti prague
20110924.ti prague
 
Demagog.sk prezentacia srpen2011
Demagog.sk prezentacia srpen2011Demagog.sk prezentacia srpen2011
Demagog.sk prezentacia srpen2011
 
Global voices
Global voicesGlobal voices
Global voices
 
Grebovka
GrebovkaGrebovka
Grebovka
 
Naši politici 2011 np+kv
Naši politici 2011   np+kvNaši politici 2011   np+kv
Naši politici 2011 np+kv
 
Naši politici 2011 zindex
Naši politici 2011   zindexNaši politici 2011   zindex
Naši politici 2011 zindex
 
Prague 2011 marko rakar
Prague 2011 marko rakarPrague 2011 marko rakar
Prague 2011 marko rakar
 
Naši politici 2011 networking
Naši politici 2011   networkingNaši politici 2011   networking
Naši politici 2011 networking
 
Prezentace datablog mapyhazardu_mucko
Prezentace datablog mapyhazardu_muckoPrezentace datablog mapyhazardu_mucko
Prezentace datablog mapyhazardu_mucko
 

Kamil Gregor: Hierarchický bayesovský model ekologické inference (prezentace pro New Media Inspiration 2013)