Una breve introduzione ad Elsa Morante, vita e opere
3 d-test of hypothesis
1. Stima dei parametri e test di ipotesi
LucioFontana-Expectations(MoMA),1959
Riccardo Rigon
2. R. Rigon
2
A cosa siamo realmente interessati ?
Solitamente, non si è interessati alle statistiche in se, ma a quello
che le statistiche dicono della popolazione.
• Potremmo, as esempio, usare la media delle precipitazioni annuali
misurate in tutte le stazioni idrometeorologiche per stimare la
precipitazione media annuale su tutta la penisola italiana.
• Oppure potremmo usare la media del campione per stabilire se la
precipitazione media annuale sia mutata lungo la durata del campione.
3. R. Rigon
3
Ipotesi Zero (Nulla)
Sui test di ipotesi avremo la possibilità di entrare nel dettaglio in
lezioni successive.
• In genere si ricordi, che è non è possibile provare con certezza
alcunchè. Una ipotesi si può tentare di provare che non sia vera. Sia
H0 l’ipotesi zero da provare.
• Se non si riesce a scartare H0 , allora si può affermare che “sia vera”
con un certo grado di confidenza
4. R. Rigon
4
Un esempio
• Consideriamo una variabile che può assumere solo quattro valori discreti,
N=4
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
• Consideriamo campioni di grandezza due, n=2
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
5. R. Rigon
5
Medie
Se consideriamo estrazioni con rimessa possiamo produrre infinite coppie
di numeri (la popolazione è infinita). Il numero di coppie distinte è però
legato a considerazioni combinatoriche.
Di ogni coppia estratta, posso evidentemente, calcolare la media:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
6. R. Rigon
6
Due Medie
Media della popolazione
Media del campione
Tre distribuzioni
Distribuzione della popolazione
Distribuzione del campione (composto da più estrazioni)
Distribuzione delle medie campionarie
7. R. Rigon
7
La popolazione
La popolazione è infinita, ma, per costruzione, gli elementi distinti sono
quattro e, quindi, la media esatta - il parametro - si può ottenere
esattamente dalla media dei quattro valori. Se ciascuno è estratto con
uguale probabilità:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
e:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
8. R. Rigon
8
Il campione
Se x1 = 2 e x2 =3 (un campione)
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
Dal calcolo combinatorico segue che possiamo
avere 16 campioni differenti
10. R. Rigon
10
La distribuzione delle medie è la seguente
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
11. R. Rigon
11
La media delle medie
è uguale alla media
Ovvero la media delle medie campionarie (tutte) è uguale alla
media della popolazione
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
12. R. Rigon
12
Supponiamo ora di avere a che fare con una popolazione
molto grande
Di cui non si riesca a calcolare la media esatta
Avendo a disposizione due campioni, avremo come nel
caso precedente due medie diverse.
Come possiamo capire se questi due campioni sono prescelti
dalla stessa popolazione. Come possiamo inferire se le medie
dei due campioni (le statistiche) sono rappresentative della
stessa media ?
13. R. Rigon
13
Un esempio: la media
Per rispondere alla domanda se due campioni hanno la stessa media,
possiamo procedere come segue:
•Determinare teoricamente quale distribuzione hanno le medie
•Assumere che la distribuzione teorica delle medie abbia parametri
determinati dalla prima media - Questa è chiamata ipotesi zero (o
anche nulla, dall’inglese “null” che significa però zero)
•Vedere come la seconda media si collocherebbe nella distribuzione
delle medie parametrizzata dalla prima serie di misure
•Scartare l’ipotesi zero se la collocazione della seconda media nella
distribuzione determinata dall’ipotesi zero è poco probabile.