Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
1. BRUZZESE SALVATORE MASTER MEP
Analisi Dati1
– POLITICHE DI WELFARE – STATA
Obiettivo Generale:
In merito alla scelta di adottare una politica di sostegno al reddito rivolta alla popolazione attiva, valutare la copertura del campione in relazione ai
sussidi, le caratteristiche demografiche, la possibilità di utilizzare 2 sussidi ed i dati ad essi connessi, le implicazioni economiche da sostenere in
relazione all’implementazione di una delle policy.
Campione:
La popolazione, composta da 7872 soggetti, è stata ridefinita escludendo outliers ed analizzando la bontà dei dati (missing); in particolare in base
alla definizione di popolazione attiva2
, sono stati presi in considerazione i soggetti appartenenti a determinate fasce di qualifica occupazionale
(apqual) e quelli non categorizzabili (categoria “altro”), escludendo casalinghe, benestanti, pensionati, studenti e bambini in età prescolare
(13<=apqual>19); i dati missing (coloro con reddito “y==.”) che rientrano nelle condizioni poste, escluse 2 incoerenze (disoccupati con reddito),
sono stati ricodificati in y=0 per evidenziare la presenza degli stessi nell’individuazione della soglia di povertà; inoltre si è proceduto alla
ridefinizione del campione escludendo gli outliers con redditi negativi (5 soggetti) e 4 elementi che presentavano un reddito oltre i 300000,
giungendo ad un campione di 4679 soggetti.
1
E’ stata mantenuta la codificazione decimali/migliaia di STATA, quindi i “.” indicano i decimali, le “,” le migliaia.
2
Secondo le definizioni adottate dall’ISTAT per popolazione attiva si intende l'insieme delle persone di età non inferiore ai 15 anni che, alla data del censimento, risultano:
1. occupate esercitando in proprio o alle dipendenze altrui una professione, arte o mestiere;
2. disoccupate ovvero hanno perduto il precedente lavoro e sono alla ricerca di una occupazione;
3. momentaneamente impedite a svolgere la propria attività lavorativa in quanto inquadrabili come: militari di leva (o in servizio civile), volontari, richiamati; ricoverati da
meno di due anni in luoghi di cura e assistenza; detenuti in attesa di giudizio o condannati a pene inferiori a 5 anni;
4. alla ricerca di prima occupazione, non avendone mai svolta alcuna in precedenza.
Le persone di cui ai punti 1), 2), 3) costituiscono la popolazione attiva in condizione professionale.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 1
2. BRUZZESE SALVATORE MASTER MEP
Descrizione politiche:
1. politica di sussidio alle famiglie numerose (ncomp>=4): i gruppi interessati dal sussidio (treated) sono pari al 44,6% (2085/4681) del
campione; includendo i missing (ex 259, ora y=0, in cerca di prima occupazione o disoccupati o militari) la mediana del reddito (taglia il
campione al 50% ed in quanto valore interno rende minima la somma delle differenze in valore assoluto, senza risentire dei valori estremi)
dei treated è (taglio al 50%) 16659.9>16023.4 (control), in media3
19585.4:19264.8 (treated:control) e varianza4
simile => dispersione
simile attorno alla media, i due sottocampioni hanno una distribuzione similare; il sottocampione dei soggetti trattati è caratterizzato dalle
seguenti caratteristiche: il 96,8% sono coniugati, maschi (66,4%), lavoratori (95%) full-time (89,2%), impiegati in prevalenza nel pubblico
(28,7%), nel settore manifatturiero (23,5%), nel commercio (15,2%), il 58,3% di n svolge la professione di operaio (32.1%) ed impiegato
(26,2%), il 10,3% è lavoratore autonomo, l’86.5% rientra fino alla 3° classe di reddito, dai 30000 in giù, con prevalenza del reddito tra
10000 e 20000 (44.1%), la classe d’età prevalente è quella tra i 40 ed i 50 anni (46,3%), la classe inferiore (solo il 2.7%) è quella dai 20 ai 30
anni; n ha un’età al di sopra dei 40 anni (74,2%), è in prevalenza impiegato e percepisce una retribuzione dai 10000 ai 20000;
2. politica di sussidio a famiglie con figli con età<=3 (eta): i treated sono l’11,7% del campione (548/4679) e percepiscono un reddito al (II
percentile) di 16214.1<16250 (control, 4131), in media 19024.5:19458.5 (treated:control) e varianza maggiore nel control; il sottocampione
dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 97,1% sono coniugati, maschi (66,4%), lavoratori (95,4%) full-time
(88%), impiegati in prevalenza nel settore manifatturiero (27,9%), nel pubblico (22,2%), nel commercio (15,9%), il 65,5% di n svolge la
professione di operaio (33,4%) ed impiegato (32,1%), il 9,1% è lavoratore autonomo, l’87,4% rientra fino alla 3° classe di reddito, dai 30000
in giù, con prevalenza del reddito tra 10000 e 20000 (48,2%), la classe d’età prevalente è quella tra i 30 ed i 40 anni (65,9%); n è
relativamente giovane e lavora (81% sotto i 40 anni), è in prevalenza impiegato o operaio e percepisce una retribuzione dai 10000 ai 20000;
3
Il calcolo della media si basa su tutte le osservazioni, è perciò influenzata dai valori estremi; la mediana è influenzata dal numero delle osservazioni, non dalla grandezza dei
valori estremi => trascurando l’eventualità di ripetizione delle osservazioni, un’osservazione scelta a caso ha la stessa probabilità di essere più grande della mediana che di essere
più piccola. Nel nostro campione, in quanto adeguatamente ridefinito dagli outliers la media può essere tranquillamente utilizzata come indicatore veritiero del valore di posizione
più comune, nonostante ciò si è preferito fare i confronti sulla mediana (definita misura robusta, assieme alla media interquartile [(Q1+Q2)/2]), ragionando con i box plot.
4
Varianza e Dev.Std.(radice quadrata varianza) misurano la dispersione media attorno ad un indice di posizione quale la media: sono ottenute valutando come le osservazioni più
grandi oscillano sopra la media e come le osservazioni più piccole si distribuiscono al di sotto della media.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 2
3. BRUZZESE SALVATORE MASTER MEP
3. politica di sussidio alle famiglie sotto la soglia di povertà (y<=mediana/2): i gruppi potenzialmente beneficiari del sussidio sono il 14,2%
(662/4679) del campione e percepiscono un reddito mediano pari a 3500<8125 (soglia di povertà), mentre il reddito che taglia al 50% il
gruppo control è 18000; il sottocampione dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 84% sono coniugati, donne
(58,3%), lavoratori (60,8%) part-time (54,3%), il 68,3% lavora nel commercio (22%), nel settore manifatturiero (19,5%), nell’agricoltura
(15,7%) e nell’edilizia (11,1%), un ~23% è distribuito tra impiego pubblico e servizi alla persona, con leggera prevalenza del primo, il
31,7% svolge la professione di operaio, il 30,5% è disoccupato, tutti rientrano nella 1° fascia di reddito, dai 10000 in giù; n è contraddistinto
dalla maggiore presenza femminile rispetto ai primi 2 sussidi, è equamente distribuita in classi dai 30 anni in su (~30% x 3), è impiegata
come operaio o disoccupata in prevalenza part-time (i primi 2 treated sono impiegati full-time, per più dell’80%) e percepisce una bassa
retribuzione, sotto la media degli altri sussidi.
Nelle tabelle allegate è possibile distinguere ulteriormente i sottocampioni per indici di posizione e di dispersione, con particolare evidenza al CV5
(coefficiente di variazione), in relazione al reddito ed all’appartenenza al gruppo teated/control di ogni sussidio:
1. sussidio numerosità:
a. indici di posizione:
i. control: classe modale6
(2° classe, 10000<y>=20000), densità relativa7
=0.12 e moda(punto centrale)=15000, percentile
(quartili: q1=11700, q2=16023.4 [mediana], q3= 23200), media (19264.8); la forma della distribuzione è obliqua8
a destra9
(media>mediana: asimmetria positiva).
5
Il coefficiente di variazione è un indice relativo dato dal rapporto tra deviazione standard e media => misura la dispersione (in %) nell’insieme dei dati relativamente alla media.
6
Per la moda sono state utilizzate le classi di reddito precedentemente individuate, da cui è strettamente dipendente; la moda corrisponde alla metà della somma dei valori estremi
della classe (punto centrale).
7
Per densità relativa si intende il rapporto tra ni ed ampiezza classe, da considerare nel caso in cui le classi siano di ampiezza non uniforme (es. ultima classe da 50000 in poi).
8
Valori estremamente piccoli (lunghe code a destra o sinistra), che attirano la media verso il basso/alto rendendola più piccola/grande della mediana.
9
Nel box-plot, se la distribuzione è obliqua a destra, ad esempio, le poche osservazioni grandi distorcono il midrange e la media verso la coda di destra, quindi ci aspetteremo un
ordinamento delle misure di posizione di questo tipo: moda<mediana<media interquartile<media<midrange.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 3
4. BRUZZESE SALVATORE MASTER MEP
ii. treated: classe modale (2° classe), densità relativa=0.09 e moda=15000, percentile (quartili: q1=11991.8, q2=16659.9
[mediana], q3=24000), media (19585.4); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria
positiva).
b. indici di dispersione (tendenza di y ad assumere valori diversi da un centro):
i. control: range10
(238704.8), cv= 0.81=81% (nelle tabelle è possibile leggere sia varianza che dev. std.11
);
ii. treated: range (220941.1), cv= 0.78=78%;
2. sussidio figli:
a. indici di posizione:
i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=11700, q2=16250 [mediana],
q3=23606), media (19458.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
ii. treated: classe modale (2° classe), densità relativa=0.03 e moda=15000, percentile (quartili: q1=12000, q2=16214.1
[mediana], q3=23736.3), media (19024.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria
positiva).
b. indici di dispersione:
i. control: range (238704.8), cv= 0.81=81%;
ii. treated: range (138000), cv= 0.72=72%;
3. sussidio reddito: la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
a. indici di posizione:
i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=13650, q2=18000 [mediana],
q3= 25193), media (22058.3); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
10
Il range totale (osservazione più grande – più piccola) è una misura di dispersione, a differenza del range interquartile (|Q3-Q1|) che è una misura della dispersione centrale.
11
Più i dati sono dispersi (> varianza), maggiore sarà il range, il range interquartile, la varianza e la dev. std. (indica il raggio (Xmedio±1Dev.Std.) entro cui si raggruppano i
valori di y, in questo caso, dalla media) => la somma e la dev. std. aiuta a definire in quale intervallo si concentra almeno la maggior parte dei valori osservati.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 4
5. BRUZZESE SALVATORE MASTER MEP
ii. treated: classe modale (1° classe, y<=10000), densità relativa=0.07 e moda=5000, percentile (quartili: q1=0, q2=3500
[mediana], q3= 6414.3), media (3323.7); la forma della distribuzione è obliqua a sinistra (media<mediana: asimmetria
negativa).
b. indici di dispersione:
i. control: range (230539.8), cv= 0.68=68%;
ii. treated: range (8450), cv= 0.93=93%;
La varianza maggiore (in realtà dal cv si nota quasi la stessa dispersione, proporzionata alla media tra control del sussidio per numerosità e control
del sussidio per figli piccoli: 0.80902994 e 0.80647532) è quella presente nel gruppo control della politica di sussidio per figli (2.46e+08), mentre
quella minore è quella dei treated della politica di sussidio per reddito (9.67e+06); all’interno delle politiche, quella del reddito presenta la maggiore
disparità tra varianza dei treated e varianza del control => in base al cv si riscontra che il reddito dei poveri è altamente variabile (da notare la
differenza interquartile dal box-plot) e più eterogeneo, ha una maggiore variabilità (tendenza ad assumere valori diversi) rispetto ai non trattati,
nonostante che questi si muovano entro un range quasi triplo.
Connessione tra politiche cumulate (Chi2 Normalizzato connessione tra 0 e 1) e copertura campione:
1. sussidio per numerosità e sussidio per età figli: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di
entrambe le politiche, è pari a 310 (su 4679), cioè il 6,6% di N, cioè il 56,6% dei beneficiari del sussidio alle famiglie con figli piccoli ed il
14,9% dei treated all’interno dei sussidiati per numerosità dei componenti. Il chi2N evidenzia un valore prossimo ad una condizione di
indipendenza, confermata dai valori di Pr (0.00) < 0.005.
2. sussidio per età figli e reddito: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche, è
pari a 67 (su 4679), cioè l’1,4% di N, cioè il 10% dei beneficiari del sussidio alle famiglie numerose ed il 12,2% dei treated all’interno dei
sussidiati perché con figli d’età minore o uguale ai 3 anni. Il chi2N dimostra una bassissima connessione.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 5
6. BRUZZESE SALVATORE MASTER MEP
3. sussidio per reddito e numerosità: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche,
è pari a 300 (su 4679), cioè l’6,4% di N, cioè il 45,3% dei beneficiari del sussidio alle famiglie povere ed il 14,4% dei treated all’interno dei
sussidiati perché con famiglie numerose. Il chi2N dimostra la più bassa connessione possibile (a causa del valore Pr elevato tale giudizio non
è significativo statisticamente per la popolazione, a differenza della prima forma di cumulabilità [numerosità x figli]).
L’indice di connessione12
(Chi2N=chi2/(n min[righe-1, colonne-1])) ha rivelato nelle associazioni fatte tra politiche una chiara indipendenza
statistica (la connessione misura la distanza dall’indipendenza, qui statisticamente molto vicina all’indipendenza, come si evince anche dal
coefficiente di correlazione lineare elevato al quadrato indica quanto una retta che passa per la nuvola dei punti sia in grado di “cogliere” la
relazione tra X ed Y).
Calcolando la differenza tra reddito medio per gruppi, distinti per ogni politica13
, si nota che la differenza maggiore tra (ymedio)teated e
(ymedio)control del sussidio vincolato alla soglia di povertà, pari a |-18734.6|, è più di 40 volte quella della 2° politica e della 1°; perciò nella 3°
politica è presente una elevata sproporzione in media tra i due gruppi, avendo due stistribuzioni non simmetriche opposte => aumenta la probabilità
che il sussidio agisca effettivamente su un target bisognoso (effettivamente la dev std diminuisce al diminuire del reddito, è ~5 volte inferiore).
REGRESSIONE LINEARE14
: permette di studiare come varia un fenomeno in relazione di un altro, in questo caso come varia il reddito in
relazione al sussidio.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 6
12
Verifica l’indipendenza tra 2 fattori in una tabella di contingenza r righe e c colonne.
13
La differenza tra reddito medio della politica per famiglie numerose è circa 160, dovute alla maggiore forza lavoro presente in famiglia, mentre la differenza tra sussidiati e non
nella politica figli è quasi nulla e questo dovrebbe portare a riflettere sulla necessità di intervento.
14
Correlazione e regressione (le correlazioni identificate dal file .do sono ritenute significative al di sotto di 0.05 e sono contrassegnate da un asterisco) non sono la stessa cosa,
possiamo trovare un'identica correlazione tra due serie di valori senza che questo implichi che le due serie di valori siano descritte da rette identiche (cioè con la stessa intercetta e
la stessa pendenza), viceversa noi possiamo comunque essere interessati a stimare un certo valore di y a partire da un valore dato di x (cioè la regressione di y su x), anche se la
forza della loro associazione non è elevata; quando siamo interessati a prevedere che valore assume la variabile y in coincidenza di un certo valore di x, il nostro problema non è
7. BRUZZESE SALVATORE MASTER MEP
Y=a+bX+e15
y=a+b(sussidio)
1. 1° politica: y= 19264.816
+ 320.617
(politica_numerosità) il modello proposto prevede che se X aumenta di 1 unità (passaggio da control a
treated) => si ha un incremento di y(reddito) in media pari a 320.6, ma R218
=0.001% (questo vuol dire che lo 0% della variabilità di y è
spiegato dalla concomitante variabilità di X) ed il t-test per la politica della numerosità è 0.70 (0.70²=F); prevista H0 (ipotesi nulla che il
coefficiente del sussidio non è significativamente diverso da 0), avrò che |t19
|<1,96 e p20
>0.005 => H0 è vera, la relazione di X su Y non è
significativa.
2. 2° politica: y= 19458.5-434(politica_figli) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a treated) => si
ha un decremento di y(reddito) in media pari a 434, ma R2=0.001% ed il t-test per la politica dei figli piccoli è -0.62 (-0.62²=F); prevista H0,
avrò che |t|<1,96 e p>0.005 => H0 è vera, la relazione di X su Y non è significativa.
3. 3° politica: y= 22058.3-18734.6(politica_reddito), ) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a
treated) => si ha un decremento di y(reddito) in media pari a 18734.6, R2=17.8%, il t-test per la politica della numerosità è -31.8 (-21.8²=F);
tanto la forza dell'associazione tra le due variabili quanto la stima (che sarà ovviamente più o meno precisa in dipendenza della forza della loro correlazione) di una variabile
essendo nota l'altra.
15
“e” rappresenta il residuo, cioè la distanza tra i punti e la retta di regressione, visibili in STATA col comando “predict e, residual” (vedi file.do).
16
L’intercetta indica il valore posseduto da y quando X=0, in questo corrisponde alla condizione del control.
17
Il coefficiente di b, cioè il valore incrementale della condizione 1 del sussidio (tale in quanto variabile dummy 0-1) rispetto alla condizione 0 (coefficiente a, cioè l’intercetta),
rappresenta in questo caso la differenza in media tra la condizione 0 e la condizione 0+1 del reddito medio dato alla condizione 0 dal valore dell’intercetta.
18
R2 o coefficiente di determinazione, esprime in che misura la variabilità di una certa variabile y si associa a quella di un'altra; è la proporzione di varianza spiegata dalla/e
variabile/i indipendente/i = SSModel/SSTotal. Sfruttando i coefficienti di correlazione significativi ed elevandoli al quadrato è possibile prevedere R2, coi relativi errori di
approssimazione, ed evidenziare così quanto una retta che passa per la nuvola di punti cogli la relazione tra X e Y.
19
Il livello di significatività statistica scelto è p<=0.005.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 7
20
p mi dice quanto la relazione individuata dal repressore sulla variabile dipendente e valida spostando il modello sulla popolazione; posto p<0,05, avrò che la relazione si
verificherà sulla popolazione al 95%, se p<0,001 => la validità sarà del 99%.
8. BRUZZESE SALVATORE MASTER MEP
prevista H0, avrò che |t|>1,96 e p<0.005 => H0 è falsa, la relazione di X su Y è significativa ed il coefficiente del sussidio è
significativamente diverso da 0 e si muove all’interno di un intervallo di confidenza del 95%, tra -19887.99 e -17581.23.
Solo l’ultimo modello verifica che la politica di sussidio per povertà sia significativamente predittore del reddito, cioè con l’aumento di una unità di
X si ha un decremento di Y in media pari a 18734.6 => si deduce che l'assegnazione del trattamento a classi svantaggiate, come nel caso delle
famiglie povere, determinate sulla base di un reddito inferiore al 50% della mediana, porti a risultati più significativi su questa classe, che
permettono di usare il modello di previsione (sul predittore della politica sussidiata) validi al 95% (p<0.005, quasi certo, poiché p<0.001, cioè 99%)
sulla popolazione.
L’unica politica con la differenza di y in media tra treated e control statisticamente significativa è quella per reddito.
REGRESSIONE MULTIPLA21
: permette di studiare come varia un fenomeno in relazione di altri, in questo caso come varia il reddito in relazione
al sussidio ed alcune caratteristiche demografiche.
Y=a+bX+cZ+dW…+e
Y=a+b(sussidio)+c(professione)+d(genere)+e(studio)+f(part-time)+g(lavora)+h(part-time)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 8
21
Un modello statistico è tanto più efficiente quanto minore è il numero di variabili indipendenti (explanatory variables) che utilizza per predire (con adeguata accuratezza) la
variabile dipendente; ad esempio se abbiamo 7 variabili indipendenti ci possiamo chiedere quali di queste 7 vale la pena introdurre nell'equazione, ovviamente una variabile
indipendente con un coefficiente standardizzato basso contribuisce poco alla stima della variabile dipendente e complica inutilmente l’equazione multipla, perciò per costruire un
modello multiplo possiamo partire da una sola variabile indipendente e quindi aggiungerne una seconda, se il coefficiente di determinazione (R2) aumenta possiamo giudicare
opportuno utilizzare anche la seconda variabile indipendente, procediamo quindi con una terza variabile e ripetiamo la stessa verifica e così via. Questo modo di procedere
introducendo una variabile per volta è la tecnica stepwise.
9. BRUZZESE SALVATORE MASTER MEP
Aggiungendo queste caratteristiche si arriva a spiegare con i predittori il ~35.6% di variabilità di y col sussidio per numerosità e per figli piccoli,
mentre si raggiunge il 38.2% col sussidio per povertà => quest’ultimo come precedentemente detto è quello che spiega al meglio la variazione, in
base alla significatività dello stesso e delle variabili indipendenti introdotte.
Fundamental Problem of Causal Inference:
Outcome(reddito): continuo
Tratment(sussidio): binario [Si=0;Si=1]
Effetto Treatment: differenza di outcome per l’i-esimo individuo tra ricevere e non ricevere il treatment MA l’individuo è osservato in un solo stato
del mondo => senza assegnamento casuale non ho controfattuale22
, cioè l’outcome dei treated se non avessero ricevuto il treatment:
yi=Si 23
=> yi(1)= outcome treated24
yi(0)= outcome non treated
in ciascun individuo avrò che Si=1 + controfattuale avrà un effetto causale =yi(1)-yi(0) ==> dato che non osserviamo yi(1) e yi(0)
contemporaneamente, qualsiasi parametro che dipenda dalla distribuzione congiunta di yi(1) e yi(0) non può essere stimato.
Io posso stimare solo y(1), solo se Si=1 e y(0), solo se Si=0.
ATT=valore atteso di y(1) alla condizione Si=1 – valore atteso controfattuale
22
Valore dato dalla seguente condizione posta per il valore atteso: E(yi(0)|Si=1.
23
S e y sono correlate (b è significativamente diverso da 0) MA non casuali => ragiono su casualità
24
La media dell’outcome per i trattati ci attendiamo sia diversa da quella per un individuo scelto a caso.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 9
10. BRUZZESE SALVATORE MASTER MEP
distorsione dovuta alla selezione del treatment= E{yi(0) |Si=1}-E{yi(0)|Si=0}
Ho ad esempio che yi(1)=a+b(Si==1) e yi(0)=a+b(Si==0), devo calcolare la differenza attesa di outcome tra coloro che sono stati sottoposti al
treatment (Si=1) e coloro che invece non sono stati sottoposti al treatment (Si=0), valutato nello stato di non treatment (yi[0]).
I POLITICA
yi(1)=19264.8+320.6(Si=1)
yi(0)=19585.4-320.6(Si=0) yi(0)=19585.4+320.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il vero
effetto.
II POLITICA
yi(1)= 19458.5-434(Si=1)
yi(0)= 19024.5+434(Si=0) yi(0)= 19024.5-434(Si=1) E[yi(0)|Si=0]>E[yi(0)|Si=1] Le stime sul campione tendono a sottostimare il vero
effetto.
I POLITICA
yi(1)= 22058.3-18734.6(Si=1)
yi(0)= 3323.7-18734.6(Si=0) yi(0)= 3323.7+18734.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il
vero effetto.
Ridistribuzione equiparata reddito:
1. Sussidio numerosità (unica politica che richiederebbe di sussidiare il control, va riformulata):
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 10
11. BRUZZESE SALVATORE MASTER MEP
a. Differenze in media y treated/control= |320.6|
b. Costo per lo Stato=320.6*208525
=668451
2. Sussidio figli:
a. Differenze in media y treated/control= |-434|
b. Costo per lo Stato=434*548=237832
3. Sussidio reddito:
a. Differenze in media y treated/control= |-18734.6|
b. Costo per lo Stato=18734.6*662=12402305
La politica che richiede meno risorse per essere implementata è la seconda politica, quella sulla presenza di figli piccoli.
Tale politica copre il 11.7% (548/4679) del campione, di cui 67/662 (10,1%) soggetti con reddito sotto la soglia di povertà in famiglie numerose e
310/2085 (14.9%) in famiglie numerose.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 11
25
Questo è il totale dei treated all’interno della politica adottata.
12. BRUZZESE SALVATORE MASTER MEP
ALLEGATI
GRAFICI:
0.00001.00002.00003.00004.00005
Density
0 50000 100000 150000 200000 250000
reddito
Kernel density estimate
Normal density
050,000100000150000200000250000
reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 12
13. BRUZZESE SALVATORE MASTER MEP
operai impiegati
insegnanti quadri
dirigenti libero professionista
imprenditore individuale lavoratore autonomo/artigiano
titolare impresa familiare socio/gestore società
in cerca di prima occupazione disoccupato
militare di leva control_num treated_num
control_figli treated_figli control_reddito treated_reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 13
14. BRUZZESE SALVATORE MASTER MEP
0.511.5
Density
1 2 3 4 5 6
classi di reddito (6)
Kernel density estimate
Normal density
18--| 30 30--| 40
40--| 50 50--| 65
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 14
15. BRUZZESE SALVATORE MASTER MEP
0--| 10e+3 10e+3--| 20e+3
20e+3--| 30e+3 30e+3--| 40e+3
40e+3--| 50e+3 50e+3--| 238,7e+3
0.01.02.03.04.05
Density
20 30 40 50 60 70
età
Kernel density estimate
Normal density
050,000100000150000200000250000
control_num treated_num
reddito
Graphs by sussidio alle famiglie numerose (n. componenti >= 4)
050,000100000150000200000250000
control_figli treated_figli
reddito
Graphs by sussidio alle famiglie con figli da 0 a 3 anni
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 15
16. BRUZZESE SALVATORE MASTER MEP
050,000100000150000200000250000
control_reddito treated_reddito
reddito
Graphs by sussidio alle famiglie sotto la soglia di povertà
02,0004,0006,0008,000
reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 16
17. BRUZZESE SALVATORE MASTER MEP
FILE “.do”:
clear all
set mem 20000
set mat 800
capture log close
log using E:ProgrammiStataVerificheProjectproject.log,replace
use E:ProgrammiStataVerificheProjectcomune.dta, replace
******************************************************
******************************************************
******* BRUZZESE Salvatore - STATA - MEP/MEGAS *******
******************************************************
******************************************************
*describe
* etichette variabili
label var staciv "stato civile"
label var studio "titolo di studio"
label var apqual "tipo di occupazione"
label var sex "genere"
label var partime "tipologia lavoro"
label var ncomp "numero componenti famiglia"
label var parent "posizione nella famiglia"
label var anasc "anno di nascita"
label var ireg "regione di residenza"
label var eta "età"
label var y "reddito"
label var nchild0_3 "figli con età tra 0 e 3 anni"
label var nchild4_10 "figli con età tra 4 e 10 anni"
label var nchild11_15 "figli con età tra 11 e 15 anni"
label var nchild "figli minori di 15 anni"
label var lavora "lavoratori"
label var nquest "numero questionario"
label var apsett "settore lavorativo"
*describe
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 17
18. BRUZZESE SALVATORE MASTER MEP
* etichette valori
label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero
professionista" 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10
"socio/gestore società" 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15
"pensionato da lavoro" 16 "pensionato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva"
20 "altro"
label val apqual tipodioccupazione
label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma
universitario" 7 "laurea" 8 "post laurea"
label val studio titolodistudio
label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a"
label val staciv statocivile
label define sesso 1 "uomo" 2 "donna"
label val sex sesso
label define tipologialavoro 1 "full-time" 2 "part-time"
label val partime tipologialavoro
label define lavoratori 0 "non lavoratore" 1 "lavoratore"
label val lavora lavoratori
label define settorelavorativo 1 "agricoltura" 2 "manifatturiero" 3 "costruzione" 4 "commercio" 5" trasporti" 6
"banche" 7 "serv. finanz." 8 "serv.person." 9 "pubblico" 10 "org.internaz"
label val apsett settorelavorativo
*********************
* SOLUZIONE QUESITI *
*********************
*browse _all
*codebook _all
* Definizione campione
tab apqual, nolab
drop if apqual>=13 & apqual<19 & y==.
tab apqual if y==.
drop if apqual>=13 & apqual<19
drop if apqual==20
tab apqual lavora if y==.
tab apqual partime if y==.
tab partime lavora if y==.
inspect partime if y==.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 18
browse y apqual partime lavora if y==.
19. BRUZZESE SALVATORE MASTER MEP
browse nquest y apqual partime lavora if apqual==11
* 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
browse nquest y apqual partime lavora if apqual==12
* 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
browse nquest y apqual partime lavora if apqual==19
* Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage o
tirocini non retribuiti.
* Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà.
drop if nquest==22168|nquest==2970
replace y=0 if y==.
graph pie, over(apqual) angle(90)
graph pie, over(lavora) angle(90)
graph pie, over(partime) angle(90)
*inspect
* Analisi grafica y
symplot y
graph box y
kdensity y, normal
hist y, normal bin(20) xlabel(0(25000)250000)
inspect y
sum y, detail
keep if y<313913
drop if y<0
count
inspect y
sum y, detail
ge politica_numerosità=0
replace politica_numerosità=0 if ncomp<4
replace politica_numerosità=1 if ncomp>=4
label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)"
label define trattamento1 1 "treated_num" 0 "control_num"
label val politica_numerosità trattamento1
tab politica_numerosità
browse apqual y if politica_numerosità==1
by politica_numerosità, sort: sum y, detail
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 19
graph pie, over(politica_numerosità) angle(90)
20. BRUZZESE SALVATORE MASTER MEP
ge politica_figli=0
replace politica_figli=1 if nchild0_3>=1
* includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0
replace politica_figli=0 if nchild0_3==0
label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni"
label define trattamento2 1 "treated_figli" 0 "control_figli"
label val politica_figli trattamento2
tab politica_figli
by politica_figli, sort: sum y, detail
graph pie, over(politica_figli) angle(90)
ge politica_reddito=0
ge mediana=16250/2
display mediana
replace politica_reddito=0 if y>=mediana
replace politica_reddito=1 if y<mediana
label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà"
label define trattamento3 1 "treated_reddito" 0 "control_reddito"
label val politica_reddito trattamento3
tab politica_reddito
by politica_reddito, sort: sum y, detail
graph pie, over(politica_reddito) angle(90)
* Politiche Cumulate
tab politica_numerosità politica_figli, row col freq chi2
by politica_numerosità, sort: tab politica_figli
ge chi2n_num_figli=36.2317/(4679*1)
label var chi2n_num_figli "chi2 normalizzato numerosita/figli"
display chi2n_num_figli
* % treated incrociati su N
display 310/4679*100
* i trattati su N coprono il 6,6%
tab politica_figli politica_reddito, row col chi2
ge chi2n_figli_reddito=1.8878/(4679*1)
label var chi2n_figli_reddito "chi2 normalizzato figli/reddito"
display chi2n_figli_reddito
display 67/4679*100
tab politica_numerosità politica_reddito, row col chi2
label var chi2n_reddito_numerosità "chi2 normalizzato reddito/numerosità"
ge chi2n_reddito_numerosità=0.1786/(4679*1)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 20
21. BRUZZESE SALVATORE MASTER MEP
display chi2n_reddito_numerosità
display 300/4681*100
summ y, detail
histogram y, percent normal
graph hbox y, medtype(cline) medline(lcolor(red))
gen classi_reddito=0
replace classi_reddito=1 if y<=10000
replace classi_reddito=2 if y>10000 & y<=20000
replace classi_reddito=3 if y>20000 & y<=30000
replace classi_reddito=4 if y>30000 & y<=40000
replace classi_reddito=5 if y>40000 & y<=50000
replace classi_reddito=6 if y>50000
label var classi_reddito "classi di reddito (6)"
label define yrecode 1 "0--| 10e+3" 2 "10e+3--| 20e+3" 3 "20e+3--| 30e+3" 4 "30e+3--| 40e+3" 5 "40e+3--| 50e+3" 6
"50e+3--| 238,7e+3"
label val classi_reddito yrecode
tab classi_reddito
by politica_numerosità, sort: tab classi_reddito
kdensity classi_reddito if politica_numerosità==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_numerosità==1, normal ylabel(0(.1)1)
by politica_figli, sort: tab classi_reddito
kdensity classi_reddito if politica_figli==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_figli==1, normal ylabel(0(.1)1)
by politica_reddito, sort: tab classi_reddito
kdensity classi_reddito if politica_reddito==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_reddito==1, normal ylabel(0(.1)1)
graph pie, over(classi_reddito) angle(90)
kdensity classi_reddito, normal
graph pie, over(classi_reddito) angle(90)
graph pie if politica_numerosità==1, over(classi_reddito) angle(90)
graph pie if politica_figli==1, over(classi_reddito) angle(90)
graph pie if politica_reddito==1, over(classi_reddito) angle(90)
sum eta, detail
histogram eta, normal percent
graph hbox eta
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 21
ge classi_età=0
22. BRUZZESE SALVATORE MASTER MEP
replace classi_età=1 if eta<=30
replace classi_età=2 if eta>30&eta<=40
replace classi_età=3 if eta>40&eta<=50
replace classi_età=4 if eta>50
label var classi_età "classi di eta (4)"
label define recode_eta 1 "18--| 30" 2 "30--| 40" 3 "40--| 50" 4 "50--| 65"
label val classi_età recode_eta
tab classi_età
tab classi_età if politica_numerosità==1
tab classi_età if politica_figli==1
tab classi_età if politica_reddito==1
graph pie, over(classi_età) angle(90)
kdensity eta, normal
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_numerosità==1
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_figli==1
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_reddito==1
* indici di posizione
by politica_numerosità, sort: sum y, detail
tab classi_reddito politica_numerosità
* densità relativa classe modale control
display 1200/10000
* densità relativa classe modale treated
display 921/10000
by politica_figli, sort: sum y, detail
tab classi_reddito politica_figli
* densità relativa classe modale control
display 1857/10000
* densità relativa classe modale treated
display 264/10000
by politica_reddito, sort: sum y, detail
tab classi_reddito politica_reddito
* densità relativa classe modale control
display 2121/10000
* densità relativa classe modale treated
display 662/10000
* indici di dispersione
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 22
* range politica numerosità control
23. BRUZZESE SALVATORE MASTER MEP
display 238704.8-0
* range politica numerosità treated
display 220941.1-0
* range politica figli control
display 238704.8-0
* range politica figli treated
display 138000-0
* range politica reddito control
display 238704.8-8165
* range politica reddito treated
display 8450-0
* CV - coefficiente di variazione
tab politica_numerosità, sum(y)
* CV Control
display 15585.8/19264.8
* CV Treated
display 15325.8/19585.4
tab politica_figli, sum(y)
* CV Control
display 15692.8/19458.5
* CV Treated
display 13677.6/19024.5
tab politica_reddito, sum(y)
* CV Control
display 15082.99/22058.3
* CV Treated
display 3109.0372/3323.7
* Confronto visivo box-plot (min, q1, q2 [mediana], q3, max, outliers)
graph box y, by(politica_numerosità)
graph box y, by(politica_figli)
graph box y, by(politica_reddito)
graph box y if politica_reddito==1
graph box y if politica_reddito==0
ge differenza_medie_numerosità= 19264.806-19585.362
ge differenza_medie_figli=19458.482-19024.451
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 23
ge differenza_medie_reddito=22058.281-3323.6727
24. BRUZZESE SALVATORE MASTER MEP
display differenza_medie_numerosità, differenza_medie_figli, differenza_medie_reddito
* Regressione Y=y e X=politiche: Y=a+bX+e
regress y politica_numerosità
pwcorr y politica_numerosità, star(.05)
regress y politica_figli
pwcorr y politica_figli, star(.05)
regress y politica_reddito
pwcorr y politica_reddito, star(.05)
regress y politica_numerosità apqual partime lavora sex studio eta
pwcorr y politica_numerosità apqual partime lavora sex studio eta, star(.05)
regress y politica_figli apqual partime lavora sex studio eta
pwcorr y politica_figli apqual partime lavora sex studio eta, star(.05)
regress y politica_reddito apqual partime lavora sex studio eta
pwcorr y politica_reddito apqual partime lavora sex studio eta, star(.05)
* ESEMPIO Metodo alternativo REGRESSIONE-DUMMY TREATED (volendo si possono creare variabili dummy dalle variabili
indipendenti utilizzate e voncolare ad una condizione particolare l'analisi, creando particolari gruppi di riferimento)
char politica_numerosità[omit] 0
xi: regress y i.politica_numerosità
* Guppo di riferimento: donne, occupate part-time, tra i 30 e 40 anni
char sex [omit] 1
char partime [omit] 1
char classi_età [omit] 2
xi: regress y i.politica_numerosità apqual i.partime i.sex studio i.classi_età
* ESEMPIO Regressione lineare con residui e
regress y politica_numerosità
predict feeted_values
predict e, residual
list y feeted_values in 1/10
list y e in 1/10
scatter y politica_numerosità
twoway (scatter y politica_numerosità) (lfit y politica_numerosità)
twoway (scatter y politica_numerosità, mlabel(y)) (lfit y politica_numerosità)
correlate y politica_numerosità apqual nchild ncomp partime nchild0_3
drop e feeted_values
* Parificazione reddito control/treated per sussidio - Valutazione politica più economica
* Numerosità
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 24
** Costo sussidio
25. BRUZZESE SALVATORE MASTER MEP
display 320.6*2085
* Figli
** Costo sussidio
display 434*548
* Reddito
** Costo sussidio
display 18734.6*662
* Soggetti beneficiari alle condizioni poste tra tutti i sussidi (famiglia povera, numerosa e con figli piccoli)
inspect nquest if politica_numerosità==1 & politica_figli==1 & politica_reddito==1
* ATT
char politica_numerosità[omit] 0
xi: regress y i.politica_numerosità
char politica_numerosità[omit] 1
xi: regress y i.politica_numerosità
tab politica_numerosità, summ(y)
char politica_figli[omit] 0
xi: regress y i.politica_figli
char politica_figli[omit] 1
xi: regress y i.politica_figli
tab politica_figli, summ(y)
char politica_reddito[omit] 0
xi: regress y i.politica_reddito
char politica_reddito[omit] 1
xi: regress y i.politica_reddito
tab politica_reddito, summ(y)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 25
26. BRUZZESE SALVATORE MASTER MEP
OUTPUT FILE “.do”:
-----------------------------------------------------------------------------------------------------------------------
----
log: E:ProgrammiStataVerificheProjectproject.log
log type: text
opened on: 31 Jan 2007, 02:26:44
. use E:ProgrammiStataVerificheProjectcomune.dta, replace
.
. ******************************************************
. ******************************************************
. ******* BRUZZESE Salvatore - STATA - MEP/MEGAS *******
. ******************************************************
. ******************************************************
.
. *describe
.
. * etichette variabili
. label var staciv "stato civile"
. label var studio "titolo di studio"
. label var apqual "tipo di occupazione"
. label var sex "genere"
. label var partime "tipologia lavoro"
. label var ncomp "numero componenti famiglia"
. label var parent "posizione nella famiglia"
. label var anasc "anno di nascita"
. label var ireg "regione di residenza"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 26
. label var eta "età"
27. BRUZZESE SALVATORE MASTER MEP
. label var y "reddito"
. label var nchild0_3 "figli con età tra 0 e 3 anni"
. label var nchild4_10 "figli con età tra 4 e 10 anni"
. label var nchild11_15 "figli con età tra 11 e 15 anni"
. label var nchild "figli minori di 15 anni"
. label var lavora "lavoratori"
. label var nquest "numero questionario"
. label var apsett "settore lavorativo"
.
. *describe
.
. * etichette valori
. label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero
professionista"
> 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10 "socio/gestore
società"
> 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15 "pensionato da lavoro" 16
"pension
> ato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva" 20 "altro"
. label val apqual tipodioccupazione
. label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma
unive
> rsitario" 7 "laurea" 8 "post laurea"
. label val studio titolodistudio
. label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a"
. label val staciv statocivile
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 27
29. BRUZZESE SALVATORE MASTER MEP
9 | 153 1.94 54.94
10 | 104 1.32 56.26
11 | 56 0.71 56.97
12 | 203 2.58 59.55
13 | 1,679 21.33 80.88
14 | 6 0.08 80.96
15 | 1,200 15.24 96.20
16 | 230 2.92 99.12
17 | 38 0.48 99.61
19 | 2 0.03 99.63
20 | 29 0.37 100.00
------------+-----------------------------------
Total | 7,872 100.00
. drop if apqual>=13 & apqual<19 & y==.
(3144 observations deleted)
. tab apqual if y==.
tipo di occupazione | Freq. Percent Cum.
------------------------------+-----------------------------------
in cerca di prima occupazione | 55 19.10 19.10
disoccupato | 202 70.14 89.24
militare di leva | 2 0.69 89.93
altro | 29 10.07 100.00
------------------------------+-----------------------------------
Total | 288 100.00
. drop if apqual>=13 & apqual<19
(9 observations deleted)
. drop if apqual==20
(29 observations deleted)
. tab apqual lavora if y==.
| lavoratori
tipo di occupazione | non lavor | Total
----------------------+-----------+----------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 29
in cerca di prima occ | 55 | 55
30. BRUZZESE SALVATORE MASTER MEP
disoccupato | 202 | 202
militare di leva | 2 | 2
----------------------+-----------+----------
Total | 259 | 259
. tab apqual partime if y==.
| tipologia lavoro
tipo di occupazione | full-time part-time | Total
----------------------+----------------------+----------
in cerca di prima occ | 1 1 | 2
disoccupato | 13 14 | 27
militare di leva | 1 0 | 1
----------------------+----------------------+----------
Total | 15 15 | 30
. tab partime lavora if y==.
tipologia | lavoratori
lavoro | non lavor | Total
-----------+-----------+----------
full-time | 15 | 15
part-time | 15 | 15
-----------+-----------+----------
Total | 30 | 30
. inspect partime if y==.
partime: tipologia lavoro Number of Observations
-------------------------- Non-
Total Integers Integers
| # # Negative - - -
| # # Zero - - -
| # # Positive 30 30 -
| # # ----- ----- -----
| # # Total 30 30 -
| # # Missing 229
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 30
+---------------------- -----
31. BRUZZESE SALVATORE MASTER MEP
1 2 259
(2 unique values)
partime is labeled and all values are documented in the label.
. browse y apqual partime lavora if y==.
. browse nquest y apqual partime lavora if apqual==11
. * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
. browse nquest y apqual partime lavora if apqual==12
. * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
. browse nquest y apqual partime lavora if apqual==19
. * Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage
o ti
> rocini non retribuiti.
. * Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà.
. drop if nquest==22168|nquest==2970
(2 observations deleted)
. replace y=0 if y==.
(259 real changes made)
. graph pie, over(apqual) angle(90)
. graph pie, over(lavora) angle(90)
. graph pie, over(partime) angle(90)
.
. *inspect
. * Analisi grafica y
. symplot y
. graph box y
. kdensity y, normal
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 31
32. BRUZZESE SALVATORE MASTER MEP
. hist y, normal bin(20) xlabel(0(25000)250000)
(bin=20, start=-6583.2607, width=1.874e+08)
.
. inspect y
y: reddito Number of Observations
----------- Non-
Total Integers Integers
| # Negative 5 3 2
| # Zero 259 259 -
| # Positive 4424 2195 2229
| # ----- ----- -----
| # Total 4688 2457 2231
| # . . . . Missing -
+---------------------- -----
-6583.261 3.75e+09 4688
(More than 99 unique values)
. sum y, detail
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 -6583.261
5% 0 -6500
10% 6000 -6174.44 Obs 4688
25% 11789.3 -600 Sum of Wgt. 4688
50% 16248 Mean 934811.9
Largest Std. Dev. 5.53e+07
75% 23629.94 313913
90% 34147.65 381262.2 Variance 3.06e+15
95% 44016.35 5.42e+08 Skewness 66.55301
99% 80886.5 3.75e+09 Kurtosis 4497.787
.
. keep if y<313913
(4 observations deleted)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 32
. drop if y<0
33. BRUZZESE SALVATORE MASTER MEP
(5 observations deleted)
. count
4679
.
. inspect y
y: reddito Number of Observations
----------- Non-
Total Integers Integers
| # Negative - - -
| # Zero 259 259 -
| # Positive 4420 2193 2227
| # ----- ----- -----
| # Total 4679 2452 2227
| # . . . . Missing -
+---------------------- -----
0 238704.8 4679
(More than 99 unique values)
. sum y, detail
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 4679
25% 11800 0 Sum of Wgt. 4679
50% 16250 Mean 19407.65
Largest Std. Dev. 15469.66
75% 23606.6 169263.5
90% 34101.2 173866 Variance 2.39e+08
95% 43622.34 220941.1 Skewness 3.712403
99% 79059 238704.8 Kurtosis 31.58755
.
. ge politica_numerosità=0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 33
34. BRUZZESE SALVATORE MASTER MEP
. replace politica_numerosità=0 if ncomp<4
(0 real changes made)
. replace politica_numerosità=1 if ncomp>=4
(2085 real changes made)
. label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)"
. label define trattamento1 1 "treated_num" 0 "control_num"
. label val politica_numerosità trattamento1
. tab politica_numerosità
sussidio |
alle |
famiglie |
numerose |
(n. |
componenti |
>= 4) | Freq. Percent Cum.
------------+-----------------------------------
control_num | 2,594 55.44 55.44
treated_num | 2,085 44.56 100.00
------------+-----------------------------------
Total | 4,679 100.00
. browse apqual y if politica_numerosità==1
. by politica_numerosità, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
10% 6000 0 Obs 2594
5% 0 0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 34
35. BRUZZESE SALVATORE MASTER MEP
25% 11700 0 Sum of Wgt. 2594
50% 16023.43 Mean 19264.81
Largest Std. Dev. 15585.79
75% 23200 150348.5
90% 34385.15 169263.5 Variance 2.43e+08
95% 44016.35 173866 Skewness 3.884143
99% 75666.59 238704.8 Kurtosis 34.25024
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 2085
25% 11991.3 0 Sum of Wgt. 2085
50% 16659.9 Mean 19585.36
Largest Std. Dev. 15325.82
75% 24000 132371
90% 33806 141676.1 Variance 2.35e+08
95% 43374.1 145000 Skewness 3.489304
99% 80886.5 220941.1 Kurtosis 28.0648
. graph pie, over(politica_numerosità) angle(90)
.
. ge politica_figli=0
. replace politica_figli=1 if nchild0_3>=1
(548 real changes made)
. * includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0
. replace politica_figli=0 if nchild0_3==0
(0 real changes made)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 35
36. BRUZZESE SALVATORE MASTER MEP
. label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni"
. label define trattamento2 1 "treated_figli" 0 "control_figli"
. label val politica_figli trattamento2
. tab politica_figli
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 4,131 88.29 88.29
treated_figli | 548 11.71 100.00
--------------+-----------------------------------
Total | 4,679 100.00
. by politica_figli, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = control_figli
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 5997.186 0 Obs 4131
25% 11700 0 Sum of Wgt. 4131
50% 16250 Mean 19458.48
Largest Std. Dev. 15692.82
75% 23606 169263.5
90% 34567.39 173866 Variance 2.46e+08
95% 44358.6 220941.1 Skewness 3.751553
99% 79059 238704.8 Kurtosis 32.14111
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 36
-----------------------------------------------------------------------------------------------------------------------
----
37. BRUZZESE SALVATORE MASTER MEP
-> politica_figli = treated_figli
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 1200 0
10% 7000 0 Obs 548
25% 12000 0 Sum of Wgt. 548
50% 16214.06 Mean 19024.45
Largest Std. Dev. 13677.58
75% 23736.33 92184
90% 32492.82 93661.01 Variance 1.87e+08
95% 40655.38 114913.8 Skewness 3.130492
99% 75453.1 138000 Kurtosis 21.28555
. graph pie, over(politica_figli) angle(90)
.
. ge politica_reddito=0
. ge mediana=16250/2
. display mediana
8125
. replace politica_reddito=0 if y>=mediana
(0 real changes made)
. replace politica_reddito=1 if y<mediana
(662 real changes made)
. label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà"
. label define trattamento3 1 "treated_reddito" 0 "control_reddito"
. label val politica_reddito trattamento3
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 37
. tab politica_reddito
38. BRUZZESE SALVATORE MASTER MEP
sussidio alle |
famiglie sotto |
la soglia di |
povertà | Freq. Percent Cum.
----------------+-----------------------------------
control_reddito | 4,017 85.85 85.85
treated_reddito | 662 14.15 100.00
----------------+-----------------------------------
Total | 4,679 100.00
. by politica_reddito, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = control_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 8553.354 8165
5% 10000 8167.9
10% 11000 8184.827 Obs 4017
25% 13650 8200 Sum of Wgt. 4017
50% 18000 Mean 22058.28
Largest Std. Dev. 15082.99
75% 25193 169263.5
90% 36461.54 173866 Variance 2.27e+08
95% 46259.3 220941.1 Skewness 4.355011
99% 82087.6 238704.8 Kurtosis 37.20802
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = treated_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 38
5% 0 0
39. BRUZZESE SALVATORE MASTER MEP
10% 0 0 Obs 662
25% 0 0 Sum of Wgt. 662
50% 3500 Mean 3323.673
Largest Std. Dev. 3109.037
75% 6414.245 8055.395
90% 7529.2 8060.6 Variance 9666112
95% 8000 8073 Skewness .1320215
99% 8007 8100 Kurtosis 1.347933
. graph pie, over(politica_reddito) angle(90)
.
. * Politiche Cumulate
. tab politica_numerosità politica_figli, row col freq chi2
+-------------------+
| Key |
|-------------------|
| frequency |
| row percentage |
| column percentage |
+-------------------+
sussidio |
alle |
famiglie |
numerose | sussidio alle
(n. | famiglie con figli da
componenti | 0 a 3 anni
>= 4) | control_f treated_f | Total
------------+----------------------+----------
control_num | 2,356 238 | 2,594
| 90.82 9.18 | 100.00
| 57.03 43.43 | 55.44
------------+----------------------+----------
treated_num | 1,775 310 | 2,085
| 85.13 14.87 | 100.00
| 42.97 56.57 | 44.56
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 39
------------+----------------------+----------
40. BRUZZESE SALVATORE MASTER MEP
Total | 4,131 548 | 4,679
| 88.29 11.71 | 100.00
| 100.00 100.00 | 100.00
Pearson chi2(1) = 36.2317 Pr = 0.000
. by politica_numerosità, sort: tab politica_figli
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 2,356 90.82 90.82
treated_figli | 238 9.18 100.00
--------------+-----------------------------------
Total | 2,594 100.00
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 1,775 85.13 85.13
treated_figli | 310 14.87 100.00
--------------+-----------------------------------
Total | 2,085 100.00
. ge chi2n_num_figli=36.2317/(4679*1)
. label var chi2n_num_figli "chi2 normalizzato numerosita/figli"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 40
41. BRUZZESE SALVATORE MASTER MEP
. display chi2n_num_figli
.00774347
. * % treated incrociati su N
. display 310/4679*100
6.6253473
. * i trattati su N coprono il 6,6%
. tab politica_figli politica_reddito, row col chi2
+-------------------+
| Key |
|-------------------|
| frequency |
| row percentage |
| column percentage |
+-------------------+
sussidio alle | sussidio alle
famiglie con | famiglie sotto la
figli da 0 a | soglia di povertà
3 anni | control_r treated_r | Total
--------------+----------------------+----------
control_figli | 3,536 595 | 4,131
| 85.60 14.40 | 100.00
| 88.03 89.88 | 88.29
--------------+----------------------+----------
treated_figli | 481 67 | 548
| 87.77 12.23 | 100.00
| 11.97 10.12 | 11.71
--------------+----------------------+----------
Total | 4,017 662 | 4,679
| 85.85 14.15 | 100.00
| 100.00 100.00 | 100.00
Pearson chi2(1) = 1.8878 Pr = 0.169
. ge chi2n_figli_reddito=1.8878/(4679*1)
. label var chi2n_figli_reddito "chi2 normalizzato figli/reddito"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 41