SlideShare uma empresa Scribd logo
1 de 88
BRUZZESE SALVATORE MASTER MEP
Analisi Dati1
– POLITICHE DI WELFARE – STATA
Obiettivo Generale:
In merito alla scelta di adottare una politica di sostegno al reddito rivolta alla popolazione attiva, valutare la copertura del campione in relazione ai
sussidi, le caratteristiche demografiche, la possibilità di utilizzare 2 sussidi ed i dati ad essi connessi, le implicazioni economiche da sostenere in
relazione all’implementazione di una delle policy.
Campione:
La popolazione, composta da 7872 soggetti, è stata ridefinita escludendo outliers ed analizzando la bontà dei dati (missing); in particolare in base
alla definizione di popolazione attiva2
, sono stati presi in considerazione i soggetti appartenenti a determinate fasce di qualifica occupazionale
(apqual) e quelli non categorizzabili (categoria “altro”), escludendo casalinghe, benestanti, pensionati, studenti e bambini in età prescolare
(13<=apqual>19); i dati missing (coloro con reddito “y==.”) che rientrano nelle condizioni poste, escluse 2 incoerenze (disoccupati con reddito),
sono stati ricodificati in y=0 per evidenziare la presenza degli stessi nell’individuazione della soglia di povertà; inoltre si è proceduto alla
ridefinizione del campione escludendo gli outliers con redditi negativi (5 soggetti) e 4 elementi che presentavano un reddito oltre i 300000,
giungendo ad un campione di 4679 soggetti.
1
E’ stata mantenuta la codificazione decimali/migliaia di STATA, quindi i “.” indicano i decimali, le “,” le migliaia.
2
Secondo le definizioni adottate dall’ISTAT per popolazione attiva si intende l'insieme delle persone di età non inferiore ai 15 anni che, alla data del censimento, risultano:
1. occupate esercitando in proprio o alle dipendenze altrui una professione, arte o mestiere;
2. disoccupate ovvero hanno perduto il precedente lavoro e sono alla ricerca di una occupazione;
3. momentaneamente impedite a svolgere la propria attività lavorativa in quanto inquadrabili come: militari di leva (o in servizio civile), volontari, richiamati; ricoverati da
meno di due anni in luoghi di cura e assistenza; detenuti in attesa di giudizio o condannati a pene inferiori a 5 anni;
4. alla ricerca di prima occupazione, non avendone mai svolta alcuna in precedenza.
Le persone di cui ai punti 1), 2), 3) costituiscono la popolazione attiva in condizione professionale.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 1
BRUZZESE SALVATORE MASTER MEP
Descrizione politiche:
1. politica di sussidio alle famiglie numerose (ncomp>=4): i gruppi interessati dal sussidio (treated) sono pari al 44,6% (2085/4681) del
campione; includendo i missing (ex 259, ora y=0, in cerca di prima occupazione o disoccupati o militari) la mediana del reddito (taglia il
campione al 50% ed in quanto valore interno rende minima la somma delle differenze in valore assoluto, senza risentire dei valori estremi)
dei treated è (taglio al 50%) 16659.9>16023.4 (control), in media3
19585.4:19264.8 (treated:control) e varianza4
simile => dispersione
simile attorno alla media, i due sottocampioni hanno una distribuzione similare; il sottocampione dei soggetti trattati è caratterizzato dalle
seguenti caratteristiche: il 96,8% sono coniugati, maschi (66,4%), lavoratori (95%) full-time (89,2%), impiegati in prevalenza nel pubblico
(28,7%), nel settore manifatturiero (23,5%), nel commercio (15,2%), il 58,3% di n svolge la professione di operaio (32.1%) ed impiegato
(26,2%), il 10,3% è lavoratore autonomo, l’86.5% rientra fino alla 3° classe di reddito, dai 30000 in giù, con prevalenza del reddito tra
10000 e 20000 (44.1%), la classe d’età prevalente è quella tra i 40 ed i 50 anni (46,3%), la classe inferiore (solo il 2.7%) è quella dai 20 ai 30
anni; n ha un’età al di sopra dei 40 anni (74,2%), è in prevalenza impiegato e percepisce una retribuzione dai 10000 ai 20000;
2. politica di sussidio a famiglie con figli con età<=3 (eta): i treated sono l’11,7% del campione (548/4679) e percepiscono un reddito al (II
percentile) di 16214.1<16250 (control, 4131), in media 19024.5:19458.5 (treated:control) e varianza maggiore nel control; il sottocampione
dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 97,1% sono coniugati, maschi (66,4%), lavoratori (95,4%) full-time
(88%), impiegati in prevalenza nel settore manifatturiero (27,9%), nel pubblico (22,2%), nel commercio (15,9%), il 65,5% di n svolge la
professione di operaio (33,4%) ed impiegato (32,1%), il 9,1% è lavoratore autonomo, l’87,4% rientra fino alla 3° classe di reddito, dai 30000
in giù, con prevalenza del reddito tra 10000 e 20000 (48,2%), la classe d’età prevalente è quella tra i 30 ed i 40 anni (65,9%); n è
relativamente giovane e lavora (81% sotto i 40 anni), è in prevalenza impiegato o operaio e percepisce una retribuzione dai 10000 ai 20000;
3
Il calcolo della media si basa su tutte le osservazioni, è perciò influenzata dai valori estremi; la mediana è influenzata dal numero delle osservazioni, non dalla grandezza dei
valori estremi => trascurando l’eventualità di ripetizione delle osservazioni, un’osservazione scelta a caso ha la stessa probabilità di essere più grande della mediana che di essere
più piccola. Nel nostro campione, in quanto adeguatamente ridefinito dagli outliers la media può essere tranquillamente utilizzata come indicatore veritiero del valore di posizione
più comune, nonostante ciò si è preferito fare i confronti sulla mediana (definita misura robusta, assieme alla media interquartile [(Q1+Q2)/2]), ragionando con i box plot.
4
Varianza e Dev.Std.(radice quadrata varianza) misurano la dispersione media attorno ad un indice di posizione quale la media: sono ottenute valutando come le osservazioni più
grandi oscillano sopra la media e come le osservazioni più piccole si distribuiscono al di sotto della media.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 2
BRUZZESE SALVATORE MASTER MEP
3. politica di sussidio alle famiglie sotto la soglia di povertà (y<=mediana/2): i gruppi potenzialmente beneficiari del sussidio sono il 14,2%
(662/4679) del campione e percepiscono un reddito mediano pari a 3500<8125 (soglia di povertà), mentre il reddito che taglia al 50% il
gruppo control è 18000; il sottocampione dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 84% sono coniugati, donne
(58,3%), lavoratori (60,8%) part-time (54,3%), il 68,3% lavora nel commercio (22%), nel settore manifatturiero (19,5%), nell’agricoltura
(15,7%) e nell’edilizia (11,1%), un ~23% è distribuito tra impiego pubblico e servizi alla persona, con leggera prevalenza del primo, il
31,7% svolge la professione di operaio, il 30,5% è disoccupato, tutti rientrano nella 1° fascia di reddito, dai 10000 in giù; n è contraddistinto
dalla maggiore presenza femminile rispetto ai primi 2 sussidi, è equamente distribuita in classi dai 30 anni in su (~30% x 3), è impiegata
come operaio o disoccupata in prevalenza part-time (i primi 2 treated sono impiegati full-time, per più dell’80%) e percepisce una bassa
retribuzione, sotto la media degli altri sussidi.
Nelle tabelle allegate è possibile distinguere ulteriormente i sottocampioni per indici di posizione e di dispersione, con particolare evidenza al CV5
(coefficiente di variazione), in relazione al reddito ed all’appartenenza al gruppo teated/control di ogni sussidio:
1. sussidio numerosità:
a. indici di posizione:
i. control: classe modale6
(2° classe, 10000<y>=20000), densità relativa7
=0.12 e moda(punto centrale)=15000, percentile
(quartili: q1=11700, q2=16023.4 [mediana], q3= 23200), media (19264.8); la forma della distribuzione è obliqua8
a destra9
(media>mediana: asimmetria positiva).
5
Il coefficiente di variazione è un indice relativo dato dal rapporto tra deviazione standard e media => misura la dispersione (in %) nell’insieme dei dati relativamente alla media.
6
Per la moda sono state utilizzate le classi di reddito precedentemente individuate, da cui è strettamente dipendente; la moda corrisponde alla metà della somma dei valori estremi
della classe (punto centrale).
7
Per densità relativa si intende il rapporto tra ni ed ampiezza classe, da considerare nel caso in cui le classi siano di ampiezza non uniforme (es. ultima classe da 50000 in poi).
8
Valori estremamente piccoli (lunghe code a destra o sinistra), che attirano la media verso il basso/alto rendendola più piccola/grande della mediana.
9
Nel box-plot, se la distribuzione è obliqua a destra, ad esempio, le poche osservazioni grandi distorcono il midrange e la media verso la coda di destra, quindi ci aspetteremo un
ordinamento delle misure di posizione di questo tipo: moda<mediana<media interquartile<media<midrange.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 3
BRUZZESE SALVATORE MASTER MEP
ii. treated: classe modale (2° classe), densità relativa=0.09 e moda=15000, percentile (quartili: q1=11991.8, q2=16659.9
[mediana], q3=24000), media (19585.4); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria
positiva).
b. indici di dispersione (tendenza di y ad assumere valori diversi da un centro):
i. control: range10
(238704.8), cv= 0.81=81% (nelle tabelle è possibile leggere sia varianza che dev. std.11
);
ii. treated: range (220941.1), cv= 0.78=78%;
2. sussidio figli:
a. indici di posizione:
i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=11700, q2=16250 [mediana],
q3=23606), media (19458.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
ii. treated: classe modale (2° classe), densità relativa=0.03 e moda=15000, percentile (quartili: q1=12000, q2=16214.1
[mediana], q3=23736.3), media (19024.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria
positiva).
b. indici di dispersione:
i. control: range (238704.8), cv= 0.81=81%;
ii. treated: range (138000), cv= 0.72=72%;
3. sussidio reddito: la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
a. indici di posizione:
i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=13650, q2=18000 [mediana],
q3= 25193), media (22058.3); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva).
10
Il range totale (osservazione più grande – più piccola) è una misura di dispersione, a differenza del range interquartile (|Q3-Q1|) che è una misura della dispersione centrale.
11
Più i dati sono dispersi (> varianza), maggiore sarà il range, il range interquartile, la varianza e la dev. std. (indica il raggio (Xmedio±1Dev.Std.) entro cui si raggruppano i
valori di y, in questo caso, dalla media) => la somma e la dev. std. aiuta a definire in quale intervallo si concentra almeno la maggior parte dei valori osservati.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 4
BRUZZESE SALVATORE MASTER MEP
ii. treated: classe modale (1° classe, y<=10000), densità relativa=0.07 e moda=5000, percentile (quartili: q1=0, q2=3500
[mediana], q3= 6414.3), media (3323.7); la forma della distribuzione è obliqua a sinistra (media<mediana: asimmetria
negativa).
b. indici di dispersione:
i. control: range (230539.8), cv= 0.68=68%;
ii. treated: range (8450), cv= 0.93=93%;
La varianza maggiore (in realtà dal cv si nota quasi la stessa dispersione, proporzionata alla media tra control del sussidio per numerosità e control
del sussidio per figli piccoli: 0.80902994 e 0.80647532) è quella presente nel gruppo control della politica di sussidio per figli (2.46e+08), mentre
quella minore è quella dei treated della politica di sussidio per reddito (9.67e+06); all’interno delle politiche, quella del reddito presenta la maggiore
disparità tra varianza dei treated e varianza del control => in base al cv si riscontra che il reddito dei poveri è altamente variabile (da notare la
differenza interquartile dal box-plot) e più eterogeneo, ha una maggiore variabilità (tendenza ad assumere valori diversi) rispetto ai non trattati,
nonostante che questi si muovano entro un range quasi triplo.
Connessione tra politiche cumulate (Chi2 Normalizzato connessione tra 0 e 1) e copertura campione:
1. sussidio per numerosità e sussidio per età figli: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di
entrambe le politiche, è pari a 310 (su 4679), cioè il 6,6% di N, cioè il 56,6% dei beneficiari del sussidio alle famiglie con figli piccoli ed il
14,9% dei treated all’interno dei sussidiati per numerosità dei componenti. Il chi2N evidenzia un valore prossimo ad una condizione di
indipendenza, confermata dai valori di Pr (0.00) < 0.005.
2. sussidio per età figli e reddito: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche, è
pari a 67 (su 4679), cioè l’1,4% di N, cioè il 10% dei beneficiari del sussidio alle famiglie numerose ed il 12,2% dei treated all’interno dei
sussidiati perché con figli d’età minore o uguale ai 3 anni. Il chi2N dimostra una bassissima connessione.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 5
BRUZZESE SALVATORE MASTER MEP
3. sussidio per reddito e numerosità: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche,
è pari a 300 (su 4679), cioè l’6,4% di N, cioè il 45,3% dei beneficiari del sussidio alle famiglie povere ed il 14,4% dei treated all’interno dei
sussidiati perché con famiglie numerose. Il chi2N dimostra la più bassa connessione possibile (a causa del valore Pr elevato tale giudizio non
è significativo statisticamente per la popolazione, a differenza della prima forma di cumulabilità [numerosità x figli]).
L’indice di connessione12
(Chi2N=chi2/(n min[righe-1, colonne-1])) ha rivelato nelle associazioni fatte tra politiche una chiara indipendenza
statistica (la connessione misura la distanza dall’indipendenza, qui statisticamente molto vicina all’indipendenza, come si evince anche dal
coefficiente di correlazione lineare elevato al quadrato indica quanto una retta che passa per la nuvola dei punti sia in grado di “cogliere” la
relazione tra X ed Y).
Calcolando la differenza tra reddito medio per gruppi, distinti per ogni politica13
, si nota che la differenza maggiore tra (ymedio)teated e
(ymedio)control del sussidio vincolato alla soglia di povertà, pari a |-18734.6|, è più di 40 volte quella della 2° politica e della 1°; perciò nella 3°
politica è presente una elevata sproporzione in media tra i due gruppi, avendo due stistribuzioni non simmetriche opposte => aumenta la probabilità
che il sussidio agisca effettivamente su un target bisognoso (effettivamente la dev std diminuisce al diminuire del reddito, è ~5 volte inferiore).
REGRESSIONE LINEARE14
: permette di studiare come varia un fenomeno in relazione di un altro, in questo caso come varia il reddito in
relazione al sussidio.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 6
12
Verifica l’indipendenza tra 2 fattori in una tabella di contingenza r righe e c colonne.
13
La differenza tra reddito medio della politica per famiglie numerose è circa 160, dovute alla maggiore forza lavoro presente in famiglia, mentre la differenza tra sussidiati e non
nella politica figli è quasi nulla e questo dovrebbe portare a riflettere sulla necessità di intervento.
14
Correlazione e regressione (le correlazioni identificate dal file .do sono ritenute significative al di sotto di 0.05 e sono contrassegnate da un asterisco) non sono la stessa cosa,
possiamo trovare un'identica correlazione tra due serie di valori senza che questo implichi che le due serie di valori siano descritte da rette identiche (cioè con la stessa intercetta e
la stessa pendenza), viceversa noi possiamo comunque essere interessati a stimare un certo valore di y a partire da un valore dato di x (cioè la regressione di y su x), anche se la
forza della loro associazione non è elevata; quando siamo interessati a prevedere che valore assume la variabile y in coincidenza di un certo valore di x, il nostro problema non è
BRUZZESE SALVATORE MASTER MEP
Y=a+bX+e15
y=a+b(sussidio)
1. 1° politica: y= 19264.816
+ 320.617
(politica_numerosità) il modello proposto prevede che se X aumenta di 1 unità (passaggio da control a
treated) => si ha un incremento di y(reddito) in media pari a 320.6, ma R218
=0.001% (questo vuol dire che lo 0% della variabilità di y è
spiegato dalla concomitante variabilità di X) ed il t-test per la politica della numerosità è 0.70 (0.70²=F); prevista H0 (ipotesi nulla che il
coefficiente del sussidio non è significativamente diverso da 0), avrò che |t19
|<1,96 e p20
>0.005 => H0 è vera, la relazione di X su Y non è
significativa.
2. 2° politica: y= 19458.5-434(politica_figli) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a treated) => si
ha un decremento di y(reddito) in media pari a 434, ma R2=0.001% ed il t-test per la politica dei figli piccoli è -0.62 (-0.62²=F); prevista H0,
avrò che |t|<1,96 e p>0.005 => H0 è vera, la relazione di X su Y non è significativa.
3. 3° politica: y= 22058.3-18734.6(politica_reddito), ) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a
treated) => si ha un decremento di y(reddito) in media pari a 18734.6, R2=17.8%, il t-test per la politica della numerosità è -31.8 (-21.8²=F);
tanto la forza dell'associazione tra le due variabili quanto la stima (che sarà ovviamente più o meno precisa in dipendenza della forza della loro correlazione) di una variabile
essendo nota l'altra.
15
“e” rappresenta il residuo, cioè la distanza tra i punti e la retta di regressione, visibili in STATA col comando “predict e, residual” (vedi file.do).
16
L’intercetta indica il valore posseduto da y quando X=0, in questo corrisponde alla condizione del control.
17
Il coefficiente di b, cioè il valore incrementale della condizione 1 del sussidio (tale in quanto variabile dummy 0-1) rispetto alla condizione 0 (coefficiente a, cioè l’intercetta),
rappresenta in questo caso la differenza in media tra la condizione 0 e la condizione 0+1 del reddito medio dato alla condizione 0 dal valore dell’intercetta.
18
R2 o coefficiente di determinazione, esprime in che misura la variabilità di una certa variabile y si associa a quella di un'altra; è la proporzione di varianza spiegata dalla/e
variabile/i indipendente/i = SSModel/SSTotal. Sfruttando i coefficienti di correlazione significativi ed elevandoli al quadrato è possibile prevedere R2, coi relativi errori di
approssimazione, ed evidenziare così quanto una retta che passa per la nuvola di punti cogli la relazione tra X e Y.
19
Il livello di significatività statistica scelto è p<=0.005.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 7
20
p mi dice quanto la relazione individuata dal repressore sulla variabile dipendente e valida spostando il modello sulla popolazione; posto p<0,05, avrò che la relazione si
verificherà sulla popolazione al 95%, se p<0,001 => la validità sarà del 99%.
BRUZZESE SALVATORE MASTER MEP
prevista H0, avrò che |t|>1,96 e p<0.005 => H0 è falsa, la relazione di X su Y è significativa ed il coefficiente del sussidio è
significativamente diverso da 0 e si muove all’interno di un intervallo di confidenza del 95%, tra -19887.99 e -17581.23.
Solo l’ultimo modello verifica che la politica di sussidio per povertà sia significativamente predittore del reddito, cioè con l’aumento di una unità di
X si ha un decremento di Y in media pari a 18734.6 => si deduce che l'assegnazione del trattamento a classi svantaggiate, come nel caso delle
famiglie povere, determinate sulla base di un reddito inferiore al 50% della mediana, porti a risultati più significativi su questa classe, che
permettono di usare il modello di previsione (sul predittore della politica sussidiata) validi al 95% (p<0.005, quasi certo, poiché p<0.001, cioè 99%)
sulla popolazione.
L’unica politica con la differenza di y in media tra treated e control statisticamente significativa è quella per reddito.
REGRESSIONE MULTIPLA21
: permette di studiare come varia un fenomeno in relazione di altri, in questo caso come varia il reddito in relazione
al sussidio ed alcune caratteristiche demografiche.
Y=a+bX+cZ+dW…+e
Y=a+b(sussidio)+c(professione)+d(genere)+e(studio)+f(part-time)+g(lavora)+h(part-time)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 8
21
Un modello statistico è tanto più efficiente quanto minore è il numero di variabili indipendenti (explanatory variables) che utilizza per predire (con adeguata accuratezza) la
variabile dipendente; ad esempio se abbiamo 7 variabili indipendenti ci possiamo chiedere quali di queste 7 vale la pena introdurre nell'equazione, ovviamente una variabile
indipendente con un coefficiente standardizzato basso contribuisce poco alla stima della variabile dipendente e complica inutilmente l’equazione multipla, perciò per costruire un
modello multiplo possiamo partire da una sola variabile indipendente e quindi aggiungerne una seconda, se il coefficiente di determinazione (R2) aumenta possiamo giudicare
opportuno utilizzare anche la seconda variabile indipendente, procediamo quindi con una terza variabile e ripetiamo la stessa verifica e così via. Questo modo di procedere
introducendo una variabile per volta è la tecnica stepwise.
BRUZZESE SALVATORE MASTER MEP
Aggiungendo queste caratteristiche si arriva a spiegare con i predittori il ~35.6% di variabilità di y col sussidio per numerosità e per figli piccoli,
mentre si raggiunge il 38.2% col sussidio per povertà => quest’ultimo come precedentemente detto è quello che spiega al meglio la variazione, in
base alla significatività dello stesso e delle variabili indipendenti introdotte.
Fundamental Problem of Causal Inference:
Outcome(reddito): continuo
Tratment(sussidio): binario [Si=0;Si=1]
Effetto Treatment: differenza di outcome per l’i-esimo individuo tra ricevere e non ricevere il treatment MA l’individuo è osservato in un solo stato
del mondo => senza assegnamento casuale non ho controfattuale22
, cioè l’outcome dei treated se non avessero ricevuto il treatment:
yi=Si 23
=> yi(1)= outcome treated24
yi(0)= outcome non treated
in ciascun individuo avrò che Si=1 + controfattuale avrà un effetto causale =yi(1)-yi(0) ==> dato che non osserviamo yi(1) e yi(0)
contemporaneamente, qualsiasi parametro che dipenda dalla distribuzione congiunta di yi(1) e yi(0) non può essere stimato.
Io posso stimare solo y(1), solo se Si=1 e y(0), solo se Si=0.
ATT=valore atteso di y(1) alla condizione Si=1 – valore atteso controfattuale
22
Valore dato dalla seguente condizione posta per il valore atteso: E(yi(0)|Si=1.
23
S e y sono correlate (b è significativamente diverso da 0) MA non casuali => ragiono su casualità
24
La media dell’outcome per i trattati ci attendiamo sia diversa da quella per un individuo scelto a caso.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 9
BRUZZESE SALVATORE MASTER MEP
distorsione dovuta alla selezione del treatment= E{yi(0) |Si=1}-E{yi(0)|Si=0}
Ho ad esempio che yi(1)=a+b(Si==1) e yi(0)=a+b(Si==0), devo calcolare la differenza attesa di outcome tra coloro che sono stati sottoposti al
treatment (Si=1) e coloro che invece non sono stati sottoposti al treatment (Si=0), valutato nello stato di non treatment (yi[0]).
I POLITICA
yi(1)=19264.8+320.6(Si=1)
yi(0)=19585.4-320.6(Si=0) yi(0)=19585.4+320.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il vero
effetto.
II POLITICA
yi(1)= 19458.5-434(Si=1)
yi(0)= 19024.5+434(Si=0) yi(0)= 19024.5-434(Si=1) E[yi(0)|Si=0]>E[yi(0)|Si=1] Le stime sul campione tendono a sottostimare il vero
effetto.
I POLITICA
yi(1)= 22058.3-18734.6(Si=1)
yi(0)= 3323.7-18734.6(Si=0) yi(0)= 3323.7+18734.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il
vero effetto.
Ridistribuzione equiparata reddito:
1. Sussidio numerosità (unica politica che richiederebbe di sussidiare il control, va riformulata):
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 10
BRUZZESE SALVATORE MASTER MEP
a. Differenze in media y treated/control= |320.6|
b. Costo per lo Stato=320.6*208525
=668451
2. Sussidio figli:
a. Differenze in media y treated/control= |-434|
b. Costo per lo Stato=434*548=237832
3. Sussidio reddito:
a. Differenze in media y treated/control= |-18734.6|
b. Costo per lo Stato=18734.6*662=12402305
La politica che richiede meno risorse per essere implementata è la seconda politica, quella sulla presenza di figli piccoli.
Tale politica copre il 11.7% (548/4679) del campione, di cui 67/662 (10,1%) soggetti con reddito sotto la soglia di povertà in famiglie numerose e
310/2085 (14.9%) in famiglie numerose.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 11
25
Questo è il totale dei treated all’interno della politica adottata.
BRUZZESE SALVATORE MASTER MEP
ALLEGATI
GRAFICI:
0.00001.00002.00003.00004.00005
Density
0 50000 100000 150000 200000 250000
reddito
Kernel density estimate
Normal density
050,000100000150000200000250000
reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 12
BRUZZESE SALVATORE MASTER MEP
operai impiegati
insegnanti quadri
dirigenti libero professionista
imprenditore individuale lavoratore autonomo/artigiano
titolare impresa familiare socio/gestore società
in cerca di prima occupazione disoccupato
militare di leva control_num treated_num
control_figli treated_figli control_reddito treated_reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 13
BRUZZESE SALVATORE MASTER MEP
0.511.5
Density
1 2 3 4 5 6
classi di reddito (6)
Kernel density estimate
Normal density
18--| 30 30--| 40
40--| 50 50--| 65
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 14
BRUZZESE SALVATORE MASTER MEP
0--| 10e+3 10e+3--| 20e+3
20e+3--| 30e+3 30e+3--| 40e+3
40e+3--| 50e+3 50e+3--| 238,7e+3
0.01.02.03.04.05
Density
20 30 40 50 60 70
età
Kernel density estimate
Normal density
050,000100000150000200000250000
control_num treated_num
reddito
Graphs by sussidio alle famiglie numerose (n. componenti >= 4)
050,000100000150000200000250000
control_figli treated_figli
reddito
Graphs by sussidio alle famiglie con figli da 0 a 3 anni
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 15
BRUZZESE SALVATORE MASTER MEP
050,000100000150000200000250000
control_reddito treated_reddito
reddito
Graphs by sussidio alle famiglie sotto la soglia di povertà
02,0004,0006,0008,000
reddito
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 16
BRUZZESE SALVATORE MASTER MEP
FILE “.do”:
clear all
set mem 20000
set mat 800
capture log close
log using E:ProgrammiStataVerificheProjectproject.log,replace
use E:ProgrammiStataVerificheProjectcomune.dta, replace
******************************************************
******************************************************
******* BRUZZESE Salvatore - STATA - MEP/MEGAS *******
******************************************************
******************************************************
*describe
* etichette variabili
label var staciv "stato civile"
label var studio "titolo di studio"
label var apqual "tipo di occupazione"
label var sex "genere"
label var partime "tipologia lavoro"
label var ncomp "numero componenti famiglia"
label var parent "posizione nella famiglia"
label var anasc "anno di nascita"
label var ireg "regione di residenza"
label var eta "età"
label var y "reddito"
label var nchild0_3 "figli con età tra 0 e 3 anni"
label var nchild4_10 "figli con età tra 4 e 10 anni"
label var nchild11_15 "figli con età tra 11 e 15 anni"
label var nchild "figli minori di 15 anni"
label var lavora "lavoratori"
label var nquest "numero questionario"
label var apsett "settore lavorativo"
*describe
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 17
BRUZZESE SALVATORE MASTER MEP
* etichette valori
label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero
professionista" 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10
"socio/gestore società" 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15
"pensionato da lavoro" 16 "pensionato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva"
20 "altro"
label val apqual tipodioccupazione
label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma
universitario" 7 "laurea" 8 "post laurea"
label val studio titolodistudio
label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a"
label val staciv statocivile
label define sesso 1 "uomo" 2 "donna"
label val sex sesso
label define tipologialavoro 1 "full-time" 2 "part-time"
label val partime tipologialavoro
label define lavoratori 0 "non lavoratore" 1 "lavoratore"
label val lavora lavoratori
label define settorelavorativo 1 "agricoltura" 2 "manifatturiero" 3 "costruzione" 4 "commercio" 5" trasporti" 6
"banche" 7 "serv. finanz." 8 "serv.person." 9 "pubblico" 10 "org.internaz"
label val apsett settorelavorativo
*********************
* SOLUZIONE QUESITI *
*********************
*browse _all
*codebook _all
* Definizione campione
tab apqual, nolab
drop if apqual>=13 & apqual<19 & y==.
tab apqual if y==.
drop if apqual>=13 & apqual<19
drop if apqual==20
tab apqual lavora if y==.
tab apqual partime if y==.
tab partime lavora if y==.
inspect partime if y==.
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 18
browse y apqual partime lavora if y==.
BRUZZESE SALVATORE MASTER MEP
browse nquest y apqual partime lavora if apqual==11
* 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
browse nquest y apqual partime lavora if apqual==12
* 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
browse nquest y apqual partime lavora if apqual==19
* Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage o
tirocini non retribuiti.
* Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà.
drop if nquest==22168|nquest==2970
replace y=0 if y==.
graph pie, over(apqual) angle(90)
graph pie, over(lavora) angle(90)
graph pie, over(partime) angle(90)
*inspect
* Analisi grafica y
symplot y
graph box y
kdensity y, normal
hist y, normal bin(20) xlabel(0(25000)250000)
inspect y
sum y, detail
keep if y<313913
drop if y<0
count
inspect y
sum y, detail
ge politica_numerosità=0
replace politica_numerosità=0 if ncomp<4
replace politica_numerosità=1 if ncomp>=4
label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)"
label define trattamento1 1 "treated_num" 0 "control_num"
label val politica_numerosità trattamento1
tab politica_numerosità
browse apqual y if politica_numerosità==1
by politica_numerosità, sort: sum y, detail
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 19
graph pie, over(politica_numerosità) angle(90)
BRUZZESE SALVATORE MASTER MEP
ge politica_figli=0
replace politica_figli=1 if nchild0_3>=1
* includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0
replace politica_figli=0 if nchild0_3==0
label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni"
label define trattamento2 1 "treated_figli" 0 "control_figli"
label val politica_figli trattamento2
tab politica_figli
by politica_figli, sort: sum y, detail
graph pie, over(politica_figli) angle(90)
ge politica_reddito=0
ge mediana=16250/2
display mediana
replace politica_reddito=0 if y>=mediana
replace politica_reddito=1 if y<mediana
label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà"
label define trattamento3 1 "treated_reddito" 0 "control_reddito"
label val politica_reddito trattamento3
tab politica_reddito
by politica_reddito, sort: sum y, detail
graph pie, over(politica_reddito) angle(90)
* Politiche Cumulate
tab politica_numerosità politica_figli, row col freq chi2
by politica_numerosità, sort: tab politica_figli
ge chi2n_num_figli=36.2317/(4679*1)
label var chi2n_num_figli "chi2 normalizzato numerosita/figli"
display chi2n_num_figli
* % treated incrociati su N
display 310/4679*100
* i trattati su N coprono il 6,6%
tab politica_figli politica_reddito, row col chi2
ge chi2n_figli_reddito=1.8878/(4679*1)
label var chi2n_figli_reddito "chi2 normalizzato figli/reddito"
display chi2n_figli_reddito
display 67/4679*100
tab politica_numerosità politica_reddito, row col chi2
label var chi2n_reddito_numerosità "chi2 normalizzato reddito/numerosità"
ge chi2n_reddito_numerosità=0.1786/(4679*1)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 20
BRUZZESE SALVATORE MASTER MEP
display chi2n_reddito_numerosità
display 300/4681*100
summ y, detail
histogram y, percent normal
graph hbox y, medtype(cline) medline(lcolor(red))
gen classi_reddito=0
replace classi_reddito=1 if y<=10000
replace classi_reddito=2 if y>10000 & y<=20000
replace classi_reddito=3 if y>20000 & y<=30000
replace classi_reddito=4 if y>30000 & y<=40000
replace classi_reddito=5 if y>40000 & y<=50000
replace classi_reddito=6 if y>50000
label var classi_reddito "classi di reddito (6)"
label define yrecode 1 "0--| 10e+3" 2 "10e+3--| 20e+3" 3 "20e+3--| 30e+3" 4 "30e+3--| 40e+3" 5 "40e+3--| 50e+3" 6
"50e+3--| 238,7e+3"
label val classi_reddito yrecode
tab classi_reddito
by politica_numerosità, sort: tab classi_reddito
kdensity classi_reddito if politica_numerosità==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_numerosità==1, normal ylabel(0(.1)1)
by politica_figli, sort: tab classi_reddito
kdensity classi_reddito if politica_figli==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_figli==1, normal ylabel(0(.1)1)
by politica_reddito, sort: tab classi_reddito
kdensity classi_reddito if politica_reddito==0, normal ylabel(0(.1)1)
kdensity classi_reddito if politica_reddito==1, normal ylabel(0(.1)1)
graph pie, over(classi_reddito) angle(90)
kdensity classi_reddito, normal
graph pie, over(classi_reddito) angle(90)
graph pie if politica_numerosità==1, over(classi_reddito) angle(90)
graph pie if politica_figli==1, over(classi_reddito) angle(90)
graph pie if politica_reddito==1, over(classi_reddito) angle(90)
sum eta, detail
histogram eta, normal percent
graph hbox eta
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 21
ge classi_età=0
BRUZZESE SALVATORE MASTER MEP
replace classi_età=1 if eta<=30
replace classi_età=2 if eta>30&eta<=40
replace classi_età=3 if eta>40&eta<=50
replace classi_età=4 if eta>50
label var classi_età "classi di eta (4)"
label define recode_eta 1 "18--| 30" 2 "30--| 40" 3 "40--| 50" 4 "50--| 65"
label val classi_età recode_eta
tab classi_età
tab classi_età if politica_numerosità==1
tab classi_età if politica_figli==1
tab classi_età if politica_reddito==1
graph pie, over(classi_età) angle(90)
kdensity eta, normal
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_numerosità==1
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_figli==1
tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_reddito==1
* indici di posizione
by politica_numerosità, sort: sum y, detail
tab classi_reddito politica_numerosità
* densità relativa classe modale control
display 1200/10000
* densità relativa classe modale treated
display 921/10000
by politica_figli, sort: sum y, detail
tab classi_reddito politica_figli
* densità relativa classe modale control
display 1857/10000
* densità relativa classe modale treated
display 264/10000
by politica_reddito, sort: sum y, detail
tab classi_reddito politica_reddito
* densità relativa classe modale control
display 2121/10000
* densità relativa classe modale treated
display 662/10000
* indici di dispersione
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 22
* range politica numerosità control
BRUZZESE SALVATORE MASTER MEP
display 238704.8-0
* range politica numerosità treated
display 220941.1-0
* range politica figli control
display 238704.8-0
* range politica figli treated
display 138000-0
* range politica reddito control
display 238704.8-8165
* range politica reddito treated
display 8450-0
* CV - coefficiente di variazione
tab politica_numerosità, sum(y)
* CV Control
display 15585.8/19264.8
* CV Treated
display 15325.8/19585.4
tab politica_figli, sum(y)
* CV Control
display 15692.8/19458.5
* CV Treated
display 13677.6/19024.5
tab politica_reddito, sum(y)
* CV Control
display 15082.99/22058.3
* CV Treated
display 3109.0372/3323.7
* Confronto visivo box-plot (min, q1, q2 [mediana], q3, max, outliers)
graph box y, by(politica_numerosità)
graph box y, by(politica_figli)
graph box y, by(politica_reddito)
graph box y if politica_reddito==1
graph box y if politica_reddito==0
ge differenza_medie_numerosità= 19264.806-19585.362
ge differenza_medie_figli=19458.482-19024.451
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 23
ge differenza_medie_reddito=22058.281-3323.6727
BRUZZESE SALVATORE MASTER MEP
display differenza_medie_numerosità, differenza_medie_figli, differenza_medie_reddito
* Regressione Y=y e X=politiche: Y=a+bX+e
regress y politica_numerosità
pwcorr y politica_numerosità, star(.05)
regress y politica_figli
pwcorr y politica_figli, star(.05)
regress y politica_reddito
pwcorr y politica_reddito, star(.05)
regress y politica_numerosità apqual partime lavora sex studio eta
pwcorr y politica_numerosità apqual partime lavora sex studio eta, star(.05)
regress y politica_figli apqual partime lavora sex studio eta
pwcorr y politica_figli apqual partime lavora sex studio eta, star(.05)
regress y politica_reddito apqual partime lavora sex studio eta
pwcorr y politica_reddito apqual partime lavora sex studio eta, star(.05)
* ESEMPIO Metodo alternativo REGRESSIONE-DUMMY TREATED (volendo si possono creare variabili dummy dalle variabili
indipendenti utilizzate e voncolare ad una condizione particolare l'analisi, creando particolari gruppi di riferimento)
char politica_numerosità[omit] 0
xi: regress y i.politica_numerosità
* Guppo di riferimento: donne, occupate part-time, tra i 30 e 40 anni
char sex [omit] 1
char partime [omit] 1
char classi_età [omit] 2
xi: regress y i.politica_numerosità apqual i.partime i.sex studio i.classi_età
* ESEMPIO Regressione lineare con residui e
regress y politica_numerosità
predict feeted_values
predict e, residual
list y feeted_values in 1/10
list y e in 1/10
scatter y politica_numerosità
twoway (scatter y politica_numerosità) (lfit y politica_numerosità)
twoway (scatter y politica_numerosità, mlabel(y)) (lfit y politica_numerosità)
correlate y politica_numerosità apqual nchild ncomp partime nchild0_3
drop e feeted_values
* Parificazione reddito control/treated per sussidio - Valutazione politica più economica
* Numerosità
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 24
** Costo sussidio
BRUZZESE SALVATORE MASTER MEP
display 320.6*2085
* Figli
** Costo sussidio
display 434*548
* Reddito
** Costo sussidio
display 18734.6*662
* Soggetti beneficiari alle condizioni poste tra tutti i sussidi (famiglia povera, numerosa e con figli piccoli)
inspect nquest if politica_numerosità==1 & politica_figli==1 & politica_reddito==1
* ATT
char politica_numerosità[omit] 0
xi: regress y i.politica_numerosità
char politica_numerosità[omit] 1
xi: regress y i.politica_numerosità
tab politica_numerosità, summ(y)
char politica_figli[omit] 0
xi: regress y i.politica_figli
char politica_figli[omit] 1
xi: regress y i.politica_figli
tab politica_figli, summ(y)
char politica_reddito[omit] 0
xi: regress y i.politica_reddito
char politica_reddito[omit] 1
xi: regress y i.politica_reddito
tab politica_reddito, summ(y)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 25
BRUZZESE SALVATORE MASTER MEP
OUTPUT FILE “.do”:
-----------------------------------------------------------------------------------------------------------------------
----
log: E:ProgrammiStataVerificheProjectproject.log
log type: text
opened on: 31 Jan 2007, 02:26:44
. use E:ProgrammiStataVerificheProjectcomune.dta, replace
.
. ******************************************************
. ******************************************************
. ******* BRUZZESE Salvatore - STATA - MEP/MEGAS *******
. ******************************************************
. ******************************************************
.
. *describe
.
. * etichette variabili
. label var staciv "stato civile"
. label var studio "titolo di studio"
. label var apqual "tipo di occupazione"
. label var sex "genere"
. label var partime "tipologia lavoro"
. label var ncomp "numero componenti famiglia"
. label var parent "posizione nella famiglia"
. label var anasc "anno di nascita"
. label var ireg "regione di residenza"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 26
. label var eta "età"
BRUZZESE SALVATORE MASTER MEP
. label var y "reddito"
. label var nchild0_3 "figli con età tra 0 e 3 anni"
. label var nchild4_10 "figli con età tra 4 e 10 anni"
. label var nchild11_15 "figli con età tra 11 e 15 anni"
. label var nchild "figli minori di 15 anni"
. label var lavora "lavoratori"
. label var nquest "numero questionario"
. label var apsett "settore lavorativo"
.
. *describe
.
. * etichette valori
. label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero
professionista"
> 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10 "socio/gestore
società"
> 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15 "pensionato da lavoro" 16
"pension
> ato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva" 20 "altro"
. label val apqual tipodioccupazione
. label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma
unive
> rsitario" 7 "laurea" 8 "post laurea"
. label val studio titolodistudio
. label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a"
. label val staciv statocivile
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 27
BRUZZESE SALVATORE MASTER MEP
. label define sesso 1 "uomo" 2 "donna"
. label val sex sesso
. label define tipologialavoro 1 "full-time" 2 "part-time"
. label val partime tipologialavoro
. label define lavoratori 0 "non lavoratore" 1 "lavoratore"
. label val lavora lavoratori
. label define settorelavorativo 1 "agricoltura" 2 "manifatturiero" 3 "costruzione" 4 "commercio" 5" trasporti" 6
"banche"
> 7 "serv. finanz." 8 "serv.person." 9 "pubblico" 10 "org.internaz"
. label val apsett settorelavorativo
.
.
. *********************
. * SOLUZIONE QUESITI *
. *********************
.
. *browse _all
. *codebook _all
.
. * Definizione campione
. tab apqual, nolab
tipo di |
occupazione | Freq. Percent Cum.
------------+-----------------------------------
1 | 1,492 18.95 18.95
2 | 1,274 16.18 35.14
3 | 303 3.85 38.99
4 | 211 2.68 41.67
5 | 110 1.40 43.06
6 | 237 3.01 46.07
7 | 85 1.08 47.15
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 28
8 | 460 5.84 53.00
BRUZZESE SALVATORE MASTER MEP
9 | 153 1.94 54.94
10 | 104 1.32 56.26
11 | 56 0.71 56.97
12 | 203 2.58 59.55
13 | 1,679 21.33 80.88
14 | 6 0.08 80.96
15 | 1,200 15.24 96.20
16 | 230 2.92 99.12
17 | 38 0.48 99.61
19 | 2 0.03 99.63
20 | 29 0.37 100.00
------------+-----------------------------------
Total | 7,872 100.00
. drop if apqual>=13 & apqual<19 & y==.
(3144 observations deleted)
. tab apqual if y==.
tipo di occupazione | Freq. Percent Cum.
------------------------------+-----------------------------------
in cerca di prima occupazione | 55 19.10 19.10
disoccupato | 202 70.14 89.24
militare di leva | 2 0.69 89.93
altro | 29 10.07 100.00
------------------------------+-----------------------------------
Total | 288 100.00
. drop if apqual>=13 & apqual<19
(9 observations deleted)
. drop if apqual==20
(29 observations deleted)
. tab apqual lavora if y==.
| lavoratori
tipo di occupazione | non lavor | Total
----------------------+-----------+----------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 29
in cerca di prima occ | 55 | 55
BRUZZESE SALVATORE MASTER MEP
disoccupato | 202 | 202
militare di leva | 2 | 2
----------------------+-----------+----------
Total | 259 | 259
. tab apqual partime if y==.
| tipologia lavoro
tipo di occupazione | full-time part-time | Total
----------------------+----------------------+----------
in cerca di prima occ | 1 1 | 2
disoccupato | 13 14 | 27
militare di leva | 1 0 | 1
----------------------+----------------------+----------
Total | 15 15 | 30
. tab partime lavora if y==.
tipologia | lavoratori
lavoro | non lavor | Total
-----------+-----------+----------
full-time | 15 | 15
part-time | 15 | 15
-----------+-----------+----------
Total | 30 | 30
. inspect partime if y==.
partime: tipologia lavoro Number of Observations
-------------------------- Non-
Total Integers Integers
| # # Negative - - -
| # # Zero - - -
| # # Positive 30 30 -
| # # ----- ----- -----
| # # Total 30 30 -
| # # Missing 229
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 30
+---------------------- -----
BRUZZESE SALVATORE MASTER MEP
1 2 259
(2 unique values)
partime is labeled and all values are documented in the label.
. browse y apqual partime lavora if y==.
. browse nquest y apqual partime lavora if apqual==11
. * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
. browse nquest y apqual partime lavora if apqual==12
. * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino
. browse nquest y apqual partime lavora if apqual==19
. * Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage
o ti
> rocini non retribuiti.
. * Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà.
. drop if nquest==22168|nquest==2970
(2 observations deleted)
. replace y=0 if y==.
(259 real changes made)
. graph pie, over(apqual) angle(90)
. graph pie, over(lavora) angle(90)
. graph pie, over(partime) angle(90)
.
. *inspect
. * Analisi grafica y
. symplot y
. graph box y
. kdensity y, normal
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 31
BRUZZESE SALVATORE MASTER MEP
. hist y, normal bin(20) xlabel(0(25000)250000)
(bin=20, start=-6583.2607, width=1.874e+08)
.
. inspect y
y: reddito Number of Observations
----------- Non-
Total Integers Integers
| # Negative 5 3 2
| # Zero 259 259 -
| # Positive 4424 2195 2229
| # ----- ----- -----
| # Total 4688 2457 2231
| # . . . . Missing -
+---------------------- -----
-6583.261 3.75e+09 4688
(More than 99 unique values)
. sum y, detail
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 -6583.261
5% 0 -6500
10% 6000 -6174.44 Obs 4688
25% 11789.3 -600 Sum of Wgt. 4688
50% 16248 Mean 934811.9
Largest Std. Dev. 5.53e+07
75% 23629.94 313913
90% 34147.65 381262.2 Variance 3.06e+15
95% 44016.35 5.42e+08 Skewness 66.55301
99% 80886.5 3.75e+09 Kurtosis 4497.787
.
. keep if y<313913
(4 observations deleted)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 32
. drop if y<0
BRUZZESE SALVATORE MASTER MEP
(5 observations deleted)
. count
4679
.
. inspect y
y: reddito Number of Observations
----------- Non-
Total Integers Integers
| # Negative - - -
| # Zero 259 259 -
| # Positive 4420 2193 2227
| # ----- ----- -----
| # Total 4679 2452 2227
| # . . . . Missing -
+---------------------- -----
0 238704.8 4679
(More than 99 unique values)
. sum y, detail
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 4679
25% 11800 0 Sum of Wgt. 4679
50% 16250 Mean 19407.65
Largest Std. Dev. 15469.66
75% 23606.6 169263.5
90% 34101.2 173866 Variance 2.39e+08
95% 43622.34 220941.1 Skewness 3.712403
99% 79059 238704.8 Kurtosis 31.58755
.
. ge politica_numerosità=0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 33
BRUZZESE SALVATORE MASTER MEP
. replace politica_numerosità=0 if ncomp<4
(0 real changes made)
. replace politica_numerosità=1 if ncomp>=4
(2085 real changes made)
. label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)"
. label define trattamento1 1 "treated_num" 0 "control_num"
. label val politica_numerosità trattamento1
. tab politica_numerosità
sussidio |
alle |
famiglie |
numerose |
(n. |
componenti |
>= 4) | Freq. Percent Cum.
------------+-----------------------------------
control_num | 2,594 55.44 55.44
treated_num | 2,085 44.56 100.00
------------+-----------------------------------
Total | 4,679 100.00
. browse apqual y if politica_numerosità==1
. by politica_numerosità, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
10% 6000 0 Obs 2594
5% 0 0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 34
BRUZZESE SALVATORE MASTER MEP
25% 11700 0 Sum of Wgt. 2594
50% 16023.43 Mean 19264.81
Largest Std. Dev. 15585.79
75% 23200 150348.5
90% 34385.15 169263.5 Variance 2.43e+08
95% 44016.35 173866 Skewness 3.884143
99% 75666.59 238704.8 Kurtosis 34.25024
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 2085
25% 11991.3 0 Sum of Wgt. 2085
50% 16659.9 Mean 19585.36
Largest Std. Dev. 15325.82
75% 24000 132371
90% 33806 141676.1 Variance 2.35e+08
95% 43374.1 145000 Skewness 3.489304
99% 80886.5 220941.1 Kurtosis 28.0648
. graph pie, over(politica_numerosità) angle(90)
.
. ge politica_figli=0
. replace politica_figli=1 if nchild0_3>=1
(548 real changes made)
. * includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0
. replace politica_figli=0 if nchild0_3==0
(0 real changes made)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 35
BRUZZESE SALVATORE MASTER MEP
. label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni"
. label define trattamento2 1 "treated_figli" 0 "control_figli"
. label val politica_figli trattamento2
. tab politica_figli
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 4,131 88.29 88.29
treated_figli | 548 11.71 100.00
--------------+-----------------------------------
Total | 4,679 100.00
. by politica_figli, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = control_figli
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 5997.186 0 Obs 4131
25% 11700 0 Sum of Wgt. 4131
50% 16250 Mean 19458.48
Largest Std. Dev. 15692.82
75% 23606 169263.5
90% 34567.39 173866 Variance 2.46e+08
95% 44358.6 220941.1 Skewness 3.751553
99% 79059 238704.8 Kurtosis 32.14111
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 36
-----------------------------------------------------------------------------------------------------------------------
----
BRUZZESE SALVATORE MASTER MEP
-> politica_figli = treated_figli
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 1200 0
10% 7000 0 Obs 548
25% 12000 0 Sum of Wgt. 548
50% 16214.06 Mean 19024.45
Largest Std. Dev. 13677.58
75% 23736.33 92184
90% 32492.82 93661.01 Variance 1.87e+08
95% 40655.38 114913.8 Skewness 3.130492
99% 75453.1 138000 Kurtosis 21.28555
. graph pie, over(politica_figli) angle(90)
.
. ge politica_reddito=0
. ge mediana=16250/2
. display mediana
8125
. replace politica_reddito=0 if y>=mediana
(0 real changes made)
. replace politica_reddito=1 if y<mediana
(662 real changes made)
. label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà"
. label define trattamento3 1 "treated_reddito" 0 "control_reddito"
. label val politica_reddito trattamento3
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 37
. tab politica_reddito
BRUZZESE SALVATORE MASTER MEP
sussidio alle |
famiglie sotto |
la soglia di |
povertà | Freq. Percent Cum.
----------------+-----------------------------------
control_reddito | 4,017 85.85 85.85
treated_reddito | 662 14.15 100.00
----------------+-----------------------------------
Total | 4,679 100.00
. by politica_reddito, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = control_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 8553.354 8165
5% 10000 8167.9
10% 11000 8184.827 Obs 4017
25% 13650 8200 Sum of Wgt. 4017
50% 18000 Mean 22058.28
Largest Std. Dev. 15082.99
75% 25193 169263.5
90% 36461.54 173866 Variance 2.27e+08
95% 46259.3 220941.1 Skewness 4.355011
99% 82087.6 238704.8 Kurtosis 37.20802
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = treated_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 38
5% 0 0
BRUZZESE SALVATORE MASTER MEP
10% 0 0 Obs 662
25% 0 0 Sum of Wgt. 662
50% 3500 Mean 3323.673
Largest Std. Dev. 3109.037
75% 6414.245 8055.395
90% 7529.2 8060.6 Variance 9666112
95% 8000 8073 Skewness .1320215
99% 8007 8100 Kurtosis 1.347933
. graph pie, over(politica_reddito) angle(90)
.
. * Politiche Cumulate
. tab politica_numerosità politica_figli, row col freq chi2
+-------------------+
| Key |
|-------------------|
| frequency |
| row percentage |
| column percentage |
+-------------------+
sussidio |
alle |
famiglie |
numerose | sussidio alle
(n. | famiglie con figli da
componenti | 0 a 3 anni
>= 4) | control_f treated_f | Total
------------+----------------------+----------
control_num | 2,356 238 | 2,594
| 90.82 9.18 | 100.00
| 57.03 43.43 | 55.44
------------+----------------------+----------
treated_num | 1,775 310 | 2,085
| 85.13 14.87 | 100.00
| 42.97 56.57 | 44.56
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 39
------------+----------------------+----------
BRUZZESE SALVATORE MASTER MEP
Total | 4,131 548 | 4,679
| 88.29 11.71 | 100.00
| 100.00 100.00 | 100.00
Pearson chi2(1) = 36.2317 Pr = 0.000
. by politica_numerosità, sort: tab politica_figli
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 2,356 90.82 90.82
treated_figli | 238 9.18 100.00
--------------+-----------------------------------
Total | 2,594 100.00
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
sussidio alle |
famiglie con |
figli da 0 a |
3 anni | Freq. Percent Cum.
--------------+-----------------------------------
control_figli | 1,775 85.13 85.13
treated_figli | 310 14.87 100.00
--------------+-----------------------------------
Total | 2,085 100.00
. ge chi2n_num_figli=36.2317/(4679*1)
. label var chi2n_num_figli "chi2 normalizzato numerosita/figli"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 40
BRUZZESE SALVATORE MASTER MEP
. display chi2n_num_figli
.00774347
. * % treated incrociati su N
. display 310/4679*100
6.6253473
. * i trattati su N coprono il 6,6%
. tab politica_figli politica_reddito, row col chi2
+-------------------+
| Key |
|-------------------|
| frequency |
| row percentage |
| column percentage |
+-------------------+
sussidio alle | sussidio alle
famiglie con | famiglie sotto la
figli da 0 a | soglia di povertà
3 anni | control_r treated_r | Total
--------------+----------------------+----------
control_figli | 3,536 595 | 4,131
| 85.60 14.40 | 100.00
| 88.03 89.88 | 88.29
--------------+----------------------+----------
treated_figli | 481 67 | 548
| 87.77 12.23 | 100.00
| 11.97 10.12 | 11.71
--------------+----------------------+----------
Total | 4,017 662 | 4,679
| 85.85 14.15 | 100.00
| 100.00 100.00 | 100.00
Pearson chi2(1) = 1.8878 Pr = 0.169
. ge chi2n_figli_reddito=1.8878/(4679*1)
. label var chi2n_figli_reddito "chi2 normalizzato figli/reddito"
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 41
BRUZZESE SALVATORE MASTER MEP
. display chi2n_figli_reddito
.00040346
. display 67/4679*100
1.4319299
. tab politica_numerosità politica_reddito, row col chi2
+-------------------+
| Key |
|-------------------|
| frequency |
| row percentage |
| column percentage |
+-------------------+
sussidio |
alle |
famiglie |
numerose | sussidio alle
(n. | famiglie sotto la
componenti | soglia di povertà
>= 4) | control_r treated_r | Total
------------+----------------------+----------
control_num | 2,232 362 | 2,594
| 86.04 13.96 | 100.00
| 55.56 54.68 | 55.44
------------+----------------------+----------
treated_num | 1,785 300 | 2,085
| 85.61 14.39 | 100.00
| 44.44 45.32 | 44.56
------------+----------------------+----------
Total | 4,017 662 | 4,679
| 85.85 14.15 | 100.00
| 100.00 100.00 | 100.00
Pearson chi2(1) = 0.1786 Pr = 0.673
. ge chi2n_reddito_numerosità=0.1786/(4679*1)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 42
BRUZZESE SALVATORE MASTER MEP
. label var chi2n_reddito_numerosità "chi2 normalizzato reddito/numerosità"
. display chi2n_reddito_numerosità
.00003817
. display 300/4681*100
6.408887
.
. summ y, detail
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 4679
25% 11800 0 Sum of Wgt. 4679
50% 16250 Mean 19407.65
Largest Std. Dev. 15469.66
75% 23606.6 169263.5
90% 34101.2 173866 Variance 2.39e+08
95% 43622.34 220941.1 Skewness 3.712403
99% 79059 238704.8 Kurtosis 31.58755
. histogram y, percent normal
(bin=36, start=0, width=6630.6897)
. graph hbox y, medtype(cline) medline(lcolor(red))
.
. gen classi_reddito=0
. replace classi_reddito=1 if y<=10000
(918 real changes made)
. replace classi_reddito=2 if y>10000 & y<=20000
(2121 real changes made)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 43
. replace classi_reddito=3 if y>20000 & y<=30000
BRUZZESE SALVATORE MASTER MEP
(999 real changes made)
. replace classi_reddito=4 if y>30000 & y<=40000
(335 real changes made)
. replace classi_reddito=5 if y>40000 & y<=50000
(134 real changes made)
. replace classi_reddito=6 if y>50000
(172 real changes made)
. label var classi_reddito "classi di reddito (6)"
. label define yrecode 1 "0--| 10e+3" 2 "10e+3--| 20e+3" 3 "20e+3--| 30e+3" 4 "30e+3--| 40e+3" 5 "40e+3--| 50e+3" 6
"50e+3-
> -| 238,7e+3"
. label val classi_reddito yrecode
. tab classi_reddito
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 918 19.62 19.62
10e+3--| 20e+3 | 2,121 45.33 64.95
20e+3--| 30e+3 | 999 21.35 86.30
30e+3--| 40e+3 | 335 7.16 93.46
40e+3--| 50e+3 | 134 2.86 96.32
50e+3--| 238,7e+3 | 172 3.68 100.00
------------------+-----------------------------------
Total | 4,679 100.00
. by politica_numerosità, sort: tab classi_reddito
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
classi di reddito |
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 44
(6) | Freq. Percent Cum.
BRUZZESE SALVATORE MASTER MEP
------------------+-----------------------------------
0--| 10e+3 | 505 19.47 19.47
10e+3--| 20e+3 | 1,200 46.26 65.73
20e+3--| 30e+3 | 530 20.43 86.16
30e+3--| 40e+3 | 186 7.17 93.33
40e+3--| 50e+3 | 80 3.08 96.41
50e+3--| 238,7e+3 | 93 3.59 100.00
------------------+-----------------------------------
Total | 2,594 100.00
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 413 19.81 19.81
10e+3--| 20e+3 | 921 44.17 63.98
20e+3--| 30e+3 | 469 22.49 86.47
30e+3--| 40e+3 | 149 7.15 93.62
40e+3--| 50e+3 | 54 2.59 96.21
50e+3--| 238,7e+3 | 79 3.79 100.00
------------------+-----------------------------------
Total | 2,085 100.00
. kdensity classi_reddito if politica_numerosità==0, normal ylabel(0(.1)1)
. kdensity classi_reddito if politica_numerosità==1, normal ylabel(0(.1)1)
. by politica_figli, sort: tab classi_reddito
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = control_figli
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 45
0--| 10e+3 | 819 19.83 19.83
BRUZZESE SALVATORE MASTER MEP
10e+3--| 20e+3 | 1,857 44.95 64.78
20e+3--| 30e+3 | 883 21.37 86.15
30e+3--| 40e+3 | 296 7.17 93.32
40e+3--| 50e+3 | 117 2.83 96.15
50e+3--| 238,7e+3 | 159 3.85 100.00
------------------+-----------------------------------
Total | 4,131 100.00
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = treated_figli
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 99 18.07 18.07
10e+3--| 20e+3 | 264 48.18 66.24
20e+3--| 30e+3 | 116 21.17 87.41
30e+3--| 40e+3 | 39 7.12 94.53
40e+3--| 50e+3 | 17 3.10 97.63
50e+3--| 238,7e+3 | 13 2.37 100.00
------------------+-----------------------------------
Total | 548 100.00
. kdensity classi_reddito if politica_figli==0, normal ylabel(0(.1)1)
. kdensity classi_reddito if politica_figli==1, normal ylabel(0(.1)1)
. by politica_reddito, sort: tab classi_reddito
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = control_reddito
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 256 6.37 6.37
10e+3--| 20e+3 | 2,121 52.80 59.17
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 46
20e+3--| 30e+3 | 999 24.87 84.04
BRUZZESE SALVATORE MASTER MEP
30e+3--| 40e+3 | 335 8.34 92.38
40e+3--| 50e+3 | 134 3.34 95.72
50e+3--| 238,7e+3 | 172 4.28 100.00
------------------+-----------------------------------
Total | 4,017 100.00
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = treated_reddito
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 662 100.00 100.00
------------------+-----------------------------------
Total | 662 100.00
. kdensity classi_reddito if politica_reddito==0, normal ylabel(0(.1)1)
. kdensity classi_reddito if politica_reddito==1, normal ylabel(0(.1)1)
. graph pie, over(classi_reddito) angle(90)
. kdensity classi_reddito, normal
. graph pie, over(classi_reddito) angle(90)
. graph pie if politica_numerosità==1, over(classi_reddito) angle(90)
. graph pie if politica_figli==1, over(classi_reddito) angle(90)
. graph pie if politica_reddito==1, over(classi_reddito) angle(90)
.
. sum eta, detail
età
-------------------------------------------------------------
Percentiles Smallest
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 47
1% 25 18
BRUZZESE SALVATORE MASTER MEP
5% 29 18
10% 32 18 Obs 4679
25% 38 19 Sum of Wgt. 4679
50% 45 Mean 44.45394
Largest Std. Dev. 8.975953
75% 51 65
90% 56 65 Variance 80.56773
95% 59 65 Skewness -.1160282
99% 63 65 Kurtosis 2.42391
. histogram eta, normal percent
(bin=36, start=18, width=1.3055556)
. graph hbox eta
.
. ge classi_età=0
. replace classi_età=1 if eta<=30
(300 real changes made)
. replace classi_età=2 if eta>30&eta<=40
(1292 real changes made)
. replace classi_età=3 if eta>40&eta<=50
(1782 real changes made)
. replace classi_età=4 if eta>50
(1305 real changes made)
. label var classi_età "classi di eta (4)"
. label define recode_eta 1 "18--| 30" 2 "30--| 40" 3 "40--| 50" 4 "50--| 65"
. label val classi_età recode_eta
. tab classi_età
classi di |
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 48
eta (4) | Freq. Percent Cum.
BRUZZESE SALVATORE MASTER MEP
------------+-----------------------------------
18--| 30 | 300 6.41 6.41
30--| 40 | 1,292 27.61 34.02
40--| 50 | 1,782 38.09 72.11
50--| 65 | 1,305 27.89 100.00
------------+-----------------------------------
Total | 4,679 100.00
. tab classi_età if politica_numerosità==1
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 57 2.73 2.73
30--| 40 | 524 25.13 27.87
40--| 50 | 966 46.33 74.20
50--| 65 | 538 25.80 100.00
------------+-----------------------------------
Total | 2,085 100.00
. tab classi_età if politica_figli==1
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 84 15.33 15.33
30--| 40 | 361 65.88 81.20
40--| 50 | 99 18.07 99.27
50--| 65 | 4 0.73 100.00
------------+-----------------------------------
Total | 548 100.00
. tab classi_età if politica_reddito==1
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 69 10.42 10.42
30--| 40 | 202 30.51 40.94
40--| 50 | 197 29.76 70.69
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 49
50--| 65 | 194 29.31 100.00
BRUZZESE SALVATORE MASTER MEP
------------+-----------------------------------
Total | 662 100.00
. graph pie, over(classi_età) angle(90)
. kdensity eta, normal
.
. tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_numerosità==1
-> tabulation of sex if politica_numerosità==1
genere | Freq. Percent Cum.
------------+-----------------------------------
uomo | 1,384 66.38 66.38
donna | 701 33.62 100.00
------------+-----------------------------------
Total | 2,085 100.00
-> tabulation of staciv if politica_numerosità==1
stato civile | Freq. Percent Cum.
--------------------+-----------------------------------
coniugato/a | 2,019 96.83 96.83
celibe/nubile | 40 1.92 98.75
separato/divorziato | 22 1.06 99.81
vedovo/a | 4 0.19 100.00
--------------------+-----------------------------------
Total | 2,085 100.00
-> tabulation of lavora if politica_numerosità==1
lavoratori | Freq. Percent Cum.
---------------+-----------------------------------
non lavoratore | 105 5.04 5.04
lavoratore | 1,980 94.96 100.00
---------------+-----------------------------------
Total | 2,085 100.00
-> tabulation of partime if politica_numerosità==1
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 50
BRUZZESE SALVATORE MASTER MEP
tipologia |
lavoro | Freq. Percent Cum.
------------+-----------------------------------
full-time | 1,355 89.20 89.20
part-time | 164 10.80 100.00
------------+-----------------------------------
Total | 1,519 100.00
-> tabulation of apsett if politica_numerosità==1
settore |
lavorativo | Freq. Percent Cum.
---------------+-----------------------------------
agricoltura | 133 6.46 6.46
manifatturiero | 483 23.45 29.90
costruzione | 188 9.13 39.03
commercio | 312 15.15 54.17
trasporti | 106 5.15 59.32
banche | 75 3.64 62.96
serv. finanz. | 84 4.08 67.04
serv.person. | 85 4.13 71.17
pubblico | 592 28.74 99.90
org.internaz | 2 0.10 100.00
---------------+-----------------------------------
Total | 2,060 100.00
-> tabulation of apqual if politica_numerosità==1
tipo di occupazione | Freq. Percent Cum.
------------------------------+-----------------------------------
operai | 669 32.09 32.09
impiegati | 547 26.24 58.32
insegnanti | 140 6.71 65.04
quadri | 96 4.60 69.64
dirigenti | 45 2.16 71.80
libero professionista | 95 4.56 76.35
imprenditore individuale | 44 2.11 78.47
lavoratore autonomo/artigiano | 215 10.31 88.78
titolare impresa familiare | 76 3.65 92.42
in cerca di prima occupazione | 25 1.20 96.16
socio/gestore società | 53 2.54 94.96
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 51
BRUZZESE SALVATORE MASTER MEP
disoccupato | 80 3.84 100.00
------------------------------+-----------------------------------
Total | 2,085 100.00
-> tabulation of classi_reddito if politica_numerosità==1
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 413 19.81 19.81
10e+3--| 20e+3 | 921 44.17 63.98
20e+3--| 30e+3 | 469 22.49 86.47
30e+3--| 40e+3 | 149 7.15 93.62
40e+3--| 50e+3 | 54 2.59 96.21
50e+3--| 238,7e+3 | 79 3.79 100.00
------------------+-----------------------------------
Total | 2,085 100.00
-> tabulation of classi_età if politica_numerosità==1
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 57 2.73 2.73
30--| 40 | 524 25.13 27.87
40--| 50 | 966 46.33 74.20
50--| 65 | 538 25.80 100.00
------------+-----------------------------------
Total | 2,085 100.00
. tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_figli==1
-> tabulation of sex if politica_figli==1
genere | Freq. Percent Cum.
------------+-----------------------------------
uomo | 364 66.42 66.42
donna | 184 33.58 100.00
------------+-----------------------------------
Total | 548 100.00
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 52
BRUZZESE SALVATORE MASTER MEP
-> tabulation of staciv if politica_figli==1
stato civile | Freq. Percent Cum.
--------------------+-----------------------------------
coniugato/a | 532 97.08 97.08
celibe/nubile | 9 1.64 98.72
separato/divorziato | 5 0.91 99.64
vedovo/a | 2 0.36 100.00
--------------------+-----------------------------------
Total | 548 100.00
-> tabulation of lavora if politica_figli==1
lavoratori | Freq. Percent Cum.
---------------+-----------------------------------
non lavoratore | 25 4.56 4.56
lavoratore | 523 95.44 100.00
---------------+-----------------------------------
Total | 548 100.00
-> tabulation of partime if politica_figli==1
tipologia |
lavoro | Freq. Percent Cum.
------------+-----------------------------------
full-time | 365 87.95 87.95
part-time | 50 12.05 100.00
------------+-----------------------------------
Total | 415 100.00
-> tabulation of apsett if politica_figli==1
settore |
lavorativo | Freq. Percent Cum.
---------------+-----------------------------------
agricoltura | 27 4.99 4.99
manifatturiero | 151 27.91 32.90
costruzione | 51 9.43 42.33
commercio | 86 15.90 58.23
trasporti | 30 5.55 63.77
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 53
banche | 17 3.14 66.91
BRUZZESE SALVATORE MASTER MEP
serv. finanz. | 34 6.28 73.20
serv.person. | 22 4.07 77.26
pubblico | 120 22.18 99.45
org.internaz | 3 0.55 100.00
---------------+-----------------------------------
Total | 541 100.00
-> tabulation of apqual if politica_figli==1
tipo di occupazione | Freq. Percent Cum.
------------------------------+-----------------------------------
operai | 183 33.39 33.39
impiegati | 176 32.12 65.51
insegnanti | 21 3.83 69.34
quadri | 19 3.47 72.81
dirigenti | 10 1.82 74.64
libero professionista | 29 5.29 79.93
imprenditore individuale | 12 2.19 82.12
lavoratore autonomo/artigiano | 50 9.12 91.24
titolare impresa familiare | 10 1.82 93.07
socio/gestore società | 13 2.37 95.44
in cerca di prima occupazione | 7 1.28 96.72
disoccupato | 18 3.28 100.00
------------------------------+-----------------------------------
Total | 548 100.00
-> tabulation of classi_reddito if politica_figli==1
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 99 18.07 18.07
10e+3--| 20e+3 | 264 48.18 66.24
20e+3--| 30e+3 | 116 21.17 87.41
30e+3--| 40e+3 | 39 7.12 94.53
40e+3--| 50e+3 | 17 3.10 97.63
50e+3--| 238,7e+3 | 13 2.37 100.00
------------------+-----------------------------------
Total | 548 100.00
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 54
-> tabulation of classi_età if politica_figli==1
BRUZZESE SALVATORE MASTER MEP
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 84 15.33 15.33
30--| 40 | 361 65.88 81.20
40--| 50 | 99 18.07 99.27
50--| 65 | 4 0.73 100.00
------------+-----------------------------------
Total | 548 100.00
. tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_reddito==1
-> tabulation of sex if politica_reddito==1
genere | Freq. Percent Cum.
------------+-----------------------------------
uomo | 276 41.69 41.69
donna | 386 58.31 100.00
------------+-----------------------------------
Total | 662 100.00
-> tabulation of staciv if politica_reddito==1
stato civile | Freq. Percent Cum.
--------------------+-----------------------------------
coniugato/a | 556 83.99 83.99
celibe/nubile | 56 8.46 92.45
separato/divorziato | 37 5.59 98.04
vedovo/a | 13 1.96 100.00
--------------------+-----------------------------------
Total | 662 100.00
-> tabulation of lavora if politica_reddito==1
lavoratori | Freq. Percent Cum.
---------------+-----------------------------------
non lavoratore | 259 39.12 39.12
lavoratore | 403 60.88 100.00
---------------+-----------------------------------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 55
Total | 662 100.00
BRUZZESE SALVATORE MASTER MEP
-> tabulation of partime if politica_reddito==1
tipologia |
lavoro | Freq. Percent Cum.
------------+-----------------------------------
full-time | 142 45.66 45.66
part-time | 169 54.34 100.00
------------+-----------------------------------
Total | 311 100.00
-> tabulation of apsett if politica_reddito==1
settore |
lavorativo | Freq. Percent Cum.
---------------+-----------------------------------
agricoltura | 95 15.70 15.70
manifatturiero | 118 19.50 35.21
costruzione | 67 11.07 46.28
commercio | 133 21.98 68.26
trasporti | 19 3.14 71.40
banche | 5 0.83 72.23
serv. finanz. | 29 4.79 77.02
serv.person. | 78 12.89 89.92
pubblico | 59 9.75 99.67
org.internaz | 2 0.33 100.00
---------------+-----------------------------------
Total | 605 100.00
-> tabulation of apqual if politica_reddito==1
tipo di occupazione | Freq. Percent Cum.
------------------------------+-----------------------------------
operai | 210 31.72 31.72
impiegati | 58 8.76 40.48
insegnanti | 10 1.51 41.99
quadri | 3 0.45 42.45
dirigenti | 1 0.15 42.60
libero professionista | 13 1.96 44.56
lavoratore autonomo/artigiano | 61 9.21 55.14
imprenditore individuale | 9 1.36 45.92
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 56
BRUZZESE SALVATORE MASTER MEP
titolare impresa familiare | 33 4.98 60.12
socio/gestore società | 5 0.76 60.88
in cerca di prima occupazione | 55 8.31 69.18
disoccupato | 202 30.51 99.70
militare di leva | 2 0.30 100.00
------------------------------+-----------------------------------
Total | 662 100.00
-> tabulation of classi_reddito if politica_reddito==1
classi di reddito |
(6) | Freq. Percent Cum.
------------------+-----------------------------------
0--| 10e+3 | 662 100.00 100.00
------------------+-----------------------------------
Total | 662 100.00
-> tabulation of classi_età if politica_reddito==1
classi di |
eta (4) | Freq. Percent Cum.
------------+-----------------------------------
18--| 30 | 69 10.42 10.42
30--| 40 | 202 30.51 40.94
40--| 50 | 197 29.76 70.69
50--| 65 | 194 29.31 100.00
------------+-----------------------------------
Total | 662 100.00
.
. * indici di posizione
. by politica_numerosità, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = control_num
reddito
-------------------------------------------------------------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 57
Percentiles Smallest
BRUZZESE SALVATORE MASTER MEP
1% 0 0
5% 0 0
10% 6000 0 Obs 2594
25% 11700 0 Sum of Wgt. 2594
50% 16023.43 Mean 19264.81
Largest Std. Dev. 15585.79
75% 23200 150348.5
90% 34385.15 169263.5 Variance 2.43e+08
95% 44016.35 173866 Skewness 3.884143
99% 75666.59 238704.8 Kurtosis 34.25024
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_numerosità = treated_num
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 6000 0 Obs 2085
25% 11991.3 0 Sum of Wgt. 2085
50% 16659.9 Mean 19585.36
Largest Std. Dev. 15325.82
75% 24000 132371
90% 33806 141676.1 Variance 2.35e+08
95% 43374.1 145000 Skewness 3.489304
99% 80886.5 220941.1 Kurtosis 28.0648
. tab classi_reddito politica_numerosità
| sussidio alle
| famiglie numerose (n.
classi di reddito | componenti >= 4)
(6) | control_n treated_n | Total
------------------+----------------------+----------
0--| 10e+3 | 505 413 | 918
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 58
10e+3--| 20e+3 | 1,200 921 | 2,121
BRUZZESE SALVATORE MASTER MEP
20e+3--| 30e+3 | 530 469 | 999
30e+3--| 40e+3 | 186 149 | 335
40e+3--| 50e+3 | 80 54 | 134
50e+3--| 238,7e+3 | 93 79 | 172
------------------+----------------------+----------
Total | 2,594 2,085 | 4,679
. * densità relativa classe modale control
. display 1200/10000
.12
. * densità relativa classe modale treated
. display 921/10000
.0921
. by politica_figli, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = control_figli
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 5997.186 0 Obs 4131
25% 11700 0 Sum of Wgt. 4131
50% 16250 Mean 19458.48
Largest Std. Dev. 15692.82
75% 23606 169263.5
90% 34567.39 173866 Variance 2.46e+08
95% 44358.6 220941.1 Skewness 3.751553
99% 79059 238704.8 Kurtosis 32.14111
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_figli = treated_figli
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 59
BRUZZESE SALVATORE MASTER MEP
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 1200 0
10% 7000 0 Obs 548
25% 12000 0 Sum of Wgt. 548
50% 16214.06 Mean 19024.45
Largest Std. Dev. 13677.58
75% 23736.33 92184
90% 32492.82 93661.01 Variance 1.87e+08
95% 40655.38 114913.8 Skewness 3.130492
99% 75453.1 138000 Kurtosis 21.28555
. tab classi_reddito politica_figli
| sussidio alle
| famiglie con figli da
classi di reddito | 0 a 3 anni
(6) | control_f treated_f | Total
------------------+----------------------+----------
0--| 10e+3 | 819 99 | 918
10e+3--| 20e+3 | 1,857 264 | 2,121
20e+3--| 30e+3 | 883 116 | 999
30e+3--| 40e+3 | 296 39 | 335
40e+3--| 50e+3 | 117 17 | 134
50e+3--| 238,7e+3 | 159 13 | 172
------------------+----------------------+----------
Total | 4,131 548 | 4,679
. * densità relativa classe modale control
. display 1857/10000
.1857
. * densità relativa classe modale treated
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 60
. display 264/10000
BRUZZESE SALVATORE MASTER MEP
.0264
. by politica_reddito, sort: sum y, detail
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = control_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 8553.354 8165
5% 10000 8167.9
10% 11000 8184.827 Obs 4017
25% 13650 8200 Sum of Wgt. 4017
50% 18000 Mean 22058.28
Largest Std. Dev. 15082.99
75% 25193 169263.5
90% 36461.54 173866 Variance 2.27e+08
95% 46259.3 220941.1 Skewness 4.355011
99% 82087.6 238704.8 Kurtosis 37.20802
-----------------------------------------------------------------------------------------------------------------------
----
-> politica_reddito = treated_reddito
reddito
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 0 0 Obs 662
25% 0 0 Sum of Wgt. 662
50% 3500 Mean 3323.673
Largest Std. Dev. 3109.037
75% 6414.245 8055.395
95% 8000 8073 Skewness .1320215
90% 7529.2 8060.6 Variance 9666112
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 61
BRUZZESE SALVATORE MASTER MEP
99% 8007 8100 Kurtosis 1.347933
. tab classi_reddito politica_reddito
| sussidio alle
| famiglie sotto la
classi di reddito | soglia di povertà
(6) | control_r treated_r | Total
------------------+----------------------+----------
0--| 10e+3 | 256 662 | 918
10e+3--| 20e+3 | 2,121 0 | 2,121
20e+3--| 30e+3 | 999 0 | 999
30e+3--| 40e+3 | 335 0 | 335
40e+3--| 50e+3 | 134 0 | 134
50e+3--| 238,7e+3 | 172 0 | 172
------------------+----------------------+----------
Total | 4,017 662 | 4,679
. * densità relativa classe modale control
. display 2121/10000
.2121
. * densità relativa classe modale treated
. display 662/10000
.0662
.
. * indici di dispersione
. * range politica numerosità control
. display 238704.8-0
238704.8
. * range politica numerosità treated
. display 220941.1-0
220941.1
. * range politica figli control
. display 238704.8-0
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 62
238704.8
BRUZZESE SALVATORE MASTER MEP
. * range politica figli treated
. display 138000-0
138000
. * range politica reddito control
. display 238704.8-8165
230539.8
. * range politica reddito treated
. display 8450-0
8450
.
. * CV - coefficiente di variazione
. tab politica_numerosità, sum(y)
sussidio |
alle |
famiglie |
numerose |
(n. |
componenti | Summary of reddito
>= 4) | Mean Std. Dev. Freq.
------------+------------------------------------
control_n | 19264.806 15585.792 2594
treated_n | 19585.362 15325.824 2085
------------+------------------------------------
Total | 19407.649 15469.661 4679
. * CV Control
. display 15585.8/19264.8
.80902994
. * CV Treated
. display 15325.8/19585.4
.78251146
. tab politica_figli, sum(y)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 63
sussidio |
BRUZZESE SALVATORE MASTER MEP
alle |
famiglie |
con figli |
da 0 a 3 | Summary of reddito
anni | Mean Std. Dev. Freq.
------------+------------------------------------
control_f | 19458.482 15692.816 4131
treated_f | 19024.451 13677.579 548
------------+------------------------------------
Total | 19407.649 15469.661 4679
. * CV Control
. display 15692.8/19458.5
.80647532
. * CV Treated
. display 13677.6/19024.5
.71894662
. tab politica_reddito, sum(y)
sussidio |
alle |
famiglie |
sotto la |
soglia di | Summary of reddito
povertà | Mean Std. Dev. Freq.
------------+------------------------------------
control_r | 22058.281 15082.99 4017
treated_r | 3323.6727 3109.0372 662
------------+------------------------------------
Total | 19407.649 15469.661 4679
. * CV Control
. display 15082.99/22058.3
.68377844
. * CV Treated
. display 3109.0372/3323.7
.93541451
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 64
BRUZZESE SALVATORE MASTER MEP
.
. * Confronto visivo box-plot (min, q1, q2 [mediana], q3, max, outliers)
. graph box y, by(politica_numerosità)
. graph box y, by(politica_figli)
. graph box y, by(politica_reddito)
. graph box y if politica_reddito==1
. graph box y if politica_reddito==0
.
. ge differenza_medie_numerosità= 19264.806-19585.362
. ge differenza_medie_figli=19458.482-19024.451
. ge differenza_medie_reddito=22058.281-3323.6727
. display differenza_medie_numerosità, differenza_medie_figli, differenza_medie_reddito
-320.556 434.03101 18734.607
.
. * Regressione Y=y e X=politiche: Y=a+bX+e
. regress y politica_numerosità
Source | SS df MS Number of obs = 4679
-------------+------------------------------ F( 1, 4677) = 0.50
Model | 118776703 1 118776703 Prob > F = 0.4812
Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001
-------------+------------------------------ Adj R-squared = -0.0001
Total | 1.1195e+12 4678 239310412 Root MSE = 15470
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_n~à | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635
_cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3
------------------------------------------------------------------------------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 65
. pwcorr y politica_numerosità, star(.05)
BRUZZESE SALVATORE MASTER MEP
| y politi~à
-------------+------------------
y | 1.0000
politica_n~à | 0.0103 1.0000
. regress y politica_figli
Source | SS df MS Number of obs = 4679
-------------+------------------------------ F( 1, 4677) = 0.38
Model | 91143078.6 1 91143078.6 Prob > F = 0.5372
Residual | 1.1194e+12 4677 239342092 R-squared = 0.0001
-------------+------------------------------ Adj R-squared = -0.0001
Total | 1.1195e+12 4678 239310412 Root MSE = 15471
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_f~i | -434.0307 703.3446 -0.62 0.537 -1812.918 944.8563
_cons | 19458.48 240.7032 80.84 0.000 18986.59 19930.37
------------------------------------------------------------------------------
. pwcorr y politica_figli, star(.05)
| y politi~i
-------------+------------------
y | 1.0000
politica_f~i | -0.0090 1.0000
. regress y politica_reddito
Source | SS df MS Number of obs = 4679
-------------+------------------------------ F( 1, 4677) = 1014.07
Model | 1.9948e+11 1 1.9948e+11 Prob > F = 0.0000
Residual | 9.2002e+11 4677 196710634 R-squared = 0.1782
-------------+------------------------------ Adj R-squared = 0.1780
Total | 1.1195e+12 4678 239310412 Root MSE = 14025
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------------------------------------------------------------------------------
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 66
BRUZZESE SALVATORE MASTER MEP
-------------+----------------------------------------------------------------
politica_r~o | -18734.61 588.3158 -31.84 0.000 -19887.99 -17581.23
_cons | 22058.28 221.2906 99.68 0.000 21624.45 22492.12
------------------------------------------------------------------------------
. pwcorr y politica_reddito, star(.05)
| y politi~o
-------------+------------------
y | 1.0000
politica_r~o | -0.4221* 1.0000
. regress y politica_numerosità apqual partime lavora sex studio eta
Source | SS df MS Number of obs = 3433
-------------+------------------------------ F( 7, 3425) = 271.22
Model | 1.7155e+11 7 2.4507e+10 Prob > F = 0.0000
Residual | 3.0949e+11 3425 90360852.9 R-squared = 0.3566
-------------+------------------------------ Adj R-squared = 0.3553
Total | 4.8104e+11 3432 140162667 Root MSE = 9505.8
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_n~à | -561.8085 330.004 -1.70 0.089 -1208.833 85.21598
apqual | 3256.275 182.251 17.87 0.000 2898.944 3613.607
partime | -4457.468 576.6978 -7.73 0.000 -5588.174 -3326.761
lavora | 50597.52 2635.324 19.20 0.000 45430.56 55764.49
sex | -6553.108 348.2265 -18.82 0.000 -7235.86 -5870.355
studio | 1620.848 137.3338 11.80 0.000 1351.584 1890.113
eta | 170.4344 19.23212 8.86 0.000 132.7269 208.142
_cons | -37542.28 2863.03 -13.11 0.000 -43155.7 -31928.86
------------------------------------------------------------------------------
. pwcorr y politica_numerosità apqual partime lavora sex studio eta, star(.05)
| y politi~à apqual partime lavora sex studio
-------------+---------------------------------------------------------------
y | 1.0000
politica_n~à | 0.0103 1.0000
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 67
apqual | 0.0214 0.0072 1.0000
BRUZZESE SALVATORE MASTER MEP
partime | -0.2583* 0.0293 0.0008 1.0000
lavora | 0.3037* 0.0196 -0.5933* -0.1268* 1.0000
sex | -0.2322* -0.1051* -0.0756* 0.2574* 0.0075 1.0000
studio | 0.3145* -0.0254 0.0163 -0.0805* 0.1259* 0.1168* 1.0000
eta | 0.1289* 0.0622* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167*
| eta
-------------+---------
eta | 1.0000
. regress y politica_figli apqual partime lavora sex studio eta
Source | SS df MS Number of obs = 3433
-------------+------------------------------ F( 7, 3425) = 270.59
Model | 1.7130e+11 7 2.4471e+10 Prob > F = 0.0000
Residual | 3.0974e+11 3425 90435875.1 R-squared = 0.3561
-------------+------------------------------ Adj R-squared = 0.3548
Total | 4.8104e+11 3432 140162667 Root MSE = 9509.8
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_f~i | 124.3377 532.056 0.23 0.815 -918.8415 1167.517
apqual | 3258.584 182.3216 17.87 0.000 2901.114 3616.054
partime | -4520.424 576.2581 -7.84 0.000 -5650.268 -3390.579
lavora | 50625.3 2636.563 19.20 0.000 45455.9 55794.69
sex | -6482.72 347.9485 -18.63 0.000 -7164.928 -5800.513
studio | 1619.138 137.4507 11.78 0.000 1349.645 1888.632
eta | 169.443 20.36845 8.32 0.000 129.5075 209.3786
_cons | -37818.47 2881.957 -13.12 0.000 -43468.99 -32167.94
------------------------------------------------------------------------------
. pwcorr y politica_figli apqual partime lavora sex studio eta, star(.05)
| y politi~i apqual partime lavora sex studio
-------------+---------------------------------------------------------------
y | 1.0000
politica_f~i | -0.0090 1.0000
apqual | 0.0214 -0.0303* 1.0000
lavora | 0.3037* 0.0155 -0.5933* -0.1268* 1.0000
partime | -0.2583* 0.0278 0.0008 1.0000
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 68
BRUZZESE SALVATORE MASTER MEP
sex | -0.2322* -0.0430* -0.0756* 0.2574* 0.0075 1.0000
studio | 0.3145* 0.0638* 0.0163 -0.0805* 0.1259* 0.1168* 1.0000
eta | 0.1289* -0.3470* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167*
| eta
-------------+---------
eta | 1.0000
. regress y politica_reddito apqual partime lavora sex studio eta
Source | SS df MS Number of obs = 3433
-------------+------------------------------ F( 7, 3425) = 302.95
Model | 1.8395e+11 7 2.6278e+10 Prob > F = 0.0000
Residual | 2.9709e+11 3425 86741870.4 R-squared = 0.3824
-------------+------------------------------ Adj R-squared = 0.3811
Total | 4.8104e+11 3432 140162667 Root MSE = 9313.5
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_r~o | -8054.855 666.8196 -12.08 0.000 -9362.259 -6747.451
apqual | 3220.971 178.5863 18.04 0.000 2870.825 3571.118
partime | -1431.979 619.1189 -2.31 0.021 -2645.858 -218.0989
lavora | 44185.35 2636.533 16.76 0.000 39016.01 49354.68
sex | -5958.358 342.1113 -17.42 0.000 -6629.121 -5287.595
studio | 1409.114 135.6837 10.39 0.000 1143.084 1675.143
eta | 159.1275 18.79768 8.47 0.000 122.2717 195.9833
_cons | -33432.04 2825.412 -11.83 0.000 -38971.71 -27892.38
------------------------------------------------------------------------------
. pwcorr y politica_reddito apqual partime lavora sex studio eta, star(.05)
| y politi~o apqual partime lavora sex studio
-------------+---------------------------------------------------------------
y | 1.0000
politica_r~o | -0.4221* 1.0000
apqual | 0.0214 0.3604* 1.0000
partime | -0.2583* 0.4723* 0.0008 1.0000
lavora | 0.3037* -0.5963* -0.5933* -0.1268* 1.0000
studio | 0.3145* -0.2005* 0.0163 -0.0805* 0.1259* 0.1168* 1.0000
sex | -0.2322* 0.1576* -0.0756* 0.2574* 0.0075 1.0000
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 69
BRUZZESE SALVATORE MASTER MEP
eta | 0.1289* -0.0328* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167*
| eta
-------------+---------
eta | 1.0000
.
. * ESEMPIO Metodo alternativo REGRESSIONE-DUMMY TREATED (volendo si possono creare variabili dummy dalle variabili
indipen
> denti utilizzate e voncolare ad una condizione particolare l'analisi, creando particolari gruppi di riferimento)
. char politica_numerosità[omit] 0
. xi: regress y i.politica_numerosità
i.politica_nu~à _Ipolitica__0-1 (naturally coded; _Ipolitica__0 omitted)
Source | SS df MS Number of obs = 4679
-------------+------------------------------ F( 1, 4677) = 0.50
Model | 118776703 1 118776703 Prob > F = 0.4812
Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001
-------------+------------------------------ Adj R-squared = -0.0001
Total | 1.1195e+12 4678 239310412 Root MSE = 15470
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Ipolitica~1 | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635
_cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3
------------------------------------------------------------------------------
. * Guppo di riferimento: donne, occupate part-time, tra i 30 e 40 anni
. char sex [omit] 1
. char partime [omit] 1
. char classi_età [omit] 2
. xi: regress y i.politica_numerosità apqual i.partime i.sex studio i.classi_età
i.politica_nu~à _Ipolitica__0-1 (naturally coded; _Ipolitica__0 omitted)
i.sex _Isex_1-2 (naturally coded; _Isex_1 omitted)
i.partime _Ipartime_1-2 (naturally coded; _Ipartime_1 omitted)
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 70
BRUZZESE SALVATORE MASTER MEP
i.classi_età _Iclassi_et_1-4 (naturally coded; _Iclassi_et_2 omitted)
Source | SS df MS Number of obs = 3433
-------------+------------------------------ F( 8, 3424) = 170.40
Model | 1.3698e+11 8 1.7122e+10 Prob > F = 0.0000
Residual | 3.4406e+11 3424 100484661 R-squared = 0.2848
-------------+------------------------------ Adj R-squared = 0.2831
Total | 4.8104e+11 3432 140162667 Root MSE = 10024
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Ipolitica~1 | -754.2657 353.6052 -2.13 0.033 -1447.564 -60.96712
apqual | 687.6728 128.5679 5.35 0.000 435.5952 939.7504
_Ipartime_2 | -5913.819 603.1368 -9.81 0.000 -7096.364 -4731.275
_Isex_2 | -6412.592 367.3136 -17.46 0.000 -7132.768 -5692.416
studio | 2791.7 128.1226 21.79 0.000 2540.496 3042.905
_Iclassi_e~1 | -3345.889 744.4077 -4.49 0.000 -4805.417 -1886.361
_Iclassi_e~3 | 2104.893 425.6387 4.95 0.000 1270.361 2939.424
_Iclassi_e~4 | 3483.438 473.8587 7.35 0.000 2554.364 4412.512
_cons | 8061.702 616.2943 13.08 0.000 6853.36 9270.044
------------------------------------------------------------------------------
.
. * ESEMPIO Regressione lineare con residui e
. regress y politica_numerosità
Source | SS df MS Number of obs = 4679
-------------+------------------------------ F( 1, 4677) = 0.50
Model | 118776703 1 118776703 Prob > F = 0.4812
Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001
-------------+------------------------------ Adj R-squared = -0.0001
Total | 1.1195e+12 4678 239310412 Root MSE = 15470
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
politica_n~à | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635
------------------------------------------------------------------------------
_cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 71
BRUZZESE SALVATORE MASTER MEP
. predict feeted_values
(option xb assumed; fitted values)
. predict e, residual
. list y feeted_values in 1/10
+----------------------+
| y feeted~s |
|----------------------|
1. | 15805.343 19264.81 |
2. | 12899.2 19585.36 |
3. | 17400.439 19585.36 |
4. | 24280.301 19585.36 |
5. | 25000 19585.36 |
|----------------------|
6. | 55705.059 19585.36 |
7. | 34693.668 19264.81 |
8. | 13000 19264.81 |
9. | 26182.1 19264.81 |
10. | 19000 19585.36 |
+----------------------+
. list y e in 1/10
+-----------------------+
| y e |
|-----------------------|
1. | 15805.343 -3459.463 |
2. | 12899.2 -6686.162 |
3. | 17400.439 -2184.923 |
4. | 24280.301 4694.938 |
5. | 25000 5414.638 |
|-----------------------|
6. | 55705.059 36119.7 |
7. | 34693.668 15428.86 |
8. | 13000 -6264.806 |
9. | 26182.1 6917.293 |
UNIVERSITÀ CATTOLICA DEL SACRO CUORE
UCSC 72
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency
Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency

Mais conteúdo relacionado

Destaque (6)

mi proyecto
mi proyecto mi proyecto
mi proyecto
 
Herramientas tecnólogicas 1
Herramientas tecnólogicas 1Herramientas tecnólogicas 1
Herramientas tecnólogicas 1
 
Bhagavad gita according to gandhi chapter 18
Bhagavad gita according to gandhi chapter 18Bhagavad gita according to gandhi chapter 18
Bhagavad gita according to gandhi chapter 18
 
The Lantern Church Marlow Bottom
The Lantern Church Marlow BottomThe Lantern Church Marlow Bottom
The Lantern Church Marlow Bottom
 
Where are the mice
Where are the miceWhere are the mice
Where are the mice
 
La Dimensión Profética del Carisma Vicenciano - 4
La Dimensión Profética del Carisma Vicenciano - 4La Dimensión Profética del Carisma Vicenciano - 4
La Dimensión Profética del Carisma Vicenciano - 4
 

Italian Welfare Efficiency: inferential statistics to evaluate economic efficiency

  • 1. BRUZZESE SALVATORE MASTER MEP Analisi Dati1 – POLITICHE DI WELFARE – STATA Obiettivo Generale: In merito alla scelta di adottare una politica di sostegno al reddito rivolta alla popolazione attiva, valutare la copertura del campione in relazione ai sussidi, le caratteristiche demografiche, la possibilità di utilizzare 2 sussidi ed i dati ad essi connessi, le implicazioni economiche da sostenere in relazione all’implementazione di una delle policy. Campione: La popolazione, composta da 7872 soggetti, è stata ridefinita escludendo outliers ed analizzando la bontà dei dati (missing); in particolare in base alla definizione di popolazione attiva2 , sono stati presi in considerazione i soggetti appartenenti a determinate fasce di qualifica occupazionale (apqual) e quelli non categorizzabili (categoria “altro”), escludendo casalinghe, benestanti, pensionati, studenti e bambini in età prescolare (13<=apqual>19); i dati missing (coloro con reddito “y==.”) che rientrano nelle condizioni poste, escluse 2 incoerenze (disoccupati con reddito), sono stati ricodificati in y=0 per evidenziare la presenza degli stessi nell’individuazione della soglia di povertà; inoltre si è proceduto alla ridefinizione del campione escludendo gli outliers con redditi negativi (5 soggetti) e 4 elementi che presentavano un reddito oltre i 300000, giungendo ad un campione di 4679 soggetti. 1 E’ stata mantenuta la codificazione decimali/migliaia di STATA, quindi i “.” indicano i decimali, le “,” le migliaia. 2 Secondo le definizioni adottate dall’ISTAT per popolazione attiva si intende l'insieme delle persone di età non inferiore ai 15 anni che, alla data del censimento, risultano: 1. occupate esercitando in proprio o alle dipendenze altrui una professione, arte o mestiere; 2. disoccupate ovvero hanno perduto il precedente lavoro e sono alla ricerca di una occupazione; 3. momentaneamente impedite a svolgere la propria attività lavorativa in quanto inquadrabili come: militari di leva (o in servizio civile), volontari, richiamati; ricoverati da meno di due anni in luoghi di cura e assistenza; detenuti in attesa di giudizio o condannati a pene inferiori a 5 anni; 4. alla ricerca di prima occupazione, non avendone mai svolta alcuna in precedenza. Le persone di cui ai punti 1), 2), 3) costituiscono la popolazione attiva in condizione professionale. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 1
  • 2. BRUZZESE SALVATORE MASTER MEP Descrizione politiche: 1. politica di sussidio alle famiglie numerose (ncomp>=4): i gruppi interessati dal sussidio (treated) sono pari al 44,6% (2085/4681) del campione; includendo i missing (ex 259, ora y=0, in cerca di prima occupazione o disoccupati o militari) la mediana del reddito (taglia il campione al 50% ed in quanto valore interno rende minima la somma delle differenze in valore assoluto, senza risentire dei valori estremi) dei treated è (taglio al 50%) 16659.9>16023.4 (control), in media3 19585.4:19264.8 (treated:control) e varianza4 simile => dispersione simile attorno alla media, i due sottocampioni hanno una distribuzione similare; il sottocampione dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 96,8% sono coniugati, maschi (66,4%), lavoratori (95%) full-time (89,2%), impiegati in prevalenza nel pubblico (28,7%), nel settore manifatturiero (23,5%), nel commercio (15,2%), il 58,3% di n svolge la professione di operaio (32.1%) ed impiegato (26,2%), il 10,3% è lavoratore autonomo, l’86.5% rientra fino alla 3° classe di reddito, dai 30000 in giù, con prevalenza del reddito tra 10000 e 20000 (44.1%), la classe d’età prevalente è quella tra i 40 ed i 50 anni (46,3%), la classe inferiore (solo il 2.7%) è quella dai 20 ai 30 anni; n ha un’età al di sopra dei 40 anni (74,2%), è in prevalenza impiegato e percepisce una retribuzione dai 10000 ai 20000; 2. politica di sussidio a famiglie con figli con età<=3 (eta): i treated sono l’11,7% del campione (548/4679) e percepiscono un reddito al (II percentile) di 16214.1<16250 (control, 4131), in media 19024.5:19458.5 (treated:control) e varianza maggiore nel control; il sottocampione dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 97,1% sono coniugati, maschi (66,4%), lavoratori (95,4%) full-time (88%), impiegati in prevalenza nel settore manifatturiero (27,9%), nel pubblico (22,2%), nel commercio (15,9%), il 65,5% di n svolge la professione di operaio (33,4%) ed impiegato (32,1%), il 9,1% è lavoratore autonomo, l’87,4% rientra fino alla 3° classe di reddito, dai 30000 in giù, con prevalenza del reddito tra 10000 e 20000 (48,2%), la classe d’età prevalente è quella tra i 30 ed i 40 anni (65,9%); n è relativamente giovane e lavora (81% sotto i 40 anni), è in prevalenza impiegato o operaio e percepisce una retribuzione dai 10000 ai 20000; 3 Il calcolo della media si basa su tutte le osservazioni, è perciò influenzata dai valori estremi; la mediana è influenzata dal numero delle osservazioni, non dalla grandezza dei valori estremi => trascurando l’eventualità di ripetizione delle osservazioni, un’osservazione scelta a caso ha la stessa probabilità di essere più grande della mediana che di essere più piccola. Nel nostro campione, in quanto adeguatamente ridefinito dagli outliers la media può essere tranquillamente utilizzata come indicatore veritiero del valore di posizione più comune, nonostante ciò si è preferito fare i confronti sulla mediana (definita misura robusta, assieme alla media interquartile [(Q1+Q2)/2]), ragionando con i box plot. 4 Varianza e Dev.Std.(radice quadrata varianza) misurano la dispersione media attorno ad un indice di posizione quale la media: sono ottenute valutando come le osservazioni più grandi oscillano sopra la media e come le osservazioni più piccole si distribuiscono al di sotto della media. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 2
  • 3. BRUZZESE SALVATORE MASTER MEP 3. politica di sussidio alle famiglie sotto la soglia di povertà (y<=mediana/2): i gruppi potenzialmente beneficiari del sussidio sono il 14,2% (662/4679) del campione e percepiscono un reddito mediano pari a 3500<8125 (soglia di povertà), mentre il reddito che taglia al 50% il gruppo control è 18000; il sottocampione dei soggetti trattati è caratterizzato dalle seguenti caratteristiche: il 84% sono coniugati, donne (58,3%), lavoratori (60,8%) part-time (54,3%), il 68,3% lavora nel commercio (22%), nel settore manifatturiero (19,5%), nell’agricoltura (15,7%) e nell’edilizia (11,1%), un ~23% è distribuito tra impiego pubblico e servizi alla persona, con leggera prevalenza del primo, il 31,7% svolge la professione di operaio, il 30,5% è disoccupato, tutti rientrano nella 1° fascia di reddito, dai 10000 in giù; n è contraddistinto dalla maggiore presenza femminile rispetto ai primi 2 sussidi, è equamente distribuita in classi dai 30 anni in su (~30% x 3), è impiegata come operaio o disoccupata in prevalenza part-time (i primi 2 treated sono impiegati full-time, per più dell’80%) e percepisce una bassa retribuzione, sotto la media degli altri sussidi. Nelle tabelle allegate è possibile distinguere ulteriormente i sottocampioni per indici di posizione e di dispersione, con particolare evidenza al CV5 (coefficiente di variazione), in relazione al reddito ed all’appartenenza al gruppo teated/control di ogni sussidio: 1. sussidio numerosità: a. indici di posizione: i. control: classe modale6 (2° classe, 10000<y>=20000), densità relativa7 =0.12 e moda(punto centrale)=15000, percentile (quartili: q1=11700, q2=16023.4 [mediana], q3= 23200), media (19264.8); la forma della distribuzione è obliqua8 a destra9 (media>mediana: asimmetria positiva). 5 Il coefficiente di variazione è un indice relativo dato dal rapporto tra deviazione standard e media => misura la dispersione (in %) nell’insieme dei dati relativamente alla media. 6 Per la moda sono state utilizzate le classi di reddito precedentemente individuate, da cui è strettamente dipendente; la moda corrisponde alla metà della somma dei valori estremi della classe (punto centrale). 7 Per densità relativa si intende il rapporto tra ni ed ampiezza classe, da considerare nel caso in cui le classi siano di ampiezza non uniforme (es. ultima classe da 50000 in poi). 8 Valori estremamente piccoli (lunghe code a destra o sinistra), che attirano la media verso il basso/alto rendendola più piccola/grande della mediana. 9 Nel box-plot, se la distribuzione è obliqua a destra, ad esempio, le poche osservazioni grandi distorcono il midrange e la media verso la coda di destra, quindi ci aspetteremo un ordinamento delle misure di posizione di questo tipo: moda<mediana<media interquartile<media<midrange. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 3
  • 4. BRUZZESE SALVATORE MASTER MEP ii. treated: classe modale (2° classe), densità relativa=0.09 e moda=15000, percentile (quartili: q1=11991.8, q2=16659.9 [mediana], q3=24000), media (19585.4); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva). b. indici di dispersione (tendenza di y ad assumere valori diversi da un centro): i. control: range10 (238704.8), cv= 0.81=81% (nelle tabelle è possibile leggere sia varianza che dev. std.11 ); ii. treated: range (220941.1), cv= 0.78=78%; 2. sussidio figli: a. indici di posizione: i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=11700, q2=16250 [mediana], q3=23606), media (19458.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva). ii. treated: classe modale (2° classe), densità relativa=0.03 e moda=15000, percentile (quartili: q1=12000, q2=16214.1 [mediana], q3=23736.3), media (19024.5); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva). b. indici di dispersione: i. control: range (238704.8), cv= 0.81=81%; ii. treated: range (138000), cv= 0.72=72%; 3. sussidio reddito: la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva). a. indici di posizione: i. control: classe modale (2° classe), densità relativa=0.2 e moda=15000, percentile (quartili: q1=13650, q2=18000 [mediana], q3= 25193), media (22058.3); la forma della distribuzione è obliqua a destra (media>mediana: asimmetria positiva). 10 Il range totale (osservazione più grande – più piccola) è una misura di dispersione, a differenza del range interquartile (|Q3-Q1|) che è una misura della dispersione centrale. 11 Più i dati sono dispersi (> varianza), maggiore sarà il range, il range interquartile, la varianza e la dev. std. (indica il raggio (Xmedio±1Dev.Std.) entro cui si raggruppano i valori di y, in questo caso, dalla media) => la somma e la dev. std. aiuta a definire in quale intervallo si concentra almeno la maggior parte dei valori osservati. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 4
  • 5. BRUZZESE SALVATORE MASTER MEP ii. treated: classe modale (1° classe, y<=10000), densità relativa=0.07 e moda=5000, percentile (quartili: q1=0, q2=3500 [mediana], q3= 6414.3), media (3323.7); la forma della distribuzione è obliqua a sinistra (media<mediana: asimmetria negativa). b. indici di dispersione: i. control: range (230539.8), cv= 0.68=68%; ii. treated: range (8450), cv= 0.93=93%; La varianza maggiore (in realtà dal cv si nota quasi la stessa dispersione, proporzionata alla media tra control del sussidio per numerosità e control del sussidio per figli piccoli: 0.80902994 e 0.80647532) è quella presente nel gruppo control della politica di sussidio per figli (2.46e+08), mentre quella minore è quella dei treated della politica di sussidio per reddito (9.67e+06); all’interno delle politiche, quella del reddito presenta la maggiore disparità tra varianza dei treated e varianza del control => in base al cv si riscontra che il reddito dei poveri è altamente variabile (da notare la differenza interquartile dal box-plot) e più eterogeneo, ha una maggiore variabilità (tendenza ad assumere valori diversi) rispetto ai non trattati, nonostante che questi si muovano entro un range quasi triplo. Connessione tra politiche cumulate (Chi2 Normalizzato connessione tra 0 e 1) e copertura campione: 1. sussidio per numerosità e sussidio per età figli: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche, è pari a 310 (su 4679), cioè il 6,6% di N, cioè il 56,6% dei beneficiari del sussidio alle famiglie con figli piccoli ed il 14,9% dei treated all’interno dei sussidiati per numerosità dei componenti. Il chi2N evidenzia un valore prossimo ad una condizione di indipendenza, confermata dai valori di Pr (0.00) < 0.005. 2. sussidio per età figli e reddito: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche, è pari a 67 (su 4679), cioè l’1,4% di N, cioè il 10% dei beneficiari del sussidio alle famiglie numerose ed il 12,2% dei treated all’interno dei sussidiati perché con figli d’età minore o uguale ai 3 anni. Il chi2N dimostra una bassissima connessione. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 5
  • 6. BRUZZESE SALVATORE MASTER MEP 3. sussidio per reddito e numerosità: il sottocampione (n) coperto dalle due forme di sussidio, corrispondente ai treated di entrambe le politiche, è pari a 300 (su 4679), cioè l’6,4% di N, cioè il 45,3% dei beneficiari del sussidio alle famiglie povere ed il 14,4% dei treated all’interno dei sussidiati perché con famiglie numerose. Il chi2N dimostra la più bassa connessione possibile (a causa del valore Pr elevato tale giudizio non è significativo statisticamente per la popolazione, a differenza della prima forma di cumulabilità [numerosità x figli]). L’indice di connessione12 (Chi2N=chi2/(n min[righe-1, colonne-1])) ha rivelato nelle associazioni fatte tra politiche una chiara indipendenza statistica (la connessione misura la distanza dall’indipendenza, qui statisticamente molto vicina all’indipendenza, come si evince anche dal coefficiente di correlazione lineare elevato al quadrato indica quanto una retta che passa per la nuvola dei punti sia in grado di “cogliere” la relazione tra X ed Y). Calcolando la differenza tra reddito medio per gruppi, distinti per ogni politica13 , si nota che la differenza maggiore tra (ymedio)teated e (ymedio)control del sussidio vincolato alla soglia di povertà, pari a |-18734.6|, è più di 40 volte quella della 2° politica e della 1°; perciò nella 3° politica è presente una elevata sproporzione in media tra i due gruppi, avendo due stistribuzioni non simmetriche opposte => aumenta la probabilità che il sussidio agisca effettivamente su un target bisognoso (effettivamente la dev std diminuisce al diminuire del reddito, è ~5 volte inferiore). REGRESSIONE LINEARE14 : permette di studiare come varia un fenomeno in relazione di un altro, in questo caso come varia il reddito in relazione al sussidio. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 6 12 Verifica l’indipendenza tra 2 fattori in una tabella di contingenza r righe e c colonne. 13 La differenza tra reddito medio della politica per famiglie numerose è circa 160, dovute alla maggiore forza lavoro presente in famiglia, mentre la differenza tra sussidiati e non nella politica figli è quasi nulla e questo dovrebbe portare a riflettere sulla necessità di intervento. 14 Correlazione e regressione (le correlazioni identificate dal file .do sono ritenute significative al di sotto di 0.05 e sono contrassegnate da un asterisco) non sono la stessa cosa, possiamo trovare un'identica correlazione tra due serie di valori senza che questo implichi che le due serie di valori siano descritte da rette identiche (cioè con la stessa intercetta e la stessa pendenza), viceversa noi possiamo comunque essere interessati a stimare un certo valore di y a partire da un valore dato di x (cioè la regressione di y su x), anche se la forza della loro associazione non è elevata; quando siamo interessati a prevedere che valore assume la variabile y in coincidenza di un certo valore di x, il nostro problema non è
  • 7. BRUZZESE SALVATORE MASTER MEP Y=a+bX+e15 y=a+b(sussidio) 1. 1° politica: y= 19264.816 + 320.617 (politica_numerosità) il modello proposto prevede che se X aumenta di 1 unità (passaggio da control a treated) => si ha un incremento di y(reddito) in media pari a 320.6, ma R218 =0.001% (questo vuol dire che lo 0% della variabilità di y è spiegato dalla concomitante variabilità di X) ed il t-test per la politica della numerosità è 0.70 (0.70²=F); prevista H0 (ipotesi nulla che il coefficiente del sussidio non è significativamente diverso da 0), avrò che |t19 |<1,96 e p20 >0.005 => H0 è vera, la relazione di X su Y non è significativa. 2. 2° politica: y= 19458.5-434(politica_figli) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a treated) => si ha un decremento di y(reddito) in media pari a 434, ma R2=0.001% ed il t-test per la politica dei figli piccoli è -0.62 (-0.62²=F); prevista H0, avrò che |t|<1,96 e p>0.005 => H0 è vera, la relazione di X su Y non è significativa. 3. 3° politica: y= 22058.3-18734.6(politica_reddito), ) il modello proposto prevede che se x aumenta di 1 unità (passaggio da control a treated) => si ha un decremento di y(reddito) in media pari a 18734.6, R2=17.8%, il t-test per la politica della numerosità è -31.8 (-21.8²=F); tanto la forza dell'associazione tra le due variabili quanto la stima (che sarà ovviamente più o meno precisa in dipendenza della forza della loro correlazione) di una variabile essendo nota l'altra. 15 “e” rappresenta il residuo, cioè la distanza tra i punti e la retta di regressione, visibili in STATA col comando “predict e, residual” (vedi file.do). 16 L’intercetta indica il valore posseduto da y quando X=0, in questo corrisponde alla condizione del control. 17 Il coefficiente di b, cioè il valore incrementale della condizione 1 del sussidio (tale in quanto variabile dummy 0-1) rispetto alla condizione 0 (coefficiente a, cioè l’intercetta), rappresenta in questo caso la differenza in media tra la condizione 0 e la condizione 0+1 del reddito medio dato alla condizione 0 dal valore dell’intercetta. 18 R2 o coefficiente di determinazione, esprime in che misura la variabilità di una certa variabile y si associa a quella di un'altra; è la proporzione di varianza spiegata dalla/e variabile/i indipendente/i = SSModel/SSTotal. Sfruttando i coefficienti di correlazione significativi ed elevandoli al quadrato è possibile prevedere R2, coi relativi errori di approssimazione, ed evidenziare così quanto una retta che passa per la nuvola di punti cogli la relazione tra X e Y. 19 Il livello di significatività statistica scelto è p<=0.005. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 7 20 p mi dice quanto la relazione individuata dal repressore sulla variabile dipendente e valida spostando il modello sulla popolazione; posto p<0,05, avrò che la relazione si verificherà sulla popolazione al 95%, se p<0,001 => la validità sarà del 99%.
  • 8. BRUZZESE SALVATORE MASTER MEP prevista H0, avrò che |t|>1,96 e p<0.005 => H0 è falsa, la relazione di X su Y è significativa ed il coefficiente del sussidio è significativamente diverso da 0 e si muove all’interno di un intervallo di confidenza del 95%, tra -19887.99 e -17581.23. Solo l’ultimo modello verifica che la politica di sussidio per povertà sia significativamente predittore del reddito, cioè con l’aumento di una unità di X si ha un decremento di Y in media pari a 18734.6 => si deduce che l'assegnazione del trattamento a classi svantaggiate, come nel caso delle famiglie povere, determinate sulla base di un reddito inferiore al 50% della mediana, porti a risultati più significativi su questa classe, che permettono di usare il modello di previsione (sul predittore della politica sussidiata) validi al 95% (p<0.005, quasi certo, poiché p<0.001, cioè 99%) sulla popolazione. L’unica politica con la differenza di y in media tra treated e control statisticamente significativa è quella per reddito. REGRESSIONE MULTIPLA21 : permette di studiare come varia un fenomeno in relazione di altri, in questo caso come varia il reddito in relazione al sussidio ed alcune caratteristiche demografiche. Y=a+bX+cZ+dW…+e Y=a+b(sussidio)+c(professione)+d(genere)+e(studio)+f(part-time)+g(lavora)+h(part-time) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 8 21 Un modello statistico è tanto più efficiente quanto minore è il numero di variabili indipendenti (explanatory variables) che utilizza per predire (con adeguata accuratezza) la variabile dipendente; ad esempio se abbiamo 7 variabili indipendenti ci possiamo chiedere quali di queste 7 vale la pena introdurre nell'equazione, ovviamente una variabile indipendente con un coefficiente standardizzato basso contribuisce poco alla stima della variabile dipendente e complica inutilmente l’equazione multipla, perciò per costruire un modello multiplo possiamo partire da una sola variabile indipendente e quindi aggiungerne una seconda, se il coefficiente di determinazione (R2) aumenta possiamo giudicare opportuno utilizzare anche la seconda variabile indipendente, procediamo quindi con una terza variabile e ripetiamo la stessa verifica e così via. Questo modo di procedere introducendo una variabile per volta è la tecnica stepwise.
  • 9. BRUZZESE SALVATORE MASTER MEP Aggiungendo queste caratteristiche si arriva a spiegare con i predittori il ~35.6% di variabilità di y col sussidio per numerosità e per figli piccoli, mentre si raggiunge il 38.2% col sussidio per povertà => quest’ultimo come precedentemente detto è quello che spiega al meglio la variazione, in base alla significatività dello stesso e delle variabili indipendenti introdotte. Fundamental Problem of Causal Inference: Outcome(reddito): continuo Tratment(sussidio): binario [Si=0;Si=1] Effetto Treatment: differenza di outcome per l’i-esimo individuo tra ricevere e non ricevere il treatment MA l’individuo è osservato in un solo stato del mondo => senza assegnamento casuale non ho controfattuale22 , cioè l’outcome dei treated se non avessero ricevuto il treatment: yi=Si 23 => yi(1)= outcome treated24 yi(0)= outcome non treated in ciascun individuo avrò che Si=1 + controfattuale avrà un effetto causale =yi(1)-yi(0) ==> dato che non osserviamo yi(1) e yi(0) contemporaneamente, qualsiasi parametro che dipenda dalla distribuzione congiunta di yi(1) e yi(0) non può essere stimato. Io posso stimare solo y(1), solo se Si=1 e y(0), solo se Si=0. ATT=valore atteso di y(1) alla condizione Si=1 – valore atteso controfattuale 22 Valore dato dalla seguente condizione posta per il valore atteso: E(yi(0)|Si=1. 23 S e y sono correlate (b è significativamente diverso da 0) MA non casuali => ragiono su casualità 24 La media dell’outcome per i trattati ci attendiamo sia diversa da quella per un individuo scelto a caso. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 9
  • 10. BRUZZESE SALVATORE MASTER MEP distorsione dovuta alla selezione del treatment= E{yi(0) |Si=1}-E{yi(0)|Si=0} Ho ad esempio che yi(1)=a+b(Si==1) e yi(0)=a+b(Si==0), devo calcolare la differenza attesa di outcome tra coloro che sono stati sottoposti al treatment (Si=1) e coloro che invece non sono stati sottoposti al treatment (Si=0), valutato nello stato di non treatment (yi[0]). I POLITICA yi(1)=19264.8+320.6(Si=1) yi(0)=19585.4-320.6(Si=0) yi(0)=19585.4+320.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il vero effetto. II POLITICA yi(1)= 19458.5-434(Si=1) yi(0)= 19024.5+434(Si=0) yi(0)= 19024.5-434(Si=1) E[yi(0)|Si=0]>E[yi(0)|Si=1] Le stime sul campione tendono a sottostimare il vero effetto. I POLITICA yi(1)= 22058.3-18734.6(Si=1) yi(0)= 3323.7-18734.6(Si=0) yi(0)= 3323.7+18734.6(Si=1) E[yi(0)|Si=0]<E[yi(0)|Si=1] Le stime sul campione tendono a sovrastimare il vero effetto. Ridistribuzione equiparata reddito: 1. Sussidio numerosità (unica politica che richiederebbe di sussidiare il control, va riformulata): UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 10
  • 11. BRUZZESE SALVATORE MASTER MEP a. Differenze in media y treated/control= |320.6| b. Costo per lo Stato=320.6*208525 =668451 2. Sussidio figli: a. Differenze in media y treated/control= |-434| b. Costo per lo Stato=434*548=237832 3. Sussidio reddito: a. Differenze in media y treated/control= |-18734.6| b. Costo per lo Stato=18734.6*662=12402305 La politica che richiede meno risorse per essere implementata è la seconda politica, quella sulla presenza di figli piccoli. Tale politica copre il 11.7% (548/4679) del campione, di cui 67/662 (10,1%) soggetti con reddito sotto la soglia di povertà in famiglie numerose e 310/2085 (14.9%) in famiglie numerose. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 11 25 Questo è il totale dei treated all’interno della politica adottata.
  • 12. BRUZZESE SALVATORE MASTER MEP ALLEGATI GRAFICI: 0.00001.00002.00003.00004.00005 Density 0 50000 100000 150000 200000 250000 reddito Kernel density estimate Normal density 050,000100000150000200000250000 reddito UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 12
  • 13. BRUZZESE SALVATORE MASTER MEP operai impiegati insegnanti quadri dirigenti libero professionista imprenditore individuale lavoratore autonomo/artigiano titolare impresa familiare socio/gestore società in cerca di prima occupazione disoccupato militare di leva control_num treated_num control_figli treated_figli control_reddito treated_reddito UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 13
  • 14. BRUZZESE SALVATORE MASTER MEP 0.511.5 Density 1 2 3 4 5 6 classi di reddito (6) Kernel density estimate Normal density 18--| 30 30--| 40 40--| 50 50--| 65 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 14
  • 15. BRUZZESE SALVATORE MASTER MEP 0--| 10e+3 10e+3--| 20e+3 20e+3--| 30e+3 30e+3--| 40e+3 40e+3--| 50e+3 50e+3--| 238,7e+3 0.01.02.03.04.05 Density 20 30 40 50 60 70 età Kernel density estimate Normal density 050,000100000150000200000250000 control_num treated_num reddito Graphs by sussidio alle famiglie numerose (n. componenti >= 4) 050,000100000150000200000250000 control_figli treated_figli reddito Graphs by sussidio alle famiglie con figli da 0 a 3 anni UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 15
  • 16. BRUZZESE SALVATORE MASTER MEP 050,000100000150000200000250000 control_reddito treated_reddito reddito Graphs by sussidio alle famiglie sotto la soglia di povertà 02,0004,0006,0008,000 reddito UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 16
  • 17. BRUZZESE SALVATORE MASTER MEP FILE “.do”: clear all set mem 20000 set mat 800 capture log close log using E:ProgrammiStataVerificheProjectproject.log,replace use E:ProgrammiStataVerificheProjectcomune.dta, replace ****************************************************** ****************************************************** ******* BRUZZESE Salvatore - STATA - MEP/MEGAS ******* ****************************************************** ****************************************************** *describe * etichette variabili label var staciv "stato civile" label var studio "titolo di studio" label var apqual "tipo di occupazione" label var sex "genere" label var partime "tipologia lavoro" label var ncomp "numero componenti famiglia" label var parent "posizione nella famiglia" label var anasc "anno di nascita" label var ireg "regione di residenza" label var eta "età" label var y "reddito" label var nchild0_3 "figli con età tra 0 e 3 anni" label var nchild4_10 "figli con età tra 4 e 10 anni" label var nchild11_15 "figli con età tra 11 e 15 anni" label var nchild "figli minori di 15 anni" label var lavora "lavoratori" label var nquest "numero questionario" label var apsett "settore lavorativo" *describe UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 17
  • 18. BRUZZESE SALVATORE MASTER MEP * etichette valori label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero professionista" 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10 "socio/gestore società" 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15 "pensionato da lavoro" 16 "pensionato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva" 20 "altro" label val apqual tipodioccupazione label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma universitario" 7 "laurea" 8 "post laurea" label val studio titolodistudio label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a" label val staciv statocivile label define sesso 1 "uomo" 2 "donna" label val sex sesso label define tipologialavoro 1 "full-time" 2 "part-time" label val partime tipologialavoro label define lavoratori 0 "non lavoratore" 1 "lavoratore" label val lavora lavoratori label define settorelavorativo 1 "agricoltura" 2 "manifatturiero" 3 "costruzione" 4 "commercio" 5" trasporti" 6 "banche" 7 "serv. finanz." 8 "serv.person." 9 "pubblico" 10 "org.internaz" label val apsett settorelavorativo ********************* * SOLUZIONE QUESITI * ********************* *browse _all *codebook _all * Definizione campione tab apqual, nolab drop if apqual>=13 & apqual<19 & y==. tab apqual if y==. drop if apqual>=13 & apqual<19 drop if apqual==20 tab apqual lavora if y==. tab apqual partime if y==. tab partime lavora if y==. inspect partime if y==. UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 18 browse y apqual partime lavora if y==.
  • 19. BRUZZESE SALVATORE MASTER MEP browse nquest y apqual partime lavora if apqual==11 * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino browse nquest y apqual partime lavora if apqual==12 * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino browse nquest y apqual partime lavora if apqual==19 * Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage o tirocini non retribuiti. * Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà. drop if nquest==22168|nquest==2970 replace y=0 if y==. graph pie, over(apqual) angle(90) graph pie, over(lavora) angle(90) graph pie, over(partime) angle(90) *inspect * Analisi grafica y symplot y graph box y kdensity y, normal hist y, normal bin(20) xlabel(0(25000)250000) inspect y sum y, detail keep if y<313913 drop if y<0 count inspect y sum y, detail ge politica_numerosità=0 replace politica_numerosità=0 if ncomp<4 replace politica_numerosità=1 if ncomp>=4 label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)" label define trattamento1 1 "treated_num" 0 "control_num" label val politica_numerosità trattamento1 tab politica_numerosità browse apqual y if politica_numerosità==1 by politica_numerosità, sort: sum y, detail UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 19 graph pie, over(politica_numerosità) angle(90)
  • 20. BRUZZESE SALVATORE MASTER MEP ge politica_figli=0 replace politica_figli=1 if nchild0_3>=1 * includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0 replace politica_figli=0 if nchild0_3==0 label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni" label define trattamento2 1 "treated_figli" 0 "control_figli" label val politica_figli trattamento2 tab politica_figli by politica_figli, sort: sum y, detail graph pie, over(politica_figli) angle(90) ge politica_reddito=0 ge mediana=16250/2 display mediana replace politica_reddito=0 if y>=mediana replace politica_reddito=1 if y<mediana label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà" label define trattamento3 1 "treated_reddito" 0 "control_reddito" label val politica_reddito trattamento3 tab politica_reddito by politica_reddito, sort: sum y, detail graph pie, over(politica_reddito) angle(90) * Politiche Cumulate tab politica_numerosità politica_figli, row col freq chi2 by politica_numerosità, sort: tab politica_figli ge chi2n_num_figli=36.2317/(4679*1) label var chi2n_num_figli "chi2 normalizzato numerosita/figli" display chi2n_num_figli * % treated incrociati su N display 310/4679*100 * i trattati su N coprono il 6,6% tab politica_figli politica_reddito, row col chi2 ge chi2n_figli_reddito=1.8878/(4679*1) label var chi2n_figli_reddito "chi2 normalizzato figli/reddito" display chi2n_figli_reddito display 67/4679*100 tab politica_numerosità politica_reddito, row col chi2 label var chi2n_reddito_numerosità "chi2 normalizzato reddito/numerosità" ge chi2n_reddito_numerosità=0.1786/(4679*1) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 20
  • 21. BRUZZESE SALVATORE MASTER MEP display chi2n_reddito_numerosità display 300/4681*100 summ y, detail histogram y, percent normal graph hbox y, medtype(cline) medline(lcolor(red)) gen classi_reddito=0 replace classi_reddito=1 if y<=10000 replace classi_reddito=2 if y>10000 & y<=20000 replace classi_reddito=3 if y>20000 & y<=30000 replace classi_reddito=4 if y>30000 & y<=40000 replace classi_reddito=5 if y>40000 & y<=50000 replace classi_reddito=6 if y>50000 label var classi_reddito "classi di reddito (6)" label define yrecode 1 "0--| 10e+3" 2 "10e+3--| 20e+3" 3 "20e+3--| 30e+3" 4 "30e+3--| 40e+3" 5 "40e+3--| 50e+3" 6 "50e+3--| 238,7e+3" label val classi_reddito yrecode tab classi_reddito by politica_numerosità, sort: tab classi_reddito kdensity classi_reddito if politica_numerosità==0, normal ylabel(0(.1)1) kdensity classi_reddito if politica_numerosità==1, normal ylabel(0(.1)1) by politica_figli, sort: tab classi_reddito kdensity classi_reddito if politica_figli==0, normal ylabel(0(.1)1) kdensity classi_reddito if politica_figli==1, normal ylabel(0(.1)1) by politica_reddito, sort: tab classi_reddito kdensity classi_reddito if politica_reddito==0, normal ylabel(0(.1)1) kdensity classi_reddito if politica_reddito==1, normal ylabel(0(.1)1) graph pie, over(classi_reddito) angle(90) kdensity classi_reddito, normal graph pie, over(classi_reddito) angle(90) graph pie if politica_numerosità==1, over(classi_reddito) angle(90) graph pie if politica_figli==1, over(classi_reddito) angle(90) graph pie if politica_reddito==1, over(classi_reddito) angle(90) sum eta, detail histogram eta, normal percent graph hbox eta UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 21 ge classi_età=0
  • 22. BRUZZESE SALVATORE MASTER MEP replace classi_età=1 if eta<=30 replace classi_età=2 if eta>30&eta<=40 replace classi_età=3 if eta>40&eta<=50 replace classi_età=4 if eta>50 label var classi_età "classi di eta (4)" label define recode_eta 1 "18--| 30" 2 "30--| 40" 3 "40--| 50" 4 "50--| 65" label val classi_età recode_eta tab classi_età tab classi_età if politica_numerosità==1 tab classi_età if politica_figli==1 tab classi_età if politica_reddito==1 graph pie, over(classi_età) angle(90) kdensity eta, normal tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_numerosità==1 tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_figli==1 tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_reddito==1 * indici di posizione by politica_numerosità, sort: sum y, detail tab classi_reddito politica_numerosità * densità relativa classe modale control display 1200/10000 * densità relativa classe modale treated display 921/10000 by politica_figli, sort: sum y, detail tab classi_reddito politica_figli * densità relativa classe modale control display 1857/10000 * densità relativa classe modale treated display 264/10000 by politica_reddito, sort: sum y, detail tab classi_reddito politica_reddito * densità relativa classe modale control display 2121/10000 * densità relativa classe modale treated display 662/10000 * indici di dispersione UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 22 * range politica numerosità control
  • 23. BRUZZESE SALVATORE MASTER MEP display 238704.8-0 * range politica numerosità treated display 220941.1-0 * range politica figli control display 238704.8-0 * range politica figli treated display 138000-0 * range politica reddito control display 238704.8-8165 * range politica reddito treated display 8450-0 * CV - coefficiente di variazione tab politica_numerosità, sum(y) * CV Control display 15585.8/19264.8 * CV Treated display 15325.8/19585.4 tab politica_figli, sum(y) * CV Control display 15692.8/19458.5 * CV Treated display 13677.6/19024.5 tab politica_reddito, sum(y) * CV Control display 15082.99/22058.3 * CV Treated display 3109.0372/3323.7 * Confronto visivo box-plot (min, q1, q2 [mediana], q3, max, outliers) graph box y, by(politica_numerosità) graph box y, by(politica_figli) graph box y, by(politica_reddito) graph box y if politica_reddito==1 graph box y if politica_reddito==0 ge differenza_medie_numerosità= 19264.806-19585.362 ge differenza_medie_figli=19458.482-19024.451 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 23 ge differenza_medie_reddito=22058.281-3323.6727
  • 24. BRUZZESE SALVATORE MASTER MEP display differenza_medie_numerosità, differenza_medie_figli, differenza_medie_reddito * Regressione Y=y e X=politiche: Y=a+bX+e regress y politica_numerosità pwcorr y politica_numerosità, star(.05) regress y politica_figli pwcorr y politica_figli, star(.05) regress y politica_reddito pwcorr y politica_reddito, star(.05) regress y politica_numerosità apqual partime lavora sex studio eta pwcorr y politica_numerosità apqual partime lavora sex studio eta, star(.05) regress y politica_figli apqual partime lavora sex studio eta pwcorr y politica_figli apqual partime lavora sex studio eta, star(.05) regress y politica_reddito apqual partime lavora sex studio eta pwcorr y politica_reddito apqual partime lavora sex studio eta, star(.05) * ESEMPIO Metodo alternativo REGRESSIONE-DUMMY TREATED (volendo si possono creare variabili dummy dalle variabili indipendenti utilizzate e voncolare ad una condizione particolare l'analisi, creando particolari gruppi di riferimento) char politica_numerosità[omit] 0 xi: regress y i.politica_numerosità * Guppo di riferimento: donne, occupate part-time, tra i 30 e 40 anni char sex [omit] 1 char partime [omit] 1 char classi_età [omit] 2 xi: regress y i.politica_numerosità apqual i.partime i.sex studio i.classi_età * ESEMPIO Regressione lineare con residui e regress y politica_numerosità predict feeted_values predict e, residual list y feeted_values in 1/10 list y e in 1/10 scatter y politica_numerosità twoway (scatter y politica_numerosità) (lfit y politica_numerosità) twoway (scatter y politica_numerosità, mlabel(y)) (lfit y politica_numerosità) correlate y politica_numerosità apqual nchild ncomp partime nchild0_3 drop e feeted_values * Parificazione reddito control/treated per sussidio - Valutazione politica più economica * Numerosità UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 24 ** Costo sussidio
  • 25. BRUZZESE SALVATORE MASTER MEP display 320.6*2085 * Figli ** Costo sussidio display 434*548 * Reddito ** Costo sussidio display 18734.6*662 * Soggetti beneficiari alle condizioni poste tra tutti i sussidi (famiglia povera, numerosa e con figli piccoli) inspect nquest if politica_numerosità==1 & politica_figli==1 & politica_reddito==1 * ATT char politica_numerosità[omit] 0 xi: regress y i.politica_numerosità char politica_numerosità[omit] 1 xi: regress y i.politica_numerosità tab politica_numerosità, summ(y) char politica_figli[omit] 0 xi: regress y i.politica_figli char politica_figli[omit] 1 xi: regress y i.politica_figli tab politica_figli, summ(y) char politica_reddito[omit] 0 xi: regress y i.politica_reddito char politica_reddito[omit] 1 xi: regress y i.politica_reddito tab politica_reddito, summ(y) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 25
  • 26. BRUZZESE SALVATORE MASTER MEP OUTPUT FILE “.do”: ----------------------------------------------------------------------------------------------------------------------- ---- log: E:ProgrammiStataVerificheProjectproject.log log type: text opened on: 31 Jan 2007, 02:26:44 . use E:ProgrammiStataVerificheProjectcomune.dta, replace . . ****************************************************** . ****************************************************** . ******* BRUZZESE Salvatore - STATA - MEP/MEGAS ******* . ****************************************************** . ****************************************************** . . *describe . . * etichette variabili . label var staciv "stato civile" . label var studio "titolo di studio" . label var apqual "tipo di occupazione" . label var sex "genere" . label var partime "tipologia lavoro" . label var ncomp "numero componenti famiglia" . label var parent "posizione nella famiglia" . label var anasc "anno di nascita" . label var ireg "regione di residenza" UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 26 . label var eta "età"
  • 27. BRUZZESE SALVATORE MASTER MEP . label var y "reddito" . label var nchild0_3 "figli con età tra 0 e 3 anni" . label var nchild4_10 "figli con età tra 4 e 10 anni" . label var nchild11_15 "figli con età tra 11 e 15 anni" . label var nchild "figli minori di 15 anni" . label var lavora "lavoratori" . label var nquest "numero questionario" . label var apsett "settore lavorativo" . . *describe . . * etichette valori . label define tipodioccupazione 1 "operai" 2 "impiegati" 3 "insegnanti" 4 "quadri" 5 "dirigenti" 6 "libero professionista" > 7 "imprenditore individuale" 8 "lavoratore autonomo/artigiano" 9 "titolare impresa familiare" 10 "socio/gestore società" > 11 "in cerca di prima occupazione" 12 "disoccupato" 13 "casalinga" 14 "benestante" 15 "pensionato da lavoro" 16 "pension > ato non da lavoro" 17 "studente" 18 "bambino in età prescolare" 19 "militare di leva" 20 "altro" . label val apqual tipodioccupazione . label define titolodistudio 1 "nessuno" 2 "elementari" 3 "medie" 4 "diploma professionale" 5 "superiori" 6 "diploma unive > rsitario" 7 "laurea" 8 "post laurea" . label val studio titolodistudio . label define statocivile 1 "coniugato/a" 2 "celibe/nubile" 3 "separato/divorziato" 4 "vedovo/a" . label val staciv statocivile UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 27
  • 28. BRUZZESE SALVATORE MASTER MEP . label define sesso 1 "uomo" 2 "donna" . label val sex sesso . label define tipologialavoro 1 "full-time" 2 "part-time" . label val partime tipologialavoro . label define lavoratori 0 "non lavoratore" 1 "lavoratore" . label val lavora lavoratori . label define settorelavorativo 1 "agricoltura" 2 "manifatturiero" 3 "costruzione" 4 "commercio" 5" trasporti" 6 "banche" > 7 "serv. finanz." 8 "serv.person." 9 "pubblico" 10 "org.internaz" . label val apsett settorelavorativo . . . ********************* . * SOLUZIONE QUESITI * . ********************* . . *browse _all . *codebook _all . . * Definizione campione . tab apqual, nolab tipo di | occupazione | Freq. Percent Cum. ------------+----------------------------------- 1 | 1,492 18.95 18.95 2 | 1,274 16.18 35.14 3 | 303 3.85 38.99 4 | 211 2.68 41.67 5 | 110 1.40 43.06 6 | 237 3.01 46.07 7 | 85 1.08 47.15 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 28 8 | 460 5.84 53.00
  • 29. BRUZZESE SALVATORE MASTER MEP 9 | 153 1.94 54.94 10 | 104 1.32 56.26 11 | 56 0.71 56.97 12 | 203 2.58 59.55 13 | 1,679 21.33 80.88 14 | 6 0.08 80.96 15 | 1,200 15.24 96.20 16 | 230 2.92 99.12 17 | 38 0.48 99.61 19 | 2 0.03 99.63 20 | 29 0.37 100.00 ------------+----------------------------------- Total | 7,872 100.00 . drop if apqual>=13 & apqual<19 & y==. (3144 observations deleted) . tab apqual if y==. tipo di occupazione | Freq. Percent Cum. ------------------------------+----------------------------------- in cerca di prima occupazione | 55 19.10 19.10 disoccupato | 202 70.14 89.24 militare di leva | 2 0.69 89.93 altro | 29 10.07 100.00 ------------------------------+----------------------------------- Total | 288 100.00 . drop if apqual>=13 & apqual<19 (9 observations deleted) . drop if apqual==20 (29 observations deleted) . tab apqual lavora if y==. | lavoratori tipo di occupazione | non lavor | Total ----------------------+-----------+---------- UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 29 in cerca di prima occ | 55 | 55
  • 30. BRUZZESE SALVATORE MASTER MEP disoccupato | 202 | 202 militare di leva | 2 | 2 ----------------------+-----------+---------- Total | 259 | 259 . tab apqual partime if y==. | tipologia lavoro tipo di occupazione | full-time part-time | Total ----------------------+----------------------+---------- in cerca di prima occ | 1 1 | 2 disoccupato | 13 14 | 27 militare di leva | 1 0 | 1 ----------------------+----------------------+---------- Total | 15 15 | 30 . tab partime lavora if y==. tipologia | lavoratori lavoro | non lavor | Total -----------+-----------+---------- full-time | 15 | 15 part-time | 15 | 15 -----------+-----------+---------- Total | 30 | 30 . inspect partime if y==. partime: tipologia lavoro Number of Observations -------------------------- Non- Total Integers Integers | # # Negative - - - | # # Zero - - - | # # Positive 30 30 - | # # ----- ----- ----- | # # Total 30 30 - | # # Missing 229 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 30 +---------------------- -----
  • 31. BRUZZESE SALVATORE MASTER MEP 1 2 259 (2 unique values) partime is labeled and all values are documented in the label. . browse y apqual partime lavora if y==. . browse nquest y apqual partime lavora if apqual==11 . * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino . browse nquest y apqual partime lavora if apqual==12 . * 1 soggetto dichiara un reddito pur essendo disoccupato?! Elimino . browse nquest y apqual partime lavora if apqual==19 . * Non tolgo i part-time/full-time disoccupati o in cerca d'occupazione o militari, considero la possibilità di stage o ti > rocini non retribuiti. . * Pongo i valori missing =0 perchè utili nelle analisi e nell'individuare una corretta soglia di povertà. . drop if nquest==22168|nquest==2970 (2 observations deleted) . replace y=0 if y==. (259 real changes made) . graph pie, over(apqual) angle(90) . graph pie, over(lavora) angle(90) . graph pie, over(partime) angle(90) . . *inspect . * Analisi grafica y . symplot y . graph box y . kdensity y, normal UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 31
  • 32. BRUZZESE SALVATORE MASTER MEP . hist y, normal bin(20) xlabel(0(25000)250000) (bin=20, start=-6583.2607, width=1.874e+08) . . inspect y y: reddito Number of Observations ----------- Non- Total Integers Integers | # Negative 5 3 2 | # Zero 259 259 - | # Positive 4424 2195 2229 | # ----- ----- ----- | # Total 4688 2457 2231 | # . . . . Missing - +---------------------- ----- -6583.261 3.75e+09 4688 (More than 99 unique values) . sum y, detail reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 -6583.261 5% 0 -6500 10% 6000 -6174.44 Obs 4688 25% 11789.3 -600 Sum of Wgt. 4688 50% 16248 Mean 934811.9 Largest Std. Dev. 5.53e+07 75% 23629.94 313913 90% 34147.65 381262.2 Variance 3.06e+15 95% 44016.35 5.42e+08 Skewness 66.55301 99% 80886.5 3.75e+09 Kurtosis 4497.787 . . keep if y<313913 (4 observations deleted) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 32 . drop if y<0
  • 33. BRUZZESE SALVATORE MASTER MEP (5 observations deleted) . count 4679 . . inspect y y: reddito Number of Observations ----------- Non- Total Integers Integers | # Negative - - - | # Zero 259 259 - | # Positive 4420 2193 2227 | # ----- ----- ----- | # Total 4679 2452 2227 | # . . . . Missing - +---------------------- ----- 0 238704.8 4679 (More than 99 unique values) . sum y, detail reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 6000 0 Obs 4679 25% 11800 0 Sum of Wgt. 4679 50% 16250 Mean 19407.65 Largest Std. Dev. 15469.66 75% 23606.6 169263.5 90% 34101.2 173866 Variance 2.39e+08 95% 43622.34 220941.1 Skewness 3.712403 99% 79059 238704.8 Kurtosis 31.58755 . . ge politica_numerosità=0 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 33
  • 34. BRUZZESE SALVATORE MASTER MEP . replace politica_numerosità=0 if ncomp<4 (0 real changes made) . replace politica_numerosità=1 if ncomp>=4 (2085 real changes made) . label var politica_numerosità "sussidio alle famiglie numerose (n. componenti >= 4)" . label define trattamento1 1 "treated_num" 0 "control_num" . label val politica_numerosità trattamento1 . tab politica_numerosità sussidio | alle | famiglie | numerose | (n. | componenti | >= 4) | Freq. Percent Cum. ------------+----------------------------------- control_num | 2,594 55.44 55.44 treated_num | 2,085 44.56 100.00 ------------+----------------------------------- Total | 4,679 100.00 . browse apqual y if politica_numerosità==1 . by politica_numerosità, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = control_num reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 10% 6000 0 Obs 2594 5% 0 0 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 34
  • 35. BRUZZESE SALVATORE MASTER MEP 25% 11700 0 Sum of Wgt. 2594 50% 16023.43 Mean 19264.81 Largest Std. Dev. 15585.79 75% 23200 150348.5 90% 34385.15 169263.5 Variance 2.43e+08 95% 44016.35 173866 Skewness 3.884143 99% 75666.59 238704.8 Kurtosis 34.25024 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = treated_num reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 6000 0 Obs 2085 25% 11991.3 0 Sum of Wgt. 2085 50% 16659.9 Mean 19585.36 Largest Std. Dev. 15325.82 75% 24000 132371 90% 33806 141676.1 Variance 2.35e+08 95% 43374.1 145000 Skewness 3.489304 99% 80886.5 220941.1 Kurtosis 28.0648 . graph pie, over(politica_numerosità) angle(90) . . ge politica_figli=0 . replace politica_figli=1 if nchild0_3>=1 (548 real changes made) . * includo anche quelli che hanno figli maggiore di 3 anni o non li hanno nella condizione 0 . replace politica_figli=0 if nchild0_3==0 (0 real changes made) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 35
  • 36. BRUZZESE SALVATORE MASTER MEP . label var politica_figli "sussidio alle famiglie con figli da 0 a 3 anni" . label define trattamento2 1 "treated_figli" 0 "control_figli" . label val politica_figli trattamento2 . tab politica_figli sussidio alle | famiglie con | figli da 0 a | 3 anni | Freq. Percent Cum. --------------+----------------------------------- control_figli | 4,131 88.29 88.29 treated_figli | 548 11.71 100.00 --------------+----------------------------------- Total | 4,679 100.00 . by politica_figli, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_figli = control_figli reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 5997.186 0 Obs 4131 25% 11700 0 Sum of Wgt. 4131 50% 16250 Mean 19458.48 Largest Std. Dev. 15692.82 75% 23606 169263.5 90% 34567.39 173866 Variance 2.46e+08 95% 44358.6 220941.1 Skewness 3.751553 99% 79059 238704.8 Kurtosis 32.14111 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 36 ----------------------------------------------------------------------------------------------------------------------- ----
  • 37. BRUZZESE SALVATORE MASTER MEP -> politica_figli = treated_figli reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 1200 0 10% 7000 0 Obs 548 25% 12000 0 Sum of Wgt. 548 50% 16214.06 Mean 19024.45 Largest Std. Dev. 13677.58 75% 23736.33 92184 90% 32492.82 93661.01 Variance 1.87e+08 95% 40655.38 114913.8 Skewness 3.130492 99% 75453.1 138000 Kurtosis 21.28555 . graph pie, over(politica_figli) angle(90) . . ge politica_reddito=0 . ge mediana=16250/2 . display mediana 8125 . replace politica_reddito=0 if y>=mediana (0 real changes made) . replace politica_reddito=1 if y<mediana (662 real changes made) . label var politica_reddito "sussidio alle famiglie sotto la soglia di povertà" . label define trattamento3 1 "treated_reddito" 0 "control_reddito" . label val politica_reddito trattamento3 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 37 . tab politica_reddito
  • 38. BRUZZESE SALVATORE MASTER MEP sussidio alle | famiglie sotto | la soglia di | povertà | Freq. Percent Cum. ----------------+----------------------------------- control_reddito | 4,017 85.85 85.85 treated_reddito | 662 14.15 100.00 ----------------+----------------------------------- Total | 4,679 100.00 . by politica_reddito, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = control_reddito reddito ------------------------------------------------------------- Percentiles Smallest 1% 8553.354 8165 5% 10000 8167.9 10% 11000 8184.827 Obs 4017 25% 13650 8200 Sum of Wgt. 4017 50% 18000 Mean 22058.28 Largest Std. Dev. 15082.99 75% 25193 169263.5 90% 36461.54 173866 Variance 2.27e+08 95% 46259.3 220941.1 Skewness 4.355011 99% 82087.6 238704.8 Kurtosis 37.20802 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = treated_reddito reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 38 5% 0 0
  • 39. BRUZZESE SALVATORE MASTER MEP 10% 0 0 Obs 662 25% 0 0 Sum of Wgt. 662 50% 3500 Mean 3323.673 Largest Std. Dev. 3109.037 75% 6414.245 8055.395 90% 7529.2 8060.6 Variance 9666112 95% 8000 8073 Skewness .1320215 99% 8007 8100 Kurtosis 1.347933 . graph pie, over(politica_reddito) angle(90) . . * Politiche Cumulate . tab politica_numerosità politica_figli, row col freq chi2 +-------------------+ | Key | |-------------------| | frequency | | row percentage | | column percentage | +-------------------+ sussidio | alle | famiglie | numerose | sussidio alle (n. | famiglie con figli da componenti | 0 a 3 anni >= 4) | control_f treated_f | Total ------------+----------------------+---------- control_num | 2,356 238 | 2,594 | 90.82 9.18 | 100.00 | 57.03 43.43 | 55.44 ------------+----------------------+---------- treated_num | 1,775 310 | 2,085 | 85.13 14.87 | 100.00 | 42.97 56.57 | 44.56 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 39 ------------+----------------------+----------
  • 40. BRUZZESE SALVATORE MASTER MEP Total | 4,131 548 | 4,679 | 88.29 11.71 | 100.00 | 100.00 100.00 | 100.00 Pearson chi2(1) = 36.2317 Pr = 0.000 . by politica_numerosità, sort: tab politica_figli ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = control_num sussidio alle | famiglie con | figli da 0 a | 3 anni | Freq. Percent Cum. --------------+----------------------------------- control_figli | 2,356 90.82 90.82 treated_figli | 238 9.18 100.00 --------------+----------------------------------- Total | 2,594 100.00 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = treated_num sussidio alle | famiglie con | figli da 0 a | 3 anni | Freq. Percent Cum. --------------+----------------------------------- control_figli | 1,775 85.13 85.13 treated_figli | 310 14.87 100.00 --------------+----------------------------------- Total | 2,085 100.00 . ge chi2n_num_figli=36.2317/(4679*1) . label var chi2n_num_figli "chi2 normalizzato numerosita/figli" UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 40
  • 41. BRUZZESE SALVATORE MASTER MEP . display chi2n_num_figli .00774347 . * % treated incrociati su N . display 310/4679*100 6.6253473 . * i trattati su N coprono il 6,6% . tab politica_figli politica_reddito, row col chi2 +-------------------+ | Key | |-------------------| | frequency | | row percentage | | column percentage | +-------------------+ sussidio alle | sussidio alle famiglie con | famiglie sotto la figli da 0 a | soglia di povertà 3 anni | control_r treated_r | Total --------------+----------------------+---------- control_figli | 3,536 595 | 4,131 | 85.60 14.40 | 100.00 | 88.03 89.88 | 88.29 --------------+----------------------+---------- treated_figli | 481 67 | 548 | 87.77 12.23 | 100.00 | 11.97 10.12 | 11.71 --------------+----------------------+---------- Total | 4,017 662 | 4,679 | 85.85 14.15 | 100.00 | 100.00 100.00 | 100.00 Pearson chi2(1) = 1.8878 Pr = 0.169 . ge chi2n_figli_reddito=1.8878/(4679*1) . label var chi2n_figli_reddito "chi2 normalizzato figli/reddito" UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 41
  • 42. BRUZZESE SALVATORE MASTER MEP . display chi2n_figli_reddito .00040346 . display 67/4679*100 1.4319299 . tab politica_numerosità politica_reddito, row col chi2 +-------------------+ | Key | |-------------------| | frequency | | row percentage | | column percentage | +-------------------+ sussidio | alle | famiglie | numerose | sussidio alle (n. | famiglie sotto la componenti | soglia di povertà >= 4) | control_r treated_r | Total ------------+----------------------+---------- control_num | 2,232 362 | 2,594 | 86.04 13.96 | 100.00 | 55.56 54.68 | 55.44 ------------+----------------------+---------- treated_num | 1,785 300 | 2,085 | 85.61 14.39 | 100.00 | 44.44 45.32 | 44.56 ------------+----------------------+---------- Total | 4,017 662 | 4,679 | 85.85 14.15 | 100.00 | 100.00 100.00 | 100.00 Pearson chi2(1) = 0.1786 Pr = 0.673 . ge chi2n_reddito_numerosità=0.1786/(4679*1) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 42
  • 43. BRUZZESE SALVATORE MASTER MEP . label var chi2n_reddito_numerosità "chi2 normalizzato reddito/numerosità" . display chi2n_reddito_numerosità .00003817 . display 300/4681*100 6.408887 . . summ y, detail reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 6000 0 Obs 4679 25% 11800 0 Sum of Wgt. 4679 50% 16250 Mean 19407.65 Largest Std. Dev. 15469.66 75% 23606.6 169263.5 90% 34101.2 173866 Variance 2.39e+08 95% 43622.34 220941.1 Skewness 3.712403 99% 79059 238704.8 Kurtosis 31.58755 . histogram y, percent normal (bin=36, start=0, width=6630.6897) . graph hbox y, medtype(cline) medline(lcolor(red)) . . gen classi_reddito=0 . replace classi_reddito=1 if y<=10000 (918 real changes made) . replace classi_reddito=2 if y>10000 & y<=20000 (2121 real changes made) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 43 . replace classi_reddito=3 if y>20000 & y<=30000
  • 44. BRUZZESE SALVATORE MASTER MEP (999 real changes made) . replace classi_reddito=4 if y>30000 & y<=40000 (335 real changes made) . replace classi_reddito=5 if y>40000 & y<=50000 (134 real changes made) . replace classi_reddito=6 if y>50000 (172 real changes made) . label var classi_reddito "classi di reddito (6)" . label define yrecode 1 "0--| 10e+3" 2 "10e+3--| 20e+3" 3 "20e+3--| 30e+3" 4 "30e+3--| 40e+3" 5 "40e+3--| 50e+3" 6 "50e+3- > -| 238,7e+3" . label val classi_reddito yrecode . tab classi_reddito classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 918 19.62 19.62 10e+3--| 20e+3 | 2,121 45.33 64.95 20e+3--| 30e+3 | 999 21.35 86.30 30e+3--| 40e+3 | 335 7.16 93.46 40e+3--| 50e+3 | 134 2.86 96.32 50e+3--| 238,7e+3 | 172 3.68 100.00 ------------------+----------------------------------- Total | 4,679 100.00 . by politica_numerosità, sort: tab classi_reddito ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = control_num classi di reddito | UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 44 (6) | Freq. Percent Cum.
  • 45. BRUZZESE SALVATORE MASTER MEP ------------------+----------------------------------- 0--| 10e+3 | 505 19.47 19.47 10e+3--| 20e+3 | 1,200 46.26 65.73 20e+3--| 30e+3 | 530 20.43 86.16 30e+3--| 40e+3 | 186 7.17 93.33 40e+3--| 50e+3 | 80 3.08 96.41 50e+3--| 238,7e+3 | 93 3.59 100.00 ------------------+----------------------------------- Total | 2,594 100.00 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = treated_num classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 413 19.81 19.81 10e+3--| 20e+3 | 921 44.17 63.98 20e+3--| 30e+3 | 469 22.49 86.47 30e+3--| 40e+3 | 149 7.15 93.62 40e+3--| 50e+3 | 54 2.59 96.21 50e+3--| 238,7e+3 | 79 3.79 100.00 ------------------+----------------------------------- Total | 2,085 100.00 . kdensity classi_reddito if politica_numerosità==0, normal ylabel(0(.1)1) . kdensity classi_reddito if politica_numerosità==1, normal ylabel(0(.1)1) . by politica_figli, sort: tab classi_reddito ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_figli = control_figli classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 45 0--| 10e+3 | 819 19.83 19.83
  • 46. BRUZZESE SALVATORE MASTER MEP 10e+3--| 20e+3 | 1,857 44.95 64.78 20e+3--| 30e+3 | 883 21.37 86.15 30e+3--| 40e+3 | 296 7.17 93.32 40e+3--| 50e+3 | 117 2.83 96.15 50e+3--| 238,7e+3 | 159 3.85 100.00 ------------------+----------------------------------- Total | 4,131 100.00 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_figli = treated_figli classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 99 18.07 18.07 10e+3--| 20e+3 | 264 48.18 66.24 20e+3--| 30e+3 | 116 21.17 87.41 30e+3--| 40e+3 | 39 7.12 94.53 40e+3--| 50e+3 | 17 3.10 97.63 50e+3--| 238,7e+3 | 13 2.37 100.00 ------------------+----------------------------------- Total | 548 100.00 . kdensity classi_reddito if politica_figli==0, normal ylabel(0(.1)1) . kdensity classi_reddito if politica_figli==1, normal ylabel(0(.1)1) . by politica_reddito, sort: tab classi_reddito ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = control_reddito classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 256 6.37 6.37 10e+3--| 20e+3 | 2,121 52.80 59.17 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 46 20e+3--| 30e+3 | 999 24.87 84.04
  • 47. BRUZZESE SALVATORE MASTER MEP 30e+3--| 40e+3 | 335 8.34 92.38 40e+3--| 50e+3 | 134 3.34 95.72 50e+3--| 238,7e+3 | 172 4.28 100.00 ------------------+----------------------------------- Total | 4,017 100.00 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = treated_reddito classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 662 100.00 100.00 ------------------+----------------------------------- Total | 662 100.00 . kdensity classi_reddito if politica_reddito==0, normal ylabel(0(.1)1) . kdensity classi_reddito if politica_reddito==1, normal ylabel(0(.1)1) . graph pie, over(classi_reddito) angle(90) . kdensity classi_reddito, normal . graph pie, over(classi_reddito) angle(90) . graph pie if politica_numerosità==1, over(classi_reddito) angle(90) . graph pie if politica_figli==1, over(classi_reddito) angle(90) . graph pie if politica_reddito==1, over(classi_reddito) angle(90) . . sum eta, detail età ------------------------------------------------------------- Percentiles Smallest UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 47 1% 25 18
  • 48. BRUZZESE SALVATORE MASTER MEP 5% 29 18 10% 32 18 Obs 4679 25% 38 19 Sum of Wgt. 4679 50% 45 Mean 44.45394 Largest Std. Dev. 8.975953 75% 51 65 90% 56 65 Variance 80.56773 95% 59 65 Skewness -.1160282 99% 63 65 Kurtosis 2.42391 . histogram eta, normal percent (bin=36, start=18, width=1.3055556) . graph hbox eta . . ge classi_età=0 . replace classi_età=1 if eta<=30 (300 real changes made) . replace classi_età=2 if eta>30&eta<=40 (1292 real changes made) . replace classi_età=3 if eta>40&eta<=50 (1782 real changes made) . replace classi_età=4 if eta>50 (1305 real changes made) . label var classi_età "classi di eta (4)" . label define recode_eta 1 "18--| 30" 2 "30--| 40" 3 "40--| 50" 4 "50--| 65" . label val classi_età recode_eta . tab classi_età classi di | UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 48 eta (4) | Freq. Percent Cum.
  • 49. BRUZZESE SALVATORE MASTER MEP ------------+----------------------------------- 18--| 30 | 300 6.41 6.41 30--| 40 | 1,292 27.61 34.02 40--| 50 | 1,782 38.09 72.11 50--| 65 | 1,305 27.89 100.00 ------------+----------------------------------- Total | 4,679 100.00 . tab classi_età if politica_numerosità==1 classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 57 2.73 2.73 30--| 40 | 524 25.13 27.87 40--| 50 | 966 46.33 74.20 50--| 65 | 538 25.80 100.00 ------------+----------------------------------- Total | 2,085 100.00 . tab classi_età if politica_figli==1 classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 84 15.33 15.33 30--| 40 | 361 65.88 81.20 40--| 50 | 99 18.07 99.27 50--| 65 | 4 0.73 100.00 ------------+----------------------------------- Total | 548 100.00 . tab classi_età if politica_reddito==1 classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 69 10.42 10.42 30--| 40 | 202 30.51 40.94 40--| 50 | 197 29.76 70.69 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 49 50--| 65 | 194 29.31 100.00
  • 50. BRUZZESE SALVATORE MASTER MEP ------------+----------------------------------- Total | 662 100.00 . graph pie, over(classi_età) angle(90) . kdensity eta, normal . . tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_numerosità==1 -> tabulation of sex if politica_numerosità==1 genere | Freq. Percent Cum. ------------+----------------------------------- uomo | 1,384 66.38 66.38 donna | 701 33.62 100.00 ------------+----------------------------------- Total | 2,085 100.00 -> tabulation of staciv if politica_numerosità==1 stato civile | Freq. Percent Cum. --------------------+----------------------------------- coniugato/a | 2,019 96.83 96.83 celibe/nubile | 40 1.92 98.75 separato/divorziato | 22 1.06 99.81 vedovo/a | 4 0.19 100.00 --------------------+----------------------------------- Total | 2,085 100.00 -> tabulation of lavora if politica_numerosità==1 lavoratori | Freq. Percent Cum. ---------------+----------------------------------- non lavoratore | 105 5.04 5.04 lavoratore | 1,980 94.96 100.00 ---------------+----------------------------------- Total | 2,085 100.00 -> tabulation of partime if politica_numerosità==1 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 50
  • 51. BRUZZESE SALVATORE MASTER MEP tipologia | lavoro | Freq. Percent Cum. ------------+----------------------------------- full-time | 1,355 89.20 89.20 part-time | 164 10.80 100.00 ------------+----------------------------------- Total | 1,519 100.00 -> tabulation of apsett if politica_numerosità==1 settore | lavorativo | Freq. Percent Cum. ---------------+----------------------------------- agricoltura | 133 6.46 6.46 manifatturiero | 483 23.45 29.90 costruzione | 188 9.13 39.03 commercio | 312 15.15 54.17 trasporti | 106 5.15 59.32 banche | 75 3.64 62.96 serv. finanz. | 84 4.08 67.04 serv.person. | 85 4.13 71.17 pubblico | 592 28.74 99.90 org.internaz | 2 0.10 100.00 ---------------+----------------------------------- Total | 2,060 100.00 -> tabulation of apqual if politica_numerosità==1 tipo di occupazione | Freq. Percent Cum. ------------------------------+----------------------------------- operai | 669 32.09 32.09 impiegati | 547 26.24 58.32 insegnanti | 140 6.71 65.04 quadri | 96 4.60 69.64 dirigenti | 45 2.16 71.80 libero professionista | 95 4.56 76.35 imprenditore individuale | 44 2.11 78.47 lavoratore autonomo/artigiano | 215 10.31 88.78 titolare impresa familiare | 76 3.65 92.42 in cerca di prima occupazione | 25 1.20 96.16 socio/gestore società | 53 2.54 94.96 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 51
  • 52. BRUZZESE SALVATORE MASTER MEP disoccupato | 80 3.84 100.00 ------------------------------+----------------------------------- Total | 2,085 100.00 -> tabulation of classi_reddito if politica_numerosità==1 classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 413 19.81 19.81 10e+3--| 20e+3 | 921 44.17 63.98 20e+3--| 30e+3 | 469 22.49 86.47 30e+3--| 40e+3 | 149 7.15 93.62 40e+3--| 50e+3 | 54 2.59 96.21 50e+3--| 238,7e+3 | 79 3.79 100.00 ------------------+----------------------------------- Total | 2,085 100.00 -> tabulation of classi_età if politica_numerosità==1 classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 57 2.73 2.73 30--| 40 | 524 25.13 27.87 40--| 50 | 966 46.33 74.20 50--| 65 | 538 25.80 100.00 ------------+----------------------------------- Total | 2,085 100.00 . tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_figli==1 -> tabulation of sex if politica_figli==1 genere | Freq. Percent Cum. ------------+----------------------------------- uomo | 364 66.42 66.42 donna | 184 33.58 100.00 ------------+----------------------------------- Total | 548 100.00 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 52
  • 53. BRUZZESE SALVATORE MASTER MEP -> tabulation of staciv if politica_figli==1 stato civile | Freq. Percent Cum. --------------------+----------------------------------- coniugato/a | 532 97.08 97.08 celibe/nubile | 9 1.64 98.72 separato/divorziato | 5 0.91 99.64 vedovo/a | 2 0.36 100.00 --------------------+----------------------------------- Total | 548 100.00 -> tabulation of lavora if politica_figli==1 lavoratori | Freq. Percent Cum. ---------------+----------------------------------- non lavoratore | 25 4.56 4.56 lavoratore | 523 95.44 100.00 ---------------+----------------------------------- Total | 548 100.00 -> tabulation of partime if politica_figli==1 tipologia | lavoro | Freq. Percent Cum. ------------+----------------------------------- full-time | 365 87.95 87.95 part-time | 50 12.05 100.00 ------------+----------------------------------- Total | 415 100.00 -> tabulation of apsett if politica_figli==1 settore | lavorativo | Freq. Percent Cum. ---------------+----------------------------------- agricoltura | 27 4.99 4.99 manifatturiero | 151 27.91 32.90 costruzione | 51 9.43 42.33 commercio | 86 15.90 58.23 trasporti | 30 5.55 63.77 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 53 banche | 17 3.14 66.91
  • 54. BRUZZESE SALVATORE MASTER MEP serv. finanz. | 34 6.28 73.20 serv.person. | 22 4.07 77.26 pubblico | 120 22.18 99.45 org.internaz | 3 0.55 100.00 ---------------+----------------------------------- Total | 541 100.00 -> tabulation of apqual if politica_figli==1 tipo di occupazione | Freq. Percent Cum. ------------------------------+----------------------------------- operai | 183 33.39 33.39 impiegati | 176 32.12 65.51 insegnanti | 21 3.83 69.34 quadri | 19 3.47 72.81 dirigenti | 10 1.82 74.64 libero professionista | 29 5.29 79.93 imprenditore individuale | 12 2.19 82.12 lavoratore autonomo/artigiano | 50 9.12 91.24 titolare impresa familiare | 10 1.82 93.07 socio/gestore società | 13 2.37 95.44 in cerca di prima occupazione | 7 1.28 96.72 disoccupato | 18 3.28 100.00 ------------------------------+----------------------------------- Total | 548 100.00 -> tabulation of classi_reddito if politica_figli==1 classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 99 18.07 18.07 10e+3--| 20e+3 | 264 48.18 66.24 20e+3--| 30e+3 | 116 21.17 87.41 30e+3--| 40e+3 | 39 7.12 94.53 40e+3--| 50e+3 | 17 3.10 97.63 50e+3--| 238,7e+3 | 13 2.37 100.00 ------------------+----------------------------------- Total | 548 100.00 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 54 -> tabulation of classi_età if politica_figli==1
  • 55. BRUZZESE SALVATORE MASTER MEP classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 84 15.33 15.33 30--| 40 | 361 65.88 81.20 40--| 50 | 99 18.07 99.27 50--| 65 | 4 0.73 100.00 ------------+----------------------------------- Total | 548 100.00 . tab1 sex staciv lavora partime apsett apqual classi_reddito classi_età if politica_reddito==1 -> tabulation of sex if politica_reddito==1 genere | Freq. Percent Cum. ------------+----------------------------------- uomo | 276 41.69 41.69 donna | 386 58.31 100.00 ------------+----------------------------------- Total | 662 100.00 -> tabulation of staciv if politica_reddito==1 stato civile | Freq. Percent Cum. --------------------+----------------------------------- coniugato/a | 556 83.99 83.99 celibe/nubile | 56 8.46 92.45 separato/divorziato | 37 5.59 98.04 vedovo/a | 13 1.96 100.00 --------------------+----------------------------------- Total | 662 100.00 -> tabulation of lavora if politica_reddito==1 lavoratori | Freq. Percent Cum. ---------------+----------------------------------- non lavoratore | 259 39.12 39.12 lavoratore | 403 60.88 100.00 ---------------+----------------------------------- UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 55 Total | 662 100.00
  • 56. BRUZZESE SALVATORE MASTER MEP -> tabulation of partime if politica_reddito==1 tipologia | lavoro | Freq. Percent Cum. ------------+----------------------------------- full-time | 142 45.66 45.66 part-time | 169 54.34 100.00 ------------+----------------------------------- Total | 311 100.00 -> tabulation of apsett if politica_reddito==1 settore | lavorativo | Freq. Percent Cum. ---------------+----------------------------------- agricoltura | 95 15.70 15.70 manifatturiero | 118 19.50 35.21 costruzione | 67 11.07 46.28 commercio | 133 21.98 68.26 trasporti | 19 3.14 71.40 banche | 5 0.83 72.23 serv. finanz. | 29 4.79 77.02 serv.person. | 78 12.89 89.92 pubblico | 59 9.75 99.67 org.internaz | 2 0.33 100.00 ---------------+----------------------------------- Total | 605 100.00 -> tabulation of apqual if politica_reddito==1 tipo di occupazione | Freq. Percent Cum. ------------------------------+----------------------------------- operai | 210 31.72 31.72 impiegati | 58 8.76 40.48 insegnanti | 10 1.51 41.99 quadri | 3 0.45 42.45 dirigenti | 1 0.15 42.60 libero professionista | 13 1.96 44.56 lavoratore autonomo/artigiano | 61 9.21 55.14 imprenditore individuale | 9 1.36 45.92 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 56
  • 57. BRUZZESE SALVATORE MASTER MEP titolare impresa familiare | 33 4.98 60.12 socio/gestore società | 5 0.76 60.88 in cerca di prima occupazione | 55 8.31 69.18 disoccupato | 202 30.51 99.70 militare di leva | 2 0.30 100.00 ------------------------------+----------------------------------- Total | 662 100.00 -> tabulation of classi_reddito if politica_reddito==1 classi di reddito | (6) | Freq. Percent Cum. ------------------+----------------------------------- 0--| 10e+3 | 662 100.00 100.00 ------------------+----------------------------------- Total | 662 100.00 -> tabulation of classi_età if politica_reddito==1 classi di | eta (4) | Freq. Percent Cum. ------------+----------------------------------- 18--| 30 | 69 10.42 10.42 30--| 40 | 202 30.51 40.94 40--| 50 | 197 29.76 70.69 50--| 65 | 194 29.31 100.00 ------------+----------------------------------- Total | 662 100.00 . . * indici di posizione . by politica_numerosità, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = control_num reddito ------------------------------------------------------------- UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 57 Percentiles Smallest
  • 58. BRUZZESE SALVATORE MASTER MEP 1% 0 0 5% 0 0 10% 6000 0 Obs 2594 25% 11700 0 Sum of Wgt. 2594 50% 16023.43 Mean 19264.81 Largest Std. Dev. 15585.79 75% 23200 150348.5 90% 34385.15 169263.5 Variance 2.43e+08 95% 44016.35 173866 Skewness 3.884143 99% 75666.59 238704.8 Kurtosis 34.25024 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_numerosità = treated_num reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 6000 0 Obs 2085 25% 11991.3 0 Sum of Wgt. 2085 50% 16659.9 Mean 19585.36 Largest Std. Dev. 15325.82 75% 24000 132371 90% 33806 141676.1 Variance 2.35e+08 95% 43374.1 145000 Skewness 3.489304 99% 80886.5 220941.1 Kurtosis 28.0648 . tab classi_reddito politica_numerosità | sussidio alle | famiglie numerose (n. classi di reddito | componenti >= 4) (6) | control_n treated_n | Total ------------------+----------------------+---------- 0--| 10e+3 | 505 413 | 918 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 58 10e+3--| 20e+3 | 1,200 921 | 2,121
  • 59. BRUZZESE SALVATORE MASTER MEP 20e+3--| 30e+3 | 530 469 | 999 30e+3--| 40e+3 | 186 149 | 335 40e+3--| 50e+3 | 80 54 | 134 50e+3--| 238,7e+3 | 93 79 | 172 ------------------+----------------------+---------- Total | 2,594 2,085 | 4,679 . * densità relativa classe modale control . display 1200/10000 .12 . * densità relativa classe modale treated . display 921/10000 .0921 . by politica_figli, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_figli = control_figli reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 5997.186 0 Obs 4131 25% 11700 0 Sum of Wgt. 4131 50% 16250 Mean 19458.48 Largest Std. Dev. 15692.82 75% 23606 169263.5 90% 34567.39 173866 Variance 2.46e+08 95% 44358.6 220941.1 Skewness 3.751553 99% 79059 238704.8 Kurtosis 32.14111 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_figli = treated_figli UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 59
  • 60. BRUZZESE SALVATORE MASTER MEP reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 1200 0 10% 7000 0 Obs 548 25% 12000 0 Sum of Wgt. 548 50% 16214.06 Mean 19024.45 Largest Std. Dev. 13677.58 75% 23736.33 92184 90% 32492.82 93661.01 Variance 1.87e+08 95% 40655.38 114913.8 Skewness 3.130492 99% 75453.1 138000 Kurtosis 21.28555 . tab classi_reddito politica_figli | sussidio alle | famiglie con figli da classi di reddito | 0 a 3 anni (6) | control_f treated_f | Total ------------------+----------------------+---------- 0--| 10e+3 | 819 99 | 918 10e+3--| 20e+3 | 1,857 264 | 2,121 20e+3--| 30e+3 | 883 116 | 999 30e+3--| 40e+3 | 296 39 | 335 40e+3--| 50e+3 | 117 17 | 134 50e+3--| 238,7e+3 | 159 13 | 172 ------------------+----------------------+---------- Total | 4,131 548 | 4,679 . * densità relativa classe modale control . display 1857/10000 .1857 . * densità relativa classe modale treated UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 60 . display 264/10000
  • 61. BRUZZESE SALVATORE MASTER MEP .0264 . by politica_reddito, sort: sum y, detail ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = control_reddito reddito ------------------------------------------------------------- Percentiles Smallest 1% 8553.354 8165 5% 10000 8167.9 10% 11000 8184.827 Obs 4017 25% 13650 8200 Sum of Wgt. 4017 50% 18000 Mean 22058.28 Largest Std. Dev. 15082.99 75% 25193 169263.5 90% 36461.54 173866 Variance 2.27e+08 95% 46259.3 220941.1 Skewness 4.355011 99% 82087.6 238704.8 Kurtosis 37.20802 ----------------------------------------------------------------------------------------------------------------------- ---- -> politica_reddito = treated_reddito reddito ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 0 0 Obs 662 25% 0 0 Sum of Wgt. 662 50% 3500 Mean 3323.673 Largest Std. Dev. 3109.037 75% 6414.245 8055.395 95% 8000 8073 Skewness .1320215 90% 7529.2 8060.6 Variance 9666112 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 61
  • 62. BRUZZESE SALVATORE MASTER MEP 99% 8007 8100 Kurtosis 1.347933 . tab classi_reddito politica_reddito | sussidio alle | famiglie sotto la classi di reddito | soglia di povertà (6) | control_r treated_r | Total ------------------+----------------------+---------- 0--| 10e+3 | 256 662 | 918 10e+3--| 20e+3 | 2,121 0 | 2,121 20e+3--| 30e+3 | 999 0 | 999 30e+3--| 40e+3 | 335 0 | 335 40e+3--| 50e+3 | 134 0 | 134 50e+3--| 238,7e+3 | 172 0 | 172 ------------------+----------------------+---------- Total | 4,017 662 | 4,679 . * densità relativa classe modale control . display 2121/10000 .2121 . * densità relativa classe modale treated . display 662/10000 .0662 . . * indici di dispersione . * range politica numerosità control . display 238704.8-0 238704.8 . * range politica numerosità treated . display 220941.1-0 220941.1 . * range politica figli control . display 238704.8-0 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 62 238704.8
  • 63. BRUZZESE SALVATORE MASTER MEP . * range politica figli treated . display 138000-0 138000 . * range politica reddito control . display 238704.8-8165 230539.8 . * range politica reddito treated . display 8450-0 8450 . . * CV - coefficiente di variazione . tab politica_numerosità, sum(y) sussidio | alle | famiglie | numerose | (n. | componenti | Summary of reddito >= 4) | Mean Std. Dev. Freq. ------------+------------------------------------ control_n | 19264.806 15585.792 2594 treated_n | 19585.362 15325.824 2085 ------------+------------------------------------ Total | 19407.649 15469.661 4679 . * CV Control . display 15585.8/19264.8 .80902994 . * CV Treated . display 15325.8/19585.4 .78251146 . tab politica_figli, sum(y) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 63 sussidio |
  • 64. BRUZZESE SALVATORE MASTER MEP alle | famiglie | con figli | da 0 a 3 | Summary of reddito anni | Mean Std. Dev. Freq. ------------+------------------------------------ control_f | 19458.482 15692.816 4131 treated_f | 19024.451 13677.579 548 ------------+------------------------------------ Total | 19407.649 15469.661 4679 . * CV Control . display 15692.8/19458.5 .80647532 . * CV Treated . display 13677.6/19024.5 .71894662 . tab politica_reddito, sum(y) sussidio | alle | famiglie | sotto la | soglia di | Summary of reddito povertà | Mean Std. Dev. Freq. ------------+------------------------------------ control_r | 22058.281 15082.99 4017 treated_r | 3323.6727 3109.0372 662 ------------+------------------------------------ Total | 19407.649 15469.661 4679 . * CV Control . display 15082.99/22058.3 .68377844 . * CV Treated . display 3109.0372/3323.7 .93541451 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 64
  • 65. BRUZZESE SALVATORE MASTER MEP . . * Confronto visivo box-plot (min, q1, q2 [mediana], q3, max, outliers) . graph box y, by(politica_numerosità) . graph box y, by(politica_figli) . graph box y, by(politica_reddito) . graph box y if politica_reddito==1 . graph box y if politica_reddito==0 . . ge differenza_medie_numerosità= 19264.806-19585.362 . ge differenza_medie_figli=19458.482-19024.451 . ge differenza_medie_reddito=22058.281-3323.6727 . display differenza_medie_numerosità, differenza_medie_figli, differenza_medie_reddito -320.556 434.03101 18734.607 . . * Regressione Y=y e X=politiche: Y=a+bX+e . regress y politica_numerosità Source | SS df MS Number of obs = 4679 -------------+------------------------------ F( 1, 4677) = 0.50 Model | 118776703 1 118776703 Prob > F = 0.4812 Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001 -------------+------------------------------ Adj R-squared = -0.0001 Total | 1.1195e+12 4678 239310412 Root MSE = 15470 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_n~à | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635 _cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3 ------------------------------------------------------------------------------ UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 65 . pwcorr y politica_numerosità, star(.05)
  • 66. BRUZZESE SALVATORE MASTER MEP | y politi~à -------------+------------------ y | 1.0000 politica_n~à | 0.0103 1.0000 . regress y politica_figli Source | SS df MS Number of obs = 4679 -------------+------------------------------ F( 1, 4677) = 0.38 Model | 91143078.6 1 91143078.6 Prob > F = 0.5372 Residual | 1.1194e+12 4677 239342092 R-squared = 0.0001 -------------+------------------------------ Adj R-squared = -0.0001 Total | 1.1195e+12 4678 239310412 Root MSE = 15471 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_f~i | -434.0307 703.3446 -0.62 0.537 -1812.918 944.8563 _cons | 19458.48 240.7032 80.84 0.000 18986.59 19930.37 ------------------------------------------------------------------------------ . pwcorr y politica_figli, star(.05) | y politi~i -------------+------------------ y | 1.0000 politica_f~i | -0.0090 1.0000 . regress y politica_reddito Source | SS df MS Number of obs = 4679 -------------+------------------------------ F( 1, 4677) = 1014.07 Model | 1.9948e+11 1 1.9948e+11 Prob > F = 0.0000 Residual | 9.2002e+11 4677 196710634 R-squared = 0.1782 -------------+------------------------------ Adj R-squared = 0.1780 Total | 1.1195e+12 4678 239310412 Root MSE = 14025 y | Coef. Std. Err. t P>|t| [95% Conf. Interval] ------------------------------------------------------------------------------ UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 66
  • 67. BRUZZESE SALVATORE MASTER MEP -------------+---------------------------------------------------------------- politica_r~o | -18734.61 588.3158 -31.84 0.000 -19887.99 -17581.23 _cons | 22058.28 221.2906 99.68 0.000 21624.45 22492.12 ------------------------------------------------------------------------------ . pwcorr y politica_reddito, star(.05) | y politi~o -------------+------------------ y | 1.0000 politica_r~o | -0.4221* 1.0000 . regress y politica_numerosità apqual partime lavora sex studio eta Source | SS df MS Number of obs = 3433 -------------+------------------------------ F( 7, 3425) = 271.22 Model | 1.7155e+11 7 2.4507e+10 Prob > F = 0.0000 Residual | 3.0949e+11 3425 90360852.9 R-squared = 0.3566 -------------+------------------------------ Adj R-squared = 0.3553 Total | 4.8104e+11 3432 140162667 Root MSE = 9505.8 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_n~à | -561.8085 330.004 -1.70 0.089 -1208.833 85.21598 apqual | 3256.275 182.251 17.87 0.000 2898.944 3613.607 partime | -4457.468 576.6978 -7.73 0.000 -5588.174 -3326.761 lavora | 50597.52 2635.324 19.20 0.000 45430.56 55764.49 sex | -6553.108 348.2265 -18.82 0.000 -7235.86 -5870.355 studio | 1620.848 137.3338 11.80 0.000 1351.584 1890.113 eta | 170.4344 19.23212 8.86 0.000 132.7269 208.142 _cons | -37542.28 2863.03 -13.11 0.000 -43155.7 -31928.86 ------------------------------------------------------------------------------ . pwcorr y politica_numerosità apqual partime lavora sex studio eta, star(.05) | y politi~à apqual partime lavora sex studio -------------+--------------------------------------------------------------- y | 1.0000 politica_n~à | 0.0103 1.0000 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 67 apqual | 0.0214 0.0072 1.0000
  • 68. BRUZZESE SALVATORE MASTER MEP partime | -0.2583* 0.0293 0.0008 1.0000 lavora | 0.3037* 0.0196 -0.5933* -0.1268* 1.0000 sex | -0.2322* -0.1051* -0.0756* 0.2574* 0.0075 1.0000 studio | 0.3145* -0.0254 0.0163 -0.0805* 0.1259* 0.1168* 1.0000 eta | 0.1289* 0.0622* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167* | eta -------------+--------- eta | 1.0000 . regress y politica_figli apqual partime lavora sex studio eta Source | SS df MS Number of obs = 3433 -------------+------------------------------ F( 7, 3425) = 270.59 Model | 1.7130e+11 7 2.4471e+10 Prob > F = 0.0000 Residual | 3.0974e+11 3425 90435875.1 R-squared = 0.3561 -------------+------------------------------ Adj R-squared = 0.3548 Total | 4.8104e+11 3432 140162667 Root MSE = 9509.8 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_f~i | 124.3377 532.056 0.23 0.815 -918.8415 1167.517 apqual | 3258.584 182.3216 17.87 0.000 2901.114 3616.054 partime | -4520.424 576.2581 -7.84 0.000 -5650.268 -3390.579 lavora | 50625.3 2636.563 19.20 0.000 45455.9 55794.69 sex | -6482.72 347.9485 -18.63 0.000 -7164.928 -5800.513 studio | 1619.138 137.4507 11.78 0.000 1349.645 1888.632 eta | 169.443 20.36845 8.32 0.000 129.5075 209.3786 _cons | -37818.47 2881.957 -13.12 0.000 -43468.99 -32167.94 ------------------------------------------------------------------------------ . pwcorr y politica_figli apqual partime lavora sex studio eta, star(.05) | y politi~i apqual partime lavora sex studio -------------+--------------------------------------------------------------- y | 1.0000 politica_f~i | -0.0090 1.0000 apqual | 0.0214 -0.0303* 1.0000 lavora | 0.3037* 0.0155 -0.5933* -0.1268* 1.0000 partime | -0.2583* 0.0278 0.0008 1.0000 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 68
  • 69. BRUZZESE SALVATORE MASTER MEP sex | -0.2322* -0.0430* -0.0756* 0.2574* 0.0075 1.0000 studio | 0.3145* 0.0638* 0.0163 -0.0805* 0.1259* 0.1168* 1.0000 eta | 0.1289* -0.3470* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167* | eta -------------+--------- eta | 1.0000 . regress y politica_reddito apqual partime lavora sex studio eta Source | SS df MS Number of obs = 3433 -------------+------------------------------ F( 7, 3425) = 302.95 Model | 1.8395e+11 7 2.6278e+10 Prob > F = 0.0000 Residual | 2.9709e+11 3425 86741870.4 R-squared = 0.3824 -------------+------------------------------ Adj R-squared = 0.3811 Total | 4.8104e+11 3432 140162667 Root MSE = 9313.5 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_r~o | -8054.855 666.8196 -12.08 0.000 -9362.259 -6747.451 apqual | 3220.971 178.5863 18.04 0.000 2870.825 3571.118 partime | -1431.979 619.1189 -2.31 0.021 -2645.858 -218.0989 lavora | 44185.35 2636.533 16.76 0.000 39016.01 49354.68 sex | -5958.358 342.1113 -17.42 0.000 -6629.121 -5287.595 studio | 1409.114 135.6837 10.39 0.000 1143.084 1675.143 eta | 159.1275 18.79768 8.47 0.000 122.2717 195.9833 _cons | -33432.04 2825.412 -11.83 0.000 -38971.71 -27892.38 ------------------------------------------------------------------------------ . pwcorr y politica_reddito apqual partime lavora sex studio eta, star(.05) | y politi~o apqual partime lavora sex studio -------------+--------------------------------------------------------------- y | 1.0000 politica_r~o | -0.4221* 1.0000 apqual | 0.0214 0.3604* 1.0000 partime | -0.2583* 0.4723* 0.0008 1.0000 lavora | 0.3037* -0.5963* -0.5933* -0.1268* 1.0000 studio | 0.3145* -0.2005* 0.0163 -0.0805* 0.1259* 0.1168* 1.0000 sex | -0.2322* 0.1576* -0.0756* 0.2574* 0.0075 1.0000 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 69
  • 70. BRUZZESE SALVATORE MASTER MEP eta | 0.1289* -0.0328* 0.0969* -0.0669* 0.0029 -0.1203* -0.1167* | eta -------------+--------- eta | 1.0000 . . * ESEMPIO Metodo alternativo REGRESSIONE-DUMMY TREATED (volendo si possono creare variabili dummy dalle variabili indipen > denti utilizzate e voncolare ad una condizione particolare l'analisi, creando particolari gruppi di riferimento) . char politica_numerosità[omit] 0 . xi: regress y i.politica_numerosità i.politica_nu~à _Ipolitica__0-1 (naturally coded; _Ipolitica__0 omitted) Source | SS df MS Number of obs = 4679 -------------+------------------------------ F( 1, 4677) = 0.50 Model | 118776703 1 118776703 Prob > F = 0.4812 Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001 -------------+------------------------------ Adj R-squared = -0.0001 Total | 1.1195e+12 4678 239310412 Root MSE = 15470 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Ipolitica~1 | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635 _cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3 ------------------------------------------------------------------------------ . * Guppo di riferimento: donne, occupate part-time, tra i 30 e 40 anni . char sex [omit] 1 . char partime [omit] 1 . char classi_età [omit] 2 . xi: regress y i.politica_numerosità apqual i.partime i.sex studio i.classi_età i.politica_nu~à _Ipolitica__0-1 (naturally coded; _Ipolitica__0 omitted) i.sex _Isex_1-2 (naturally coded; _Isex_1 omitted) i.partime _Ipartime_1-2 (naturally coded; _Ipartime_1 omitted) UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 70
  • 71. BRUZZESE SALVATORE MASTER MEP i.classi_età _Iclassi_et_1-4 (naturally coded; _Iclassi_et_2 omitted) Source | SS df MS Number of obs = 3433 -------------+------------------------------ F( 8, 3424) = 170.40 Model | 1.3698e+11 8 1.7122e+10 Prob > F = 0.0000 Residual | 3.4406e+11 3424 100484661 R-squared = 0.2848 -------------+------------------------------ Adj R-squared = 0.2831 Total | 4.8104e+11 3432 140162667 Root MSE = 10024 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Ipolitica~1 | -754.2657 353.6052 -2.13 0.033 -1447.564 -60.96712 apqual | 687.6728 128.5679 5.35 0.000 435.5952 939.7504 _Ipartime_2 | -5913.819 603.1368 -9.81 0.000 -7096.364 -4731.275 _Isex_2 | -6412.592 367.3136 -17.46 0.000 -7132.768 -5692.416 studio | 2791.7 128.1226 21.79 0.000 2540.496 3042.905 _Iclassi_e~1 | -3345.889 744.4077 -4.49 0.000 -4805.417 -1886.361 _Iclassi_e~3 | 2104.893 425.6387 4.95 0.000 1270.361 2939.424 _Iclassi_e~4 | 3483.438 473.8587 7.35 0.000 2554.364 4412.512 _cons | 8061.702 616.2943 13.08 0.000 6853.36 9270.044 ------------------------------------------------------------------------------ . . * ESEMPIO Regressione lineare con residui e . regress y politica_numerosità Source | SS df MS Number of obs = 4679 -------------+------------------------------ F( 1, 4677) = 0.50 Model | 118776703 1 118776703 Prob > F = 0.4812 Residual | 1.1194e+12 4677 239336183 R-squared = 0.0001 -------------+------------------------------ Adj R-squared = -0.0001 Total | 1.1195e+12 4678 239310412 Root MSE = 15470 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- politica_n~à | 320.5562 455.0328 0.70 0.481 -571.5226 1212.635 ------------------------------------------------------------------------------ _cons | 19264.81 303.752 63.42 0.000 18669.31 19860.3 UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 71
  • 72. BRUZZESE SALVATORE MASTER MEP . predict feeted_values (option xb assumed; fitted values) . predict e, residual . list y feeted_values in 1/10 +----------------------+ | y feeted~s | |----------------------| 1. | 15805.343 19264.81 | 2. | 12899.2 19585.36 | 3. | 17400.439 19585.36 | 4. | 24280.301 19585.36 | 5. | 25000 19585.36 | |----------------------| 6. | 55705.059 19585.36 | 7. | 34693.668 19264.81 | 8. | 13000 19264.81 | 9. | 26182.1 19264.81 | 10. | 19000 19585.36 | +----------------------+ . list y e in 1/10 +-----------------------+ | y e | |-----------------------| 1. | 15805.343 -3459.463 | 2. | 12899.2 -6686.162 | 3. | 17400.439 -2184.923 | 4. | 24280.301 4694.938 | 5. | 25000 5414.638 | |-----------------------| 6. | 55705.059 36119.7 | 7. | 34693.668 15428.86 | 8. | 13000 -6264.806 | 9. | 26182.1 6917.293 | UNIVERSITÀ CATTOLICA DEL SACRO CUORE UCSC 72