EP
Distribuição Normal
e T-de-Student
- Intervalos de confiança para a média -
Distribuição Normal
e T-de-Student
- Intervalos de confiança para a média -
EP
▪ Distribuição de frequências para variáveis contínuas
▪ Distribuição mais estudada é a curva de Gauss
▪ Distribuição Normal, com forma característica
Johann Carl Friedrich Gauss
Karl Friedrich Gauss
(1777 – 1855)
Distribuição de probabilidades
EP
Distribuição Normal
▪ Diz-se que X segue uma distribuição Normal com média µ e desvio padrão
 e escreve-se:
▪ X ~ N (µ ,  )
▪ E[X] = µ
▪ Var(X) = 2
▪ A sua função densidade de probabilidade é dada por:
𝑓(𝑥) =
1
𝜎 2𝜋
𝑒
−
1
2
𝑥−𝜇
𝜎
2
EP
Distribuição Normal
▪ É unimodal (o seu gráfico só apresenta um máximo)
▪ É simétrica em relação à média
▪ Quando se varia a média, o gráfico desloca-se na horizontal
▪ Quanto maior for o desvio padrão, mais achatado é o gráfico
▪ Quanto menor for a variabilidade, mais concentrados em torno da
média estão os dados
▪ A probabilidade de tomar valores entre a e b, isto é, P(a ≤ X ≤ b), é dada
pela área sob a função densidade de probabilidade de X.
EP
Distribuição Normal
Médias diferentes, mas
o mesmo desvio padrão
Médias iguais, mas
desvio padrão diferente
EP
▪ Distribuição Normal – Distribuição de probabilidades
▪ Área total debaixo da curva é 1
▪ Existe correspondência entre a área e a probabilidade
Distribuição de probabilidades
EP
Distribuição Normal reduzida / padronizada
▪ Na curva Normal padrão, qual a P(0 ≤ Z ≤ 1,22)?
De acordo com a tabela, P(-∞ ≤ Z ≤ 1,22) = 0,8888
Então, P(0 ≤ Z ≤ 1,22) = 0,8888 – 0,5 = 0,3888
0,5 0,5
EP
Distribuição Normal reduzida / padronizada
▪ Se uma certa variável aleatória X tem distribuição Normal, então:
𝑍 =
𝑋 − 𝜇
𝜎
~𝑁(0,1)
Conversão/ redução de valores
da variável X para valores
padronizados (Z)
O tempo de vida de uma certa estirpe de bactérias segue uma distribuição
Normal, com média 3h e desvio padrão 4h. Qual a probabilidade de uma
colónia destas bactérias sobreviver até 5h?
E entre 4h e 7h?
EP
Distribuição Normal reduzida / padronizada
𝑍 =
𝑋−𝜇
𝜎
=
5−3
4
=0,5
Na curva Normal padrão, 5h
“equivale” a 0,5 unidades Z
Então, P(X ≤ 5 horas) = P(-∞ ≤ Z ≤ 0,5) = 0,6915
E entre 4h e 7h? Em Z, 4h equivale a 0,25 e 7h equivale a 1; Então,
P(4 ≤ X ≤ 7) = P(0,25 ≤ Z ≤ 1)
De acordo com a tabela, esta probabilidade pode ser calculada como:
P(0,25 ≤ Z ≤ 1) = 0,8413 – 0,5987 = 0,2426
EP
▪ Distribuição Normal – Desvios
▪ Falta de simetria
Distribuição de probabilidades
EP
▪ Distribuição Normal - Desvios
▪ Inclinação (curtose)
Positiva (leptocúrtica) Negativa(platicúrtica)
Distribuição de probabilidades
EP
Sample Mean
6 7 8 9 10 11 12 13 14
Frequency
0
1
2
3
4
Mean = 10
SD = 1.22
 =
10
M = 8
M = 10
M = 9
M = 11
M = 12
M = 11
M = 9
M = 10
M = 10
EP
▪ Média = 25; Desvio padrão = 11,2
▪ Média de todas as médias amostrais = 25
Indivíduo Parâmetro
A 10
B 20
C 30
D 40
Amostra Média da amostra
10,10 10
10,20 15
10,30 20
10,40 25
20,10 15
20,20 20
20,30 25
20,40 30
Amostra Média da amostra
30,10 20
30,20 25
30,30 30
30,40 35
40,10 25
40,20 30
40,30 35
40,40 40
𝜇 lj
𝑥 = 𝜇
EP
▪ Cálculo do intervalo de confiança para a média da população
Análise de dados
Estimador ± Coeficiente de fiabilidade x Erro padrão
lj
𝑥 − 𝑧(1−
𝛼
2
)
𝜎
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧(1−
𝛼
2
)
𝜎
𝑛 𝑍 =
𝑋 − 𝜇
𝜎
EP
▪ Uma amostra aleatória de 100 alunos de uma escola tem o peso médio de 67 kg,
com desvio padrão de 13 kg. A média da população pode ser estimada com:
Confiança Z
90% 1,645
95% 1,96
99% 2,575
67 − 1,645
13
100
≤ μ ≤ 67 + 1,645
13
100
67 − 1,96
13
100
≤ μ ≤ 67 + 1,96
13
100
67 − 2,575
13
100
≤ μ ≤ 67 + 2,575
13
100
lj
𝑥 − 𝑧(1−
𝛼
2)
𝜎
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧(1−
𝛼
2)
𝜎
𝑛
EP
Um nutricionista pretende estimar o consumo de proteína numa certa
população. Uma amostra aleatória simples de 36 indivíduos mostra um
consumo médio de 1,5 g/kg. Assumindo um desvio padrão da população
igual a 0,3 g/kg, construa intervalos para estimar a média da população
com 95% de confiança e com 85% de confiança
Estimação por intervalos - Média
EP
Quando o desvio padrão da população (σ) não é conhecido, usa-se o
desvio padrão da amostra como estimador
lj
𝑥 − 𝑧
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧
𝑠
𝑛
Um comerciante quer estimar o custo das
compras por cliente na sua loja. Uma
amostra de 100 clientes gasta, em média,
€13,5, com um desvio padrão de €0,75.
Estimar a média da população com 90% de
confiança
Estimação por intervalos - Média
EP
n
s
x
t

−
=
Estimação por intervalos - Média
▪ Quando n<30 e σ é desconhecido
▪ Mesmo que o parâmetro tenha distribuição normal…
▪ Usa-se a distribuição t de student
▪ Forma depende dos graus de liberdade (𝜈) que correspondem a n-1
lj
𝑥 − 𝑡(1−
𝛼
2
;𝜈)
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑡(1−
𝛼
2
;𝜈)
𝑠
𝑛
EP
EP
O gerente do economato de uma cozinha quer estimar a quantidade de
vegetais consumidos por dia. Monitoriza o consumo durante 20 dias
onde foram consumidos uma média de 32 kg por dia. O desvio padrão é
de 12 kg. Calcular os limites de confiança para um nível de confiança de
95%.
Estimação por intervalos - Média
lj
𝑥 − 𝑡(1−
𝛼
2;𝜈)
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑡(1−
𝛼
2;𝜈)
𝑠
𝑛
𝑡(1−
𝛼
2
;𝜈) corresponde ao t associado ao risco de errar, para o intervalo de confiança, com 𝜈 graus de
liberdade. Neste caso, pretende-se t para 1 – 0,05/2, ou seja 0,975 ou 97,5%, com 19 graus de liberdade
EP
gl 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.09 22.33 31.60
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
…
12 0,695 0,873 1,083 1,356 1,538 1,782 2,179 2,681 3,055 3,930 4,318
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
…
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
∞ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
Distribuição t de Student
EP
Utilização da distribuição Normal ou t-de-Student
N>30 ?
N>30 ?
Distribuição Normal
na população ?
Distribuição Normal
na população ?
Outra distribuição
Outra distribuição
sim
Não
Não
Início com tamanho da amostra
σ conhecido?
σ conhecido?
Dist. Normal
Dist. Normal
sim
Não
t-de-Student
t-de-Student
sim
Dist. Normal
Dist. Normal

Estatistica- Distribuição Normal e T-Student

  • 1.
    EP Distribuição Normal e T-de-Student -Intervalos de confiança para a média - Distribuição Normal e T-de-Student - Intervalos de confiança para a média -
  • 2.
    EP ▪ Distribuição defrequências para variáveis contínuas ▪ Distribuição mais estudada é a curva de Gauss ▪ Distribuição Normal, com forma característica Johann Carl Friedrich Gauss Karl Friedrich Gauss (1777 – 1855) Distribuição de probabilidades
  • 3.
    EP Distribuição Normal ▪ Diz-seque X segue uma distribuição Normal com média µ e desvio padrão  e escreve-se: ▪ X ~ N (µ ,  ) ▪ E[X] = µ ▪ Var(X) = 2 ▪ A sua função densidade de probabilidade é dada por: 𝑓(𝑥) = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2
  • 4.
    EP Distribuição Normal ▪ Éunimodal (o seu gráfico só apresenta um máximo) ▪ É simétrica em relação à média ▪ Quando se varia a média, o gráfico desloca-se na horizontal ▪ Quanto maior for o desvio padrão, mais achatado é o gráfico ▪ Quanto menor for a variabilidade, mais concentrados em torno da média estão os dados ▪ A probabilidade de tomar valores entre a e b, isto é, P(a ≤ X ≤ b), é dada pela área sob a função densidade de probabilidade de X.
  • 5.
    EP Distribuição Normal Médias diferentes,mas o mesmo desvio padrão Médias iguais, mas desvio padrão diferente
  • 6.
    EP ▪ Distribuição Normal– Distribuição de probabilidades ▪ Área total debaixo da curva é 1 ▪ Existe correspondência entre a área e a probabilidade Distribuição de probabilidades
  • 9.
    EP Distribuição Normal reduzida/ padronizada ▪ Na curva Normal padrão, qual a P(0 ≤ Z ≤ 1,22)? De acordo com a tabela, P(-∞ ≤ Z ≤ 1,22) = 0,8888 Então, P(0 ≤ Z ≤ 1,22) = 0,8888 – 0,5 = 0,3888 0,5 0,5
  • 10.
    EP Distribuição Normal reduzida/ padronizada ▪ Se uma certa variável aleatória X tem distribuição Normal, então: 𝑍 = 𝑋 − 𝜇 𝜎 ~𝑁(0,1) Conversão/ redução de valores da variável X para valores padronizados (Z) O tempo de vida de uma certa estirpe de bactérias segue uma distribuição Normal, com média 3h e desvio padrão 4h. Qual a probabilidade de uma colónia destas bactérias sobreviver até 5h? E entre 4h e 7h?
  • 11.
    EP Distribuição Normal reduzida/ padronizada 𝑍 = 𝑋−𝜇 𝜎 = 5−3 4 =0,5 Na curva Normal padrão, 5h “equivale” a 0,5 unidades Z Então, P(X ≤ 5 horas) = P(-∞ ≤ Z ≤ 0,5) = 0,6915 E entre 4h e 7h? Em Z, 4h equivale a 0,25 e 7h equivale a 1; Então, P(4 ≤ X ≤ 7) = P(0,25 ≤ Z ≤ 1) De acordo com a tabela, esta probabilidade pode ser calculada como: P(0,25 ≤ Z ≤ 1) = 0,8413 – 0,5987 = 0,2426
  • 12.
    EP ▪ Distribuição Normal– Desvios ▪ Falta de simetria Distribuição de probabilidades
  • 13.
    EP ▪ Distribuição Normal- Desvios ▪ Inclinação (curtose) Positiva (leptocúrtica) Negativa(platicúrtica) Distribuição de probabilidades
  • 14.
    EP Sample Mean 6 78 9 10 11 12 13 14 Frequency 0 1 2 3 4 Mean = 10 SD = 1.22  = 10 M = 8 M = 10 M = 9 M = 11 M = 12 M = 11 M = 9 M = 10 M = 10
  • 15.
    EP ▪ Média =25; Desvio padrão = 11,2 ▪ Média de todas as médias amostrais = 25 Indivíduo Parâmetro A 10 B 20 C 30 D 40 Amostra Média da amostra 10,10 10 10,20 15 10,30 20 10,40 25 20,10 15 20,20 20 20,30 25 20,40 30 Amostra Média da amostra 30,10 20 30,20 25 30,30 30 30,40 35 40,10 25 40,20 30 40,30 35 40,40 40 𝜇 lj 𝑥 = 𝜇
  • 16.
    EP ▪ Cálculo dointervalo de confiança para a média da população Análise de dados Estimador ± Coeficiente de fiabilidade x Erro padrão lj 𝑥 − 𝑧(1− 𝛼 2 ) 𝜎 𝑛 ≤ 𝜇 ≤ lj 𝑥 + 𝑧(1− 𝛼 2 ) 𝜎 𝑛 𝑍 = 𝑋 − 𝜇 𝜎
  • 17.
    EP ▪ Uma amostraaleatória de 100 alunos de uma escola tem o peso médio de 67 kg, com desvio padrão de 13 kg. A média da população pode ser estimada com: Confiança Z 90% 1,645 95% 1,96 99% 2,575 67 − 1,645 13 100 ≤ μ ≤ 67 + 1,645 13 100 67 − 1,96 13 100 ≤ μ ≤ 67 + 1,96 13 100 67 − 2,575 13 100 ≤ μ ≤ 67 + 2,575 13 100 lj 𝑥 − 𝑧(1− 𝛼 2) 𝜎 𝑛 ≤ 𝜇 ≤ lj 𝑥 + 𝑧(1− 𝛼 2) 𝜎 𝑛
  • 18.
    EP Um nutricionista pretendeestimar o consumo de proteína numa certa população. Uma amostra aleatória simples de 36 indivíduos mostra um consumo médio de 1,5 g/kg. Assumindo um desvio padrão da população igual a 0,3 g/kg, construa intervalos para estimar a média da população com 95% de confiança e com 85% de confiança Estimação por intervalos - Média
  • 19.
    EP Quando o desviopadrão da população (σ) não é conhecido, usa-se o desvio padrão da amostra como estimador lj 𝑥 − 𝑧 𝑠 𝑛 ≤ 𝜇 ≤ lj 𝑥 + 𝑧 𝑠 𝑛 Um comerciante quer estimar o custo das compras por cliente na sua loja. Uma amostra de 100 clientes gasta, em média, €13,5, com um desvio padrão de €0,75. Estimar a média da população com 90% de confiança Estimação por intervalos - Média
  • 20.
    EP n s x t  − = Estimação por intervalos- Média ▪ Quando n<30 e σ é desconhecido ▪ Mesmo que o parâmetro tenha distribuição normal… ▪ Usa-se a distribuição t de student ▪ Forma depende dos graus de liberdade (𝜈) que correspondem a n-1 lj 𝑥 − 𝑡(1− 𝛼 2 ;𝜈) 𝑠 𝑛 ≤ 𝜇 ≤ lj 𝑥 + 𝑡(1− 𝛼 2 ;𝜈) 𝑠 𝑛
  • 21.
  • 22.
    EP O gerente doeconomato de uma cozinha quer estimar a quantidade de vegetais consumidos por dia. Monitoriza o consumo durante 20 dias onde foram consumidos uma média de 32 kg por dia. O desvio padrão é de 12 kg. Calcular os limites de confiança para um nível de confiança de 95%. Estimação por intervalos - Média lj 𝑥 − 𝑡(1− 𝛼 2;𝜈) 𝑠 𝑛 ≤ 𝜇 ≤ lj 𝑥 + 𝑡(1− 𝛼 2;𝜈) 𝑠 𝑛 𝑡(1− 𝛼 2 ;𝜈) corresponde ao t associado ao risco de errar, para o intervalo de confiança, com 𝜈 graus de liberdade. Neste caso, pretende-se t para 1 – 0,05/2, ou seja 0,975 ou 97,5%, com 19 graus de liberdade
  • 23.
    EP gl 75% 80%85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95% 1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.09 22.33 31.60 3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92 4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 … 12 0,695 0,873 1,083 1,356 1,538 1,782 2,179 2,681 3,055 3,930 4,318 14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140 15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015 17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965 18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922 19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883 20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850 21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819 22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792 … 80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416 100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390 120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373 ∞ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291 Distribuição t de Student
  • 24.
    EP Utilização da distribuiçãoNormal ou t-de-Student N>30 ? N>30 ? Distribuição Normal na população ? Distribuição Normal na população ? Outra distribuição Outra distribuição sim Não Não Início com tamanho da amostra σ conhecido? σ conhecido? Dist. Normal Dist. Normal sim Não t-de-Student t-de-Student sim Dist. Normal Dist. Normal