EP
▪ Distribuição defrequências para variáveis contínuas
▪ Distribuição mais estudada é a curva de Gauss
▪ Distribuição Normal, com forma característica
Johann Carl Friedrich Gauss
Karl Friedrich Gauss
(1777 – 1855)
Distribuição de probabilidades
3.
EP
Distribuição Normal
▪ Diz-seque X segue uma distribuição Normal com média µ e desvio padrão
e escreve-se:
▪ X ~ N (µ , )
▪ E[X] = µ
▪ Var(X) = 2
▪ A sua função densidade de probabilidade é dada por:
𝑓(𝑥) =
1
𝜎 2𝜋
𝑒
−
1
2
𝑥−𝜇
𝜎
2
4.
EP
Distribuição Normal
▪ Éunimodal (o seu gráfico só apresenta um máximo)
▪ É simétrica em relação à média
▪ Quando se varia a média, o gráfico desloca-se na horizontal
▪ Quanto maior for o desvio padrão, mais achatado é o gráfico
▪ Quanto menor for a variabilidade, mais concentrados em torno da
média estão os dados
▪ A probabilidade de tomar valores entre a e b, isto é, P(a ≤ X ≤ b), é dada
pela área sob a função densidade de probabilidade de X.
EP
▪ Distribuição Normal– Distribuição de probabilidades
▪ Área total debaixo da curva é 1
▪ Existe correspondência entre a área e a probabilidade
Distribuição de probabilidades
9.
EP
Distribuição Normal reduzida/ padronizada
▪ Na curva Normal padrão, qual a P(0 ≤ Z ≤ 1,22)?
De acordo com a tabela, P(-∞ ≤ Z ≤ 1,22) = 0,8888
Então, P(0 ≤ Z ≤ 1,22) = 0,8888 – 0,5 = 0,3888
0,5 0,5
10.
EP
Distribuição Normal reduzida/ padronizada
▪ Se uma certa variável aleatória X tem distribuição Normal, então:
𝑍 =
𝑋 − 𝜇
𝜎
~𝑁(0,1)
Conversão/ redução de valores
da variável X para valores
padronizados (Z)
O tempo de vida de uma certa estirpe de bactérias segue uma distribuição
Normal, com média 3h e desvio padrão 4h. Qual a probabilidade de uma
colónia destas bactérias sobreviver até 5h?
E entre 4h e 7h?
11.
EP
Distribuição Normal reduzida/ padronizada
𝑍 =
𝑋−𝜇
𝜎
=
5−3
4
=0,5
Na curva Normal padrão, 5h
“equivale” a 0,5 unidades Z
Então, P(X ≤ 5 horas) = P(-∞ ≤ Z ≤ 0,5) = 0,6915
E entre 4h e 7h? Em Z, 4h equivale a 0,25 e 7h equivale a 1; Então,
P(4 ≤ X ≤ 7) = P(0,25 ≤ Z ≤ 1)
De acordo com a tabela, esta probabilidade pode ser calculada como:
P(0,25 ≤ Z ≤ 1) = 0,8413 – 0,5987 = 0,2426
EP
▪ Distribuição Normal- Desvios
▪ Inclinação (curtose)
Positiva (leptocúrtica) Negativa(platicúrtica)
Distribuição de probabilidades
14.
EP
Sample Mean
6 78 9 10 11 12 13 14
Frequency
0
1
2
3
4
Mean = 10
SD = 1.22
=
10
M = 8
M = 10
M = 9
M = 11
M = 12
M = 11
M = 9
M = 10
M = 10
15.
EP
▪ Média =25; Desvio padrão = 11,2
▪ Média de todas as médias amostrais = 25
Indivíduo Parâmetro
A 10
B 20
C 30
D 40
Amostra Média da amostra
10,10 10
10,20 15
10,30 20
10,40 25
20,10 15
20,20 20
20,30 25
20,40 30
Amostra Média da amostra
30,10 20
30,20 25
30,30 30
30,40 35
40,10 25
40,20 30
40,30 35
40,40 40
𝜇 lj
𝑥 = 𝜇
16.
EP
▪ Cálculo dointervalo de confiança para a média da população
Análise de dados
Estimador ± Coeficiente de fiabilidade x Erro padrão
lj
𝑥 − 𝑧(1−
𝛼
2
)
𝜎
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧(1−
𝛼
2
)
𝜎
𝑛 𝑍 =
𝑋 − 𝜇
𝜎
17.
EP
▪ Uma amostraaleatória de 100 alunos de uma escola tem o peso médio de 67 kg,
com desvio padrão de 13 kg. A média da população pode ser estimada com:
Confiança Z
90% 1,645
95% 1,96
99% 2,575
67 − 1,645
13
100
≤ μ ≤ 67 + 1,645
13
100
67 − 1,96
13
100
≤ μ ≤ 67 + 1,96
13
100
67 − 2,575
13
100
≤ μ ≤ 67 + 2,575
13
100
lj
𝑥 − 𝑧(1−
𝛼
2)
𝜎
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧(1−
𝛼
2)
𝜎
𝑛
18.
EP
Um nutricionista pretendeestimar o consumo de proteína numa certa
população. Uma amostra aleatória simples de 36 indivíduos mostra um
consumo médio de 1,5 g/kg. Assumindo um desvio padrão da população
igual a 0,3 g/kg, construa intervalos para estimar a média da população
com 95% de confiança e com 85% de confiança
Estimação por intervalos - Média
19.
EP
Quando o desviopadrão da população (σ) não é conhecido, usa-se o
desvio padrão da amostra como estimador
lj
𝑥 − 𝑧
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑧
𝑠
𝑛
Um comerciante quer estimar o custo das
compras por cliente na sua loja. Uma
amostra de 100 clientes gasta, em média,
€13,5, com um desvio padrão de €0,75.
Estimar a média da população com 90% de
confiança
Estimação por intervalos - Média
20.
EP
n
s
x
t
−
=
Estimação por intervalos- Média
▪ Quando n<30 e σ é desconhecido
▪ Mesmo que o parâmetro tenha distribuição normal…
▪ Usa-se a distribuição t de student
▪ Forma depende dos graus de liberdade (𝜈) que correspondem a n-1
lj
𝑥 − 𝑡(1−
𝛼
2
;𝜈)
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑡(1−
𝛼
2
;𝜈)
𝑠
𝑛
EP
O gerente doeconomato de uma cozinha quer estimar a quantidade de
vegetais consumidos por dia. Monitoriza o consumo durante 20 dias
onde foram consumidos uma média de 32 kg por dia. O desvio padrão é
de 12 kg. Calcular os limites de confiança para um nível de confiança de
95%.
Estimação por intervalos - Média
lj
𝑥 − 𝑡(1−
𝛼
2;𝜈)
𝑠
𝑛
≤ 𝜇 ≤ lj
𝑥 + 𝑡(1−
𝛼
2;𝜈)
𝑠
𝑛
𝑡(1−
𝛼
2
;𝜈) corresponde ao t associado ao risco de errar, para o intervalo de confiança, com 𝜈 graus de
liberdade. Neste caso, pretende-se t para 1 – 0,05/2, ou seja 0,975 ou 97,5%, com 19 graus de liberdade
EP
Utilização da distribuiçãoNormal ou t-de-Student
N>30 ?
N>30 ?
Distribuição Normal
na população ?
Distribuição Normal
na população ?
Outra distribuição
Outra distribuição
sim
Não
Não
Início com tamanho da amostra
σ conhecido?
σ conhecido?
Dist. Normal
Dist. Normal
sim
Não
t-de-Student
t-de-Student
sim
Dist. Normal
Dist. Normal