1. Aula 9
Noções de probabilidade; noções de
amostragem; Distribuição normal,
distribuição amostral da média
Profa Dra. Denise Pimentel
Bergamaschi
HEP 175 – Bioestatística
2. Noções de probabilidade e distribuição Bernoulli e
distribuição binomial
PROBABILIDADE (probability, chance, likelihood)
• É uma afirmação numérica sobre a possibilidade de que
algum evento ocorra.
• Quantifica o grau de incerteza de eventos, variando de 0 (0%)
a 1 (100%).
• Um evento impossível de ocorrer tem probabilidade 0 (zero).
• Um evento certo tem probabilidade 1 (um).
• Quando se joga uma moeda, não se sabe se vai sair cara. Mas
sabe-se que a probabilidade de sair cara é 0,5 = 50% = 1/2.
• Dizer que a eficácia de uma vacina é de 70% corresponde a
dizer que cada indivíduo vacinado tem probabilidade 0,7 de
ficar imune.
3. Probabilidade em espaços finitos contáveis
Espaço amostral (S)
• É o conjunto de todos os resultados possíveis de um
experimento.
• Supor o experimento lançar uma moeda: S= {cara, coroa}
Há dois pontos neste espaço amostral, sendo um favorável ao
evento A={cara}.
Definição clássica de probabilidade
Exemplo: probabilidade de (ouros) =
5
,
0
2
1
S
de
elementos
de
numero
A
de
elementos
de
numero
)
(
A
P
4
1
52
13
4. Probabilidade de eventos mutuamente excludentes
• Diz-se que dois eventos são mutuamente excludentes
(ou mutuamente exclusivos) quando não podem
ocorrer simultaneamente.
Exemplo:
A = {cara} ; B= {coroa}, no lançamento de uma moeda;
A = {carta com naipe vermelho}; B={carta com naipe
preto}, na retirada de uma carta de baralho.
Exemplo de eventos não mutuamente exclusivos
A= {naipe vermelho} ; B = {ás} .
5. • A probabilidade da ocorrência de um evento
A ou de um evento B é:
P(A ou B) = P(A υ B) = P(A) + P(B) – P(A B)
Exemplo: P(naipe vermelho ou ás) = P(naipe
vermelho) + P(ás) – P(naipe vermelho e ás) =
(26/52) + (4/52) – (2/52) = 28/52 = 0,538.
• A probabilidade da ocorrência simultânea de
eventos mutuamente exclusivos é zero.
P(cara e coroa) = P(cara coroa) = 0, no
lançamento de uma moeda.
6. • Se A e B forem mutuamente excludentes, P(A B) = 0 e
P(A ou B) = P(A υ B) = P(A) + P(B)
Exemplo:
P(Face 2 ou Face 3) no lançamento de um dado
P(2 ou 3)= P(2)+P(3)= 1/6 + 1/6 = 2/6 = 1/3.
P(Resultado ímpar)= P(1 ou 3 ou 5)= P(1)+P(3)+P(5)=
3/6 = 1/2.
Regra da adição: P(A ou B) = P(A υ B) = P(A) + P(B) –
P(A B)
7. Probabilidade de eventos independentes
• Os eventos A e B são independentes quando o resultado de
um não influi no resultado do outro.
Exemplo: no lançamento simultâneo de duas moedas, o
resultado de uma não interfere no resultado da outra.
• A probabilidade da ocorrência de eventos independentes é
o produto das probabilidades de cada evento.
P(A e B)= P(A B) = P(A) x P(B)
• P(face 2 no primeiro dado e face 3 no segundo dado), no
lançamento sequencial de dois dados = P(2 e 3) =
P(2)xP(3)= 1/6 x 1/6= 1/36= 0,0278= 2,78%.
8. Probabilidade condicional
A probabilidade condicional do evento A dado que ocorreu o
evento B é
, para
Lê-se P(A|B) como probabilidade de A dado B.
Exemplo:
Probabilidade de rei dado que ocorreu figura:
P(r|figura)= P(r e figura)/P(figura)= 4/52 12/52= 4/12= 1/3
• Probabilidade de rei, dado que ocorreu copas:
P(r|)= P(r e )/P()= 1/5213/52= 1/13
Regra da multiplicação
se A e B forem independentes, P(A|B) = P(A) e como consequência,
)
(
)
(
)
|
(
B
P
B
A
P
B
A
P
0
)
(
B
P
)
(
)
|
(
)
( B
xP
B
A
P
B
A
P
)
(
)
(
)
( B
xP
A
P
B
A
P
9. Exemplo
Considerar uma população de homens que foram
classificados segundo o hábito de fumar e doença
respiratória crônica. Nesta população sabe-se que 5% dos
homens têm doença respiratória e são não fumantes, 15%
têm doença e são fumantes, 50% não têm doença e são
não fumantes e 30% não têm a doença e são fumantes.
Problema
respiratório
Não fumante Fumante
S
Não ( ) 0,5 = P( ) 0,30 = P( ) 0,80 = P( )
Sim (R) 0,05 = P( ) 0,15 = P(SR) 0,20 = P(R)
0,55 = P( ) 0,45 = P(S)
S
R
R
S S
R
R
R
S
S
Escolhe-se um homem ao acaso, qual a probabilidade dele ter
doença respiratória dado que era fumante?
= 0,15/0,45 = 0,33
Os eventos não são independentes porque
)
(
)
(
)
|
(
S
P
S
R
P
S
R
P
)
(
)
(
)
( R
xP
S
P
R
S
P
10. Relação entre eventos mutuamente exclusivos e
independentes:
Os eventos mutuamente exclusivos A e B satisfazem
a condição que P(A e B) = 0, então dois eventos
mutuamente exclusivos A e B são não independentes
a menos que P(A)=0 ou P(B)=0. Caso contrário, eles
são claramente dependentes pois P(A)P(B)>0 se
ambos P(A)>0 e P(B)>0, portanto porque .
Assim, dois eventos mutuamente exclusivos A e B
são dependentes exceto nos casos onde P(A)=0 ou
P(B)=0.
11. Definição frequentista de probabilidade:
n repetições do evento A; A ocorre m vezes,
então a frequência relativa de
Para n suficientemente grande, ou
seja,
Quando n cresce, tende a se estabilizar em
torno de uma constante, P(A)
n
m
A
)
(A
P
n
m
)
(
lim A
P
n
m
n
n
m
12. Variável aleatória discreta
Variável aleatória é qualquer função de número real, definida no espaço
amostral e existe associado a este número uma probabilidade de
ocorrência.
Exemplo:
No lançamento de 1 moeda, o número de caras é uma variável aleatória.
Se esta variável for denominada X, tem-se que os valores possíveis para X
são 0 e 1. Assim escreve-se X:0,1.
A probabilidade de cara é 0,5: P(cara)= 0,5= 1/2.
No lançamento de 10 moedas, X:0, 1, 2,....,10; e a probabilidade de cara =
0,5.
Sair cara é mutuamente exclusivo de sair coroa e um particular resultado
de cada lançamento independe dos demais.
13. É possível calcular a probabilidade da variável
assumir cada valor x, ou seja, P(X=x).
O conjunto de valores da variável aleatória e
das probabilidades obtidas define uma
distribuição de probabilidades. Se X assume
valores inteiros, a variável é denominada
discreta. Se X assume valores no conjunto dos
números reais, a variável é denominada
contínua.
14. Distribuição de probabilidades
Distribuição normal ou de Gauss; distribuição amostral da média
Os dados abaixo são medidas do tórax (polegadas) de 5732 soldados
escoceses, tomadas pelo matemático belga, Adolphe Quetelet (1796-
1874).
medidas | Freq, Percent Cum,
------------+-----------------------------------
33 | 3 0,05 0,05
34 | 19 0,33 0,38
35 | 81 1,41 1,80
36 | 189 3,30 5,09
37 | 409 7,14 12,23
38 | 753 13,14 25,37
39 | 1062 18,53 43,89
40 | 1082 18,88 62,77
41 | 935 16,31 79,08
42 | 646 11,27 90,35
43 | 313 5,46 95,81
44 | 168 2,93 98,74
45 | 50 0,87 99,62
46 | 18 0,31 99,93
47 | 3 0,05 99,98
48 | 1 0,02 100,00
------------+-----------------------------------
Total | 5732 100,00
15. Distribuição de medidas do tórax (polegadas)
de soldados escoceses.
Fonte: Daly F et al. Elements of Statistics,
1999.
Frequency
medidas
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
0
200
400
600
800
1000
16. Função densidade de probabilidade da
distribuição normal: Se a variável aleatória X é
normalmente distribuída com média e
desvio padrão (variância ), a função
densidade de probabilidade de
2
17. Propriedades:
• campo de variação: ;
• é simétrica em torno da média m (ou );
• a média e a mediana são coincidentes;
• a área total sob a curva é igual a 1 ou 100%;
• a área sob a curva pode ser entendida como
medida de probabilidade.
X
s
observaçõe
das
inclui
s
observaçõe
das
inclui
s
observaçõe
das
inclui
%
0
,
99
58
,
2
%
0
,
95
96
,
1
%
2
,
68
1
18. Exemplo:
Depois de tomarmos várias amostras, decidiu-se adotar um modelo para
as medidas de perímetro do tórax de uma população de homens adultos
com os parâmetros: média ( ) = 40 polegadas e desvio padrão ( ) = 2
polegadas.
40 43 X
Qual a probabilidade de um indivíduo, sorteado desta população, ter um
perímetro de tórax entre 40 e 43 polegadas?
Quantos desvio padrão 43 está em torno da média?
dx
e
X
P x
x
43
40
]
4
2
)
40
(
[
2
2
2
1
)
43
40
(
19. Normal reduzida:
0 1,5 Z
Utilizando a tabela da curva normal reduzida,
= 0,43319 =43,3%
-
x
onde
1
;
0
~
Z
N
Z
)
5
,
1
0
(
)
2
40
43
2
40
40
(
)
43
40
(
Z
P
X
P
X
P
)
5
,
1
0
(
Z
P
20. Exemplo 29:
Com base na distribuição de X~N( =40, =2), calcular:
a) a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de
tórax maior ou igual a 43 polegadas.
40 43 X
0 1,5 Z
Utilizando a tabela da curva normal reduzida,
= 0,5-0,43319=0,06681= 6,7%.
)
5
,
1
(
)
2
40
43
(
)
43
(
Z
P
X
P
X
P
)
5
,
1
(
Z
P
21. b) a probabilidade de um indivíduo, sorteado desta
população, ter um perímetro de tórax entre 35 e 40
polegadas.
c) a probabilidade de um indivíduo, sorteado desta
população, ter um perímetro de tórax menor que 35.
d) Qual o valor do perímetro do tórax, que seria
ultrapassado por 25% da população?
22. Exemplo 30
Considerar a altura de 351 mulheres idosas
como seguindo uma distribuição normal com
média 160cm e desvio padrão 6 cm. Sorteia-se
uma mulher; qual a probabilidade de que ela
tenha:
a) altura entre 160 cm e 165 cm?
b) altura menor do que 145 cm?
c) altura maior do que 170 cm?
23. Distribuição amostral da média
Supor a situação onde uma população é composta por 6
elementos, para os quais observou-se a característica X, cujos
valores estão apresentados abaixo.
Fonte: Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The
Maple Press Company, York, 1957.
Média populacional ( ) = 14;
Variância populacional ( ) = 3,667;
Desvio padrão populacional ( ) = 1,9149.
elementos Xi
A 11
B 16
C 12
D 15
E 16
F 14
2
26. Distribuição de frequência de todas as possíveis
médias:
Distribuição amostral da média
i frequência
1 11 1
2 11,5 2
3 12 1
4 12,5 2
5 13 4
6 13,5 6
7 14 5
8 14,5 2
9 15 5
10 15,5 4
11 16 4
Total 36
i
x
Frequency
medias
10 10.65 11.3 11.95 12.6 13.25 13.9 14.55 15.2 15.85
0
2
4
6
8
27. Média das médias
Variância das médias ;
Desvio padrão das médias = erro padrão da
média = ;
Erro padrão da média = .
14
)
(
11
1
n
f
x
x i
i
i
833
,
1
)
( 2
11
1
2
n
f
x
x i
i
i
x
2
x
x
354
,
1
833
,
1
28. Teorema central do limite: X é variável aleatória
com média e variância , então
No exemplo, , portanto
.
2
)
,
(
~
n
N
X
)
915
,
1
,
14
(
~
N
X
)
354
,
1
2
915
,
1
,
14
(
~
x
x
N
X
29. Exemplo:
Os valores de ácido úrico em homens adultos
sadios seguem distribuição aproximadamente
Normal com média 5,7mg% e desvio padrão
1mg%. Encontre a probabilidade de que uma
amostra aleatória de tamanho 9, sorteada
desta população, tenha média
a) maior do que 6 mg%.
b) menor do que 5,2 mg%.
31. Exemplo 31
a) Suponha que o peso em gramas do conteúdo de pacotes de
salgadinho siga uma distribuição normal com média 500g e
desvio padrão 85g. Sorteia-se uma amostra de 50 pacotes.
Calcule:
b) a probabilidade de obter peso médio entre 500 e 530
gramas.
c) a probabilidade de obter peso médio entre 450 e 500
gramas.
32. EXERCÍCIOS SUPLEMENTARES
Exercício S24
Suponha que o peso de açúcar em pacotes seja
anunciado como sendo 2Kg (2000g). Suponha que o
peso (X) segue uma distribuição normal com média e
desvio padrão em gramas dado por N( ). Qual a
probabilidade de sortear um pacote com peso abaixo
do anunciado?
33. Exercício S25
Suponha que o tempo médio de permanência em
um hospital para pacientes com determinada doença
é de 60 dias com desvio padrão de 15 dias. Supor
que o tempo de permanência segue uma distribuição
aproximadamente normal. Se for sorteado 1
paciente desta população, calcule a probabilidade de
que seu tempo de permanência será
a) maior que 50 dias.
b) menor que 30 dias.
c) entre 40 e 70 dias.
d) maior do que 75 dias.
34. Exercício S26
Supor que a idade para o aparecimento de certa
doença possui distribuição aproximadamente normal
com média 11,5 anos e desvio padrão 3 anos. Uma
criança apresentou esta doença. Calcule a
probabilidade de que a criança tenha
a) idade entre 8,5 e 14,5 anos.
b) acima de 10 anos.
c) abaixo de 12 anos.
35. Exercício S27
Supor que a pressão média diastólica de certa
população em certo grupo de idade é igual a
78mmHg com desvio padrão 9mmHg. Calcule a
probabilidade de que em uma amostra de tamanho
16, a média seja maior que 81mmgHg.
36. Exercício S28
Seja X a variável estatura de homens adultos, assuma que X
segue uma distribuição normal com média = 172 cm e
desvio padrão = 7,6 cm. Supor que uma amostra de
tamanho n= 25 é retirada desta população.
a) Qual é a distribuição da média amostral e qual é a média e o
desvio padrão desta distribuição?
b) Calcule a probabilidade que a média amostral seja menor
que a média populacional em 2,5 cm.
37. A família de distribuições t de Student
Student é o pseudônimo de W. S. Gosset que, em 1908,
propôs a distribuição t. Esta distribuição é muito parecida com
a distribuição normal. A família de distribuições t é centrada
no zero e possui formato em sino. A curva não é tão alta
quanto a curva da distribuição normal e as caudas da
distribuição t são mais altas que as da distribuição normal. O
parâmetro que determina a altura e largura da distribuição t
depende do tamanho da amostra (n) e é denominado graus
de liberdade (gl), denotado pela letra grega ( ) (lê-se ni). A
notação da distribuição t é .
Curvas t para graus de liberdade (tamanhos de amostra)
diferentes.
t
38. Quando o número de graus de liberdade da
distribuição t aumenta, a distribuição se
aproxima de uma distribuição normal.
39.
40. Esta família t não descreve o que acontece na
natureza mas sim o que aconteceria se
selecionássemos milhares de amostras aleatórias de
uma população normal com média e fosse
calculado para cada amostra.
Calculando o valor de t para 500 amostras de
tamanho 6 de uma população com distribuição
normal, obtém-se o gráfico a seguir:
n
s
X
t