2. Duas Fases da Estatística
• Estatística Descritiva: descrever e estudar uma amostra.
• Estatística Indutiva (inferencial): a partir de uma amostra inferir
sobre as características de uma população.
3. População vs. Amostra
Podemos inferir (deduzir) determinadas características de uma
população se extraímos uma amostra representativa desta
População: colecção de unidades Amostra: Conjunto de dados ou
observações, recolhidos a partir
individuais (pessoas ou resultados de um subconjunto da
experimentais) com uma ou mais população, que se estuda com o
características comuns, que se objectivo de tirar conclusões
pretendem estudar. para a população de onde foi
recolhida
amostragem
4. Amostragem
Processo pelo qual se extraem dados de uma população
Existem vários tipos de amostragem:
• Amostragem Aleatória Simples: cada elemento da amostra é retirado
aleatoriamente de toda a população (com ou sem reposição)
cada possível amostra tem a mesma probabilidade de ser recolhida
• Amostragem Estratificada: subdividir a população em, pelo menos, dois
subgrupos distintos que partilham alguma característica e, em seguida,
recolher uma amostra de cada um dos subgrupos (estratos)
• Amostragem por clusters: dividir a população em secções (clusters);
seleccionar aleatoriamente alguns desses clusters; escolher todos os
membros dos clusters seleccionados.
5. Inferência Estatística
inferir certas características
da população
n indivíduos (ou objetos) da população
ex: sortear n pixels de uma imagem
amostra (com ou sem reposição)
n realizações de uma v.a. X
ex: medir a reflectância de um objeto
n vezes
distribuição conhecida/desconhecida
e/ou parâmetros desconhecidos
a amostra constitui um conjunto de n v.a.
X1, X2, ..., Xn independentes e identicamente
distribuídas com distribuição FX
Amostra Aleatória
6. Parâmetro vs. Estatística
• Parâmetro – Medida usada para descrever a distribuição da
população.
– a média μ e o desvio padrão σ são parâmetros de uma distribuição
Normal.
– a probabilidade de sucesso p é um parâmetro da distribuição Binomial.
• Estatística – Função de uma amostra aleatória que não
depende de parâmetros desconhecidos
– Média amostral
– Variância amostral
– Amplitude da amostra
7. Estimação de Parâmetros
População Amostra
Distribuição da População Distribuição Amostral
estimar
Parâmetros Estatísticas
(valor fixo) (função da amostra)
pontual (estatísticas)
Estimação
por intervalo (intervalos de confiança)
OBS: estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional)
as vezes é chamada simplesmente de estimador
estimativa: é o valor do estimador obtido para uma amostra específica
8. Intervalo de Confiança
É uma faixa de possíveis valores em torno da média amostral, e a
probabilidade de que esta faixa realmente contenha o valor real da média
da população
O Intervalo de confiança terá uma certa probabilidade chamada de nível
de confiança (simbolizada por 1 – ) de conter a média da população.
Há uma probabilidade de 1 – da
1 – α = nível de confiança
média estar contida no intervalo
definido α = nível de significância (probabilidade de erro)
Há uma probabilidade de a média
amostral estar fora do intervalo definido
(área hachurada)
1–α
/2 /2
x
Intervalo de confiança
9. Intervalo de Confiança
Distribuição das médias amostrais
1–α
α /2 α /2
x s = desvio padrão da população
(μ)
1 - α = grau de confiança
Erro = z . Desvio padrão amostral
z1 z2
intervalo e = z. s
n
x erro x erro
P( x e x e) = 1
10. Intervalo de Confiança
x e x e ou = x e
Quando tem n > 30 e Quando tem n > 30 e
s é conhecido σ é desconhecido
SX
: X z.s X 1-α
= X z.
n
s
sX = Z/2 x Z/2
n Região Região
Crítica Zcrítico Zcrítico Crítica
s SX
e = z. e = z.
n n
Substitui o desvio padrão da
população s pelo desvio
padrão da amostra s
11. Intervalo de Confiança
Interpretação: Se em um estudo, forem
retiradas várias amostras
aleatórias de tamanho n da
população e que, para cada
Amostra 20 30 40 50 60 70 80 X amostra, seja construído
1 um intervalo de (1-) de
confiança para a variável
2
desejada.
3
...
45
46 Os intervalos obtidos
47 serão diferentes, mas
... (1-)% destes intervalos
98 conterão entre os seus
99 intervalos o valor real do
100
=50 parâmetro.
Ao nível de 95% de confiança espera-se que em 100
intervalos para as amostras, 95 deles contenham a média μ
12. Exercícios
1) Determine o valor crítico Z / 2 que corresponde ao grau de
confiança indicado:
a) 99%
b) 94%
c) 92%
d) 90%
13. Exercícios
1) Um dos principais produtos de uma indústria siderúrgica é a
folha de flandres. Havia uma preocupação com a possibilidade de
haver um número de folhas fora da faixa de especificação de
dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta
informação a empresa decidiu estimar a dureza média das folhas
de flandres () coletando uma amostra aleatória de 49 folhas.
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela
siderúrgica
61,0 60,2 60,3 60,3 60,0 61,0 60,3
60,0 60,0 60,9 61,0 61,2 59,2 60,9
60,0 60,5 59,8 59,3 61,0 59,6 59,8
59,6 60,1 58,0 59,8 58,9 57,6 58,0
60,5 60,1 61,6 61,1 59,7 58,3 61,6
59,5 59,0 60,3 58,7 59,6 54,2 60,3
61,0 59,7 59,9 59,9 60,0 58,6 59,9
Para um grau de confiança de 95%, determine a margem de erro (E) e o
intervalo de confiança para média populacional ().
14. Exercícios:
3) Uma máquina automática de suco industrial é regulada de modo
que a quantidade suprida de cada vez, tenha distribuição
aproximadamente normal com desvio-padrão de 35ml. Determine
um intervalo de 96% de confiança para a quantidade média de toda
produção, sabendo que uma amostra de 30 embalagens teve um
conteúdo médio de 290 ml.
15. Exercícios:
4) A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a
velocidade desenvolvida nas rodovias durante o período de 2 às 4
horas da madrugada. Num período de observação e em um trecho
específico, 100 carros passaram por um aparelho de radar a uma
velocidade média de 115 Km/h, com desvio padrão de 10 Km/h.
a) Construa um intervalo de 98% de confiança para a média da
população;
5) Uma amostra aleatória de 40 contas não-comerciais na filial de um
banco acusou saldo médio de R$140,00 com desvio-padrão de
R$30,00.
a) Construa um intervalo de 95% confiança para a verdadeira média.
b) Construa um intervalo de 99% confiança para a verdadeira média.
c) A que conclusão podemos chegar com os resultados das opções
anteriores?