1. Wadiley Sousa do Nascimento
Pós-Graduado em Estatística, Matemática e Computação – Ramo
Estatística Computacional
Mobile: +239 980 10 45 / 906 02 00 | Email: wadmiguel547@yahoo.com
ESTATÍSTICA II
2. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Motivação
2
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
O objectivo fundamental da Estatística é extrair informações
confiáveis a partir dos dados recolhidos para a tomada de decisão.
Informação
Decisão
Dados
Estatística
Conhecimento
3. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
Motivação
3
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Nas áreas económicas e de gestão do empresas, a Estatística
pode ser utilizada com três objectivas: (1) descrever e
compreender relações entre diferentes características de uma
população, (2) Tomar decisões mais correctas e (3) fazer face a
mudança.
A Estatística fornece aos gestores instrumentos para que
possam responder as preocupações e tomar decisões com
alguma confiança, mesmo quando a quantidade de informação
disponível é pequena e as situações futuras são de elevada
incerteza.
4. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
Definição
4
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Uma variável aleatória (unidimensional), geralmente designada por 𝑋,
e uma função que a cada acontecimento w do espaço de resultados,
faz corresponder um valor real, 𝑥 = 𝑋(𝑤).
“Uma variável aleatória é uma função com valores numéricos, cujo
valor é determinado por fatores de chance.”
Associa números aos eventos do espaço amostral.
𝑿 = Número de coroas em 2 lançamentos de uma moeda.
5. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
Definição
5
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Variável Aleatória
Contínua
Os possíveis resultados
abrangem todo um intervalo de
números reais
Discreta
Os possíveis resultados estão
contidos em um conjunto finito
ou enumerável
0 1 2 3 4 ...
Número de defeitos em ...
Ex.
0
Ex.
Tempo de resposta de ...
6. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
V. A - Discreta
6
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplos
1. Lança-se uma moeda 10 vezes e anota-se o número de caras. Este número pode
ser 0, 1, 2 ...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes
compram um determinado produto. O número de pessoas que compram o produto
varia de 0 a 200.
3. Um pesquisador conta quantos, dos 500 chefes de família que entrevistou, eram
mulheres
4. Um médico conta quantos, dos 100 pacientes que tratou com uma nova droga ,
ficaram curados
7. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
Distribuição de Probabilidades
7
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Uma distribuição de probabilidade é um modelo matemático que
relaciona um certo valor da variável em estudo com a sua
probabilidade de ocorrência.
Há dois tipos de distribuição de probabilidade:
1. Distribuições Contínuas: Quando a variável que está sendo medida
é expressa em uma escala contínua, como no caso de uma
característica dimensional.
2. Distribuições Discretas: Quando a variável que está sendo medida
só pode assumir certos valores, como por exemplo os valores inteiros:
0, 1, 2, etc.
8. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória
Distribuição de Probabilidades
8
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
No caso de distribuições discretas, a probabilidade de que a variável
X assuma um valor específico xo é dada por:
𝑃(𝑋 = 𝑥𝑜) = 𝑃(𝑥𝑜)
No caso de distribuições contínuas, as probabilidades são
especificadas em termos de intervalos, pois a probabilidade associada
a um número específico é zero.
𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = න
𝑎
𝑏
𝑓 𝑥 𝑑𝑥
9. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição de Bernoulli
9
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Consideremos uma única tentativa de um experimento aleatório.
Podemos ter sucesso ou fracasso nessa tentativa.
Seja 𝒑 a probabilidade de sucesso e 𝑞 a probabilidade de fracasso,
com 𝑝 + 𝑞 = 1.
Seja 𝑋 o número de sucessos em uma única tentativa do experimento.
𝑋 assume o valor 𝟎 que corresponde ao fracasso, com probabilidade
𝑞, ou o valor 1, que corresponde ao sucesso, com probabilidade 𝑝
Alguns exemplos:
• Lançar uma moeda e observar se ocorre cara ou coroa;
• Lançar um dado e observar se ocorre seis ou não;
• Verificar se um servidor de intranet está ativo ou não ativo.
11. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição Binomial
11
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Consideremos 𝑛 tentativas independentes de um mesmo
experimento aleatório. Cada tentativa admite apenas dois resultados:
fracasso com probabilidades 𝑞 e sucesso com probabilidade 𝑝.
As probabilidades de sucesso e fracasso são as mesmas para cada
tentativa.
Seja X número de sucessos em 𝑛 tentativas.
12. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição Binomial
12
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
A distribuição binomial deve satisfazer os seguintes critérios:
• A experiência é repetida 𝑛 vezes, onde cada tentativa é independente das
demais;
• Há apenas dois resultados possíveis em cada tentativa: um de interesse,
associado à variável X, chamado de sucesso e o seu complementar que é o
fracasso;
• A probabilidade de sucesso será denotada por 𝑝 e é a mesma em cada
tentativa. Logo, a probabilidade de fracasso será denotada por 𝑞 = 1 – 𝑝.
• As repetições são independentes, ou seja, o resultado de uma repetição
não é influenciado por outros resultados.
14. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição de Poisson
14
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
A distribuição de Poisson é adequada para descrever situações onde
existe uma probabilidade de ocorrência em um campo ou intervalo
contínuo, geralmente tempo ou área.
Por exemplo, o no de acidentes por mês, no de defeitos por metro
quadrado, no de clientes atendidos por hora.
Nota-se que a variável aleatória é discreta (número de ocorrência), no
entanto a unidade de medida é contínua (tempo, área).
Além disso, as falhas não são contáveis, pois não é possível contar o
número de acidentes que não ocorreram, nem tampouco o número de
defeitos que não ocorreram.
A probabilidade de o acontecimento ocorrer é a mesma para cada
intervalo;
O número de ocorrências em um intervalo é independente do número
de ocorrências em outro intervalo.
15. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição de Poisson
15
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplos:
• Chamadas telefónicas recebidas numa central telefónica num
certo intervalo de tempo;
• Chegadas de clientes a uma bilheteira durante um certo
período;
• Chegadas de sinistrados a um banco de um hospital durante
um certo período.
•A distribuição de Poisson possui um parâmetro 𝝀 (lê-se:
“Lambda”) que chamamos de taxa de ocorrência, que
corresponde à frequência média ou esperada de ocorrências
em um determinado intervalo.
16. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Discreta
Distribuição de Poisson
16
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
•A probabilidade é calculada da seguinte forma:
𝑷 𝑿 = 𝒌 =
𝒆−𝝀. 𝝀𝒌
𝒌!
•Onde:
• 𝑘 𝜖 ℕ;
•𝜆 é a taxa de ocorrência (que é igual à média e a Variância da
distribuição).
Notação: 𝑋~𝒫(𝜆)
O número de defeitos de pintura segue uma distribuição de
Poisson com 𝜆 = 2. Qual a probabilidade que uma peça apresente
mais de 4 defeitos de pintura?
%
5
,
5
055
,
0
945
,
0
1
!
4
2
1
4
1
4
0
4
2
=
=
−
=
−
=
−
=
−
x
e
X
P
21. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
21
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Uma variável aleatória contínua 𝑋 tem distribuição normal de
probabilidade se a sua f. d. p. é dada por:
• Propriedades da
Distribuição
Normal 1. A curva normal é um tipo de curva simétrica;
2. Formato de “sino”;
3. A área sob a curva é igual a 1;
4. Unimodal, sendo seu ponto de frequência
máxima situado no meio da distribuição;
5. Média, mediana e moda coincidem.
𝑓 𝑥 =
1
𝜎 2𝜋
e
−
1
2
𝑥−𝜇
𝜎
22. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
22
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
23. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
23
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
24. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
24
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
25. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
25
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
• O valor z (valor padronizado) é uma medida relativa. Mede o quanto x se afasta da média (),
em unidade de desvio padrão ().
𝑧 =
𝑥 − μ
σ
x
x
Z - número de desvios padrões a partir da média
x - valor de interesse
- média da distribuição normal de interesse
- desvio padrão da distribuição normal
Através de uma transformação de variáveis é possível
converter os valores de qualquer distribuição Normal em
valores da distribuição Normal padrão e assim obter suas
probabilidades - calcular o número de desvios padrões, a contar
da média a que está um valor da variável
26. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
26
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Teorema
• Sejam 𝑋1, 𝑋2, … 𝑋𝑛 v.a. normais independentes, tais que 𝑋1~𝑁(𝜇1, 𝜎1),
𝑋2~𝑁(𝜇2, 𝜎2), ..., 𝑋𝑛~𝑁(𝜇𝑛, 𝜎𝑛).
• A v.a. 𝑋 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 tem distribuição normal de parámetros (𝜇, 𝜎),
com:
• 𝜇 = 𝜇1 + 𝜇2 + ⋯ + 𝜇𝑛 e 𝜎 = 𝜎1
2 + 𝜎2
2 + ⋯ + 𝜎𝑛
2
Teorema Limite Central
Sejam 𝑋1, 𝑋2, … 𝑋𝑛 variáveis aleatórias independentes e identicamente
distribuídas, com valor médio 𝜇 e variância 𝜎2 (finita).
A v.a. Sn = σ𝑖=1
𝑛
𝑋𝑖 verifica quando n é “grande”:
𝑆𝑛−𝑛𝜇
𝜎 𝑛
~𝑁(0,1)
27. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
27
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplo 1: A resistência à tração do papel usado em sacolas de super-
mercado é uma característica de qualidade importante.
Sabe-se que essa resistência segue um modelo Normal com média 40 psi
e desvio padrão 2 psi.
Se a especificação estabelece que a resistência deve ser maior que 35 psi,
qual a probabilidade que uma sacola produzida com este material
satisfaça a especificação?
𝑃 𝑋 ≥ 35 = 1 − 𝑃 𝑋 ≤ 35 = 1 − 𝑃 𝑍 ≤
35 − 40
2
= 1 − 𝑃 𝑍 ≤ −2,5
= 1 − 1 − 𝑃 𝑍 ≤ 2,5 = 𝑃 𝑍 ≤ 2,5 = 0,9938 = 99,38%
28. INFERÊNCIA ESTATÍSTICA:
Variável Aleatória - Contínuas
Distribuição de Normal
28
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplo 2: O diâmetro do eixo principal de um disco rígido segue a
distribuição Normal com média 25,08 in e desvio padrão 0,05 in.
Se as especificações para esse eixo estiver entre 24,85 e 25,15,
determine o percentual de unidades produzidas em conformidades
com as especificações.
𝑃 24,85 ≤ 𝑋 ≤ 25,15 = 𝑃 𝑋 ≤ 25,15 − 𝑃 𝑋 ≤ 24,85 = 𝑃 𝑍 ≤
25,15 − 25,08
0,05
− 𝑃 𝑍 ≤
24,85 − 25,08
0,05
= 𝑃 𝑍 ≤ 1,40 − 𝑃 𝑍 ≤ −4,60 = 0,9192 − 1 − 𝑃 𝑍 ≤ 4,60 = 0,9192 − 1 + 0,999999 = 0,9192
= 91,92%
Exemplo 3: Suponha que 𝑋 → 𝑁 85; 81 . Encontre um valor limite 𝑥,
tal que 𝑃 𝑋 > 𝑥 = 0,05.
𝑃 𝑋 > 𝑥 = 1 − 𝑃 𝑋 ≤ 𝑥 = 1 − 𝑃 𝑍 ≤
𝑥 − 85
9
= 0,05 ⇔ 𝑃 𝑍 ≤
𝑥 − 85
9
= 1 − 0,05
⇔ 𝑃 𝑍 ≤
𝑥 − 85
9
= 0,95 ⇔ 1,645 =
𝑥 − 85
9
⟺ 𝑥 = 99,805
Tabela 𝑍 = 1,645
29. Wadiley Sousa do Nascimento
Pós-Graduado em Estatística, Matemática e Computação – Ramo
Estatística Computacional
Mobile: +239 980 10 45 / 906 02 00 | Email: wadmiguel547@yahoo.com
INFERÊNCIA ESTATÍSTICA
30. INFERÊNCIA ESTATÍSTICA Motivação
30
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Métodos Estatísticos
Estatística Descritiva Inferência Estatística
Estimação Teste de Hipóteses
31. INFERÊNCIA ESTATÍSTICA Motivação
31
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
POPULAÇÃO: todos os
possíveis consumidores
Amostragem
AMOSTRA: um subconjunto
dos consumidores
Inferência
A Lei do Retorno
32. INFERÊNCIA ESTATÍSTICA:
Amostragem
Definições
32
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
População: é um conjunto formado por indivíduos ou objetos que
apresentam, pelo menos, uma característica/variável comum e
observável. Usa-se 𝑵 para designar esse número/tamanho.
Amostra: É qualquer subconjunto da população com as mesmas
características. Usa-se 𝒏 para designar esse número/tamanho.
Amostragem: é o processo de selecção de uma amostra, que
possibilita o estudo das características da população.
Erro amostral: é o erro que ocorre justamente pelo uso da amostra.
Ele representa a diferença entre o resultado amostral e o verdadeiro
resultado da população. O erro amostral ocorre devido às variações
amostrais.
De acordo com Fonseca e Martins (2011) na Teoria da Amostragem
são consideradas: i) Tamanho da amostra; ii) Composição da amostra.
33. INFERÊNCIA ESTATÍSTICA:
Amostragem
Tamanho da Amostra
33
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Procedimento:
1. Analise o questionário, ou roteiro da entrevista e escolha uma
variável que julgue mais importante para o estudo. Se possível,
escolha mais do que uma;
2. Verifique o nível de mensuração da variável: se nominal,
ordinal ou quantitativa;
3. Considere o tamanho da população: infinita ou finita.
Se a variável escolhida for quantitativa e a população considerada
infinita, pode-se determinar o tamanho da amostra pela fórmula:
𝒏 =
𝒁𝜶/𝟐. 𝝈
𝑬
𝟐
34. INFERÊNCIA ESTATÍSTICA:
Amostragem
Tamanho da Amostra
34
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Se a variável escolhida for quantitativa e a população considerada
finita, pode-se determinar o tamanho da amostra pela fórmula:
𝒏 =
𝒁𝜶/𝟐
𝟐
𝝈𝟐 𝑵
𝑬𝟐 𝑵 − 𝟏 + 𝒁𝜶/𝟐
𝟐
𝝈𝟐
35. INFERÊNCIA ESTATÍSTICA:
Amostragem
Tamanho da Amostra
35
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Se a variável escolhida for nominal ou ordinal e a população
considerada infinita, pode-se determinar o tamanho da amostra pela
fórmula:
𝒏 =
𝒁𝜶/𝟐
𝟐
ෝ
𝒑 ෝ
𝒒
𝑬𝟐
37. INFERÊNCIA ESTATÍSTICA:
Amostragem
Tamanho da Amostra
37
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Se a variável escolhida for nominal ou ordinal e a população
considerada finita, pode-se determinar o tamanho da amostra pela
fórmula:
𝒏 =
𝒁𝜶/𝟐
𝟐
ෝ
𝒑 ෝ
𝒒 𝑵
𝑬𝟐 𝑵 − 𝟏 + 𝒁𝜶/𝟐
𝟐
ෝ
𝒑 ෝ
𝒒
38. INFERÊNCIA ESTATÍSTICA:
Amostragem
Composição da Amostra
38
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Fonseca e Martins (2011) apontam que existem dois métodos para
composição da amostra:
i. Métodos probabilísticos: são usados para garantir que a
selecção da amostra seja aleatória e representativa da
população, permitindo assim que as conclusões obtidas a partir
da análise da amostra possam ser generalizadas para a
população inteira.
ii. Métodos não probabilísticos: são técnicas que não utilizam a
aleatoriedade na seleção da amostra, dependendo em vez disso
de critérios específicos ou da escolha do pesquisador. Eles são
menos confiáveis do que os métodos probabilísticos, pois
podem levar a amostras enviesadas e não representativas da
população.
39. INFERÊNCIA ESTATÍSTICA:
Amostragem - Composição
Métodos Probabilísticos
39
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Amostragem aleatória simples: Cada elemento da população tem a
mesma probabilidade de ser escolhido para a amostra, garantindo
assim que a amostra seja representativa da população.
Amostragem por clusters: a população é dividida em grupos e
alguns desses grupos são selecionados aleatoriamente para compor a
amostra, incluindo todos os indivíduos dentro dos clusters
selecionados.
É frequentemente usado quando a população é grande e dispersa
geograficamente.
40. INFERÊNCIA ESTATÍSTICA:
Amostragem - Composição
Métodos Probabilísticos
40
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Amostragem sistemática: os elementos da população são
selecionados em um padrão sistemático, a partir de um ponto de
partida aleatório.
Exemplo: Se quisermos selecionar uma amostra sistemática de 100
estudantes em uma escola com uma população de 1000 alunos,
poderíamos selecionar aleatoriamente um número entre 1 e 10 para
determinar o ponto de partida, e depois selecionar a cada 10 alunos
subsequentes para compor a amostra.
Esse método é útil quando se tem uma lista ordenada dos
elementos da população e quando se deseja garantir uma amostra
representativa, mas não é tão aleatório quanto a amostragem aleatória
simples.
41. INFERÊNCIA ESTATÍSTICA:
Amostragem - Composição
Métodos Não Probabilísticos
41
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Amostragem acidental: os elementos são selecionados de forma
casual e sem critério específico.
Por exemplo, selecionar os primeiros clientes que chegam a uma loja
para avaliar a satisfação do cliente com o atendimento e o serviço
prestado.
Amostragem intencional: os elementos são escolhidos de forma
proposital, com base em algum critério específico.
Esse método pode ser útil quando se deseja incluir apenas indivíduos
que possuem certas características ou quando se deseja obter
informações mais profundas sobre uma subpopulação específica.
Um exemplo seria selecionar um grupo de pacientes com uma
condição médica específica para avaliar a eficácia de um novo
tratamento.
42. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Introdução
42
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
43. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Introdução
43
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
O campo da Inferência Estatística consiste naqueles métodos usados
para tomar decisões ou tirar conclusões a cerca de uma população.
Esses métodos utilizam a informação contida em uma amostra da
população para tirar conclusões.
População Histograma
Média Populacional
Desvio Padrão
Populacional
Amostra
Média Amostral
Desvio Padrão
Amostral
Figura 1: Relação entre uma população e uma amostra
44. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Definições
44
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Parâmetro: é a medida usada para descrever uma característica
numérica populacional.
A média (𝝁),a variância (𝝈𝟐) e o coeficiente de correlação (𝝆) são
alguns exemplos de parâmetros populacionais.
Estimação: é o procedimento usado para obter informações sobre os
parâmetros desconhecidos de uma população com base nos dados da
amostra.
Estimador: também denominado estatística de um parâmetro
populacional: é uma característica numérica determinada na
amostra, uma função de seus elementos.
A média amostral (ഥ
𝒙),a variância amostral (𝒔𝟐
) e o coeficiente de
correlação amostral (𝒓)são alguns exemplos de estimadores.
Estimativa: é o valor numérico determinado pelo estimador.
46. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Distribuição Amostral
46
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Proposição 1: A média das médias amostrais, ou 𝐸( ҧ
𝑥), é igual à
média 𝜇 populacional.
𝐸 ҧ
𝑥 = 𝐸
1
𝑛
𝑖=1
𝑛
𝑥𝑖 =
1
𝑛
𝐸
𝑖=1
𝑛
𝑥𝑖 =
1
𝑛
𝑖=1
𝑛
𝐸 𝑥𝑖 =
1
𝑛
𝑖=1
𝑛
𝜇 =
1
𝑛
𝑛𝜇 = 𝜇
Proposição 2: A variância da média amostral é igual à variância
populacional dividida pelo tamanho da amostra.
VAR ҧ
𝑥 = VAR
1
𝑛
𝑖=1
𝑛
𝑥𝑖 =
1
𝑛2 VAR
𝑖=1
𝑛
𝑥𝑖 =
1
𝑛2
𝑖=1
𝑛
VAR 𝑥𝑖 =
1
𝑛2
𝑖=1
𝑛
𝜎2
=
1
𝑛2 𝑛𝜎2
=
𝜎2
𝑛
47. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Distribuição Amostral
47
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Proposição 3: A para grandes amostras, a proporção amostral se
distribui com média igual à proporção populacional.
𝐸 Ƹ
𝑝 = 𝐸
𝑥
𝑛
=
1
𝑛
𝐸 𝑥 =
1
𝑛
𝑛𝑝 = 𝑝 = 𝜇 ො
𝑝
Proposição 4: A variância da proporção amostral é a variância da
população dividida pelo número de ele1nentos da amostra.
VAR Ƹ
𝑝 = VAR
𝑋
𝑛
=
1
𝑛2
VAR 𝑋 =
1
𝑛2
𝑛𝑝𝑞 =
𝑝𝑞
𝑛
48. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Pontual
Tipos de Estimação
48
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Existem dois tipos fundamentais de estimação de um parâmetro
populacional: por ponto e por intervalo.
Estimação pontual
Quando utilizamos dados amostrais calcula-se um valor da estimativa
do parâmetro populacional e com isso tem-se uma estimativa por
ponto do parâmetro analisado.
Estimativa pontual é a estimativa de um único valor para um
parâmetro populacional.
Assim, a estatística amostral 𝑥, média da amostra, pode ser usada
como um estimador do parâmetro 𝜇, média da população.
Exemplo: Amostra aleatória de 200 alunos de uma universidade de
20.000 estudantes revelou uma média amostral de 5,2.
49. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Estimação de Intervalar
49
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Quando, a partir da amostra procura-se construir um intervalo de
variação, de modo que esse intervalo tem uma probabilidade
conhecida de conter o verdadeiro parâmetro populacional.
Na estimação por intervalos, em vez de se indicar um valor concreto
para certo parâmetro da população, e, constrói-se um intervalo que,
com certo grau de certeza, previamente estipulado, o contenha.
Ao estimar um parâmetro populacional através de uma amostra,
evidentemente estamos cometendo um erro. Portanto, a deficiência da
estimação pontual reside no fato de que, neste procedimento,
desconhecemos a medida do possível erro cometido na estimação.
Desta limitação surge a idéia da estimação por intervalo.
50. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Definições
50
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Grau de Confiança: também conhecido como nível de confiança ou
coeficiente de confiança: É a probabilidade 1 − 𝛼 do intervalo de
confiança conter o verdadeiro valor do parâmetro populacional.
Grau de Significância: também conhecido como nível de
significância ou alpha: É um limite que determina se o resultado de
um estudo pode ser considerado estatisticamente significativo depois
de se realizarem os teste estatísticos planeados.
51. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝝈𝑪𝒐𝒏𝒉𝒆𝒄𝒊𝒅𝒐
51
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
𝑰𝑪 𝝁, 𝟏 − 𝜶 = 𝒙 − 𝒛𝜶
𝟐
×
𝝈
𝒏
; 𝒙 + 𝒛𝜶
𝟐
×
𝝈
𝒏
Exercício 1: Seja 𝑋 uma população com distribuição normal de média
𝜇 e desvio padrão igual a 2. Uma amostra aleatória de dimensão 𝑛 =
25 foi extraída desta população e revelou uma média 𝑥 = 78.3.
Calcule o intervalo de confiança para μ a 99%.
Sabendo que 𝜎 = 2; 𝑛 = 25; 𝑥 = 78,3; 1 − 𝛼 = 0,99 ⟹ 𝛼 =
0,01 ⟹
𝛼
2
= 0,005 ∧ 𝑧𝛼
2
= 𝑧0,005 = 2,57
𝑰𝑪 = 𝒙 − 𝒛𝜶
𝟐
×
𝝈
𝒏
; 𝒙 + 𝒛𝜶
𝟐
×
𝝈
𝒏
= 𝟕𝟖, 𝟑 − 𝟐, 𝟓𝟕 ×
𝟐
𝟐𝟓
; 𝟕𝟖, 𝟑 + 𝟐, 𝟓𝟕 ×
𝟐
𝟐𝟓
𝑰𝑪 𝝁, 𝟗𝟗% = 𝟕𝟕, 𝟐𝟕𝟐; 𝟕𝟗, 𝟑𝟐𝟖
52. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝝈𝑪𝒐𝒏𝒉𝒆𝒄𝒊𝒅𝒐
52
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exercício 2: Considere uma v.a. normal de variância igual a 4.
Recolheu-se a seguinte amostra: 3, 7, 9, 10, 11, 12, 12, 14
Determine um intervalo de confiança a 90% para a média.
Sabendo que 𝜎2
= 4; 𝑛 = 8;
𝑥 =
3 + 7 + 9 + 10 + 11 + 12 + 12 + 14
8
= 9,75;
1 − 𝛼 = 0,90 ⟹ 𝛼 = 0,1 ⟹
𝛼
2
= 0,05 ∧ 𝑧𝛼
2
= 𝑧0,05 = 1,65
𝐼𝐶 = 𝑥 − 𝑧𝛼
2
×
𝜎
𝑛
; 𝑥 + 𝑧𝛼
2
×
𝜎
𝑛
= 9,75 − 1,65 ×
2
8
; 9,75 + 1,65 ×
2
8
𝑰𝑪 𝝁, 𝟗𝟎% = 𝟖, 𝟓𝟖𝟑; 𝟏𝟎, 𝟗𝟏𝟕
53. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝝈𝑫𝒆𝒔𝒄𝒐𝒏𝒉𝒆𝒄𝒊𝒅𝒐
53
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Caso 1: Tamanho da Amostra 𝒏 > 𝟑𝟎
𝑛 = 100 𝑍𝛼
2
= 1,96 ҧ
𝑥 =
σ𝑖=1
𝑛
𝑥𝑖
𝑛
= 28,35 𝑠𝑥 = 𝑣𝑎𝑟 𝑥 = 7,04
𝑰𝑪 𝝁, 𝟏 − 𝜶 : ഥ
𝒙 − 𝒁𝜶
𝟐
∗
𝒔𝒙
𝒏
≤ 𝝁 ≤ ഥ
𝒙 + 𝒁𝜶
𝟐
∗
𝒔𝒙
𝒏
𝐼𝐶 𝜇, 0,95 = 28,35 − 1,96 ∗
7,04
100
; 28,35 + 1,96 ∗
7,04
100
𝐼𝐶 𝜇, 0,95 = 26,97 ; 29,73
A média da idade dos utentes que frequentam a ASAG encontram-se, a
um nível de confiança de 95%, entre 26,97 e 29,73 anos de idade.
54. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝝈𝑫𝒆𝒔𝒄𝒐𝒏𝒉𝒆𝒄𝒊𝒅𝒐
54
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Caso 2: Tamanho da Amostra 𝒏 ≤ 𝟑𝟎 – t-Studant
𝑰𝑪 𝝁, 𝟏 − 𝜶 = 𝒙 − 𝒕𝜶
𝟐
;𝒏−𝟏
×
𝒔𝒙
𝒏
; 𝒙 + 𝒕𝜶
𝟐
;𝒏−𝟏
×
𝒔𝒙
𝒏
Numa fábrica de automóveis existe uma secção destinada à produção
de determinado tipo de peças, cujo comprimento deverá ser
aproximadamente de 2.5 cm. A secção de controlo de qualidade da
referida fábrica afirma que as peças apresentam comprimentos
superiores aos exigidos.
Com o objectivo de avaliar a veracidade da afirmação proferida pela
secção de controlo de qualidade, seleccionou-se ao acaso uma
amostra de 26 peças na produção de um dia, tendo sido obtidos os
resultados seguintes: σ𝑖=1
26
𝑥𝑖 = 78; σ𝑖=1
26
𝑥𝑖 − 𝑥 2
= 13.
55. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝝈𝑫𝒆𝒔𝒄𝒐𝒏𝒉𝒆𝒄𝒊𝒅𝒐
55
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Caso 2: Tamanho da Amostra 𝒏 ≤ 𝟑𝟎 – t-Studant
Admitindo a normalidade da população subjacente aos dados:
Construa um intervalo de confiança a 95% para o comprimento médio
das peças.
𝑥 =
1
𝑛
𝑖=1
𝑛
𝑥𝑖 =
1
26
𝑖=1
26
𝑥𝑖 =
78
26
= 3; 𝑠2 =
1
𝑛 − 1
𝑖=1
26
𝑥𝑖 − 𝑥 2 =
13
25
= 0,52
𝐼𝐶 = 𝑥 − 𝑡𝛼
2;𝑛−1
×
𝑠𝑥
𝑛
; 𝑥 + 𝑡𝛼
2;𝑛−1
×
𝑠𝑥
𝑛
𝑰𝑪 𝝁, 𝟏 − 𝜶 = 3 − 2,060 ×
0,72111
26
; 3 + 2,060 ×
0,72111
26
= 𝟐, 𝟕𝟎𝟗; 𝟑, 𝟐𝟗
56. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝑬𝒙𝒆𝒓𝒄í𝒄𝒊𝒐𝒔
56
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
1) Um fabricante produz resistores que segue uma distribuição normal
com desvio padrão de 8Ω. A resistência média de uma amostra
aleatória de 20 resistores foi medida como sendo de 80 Ω. Calcule o
intervalo de confiança, com um nível de confiança de 95,0%, para a
média da população de resistores produzidos.
57. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝑬𝒙𝒆𝒓𝒄í𝒄𝒊𝒐𝒔
57
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
2) Para avaliar a qualidade dos rolamentos produzidos, um engenheiro
recolheu uma amostra aleatória de 12 esferas da produção diária.
Usando um paquímetro ele obteve as seguintes medições para as
esferas. Calcule o intervalo de confiança para a média das esferas
produzidas com 95% de confiança.
8,2 ; 8,3 ; 8,4 ; 8,2 ; 8,2 ; 8,4 ; 8,3 ; 8,2 ; 8,4 ; 8,4 ; 8,2 ; 8,4
58. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Média - 𝑬𝒙𝒆𝒓𝒄í𝒄𝒊𝒐𝒔
58
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
3) Um fabricante produz resistores com desvio padrão 12Ω e
distribuição normal. A resistência média de uma amostra aleatória de
𝑛 = 25 foi 98,0Ω. Calcule o intervalo de confiança para a média da
população de resistores produzidos. Use o nível de confiança 95,0%.
59. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Proporção
59
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Agora, queremos construir um intervalo de confiança para a
proporção populacional 𝒑.
Lembrando que a estimativa pontual de 𝒑 é dada pela proporção de
sucessos numa amostra e é denotada por ො
𝑝 =
𝑁º 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑠𝑜𝑠
𝑛
.
Antes de construir um intervalo para a proporção, devemos verificar
se a distribuição de amostragem de ො
𝑝 pode ser aproximada pela
distribuição Normal. Isso ocorrerá se forem satisfeitas as condições:
𝑖 𝒏ෝ
𝒑 ≥ 𝟓; 𝑖𝑖 𝒏ෝ
𝒒 ≥ 𝟓
Se essas duas condições ocorrerem, podemos construir o intervalo de
confiança para a proporção, que utilizará, para a determinação do
valor crítico, a tabela da Normal:
61. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Proporção
61
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Quando não possuímos uma estimativa prévia do valor de ෝ
𝒑,
utilizamos uma abordagem conservativa para o cálculo do intervalo
de confiança, baseada no facto de que a expressão 𝑝(1– 𝑝) possui
valor máximo igual a ¼ quando 0 ≤ 𝑝 ≤ 1.
Populações infinitas:
𝑰𝑪 𝝆, 𝟏 − 𝜶 = ෝ
𝒑 − 𝒛𝒄
𝟏
𝟒𝒏
; ෝ
𝒑 + 𝒛𝒄
𝟏
𝟒𝒏
Populações finitas:
𝑰𝑪 𝝆, 𝟏 − 𝜶 = ෝ
𝒑 − 𝒛𝒄
𝟏
𝟒𝒏
𝑵 − 𝒏
𝑵 − 𝟏
; ෝ
𝒑 + 𝒛𝒄
𝟏
𝟒𝒏
𝑵 − 𝒏
𝑵 − 𝟏
62. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Proporção
62
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Pretende-se estimar a proporção de cura, através do uso de um certo
medicamento em doentes contaminados com certa doença. Uma
experiência consistiu em aplicar o medicamento a 200 pacientes,
escolhidos ao acaso, e observar que 160 deles foram curados. O que
podemos dizer da proporção da população em geral para um nível de
confiança de 95%?
Inicialmente, vamos calcular a proporção amostral: ො
𝑝 =
160
200
= 0,8
𝐼𝐶 = ො
𝑝 ± 𝑧𝑐
ො
𝑝 1 − ො
𝑝
𝑛
= 0,8 ± 1,96
0,8 1 − 0,8
200
= 0,8 ± 0,055
𝑰𝑪 𝝆, 𝟏 − 𝜶 = 𝟎, 𝟕𝟒𝟓; 𝟎, 𝟖𝟓𝟓
63. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Proporção
63
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Numa amostra aleatória de tamanho 𝑛 = 700 foram encontrados 68
elementos defeituosos. Encontrar um intervalo de confiança de nível
95% para a proporção 𝑝 de elementos defeituosos.
Temos que ො
𝑝 =
68
700
= 0,0971. Para 𝛼 = 0,05, temos pela tabela da
distribuição normal que 𝑍0,025 = 1,96. Então o intervalo de confiança
é dado por
𝐼𝐶 𝑝, 1 − 𝛼 = Ƹ
𝑝 − 𝑍𝛼
2
Ƹ
𝑝 1 − Ƹ
𝑝
𝑛
, Ƹ
𝑝 − 𝑍𝛼
2
Ƹ
𝑝 1 − Ƹ
𝑝
𝑛
𝐼𝐶 𝑝, 0,95 = 0,0971 − 1,96
0,0971 1 − 0,0971
700
, 0,0971 + 1,96
0,0971 1 − 0,0971
700
𝑰𝑪 𝝆, 𝟏 − 𝜶 = 𝟎, 𝟎𝟕𝟓𝟐; 𝟎, 𝟏𝟏𝟗 .
64. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Variância & Desvio Padrão
64
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Para construirmos intervalos de confiança para a variância e desvio
padrão, devemos lembrar que a estimativa pontual para 𝜎2 é 𝑠2 e que
a estimativa pontual para 𝜎 é 𝑠.
Além disso, devemos trabalhar com uma outra distribuição que não a
Normal nem a t-Student: usamos a Qui-quadrado.
Intervalo de confiança para a Variância:
𝑰𝑪 𝝈𝟐, 𝟏 − 𝜶 =
𝒏 − 𝟏 𝒔𝟐
𝝌𝒔𝒖𝒑
𝟐
;
𝒏 − 𝟏 𝒔𝟐
𝝌𝒊𝒏𝒇
𝟐
Intervalo de confiança para o Desvio-padrão:
𝑰𝑪 𝝈, 𝟏 − 𝜶 =
𝒏 − 𝟏 𝒔𝟐
𝝌𝒔𝒖𝒑
𝟐
;
𝒏 − 𝟏 𝒔𝟐
𝝌𝒊𝒏𝒇
𝟐
65. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Variância & Desvio Padrão
65
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Vamos encontrar os valores críticos 𝝌𝒊𝒏𝒇
𝟐
e 𝝌𝒔𝒖𝒑
𝟐 para um intervalo de
confiança de 90%, quando o tamanho da amostra for igual a 20.
Os graus de liberdade são: 𝒈. 𝒍. = 𝒏 – 𝟏 = 20 – 1 = 19.
Para um intervalo de 90%, teremos uma área de 5% à esquerda de
𝜒𝑖𝑛𝑓
2
e de 5% à direita de 𝜒𝑠𝑢𝑝
2 .
Mas, para utilizarmos a tabela,
devemos pensar em valores à direita
e, portanto, temos de 95% à
esquerda de 𝝌𝒔𝒖𝒑
𝟐
e 5% à esquerda
de 𝝌𝒊𝒏𝒇
𝟐
.
Ou seja, 𝝌𝒔𝒖𝒑
𝟐
= 𝝌𝟏−
𝜶
𝟐
𝟐
e 𝝌𝒊𝒏𝒇
𝟐
= 𝝌𝜶
𝟐
𝟐
66. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Variância & Desvio Padrão
66
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Um farmacêutico selecciona aleatoriamente 30 amostras de um
antialérgico e as pesa. O desvio padrão da amostra é 1,20 miligramas.
Supondo que os pesos são normalmente distribuídos, construa um
intervalo de confiança de 99% para a variância e o desvio padrão da
população.
Para 𝑔. 𝑙. = 𝑛 − 1 = 30 − 1 = 29, os valores obtidos na tabela são:
𝜒𝑖𝑛𝑓
2
= 13,121; 𝜒𝑠𝑢𝑝
2
= 52,336
O intervalo de confiança para a variância é:
𝐼𝐶 =
𝑛 − 1 𝑠2
𝜒𝑠𝑢𝑝
2 ;
𝑛 − 1 𝑠2
𝜒𝑖𝑛𝑓
2 =
30 − 1 1,20 2
52,336
;
30 − 1 1,20 2
13,121
𝑰𝑪 𝝈𝟐, 𝟏 − 𝜶 = 𝟎, 𝟖𝟎; 𝟑, 𝟏𝟖
67. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação - Intervalar
Variância & Desvio Padrão
67
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Um farmacêutico selecciona aleatoriamente 30 amostras de um
antialérgico e as pesa. O desvio padrão da amostra é 1,20 miligramas.
Supondo que os pesos são normalmente distribuídos, construa um
intervalo de confiança de 99% para a variância e o desvio padrão da
população.
Intervalo de confiança para o desvio−padrão:
𝑰𝑪 𝝈, 𝟏 − 𝜶 =
30 − 1 1,20 2
52,336
;
30 − 1 1,20 2
13,121
= 𝟎, 𝟖𝟗; 𝟏, 𝟕𝟖
Assim, podemos dizer: com 99% de confiança a variância
populacional está entre 0,80 e 3,18 miligramas2, enquanto que o
desvio padrão fica entre 0,89 e 1,78 miligramas.
68. Wadiley Sousa do Nascimento
Pós-Graduado em Estatística, Matemática e Computação – Ramo
Estatística Computacional
Mobile: +239 980 10 45 / 906 02 00 | Email: wadmiguel547@yahoo.com
OBRIGADO
69. INFERÊNCIA ESTATÍSTICA:
Estimação Intervalar
Introdução
69
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplo 1:
𝐻0: 𝑝 = 0,75 𝑣𝑠 𝐻𝐴: 𝑝 ≠ 0,75
𝑍𝑂𝑏𝑠 =
Ƹ
𝑝 − 𝑝
Ƹ
𝑝 1 − Ƹ
𝑝
𝑛
=
0,24 − 0,75
0,24 1 − 0,24
100
= −
0,51
0,043
= −11,86
Como −11,86 = 𝑍𝑂𝑏𝑠 < −𝑍𝛼
2
= −1,96, rejeitamos a hipótese nula
𝐻0 . Portanto, com 95% de confiança, verifica-se que 75% dos
utentes não frequentam ASAG apenas por estar perto das suas
comunidades, mas também devidos outros factores.
70. INFERÊNCIA ESTATÍSTICA:
Estimação Intervalar
Introdução
70
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplo 1:
𝐻0: 𝑝 = 0,50 𝑣𝑠 𝐻𝐴: 𝑝 < 0,50
𝑍𝑂𝑏𝑠 =
Ƹ
𝑝 − 𝑝
Ƹ
𝑝 1 − Ƹ
𝑝
𝑛
=
0,25 − 0,50
0,25 1 − 0,25
100
=
−0,25
0,0433
= −5,77
Como −2,33 = −𝑍𝛼
2
> 𝑍𝑂𝑏𝑠 = −5,77, rejeitamos a hipótese nula
𝐻0 . Portanto, existe fortes evidencias para rejeitar a hipótese
nula, ou seja, com 99% de confiança a percentagem dos utentes
que demoram mais de 40min não é de 50%.
71. INFERÊNCIA ESTATÍSTICA:
Estimação Intervalar
Introdução
71
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
Exemplo 1:
𝐻0: 𝑝 = 0,20 𝑣𝑠 𝐻𝐴: 𝑝 > 0,20
𝑍𝑂𝑏𝑠 =
Ƹ
𝑝 − 𝑝
Ƹ
𝑝 1 − Ƹ
𝑝
𝑛
=
0,18 − 0,20
0,18 1 − 0,18
100
=
−0,02
0,0384
= −0,52
Como −1,64 = 𝑍𝛼
2
> 𝑍𝑂𝑏𝑠 = −0,52, não rejeitamos a hipótese nula
𝐻0 . Portanto, não existe evidencias suficientes que justifica a
existência de mais de 20% de utentes insatisfeitos em relação ao tempo
que levam para serem atendidos na ASAG.
72. TESTE DE HIPÓTESES
Eu acredito que
30% da população
é careca.
J
Não está
nem perto.
Rejeito a
hipótese.
População
J
J
J
J
J
J
J
J
J
J
J J
Amostra
Aleatória
J 05
.
0
ˆ =
p
J J
Proporção
J
74. Estimação Teste de Hipóteses
A moeda é honesta ou é
desequilibrada?
Qual é a proporção de votos
que o candidato A terá na
próxima eleição?
Qual é a probabilidade de
“cara” no lançamento de uma
moeda?
Qual é a proporção de
motoristas habilitados de SP
que tiveram suas carteiras
apreendidas após a vigência
da nova lei de trânsito?
O candidato A vencerá a
eleição?
A proporção dos moto-
ristas habilitados de SP
que tiveram suas carteiras
apreendidas após a nova
lei é maior que 2% ou
não?
74
75. Introdução
Em estimação, o objetivo é “estimar” o valor
desconhecido de um parâmetro, por exemplo, a
proporção p de “indivíduos” em uma população
com determinada característica.
A estimativa é baseada no número x de “indivíduos”
com a característica numa amostra aleatória de
tamanho n.
Entretanto, se o objetivo for saber se o valor
observado x nessa amostra dá ou não suporte a
uma conjectura sobre o valor de p, trata-se de um
teste de hipóteses.
75
76. • Teste de Hipótese (TH) é uma ferramenta estatística que também é utilizado
para fazer inferência estatística ou seja, a partir de um teste de hipóteses,
realizado com dados amostrais, pode-se inferir sobre a população.
•A partir de dados amostrais pode-se generalizar conclusões sobre a
população.
Teste de Hipóteses
77. • O TH é uma regra de decisão para aceitar ou rejeitar uma hipótese
estatística com base nos elementos amostrais.
Teste de Hipóteses
78. Hipótese Estatística
Trata-se de uma suposição quanto ao valor de um parâmetro
populacional.
Designa-se por Ho, a hipótese nula, ou seja, a hipótese estatística a
ser testada, e por H1 a hipótese alternativa.
A hipótese nula sempre expressa uma igualdade, enquanto que a
hipótese alternativa é dada por uma desigualdade (≠ , < , >).
Principais Conceitos
80. Nunca se sabe se uma hipótese é realmente verdadeira, pois utiliza-se
amostragem, que sempre possui uma probabilidade de erro.
De fato, só se saberá que uma hipótese é realmente verdadeira se for realizado
um censo, mas então, não seria necessário testar uma hipótese, já que não
haveria erro, ou seja, não haveria aleatoriedade se o parâmetro fosse conhecido.
Tipos de Erros
81. Os testes de significância consideram somente erros do tipo α, pois
são os mais usados em pesquisas educacionais, sócio-econômicas.
O procedimento para realização dos testes de significância é
resumido em alguns passos:
Teste de Significância
82. 1. Enunciar as hipóteses H0 e H1
2. Com o auxílio das tabelas estatísticas, considerando α e a variável do teste,
encontrar a estatística tabelada e determinar as RR (região de rejeição) e RA
(região de aceitação) para H0;
3. Com os elementos amostrais, calcular o valor da estatística do teste, ou seja,
a estatística calculada;
4. Comparar a estatística calculada com a estatística tabelada e decidir sobre a
aceitação ou rejeição de H0.
5. Se a estatística calculada cair dentro da região de aceitação, então aceita-se
H0, caso contrário, rejeita-se H0;
6. Contextualizar e concluir.
Teste de Significância - Passos
83. Quando a variância populacional é conhecida, a estatística calculada para o teste
de hipótese para a média populacional é dada por:
Teste para a Média
n
X
ZC
0
−
=
84. Teste de Hipóteses – Para média
Exemplo 1:
O Departament of Agriculture dos Estados Unidos comunica que
o custo médio para se criar uma criança desde o nascimento até os
dois anos em uma área rural é US$ 8.390. Você acredita que esse
valor é incorreto. Desse modo, seleciona uma amostra ao acaso de
900 crianças com dois anos e determina que o custo médio é de
US$ 8.275 com desvio padrão de US$ 1540. Sendo alfa=0,05, há
evidência suficiente para concluir que o custo médio é diferente de
US$ 8390.
Solução:
n= 900 crianças
X = US$ 8275
Desvio padrão= US$ 1540
alfa= 0,05
Hipóteses:
H0:µ = 8390
H1:µ ≠ 8390
85. n
X
Z C
0
−
=
Conclusão:
Rejeita –se Ho, assim concluísse que há evidências suficiente para
concluir que o custo médio da criação de uma criança de
nascimento até os 2 anos de idade na área rural é significantemente
diferente de US$ 8390 a um nível de significância de 5%
86. Teste de Hipóteses – Para média
Exemplo 2:
Funcionários de uma grande clínica de estética alegam que seu
salário é menor que o do seu concorrente , que é US$ 45000. Uma
amostra aleatória de 30 funcionários da clinica gera um salário médio
de US$ 43.500 com desvio padrão de US$ 5200. Teste a alegação dos
funcionário com alfa=0,05,
Solução:
N= 30
X = US$43500
desvio padrão =US$ 5200
alfa=0,05
87. Solução:
Funcionário de uma grande clínica de estética alega que seu salário
médio é menor que o do concorrente, que é US$ 45000.
Uma amostra aleatória de 30 funcionários da clínica que gera um
salário médio de US$ 43.500, com desvio padrão de US$5.200. Teste
a alegação que o salário médio dos funcionários é menor que US$
45.000.
Hipóteses:
H0:µ = 45.000
H1:µ < 45.000
Estatística do teste
n
X
Z C
0
−
=
88. Quando a variância populacional é desconhecida, a estatística calculada para o
teste de hipótese para a média populacional é dada por:
Teste para a Média
n
s
X
tC
0
−
=
89. Exemplo: A fim de acelerar o tempo que um analgésico leva para penetrar na
corrente sanguínea, um químico analista acrescentou certo ingrediente à fórmula
original, que acusava um tempo médio de 43 minutos. Em 20 observações com
a nova fórmula obteve-se um tempo médio de 42 minutos e desvio padrão
amostral de 6 min
O que se pode concluir ao nível de 0,05, sobre a eficiência do novo ingrediente?
Teste para a Média
92. onde:
• representa a estatística t, da distribuição de probabilidade t de student,
correspondente à probabilidade do erro com graus de liberdade.
Teste para a Média
96. Estatística
Teste de hipóteses para uma média populacional:
Teste unilateral à direita
Teste unilateral à esquerda
Teste bilateral
Renata Souza
97. Teste de Hipótese
Definição
Uma hipótese estatística é uma afirmação acerca dos parâmetros de uma ou mais populações (testes
paramétricos) ou acerca da distribuição da população. É uma afirmação sobre uma população, e não
sobre amostra.
Normalmente são formuladas duas hipóteses:
H0: (hipótese nula) que é a hipótese que não se quer testar;
Ha: (hipótese alternativa) que será aceita se não for possível provar que H0 é verdadeira.
Exemplo
H0: mulheres vivem o mesmo ou mais que os homens;
Ha: mulheres vivem menos que os homens.
98. Teste de Hipótese
Exemplo
Em um estudo para avaliar um novo motor instalado em automóveis, um grupo de
pesquisa está buscando evidências para concluir que o novo motor aumenta a média de
quilômetros por litro.
H0: µ ≤ 15 (hipótese nula)
Ha: µ > 15 (hipótese alternativa)
Neste exemplo a hipótese alternativa é a hipótese de pesquisa. Em tal caso as hipóteses
nula e alternativa devem ser formuladas de modo que a rejeição de H0 suporte a conclusão
e ação que estão sendo procuradas.
99. Teste de Hipótese
As hipóteses podem ter várias formas:
Onde µ0 é o valor numérico específico que está sendo considerado
nas hipóteses nula e alternativa.
H0: µ ≤ µ0
Ha: µ > µ0
H0: µ ≥ µ0
Ha: µ < µ0
H0: µ = µ0
Ha: µ ≠ µ0
Teste
1. Bilateral
2. Unilateral
2.1. À direita
2.2. À esquerda
100. Erros de decisão
Erro tipo I: rejeitar H0 quando está verdadeira;
Erro tipo II: não rejeitar H0 quando está falsa;
A probabilidade de cometer erro tipo I é denominada “nível de
significância” e é denotada por α.
A probabilidade de cometer erro tipo II é denotada por β.
Decisão H0 é verdadeira H0 é falsa
Não rejeitar H0 Decisão Correta Erro tipo II
Rejeitar H0 Erro tipo I Decisão Correta
101. Erros de decisão
• Na prática é especificado a probabilidade máxima permissível de se
cometer o erro tipo I, chamado nível de significância.
• Escolhas comuns para o nível de significância são:
0,05 (5%) e 0,01 (1%)
• Assim, se a probabilidade de se cometer um erro Tipo I é controlada por
selecionar um pequeno valor para o nível de significância, temos um alto
grau de confiança que a conclusão para rejeitar H0 está correta.
• Em tais casos temos o suporte estatístico para concluir que H0 é falso e Ha é
verdadeiro. Qualquer hipótese sugerida para Ha é aceita.
102. Erros de decisão
⚫ Como na prática não se atenta para a probabilidade de
se cometer o erro tipo II, se decidimos aceitar H0 não
podemos determinar quão confiantes podemos estar com
aquela decisão.
⚫ Assim recomenda-se que seja usado a declaração “não
rejeitar H0” em vez de aceitar H0.
103. Como realizar Testes de Hipótese
Passo 1
Interprete a situação de modo a obter a média μ;
Passo 2
Construa as hipóteses, dizendo se é bilateral ou unilateral, considerando a
média em questão;
Passo 3
Obtenha o grau de significância;
Passo 4
Verifique qual o tipo de distribuição mais apropriado (normal ou t-
Student);
105. Como realizar Testes de Hipótese
Passo 6
Interprete a estatística de teste para verificar se a hipótese nula será ou não
rejeitada. Se z ou t corresponder a valores da região crítica, rejeite H0, caso
contrário, não rejeite H0.
Região crítica
Diferentes níveis de significância podem gerar diferentes conclusões. Com um
nível de 5%, H0 poderá ser rejeitado, mas com 1% poderá ser aceito.
106. Como realizar Testes de Hipótese
⚫ Para amostras em que σ for desconhecido, usamos s ao
invés de σ e consideramos o grau de liberdade como n-1;
⚫ Para σ desconhecido, a distribuição é uma t_Student.
Para amostras de tamanho maiores que 30, a distribuição
normal é uma boa aproximação para a distribuição t.
107. 1. Testes de Hipótese Bilateral
α/2 α/2
Rejeitar H0 Rejeitar H0
Não rejeitar H0
108. 1. Testes de Hipótese Bilateral
⚫
Conclusão: rejeitamos H0, isto é, a
resistência não é mais de 400 libras.
zc = -1,96 zc = 1,96
109. 2.1 Testes de Hipótese Unilateral a direita
⚫
Não rejeitar H0 Rejeitar H0
110. 2.1 Testes de Hipótese Unilateral a direita
t = 1,5 tc = 1,83
Conclusão: Não rejeitamos H0, o que
implica que o número de infrações não
teve um aumento significativo.
111. 2.2 Testes de Hipótese Unilateral a esquerda
⚫
Rejeitar H0 Não rejeitar H0
112. 2.2 Testes de Hipótese Unilateral a esquerda
Conclusão: Rejeitamos H0. O salário
é menor que R$ 48.0000
considerando o nível de significância
de 5%. O professor está correto.
zc = 1,65
Uma pesquisa feita em universidades mostrou que professores de Estatística
ganham em média R$ 48. 000,00 com descvio padrão de R$ 7000,00. Um deles
constestou a pesquisa e disse que a real média seria R$ 45678,00 com base em
uma amostra de 81 professores. O que o professor disse é válido (nível de
significância de 5%)?
H0
: m ³ 48.000
Ha
: m < 48.000
z=
x -m
s
n
=
45678- 48000
7000 9
=
-2322
777,77
= 2,98
113. Exercício
1) A vida média de uma amostra de 100 lâmpadas
fluorescentes produzidas por uma companhia foi
calculada em 1570 horas, com desvio padrão de 120
horas. Se µ é a vida média de todas as lâmpadas
produzidas pela companhia, teste a hipótese µ = 1600
horas, em face da hipótese alternativa µ ≠ 1600 horas,
adotando o nível de significância 0,05 e 0,01 .
114. Exercício
2) Em um estudo para avaliar um novo motor instalado em
automóveis, um grupo de pesquisa está buscando evidências
para concluir que o novo motor aumenta a média de
quilômetros por litro. Numa amostra de 25 carros com o
motor novo, a média de km/l foi de 12 e desvio padrão de
0,5. O que se pode concluir a respeito desse novo motor,
sabendo que o fabricante garante uma média de 13km/l e
nível de significância de 5%?
115. Wadiley Sousa do Nascimento
Pós-Graduado em Estatística, Matemática e Computação – Ramo
Estatística Computacional
Mobile: +239 980 10 45 / 906 02 00 | Email: wadmiguel547@yahoo.com
MÉTODOS
ECONOMÉTRICOS
116. INFERÊNCIA ESTATÍSTICA:
Teoria da Estimação
Motivação
11
6
Wadiley Nascimento (Pós-Graduação em Estatística) Telm.: (+239) 980 1045 / 906 0200 E-mail: wadmiguel547@yahoo.com
O objectivo fundamental da Estatística é extrair informações
confiáveis a partir dos dados recolhidos para a tomada de decisão.
Informação
Decisão
Dados
Estatística
Conhecimento