Estatística intervalo de confiança (aula 4)

216 visualizações

Publicada em

Estatística intervalo de confiança (aula 4)

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
216
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4
Ações
Compartilhamentos
0
Downloads
2
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Estatística intervalo de confiança (aula 4)

  1. 1. 0 Associação Diocesana de Ensino e Cultura de Caruaru FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69 CURSO: ADMINISTRAÇÃO Prof. Wellington Marinho Falcão AULA 4
  2. 2. 1 INTERVALO DE CONFIANÇA Na estatística inferencial, buscamos inferir (tirar conclusões) a respeito do todo (conjunto universo) a partir de uma amostra deste todo. O erro padrão da distribuição das médias amostrais é o seu desvio padrão Quando desconhecemos a variância da população σ(X), a substituímos na fórmula acima pelo desvio padrão da amostra coletada S(X), desde que a amostra seja suficientemente grande (n ≥ 30). σ( X ) = ௌ(௑) √௡ Se n for pequeno (n < 30) usaremos a distribuição t de Student, tratada posteriormente. Vimos do Teorema do Limite Central que podemos construir uma distribuição com médias das amostras de n elementos do conjunto universo. No exemplo da aula anterior, para um conjunto universo com N = 9 elementos, havia 81 possíveis amostras de n = 2 elementos. Para cada uma destas 81 amostras calculamos suas respectivas médias. Desvio padrão do conjunto universo Raiz quadrada do tamanho n da amostra Desvio padrão da distribuição das médias amostrais n X X )( )( σ σ =
  3. 3. 2 Perceba que as 81 médias calculadas variam de 1 a 5, onde a média X destas 81 médias (média da distribuição das médias amostrais) é igual a µ (média do conjunto universo). X é um estimador de µ que é um parâmetro da população. µ é uma constante (µ = 3) e X é uma variável que pode assumir os seguintes valores ( X = 1,0 ; 1,5 ; 2,0 ; 2,5 ; 3,0 ; 3,5 ; 4,0 ; 4,5 ; 5,0) cuja média destes valores de 1 a 5 é X = 3. O valor que o estimador X assume é uma estimativa do parâmetro µ, e embora ele varie (variância), em média X = µ, o que indica ser X um bom estimador da média. Não confunda variância de um estimador com estimador de uma variância. σ²( X ) é a variância do estimador X , cujo desvio padrão σ( X ) é dado pela divisão do desvio padrão do conjunto universo pela raiz quadrada do número n de elementos da amostra*: σ(X ) = ఙ(௑) √௡ Não se conhecendo o desvio padrão da população (o que é a regra), substitui-se na fórmula acima pelo desvio padrão da amostra. O estimador da variância é quando, através da variância da amostra, inferimos ser esta a variância da população e para este caso na fórmula tradicional substituímos n por n-1. Temos para IC (Intervalo de Confiança) X ± 1,96( ௌ(௑) √௡ ) →Intervalo com uma certeza de 95%; X ± 2,58( ௌ(௑) √௡ ) →Intervalo com uma certeza de 99%.
  4. 4. 3 Vejamos o exemplo: O salário médio ( X ) dos funcionários de uma determinada empresa para uma amostra n = 400 coletada ao acaso foi X = R$ 4.500,00, cujo desvio padrão foi S(X) = R$ 800,00. Calcule o intervalo de confiança com um nível um nível de confiança de 95%, ou seja, com uma significância α = 5%. IC = 4.500 ± 1,96 x ଼଴଴ √ସ଴଴ = 4.500 ± 1,96 x ଼଴଴ ଶ଴ = 4.500 ± 1,96 x 40 IC = 4.500 ± 78,4 4.500 - 78,4 = 4.421,60 4.500 + 78,4 = 4.578,40 Portanto, o intervalo de confiança desejado (IC) será: IC ⇒ 4.421,60 < X < 4.578,40. Isto significa que há 95% de probabilidade de a média populacional (a média dos salários de todos os funcionários e não só os da amostra) estar contida no IC, ou seja, se eu tirar 100 amostras de 400 elementos, em 95 delas a média estaria entre 4.421,60 e 4.578,40. CALCULE AGORA O IC PARA UM NÍVEL DE CONFIANÇA DE 99% A relação σ( X ) = ఙ(௑) √௡ pressupõe população infinita. Para entendermos melhor o que vem a ser população infinita, precisamos das seguintes convenções: n = número de elementos da amostra; N = número de elementos da população. Quando n é muito menor que N ou, embora não seja muito menor, haja reposição, consideramos a população finita. Convencionou-se população infinita quando n < 0,05 N
  5. 5. 4 Para população finita a fórmula anterior fica da seguinte maneira: onde Zc = 1,96 para 95% de confiança Zc = 2,58 para 99% de confiança Exemplo: Numa amostra de 100 alunos da FAFICA que tem 1.500 alunos tem-se para esta amostra uma altura média de 1,70m e desvio padrão de 0,15m. Ache o IC para α=5%? Já vimos que σ( X ) é a variância do estimador X . Mas o que é estimador da variância? Da mesma forma como através da média da amostra estima-se a média da população, uma vez que, em rera, a média da população é desconhecida, o mesmo se faz com a variância da amostra como estimador da variância da população que também desconhecemos. Temos o seguinte: σ²= variância da população; S² = variância amostral. 1− − ±= N nN n S ZXIC c 11500 1001500 100 15,0 96,17,1 − − ±= xIC N xxi 2 2 )( −Σ =σ 1 )( 2 2 − −Σ = n xx S i
  6. 6. 5 σ² é a variância para a torta inteira e S² é a variância para uma fatia da torta d qual inferimos a variância do todo (torta). Quando, porém, a amostra for muito grande (n > 30) é irrelevante se dividirmos por n ou por n-1. Exemplo: Em uma empresa onde trabalham muitas pessoas, coletou-se uma amostra dos salários de 5, que são: R$ 1.000,00; R$ 2.000,00; R$ 3.000,00; R$ 4.000,00; R$ 5.000,00. Pede-se a média e variância amostral e variância da média amostral. σ²( X ) = ௌ² ௡ = ଶ.ହ଴଴.଴଴଴ ହ 00,000.3 5 000.5000.4000.3000.2000.1 = ++++ =X 000.500.2 4 )000.3000.5()000.3000.4()000.3000.3()000.3000.2()000.3000.1( 22222 2 = −+−+−+−+− =S
  7. 7. 6 PESQUISA ELEITORAL (INTERVALO DE CONFIANÇA) Suponhamos que saia na TV a seguinte pesquisa eleitoral para governador de Pernambuco: Eduardo Campos 38% Jarbas Vasconcelos 35% Porém o apresentador do telejornal acrescenta que há uma margem de erro de 2%. Isto significa que o percentual de Eduardo Campos oscila entre 36% e 40% e o de Jarbas Vasconcelos entre 33% e 37%, ou seja, há uma probabilidade razoável (por exemplo) de Jarbas ter 37% das intenções de voto e Eduardo 36%. Embora a pesquisa dê uma ligeira vantagem para Eduardo Campos, o instituto de pesquisa entende que a diferença para o seu oponente está dentro da margem de erro e, portanto, considera que há um empate técnico. DIMENSIONAMENTO DA AMOSTRA Suponha que Fulano, numa pesquisa realizada com 1.000 eleitores de Caruaru, tenha 55% de intenção de voto. O que se pode afirmar para este candidato com um nível de confiança de 95%? IC = Média ± 1,96 Desvios Padrão p (sucesso) seria votar no candidato, logo p=0,55. Portanto, q=0,45 já que p + q = 1 Para este tipo de distribuição temos: Média = p e Desvio Padrão = ට ௣௤ ௡ IC = 0,55 ± 1,96 ඥ(0,55)(0,45) 1000⁄ = 0,55 ± 0,03 Nível de confiança = 95%
  8. 8. 7 IC = 0,52 a 0,58 Há 95% de chances de o percentual de intenção de voto estar entre 52% e 58%. Na fórmula do IC o termo após o sinal ± é o seu erro (para mais e para menos em relação à média) Para dimensionarmos o tamanho da amostra n refazemos a expressão acima. Para o exemplo anterior p era conhecido (p=0,55), mas quando se desconhece p, faz-se um estudo-piloto para estimá-lo ou se calcula o tamanho da amostra para p=q=0,5 o que nos dará a maior amostra possível. n pq Zc=ξ para o nível de confiança de 95% temos Zc = 1,96 ² 2 ξ pqz n c = ²03,0 45,055,0²96,1 xx n =
  9. 9. BIBLIOGRAFIA Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva

×