Aula parte6 distribuicao_amostral

2.208 visualizações

Publicada em

0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
2.208
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
116
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Aula parte6 distribuicao_amostral

  1. 1. DISTRIBUIÇÃO AMOSTRAL
  2. 2. <ul><li>Com a média de uma amostra extraída de uma população será estimada a média dessa população. </li></ul><ul><li>Entretanto, de uma mesma população pode-se tomar muitas amostras diferentes do mesmo tamanho. </li></ul><ul><li>A principal preocupação numa inferência estatística é obter conclusões sobre a população. </li></ul><ul><li>Por exemplo: </li></ul>
  3. 3. <ul><li>Na determinação da vida média de uma lâmpada fluorescente especificada pelo fabricante fazem parte: </li></ul><ul><ul><li>Do controle de qualidade da empresa. </li></ul></ul><ul><ul><ul><li>Se a vida média das lâmpadas fluorescentes de uma amostra retirada de um lote de produção não atender à especificação estabelecida, então o lote deverá ser rejeitado. </li></ul></ul></ul><ul><ul><li>Do órgão de defesa do consumidor. </li></ul></ul><ul><ul><ul><li>Se a vida média das lâmpadas fluorescentes da amostra retirada de diversos pontos de venda atender à especificação do fabricante, então a reclamação dos consumidores não deverá ser aceita. </li></ul></ul></ul>
  4. 4. <ul><li>Avaliação de um novo produto. </li></ul><ul><ul><li>Antes de seu lançamento, em muitos casos, o novo produto é distribuído a um grupo de consumidores potenciais que respondem um questionário. </li></ul></ul><ul><ul><li>Se os resultados dos questionários mostrarem que o novo produto foi bem aceito, então o grupo de marketing terá suporte para defender o lançamento desse novo produto. </li></ul></ul>
  5. 5. <ul><li>Previsão do tempo médio de espera dos clientes no caixa de um banco. </li></ul><ul><ul><li>Se o tempo médio de espera de uma amostra de clientes for maior que o tempo médio afirmado pelo gerente da agência, então será bastante provável que as reclamações dos clientes tenham fundamento. </li></ul></ul>
  6. 6. <ul><li>Um denominador comum nos três casos apresentados é que as decisões que deverão ser tomadas serão apoiadas em informações incompletas. </li></ul><ul><li>No dia-a-dia, estamos acostumados a tomar decisões com informações incompletas baseadas na própria experiência ou em amostras. </li></ul><ul><ul><li>Por exemplo, o procedimento de degustar uma porção de fruta ou queijo antes de comprar. </li></ul></ul><ul><ul><ul><li>Ao aprovar a amostra degustada e comprar uma quantidade da fruta ou do queijo, estamos aceitando que o resto do lote de fruta ou peça de queijo tem a mesma característica que apreciamos na amostra. </li></ul></ul></ul><ul><ul><ul><li>A experiência mostra que é mais fácil acertar no caso do queijo que no da fruta, salvo que o pedaço de queijo comprado seja de outra peça não amostrada. </li></ul></ul></ul><ul><li>Seja qual for a decisão tomada, estará sendo aplicada a distribuição das médias das amostras . </li></ul>
  7. 7. <ul><li>Parâmetro é uma medida numérica que descreve uma população. </li></ul><ul><li>Estatística é uma medida numérica que descreve uma amostra. </li></ul>
  8. 8. Exemplo <ul><li>A coordenadora do ensino de primeiro grau tem interesse em conhecer a estatura média dos alunos da primeira série da rede escolar. </li></ul><ul><li>Se a variável estatura estivesse registrada no cadastro dos alunos seria fácil calcular a média das estaturas dos alunos da primeira série, entretanto, essa informação não está disponível. </li></ul><ul><li>Uma tentativa de alcançar o objetivo é estimar a média de todos os alunos utilizando a média de uma amostra dos alunos da primeira série, tendo presente que essa amostra será representativa da população; isto é, a amostra possuirá características similares às que seriam observadas na população se estivesse disponível. </li></ul>
  9. 9. <ul><li>Para testar a idéia, a coordenadora preparou dez funcionários com a tarefa individual de selecionar aleatoriamente trinta alunos da primeira série da escola designada, medir a estatura dos trinta alunos e finalmente calcular e registrar a média dessa amostra. </li></ul><ul><li>Terminada a tarefa, a coordenadora receberá as dez médias amostrais </li></ul><ul><li>que, em geral, serão diferentes entre si devido à variabilidade amostral. Além disso, essas dez médias deverão ser diferentes da média da população. </li></ul>
  10. 10. <ul><li>Analisemos o resultado da tarefa dos dez funcionários: </li></ul><ul><li>O parâmetro média da população é um valor único e desconhecido. </li></ul><ul><li>A estatística média da amostra é um valor conhecido, porém pode variar de amostra para amostra. </li></ul><ul><li>Se os dez funcionários realizarem novas amostragens aleatórias do mesmo tamanho, as médias das novas amostras não deverão ser iguais às dez primeiras. </li></ul><ul><li>Apesar de a média da população não ter mudado, a média da amostra dependerá de cada amostra. </li></ul>
  11. 11. <ul><li>Com as médias das amostras, é possível construir a distribuição de freqüências das médias das amostras, denominada distribuição amostral, cuja média denomina-se média amostral e seu desvio padrão, erro padrão . </li></ul><ul><li>Embora os parâmetros média e desvio padrão da população não sejam conhecidos, para ajudar na compreensão da distribuição amostra l, inicialmente, esses parâmetros serão considerados como conhecidos. </li></ul>
  12. 17. O desvio padrão é conhecido como erro amostral .
  13. 19. <ul><li>O erro padrão da distribuição das médias amostrais diminui quando aumenta o tamanho da amostra n . </li></ul><ul><li>Isso significa que à medida que n aumenta e mais informações são utilizadas, a média da amostra se aproxima da média da população, como pode-se ver na expressão do erro padrão. </li></ul>
  14. 20. FORMA DA DISTRIBUIÇÃO AMOSTRAL <ul><li>Ao estudar as medidas estatísticas descritivas, foi observado que a forma da distribuição da variável é importante. </li></ul><ul><li>A distribuição amostral do Exemplo 10.1 é simétrica, embora a distribuição da população seja uniforme. </li></ul><ul><li>De forma geral, a forma da distribuição amostral depende da forma da distribuição da população. </li></ul><ul><li>Se a distribuição da população for normal N (  ,  ), a distribuição da média amostral também será normal, </li></ul><ul><li>seja qual for o tamanho n da </li></ul><ul><li>amostra. </li></ul>
  15. 21. <ul><li>Se a distribuição da população não for normal, à medida que o tamanho da amostra aumentar, a distribuição da média amostral se aproximará da distribuição normal. </li></ul><ul><li>De acordo com o teorema central do limite, a distribuição das médias de amostras de tamanho suficientemente grande poderá ser considerada como normal, </li></ul><ul><li>seja qual for a forma da distribuição </li></ul><ul><li>da população. </li></ul>
  16. 23. <ul><li>O teorema central do limite é muito importante, pois permite utilizar a distribuição normal para realizar inferências da média amostral, seja qual for a forma da distribuição da população. </li></ul><ul><li>Como aplicação prática, podemos dizer que a soma de um número de efeitos aleatórios, sem dominância de nenhum deles sobre o resultado total, produz uma variável aleatória com distribuição normal. Por exemplo: </li></ul><ul><li>Um cabo de aço trançado utilizado num elevador é formado por muitos fios de aço que adequadamente entrelaçados conferem uma forte resistência ao cabo, cuja capacidade é igual à soma das capacidades individuais dos fios de aço. </li></ul><ul><ul><li>Se o número de fios que formam o cabo for adequadamente grande, mesmo que a distribuição da capacidade dos fios de aço não seja normal, a distribuição da capacidade do cabo será normal. </li></ul></ul>
  17. 24. SIMULADOR <ul><li>O teorema central do limite pode ser verificado na prática realizando simulações repetidas de um experimento, como o lançamento de um dado que tem seis resultados possíveis {1, 2, 3, 4, 5, 6} com a mesma probabilidade 1/6 de ocorrer. </li></ul><ul><li>O histograma desse experimento mostra que sua distribuição de freqüências é discreta e uniforme com média igual a 3,50, variância 2,917 e desvio padrão 1,71. </li></ul>
  18. 25. <ul><li>O simulador permite realizar simulações para três tamanhos de amostra, n =15, 30 e 50 resultados aleatórios de um dado obtidos com a fórmula =ARRED(ALEATÓRIO()*(6-1)+1;0) registrada em cada célula da tabela de trinta lançamentos de um dado repetido cinco mil vezes. </li></ul><ul><li>A última coluna da tabela registra a média de cada lançamento de n =15, 30 e 50 dados. Cada vez que o botão Simulação é pressionado, o modelo atualiza os seguintes resultados para o tamanho n previamente definido: </li></ul><ul><ul><li>Calcula a média e o desvio padrão das médias amostrais, intervalo de células C10:F11. </li></ul></ul><ul><ul><li>Calcula a tabela de freqüências absolutas e apresenta o histograma de 200, 500, 1.000 e 5.000 lançamentos de n =15, 30 e 50 dados, como mostra o slide seguinte no caso de n =30. </li></ul></ul>
  19. 27. <ul><li>Os quatro histogramas mostram que, ao aumentar o número de simulações, acentua-se a concentração das médias amostrais ao redor da média da população. </li></ul><ul><li>Também se for aumentado o tamanho da amostra para n =50 essa concentração ao redor da média começa a perceber-se com menos simulações, confirmando que à medida que n aumenta têm-se mais informações, como mostra o slide seguinte. </li></ul>
  20. 29. <ul><li>Repetindo o que já foi apresentado: </li></ul><ul><li>A soma de um número de efeitos aleatórios, sem dominância de nenhum deles sobre o resultado total, produz uma variável aleatória com distribuição normal. </li></ul>
  21. 30. FATOR DE CORREÇÃO FINITA <ul><li>As premissas incluídas nas expressões apresentadas estabelecem que a população é suficientemente grande, os valores da amostra são independentes e a amostragem é realizada com reposição. </li></ul><ul><li>Se numa população pequena for realizada uma amostragem sem reposição de tamanho maior que 5% do tamanho da população, no cálculo do erro padrão deverá ser incluído o fator de correção finita </li></ul>
  22. 32. <ul><li>A tabela seguinte mostra valores do coeficiente de correção finita em função do tamanho n da amostra numa população de tamanho N =1.000. </li></ul>
  23. 33. UTILIZAÇÃO <ul><li>Quanto maior for o tamanho n da amostra, mais a média amostral se aproximará da média da população, pois à medida que n aumenta, o erro padrão diminui e no limite, quando n tender à própria população, o erro padrão tenderá a zero. </li></ul><ul><li>As propriedades da distribuição amostral asseguram que a média de uma amostra é uma boa estatística para inferir sobre a média da população  da qual foi extraída. </li></ul><ul><li>Ao mesmo tempo, o teorema central do limite estabelece que se o tamanho da amostra n for suficientemente grande a distribuição da média amostral será normal, qualquer que seja a forma da distribuição da população. </li></ul><ul><li>Portanto, o teorema central do limite permite aplicar a distribuição normal para obter respostas da média de uma amostra de tamanho suficientemente grande retirada de uma população qualquer. </li></ul>
  24. 38. <ul><li>Qual o significado da probabilidade 6,68%? </li></ul><ul><li>Tendo presente que a distribuição amostral fornece a distribuição teórica de todas as possíveis amostras de tamanho nove, a probabilidade 6,68% é a proporção de amostras de tamanho nove que têm media menor ou igual a 149,75 centímetros cúbicos. </li></ul>
  25. 40. <ul><li>Qual o significado da probabilidade 0,62%? </li></ul><ul><li>Considerando que a distribuição amostral fornece a distribuição teórica de todas as possíveis amostras de tamanho vinte e cinco, a probabilidade 0,62% é a proporção de amostras de tamanho nove que têm media menor ou igual a 149,75 centímetros cúbicos. </li></ul>
  26. 41. <ul><li>A probabilidade 0,62% confirma que o volume de enchimento realizado pela máquina automática é de 150 centímetros cúbicos? Vejamos: </li></ul><ul><ul><li>Se for retirado apenas um único frasco de detergente como amostra, a probabilidade de o volume desse frasco ser menor ou igual a 149,75 centímetros cúbicos é 30,85%, resultado obtido com a fórmula =DIST.NORM(149,75;150;0,5;VERDADEIRO). A probabilidade 30,85% é bastante alta comparada às probabilidades com a média de uma amostra dos exemplos anteriores. </li></ul></ul>
  27. 42. <ul><ul><li>A probabilidade 6,68% da amostra do Exemplo 10.3 não é suficiente para afirmar que a máquina esteja enchendo realmente com média igual a 150, pois a proporção de amostras de tamanho nove com media menor ou igual a 149,75 centímetros cúbicos não é pequena. </li></ul></ul><ul><ul><li>A probabilidade da amostra do Exemplo 10.4 é pequena, o que nos leva a aceitar que o volume médio de enchimento da máquina seja 150. </li></ul></ul><ul><li>A aceitação do volume de enchimento da máquina automática depende do tamanho da amostra n , pois quanto maior for n, maior será a chance de aceitação. </li></ul>
  28. 44. Modelo Distribuição Amostral

×