Amostragem - estatistica

4.713 visualizações

Publicada em

Publicada em: Economia e finanças
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
4.713
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
218
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Amostragem - estatistica

  1. 1. Noções de Amostragem Denise Duarte Depto de Estatística ICEx- UFMG
  2. 2. População e Amostras Ao conjunto de entes portadores de pelo menos uma característica comum denominamos População Estatística ou Universo Estatístico. Ou seja, não se refere apenas a uma coleção de indivíduos, mas também pode ser ao alvo sobre o qual reside nosso interesse.
  3. 3. Em Estatística, a palavra população tem um significado muito mais amplo do que no vocabulário comum. Exemplos: A população de interesse pode ser todas as lâmpadas produzidas por uma fábrica, todo o sangue que corre no corpo de uma pessoa ou todos os habitantes de uma cidade, estado ou país.
  4. 4. AMOSTRAGEM X CENSO Uma amostra envolve o estudo de uma parcela dos itens de uma população, enquanto que um censo requer o exame de todos os itens. A amostragem pode ser melhor em várias situações a) A população pode ser considerada infinita. b) Uma amostra pode estar mais atualizada que um censo, pois é mais rápido de se obter informações. c)Os testes podem ter caráter destrutivo, ou seja, os itens examinados são destruídos no ato do experimento. d) O custo de um censo pode ser proibitivo, tanto em termos de recurso como de tempo. e)A amostragem envolve menor número de coletores de dados, o que pode diminuir os erros.
  5. 5. Censo No censo coletamos informação sobre todos os indivíduos da população. Em algumas situações é mais vantajoso fazer censo: a) A população pode ser tão pequena que o custo, de tempo e dinheiro, sejam pouco maiores que o de uma amostra. b) Se o tamanho da amostra é grande em relação à população, o esforço adicional requerido por um censo pode ser pequeno; c) O censo elimina a variabilidade amostral. Então, se a informação tem que ser precisa, a única alternativa é o censo.
  6. 6. Amostras Tendenciosas 1) As inferências, quando possíveis, só devem ser feitas para a população onde a amostra foi recolhida. 2) É preciso verificar se a amostra foi retirada da população utilizando um processo delineado segundo critérios estatísticos. 3) Na prática, o tamanho da amostra costuma ser determinado por considerações de ordem prática, como o orçamento disponível. 4) Amostras pequenas podem até ser excelentes estudos de casos, mas não permitem fazer Inferência Estatística. Mas desconfie de amostras muito grandes, os dados podem ser falsos!
  7. 7. AMOSTRAGEM PROBABILÍSTICA Uma amostragem será probabilística se todos os elementos da população tiverem uma probabilidade conhecida, diferente de zero, de pertencer à amostra. Desta forma, a amostragem probabilística implica um sorteio com regras bem determinadas. Como toda a Estatística Inferencial é baseada em Amostragem Probabilística, as amostras coletadas de outra forma não têm tratamento Estatístico adequado desenvolvido para elas.
  8. 8. AMOSTRAGEM NÃO PROBABILÍSTICA Quando não é possível designar uma probabilidade a cada elemento, dizemos que a amostragem é não probabilística. Este processo de amostragem é subjetivo e depende do conhecimento que o pesquisador tem a respeito da população que está estudando.
  9. 9. Principais tipos de Amostragem Não Probabilísticas: 1) A Esmo ( Tenta imitar o aleatório, mas sem sorteio) 2) Por cotas ( Cada coletor deve amostrar um número fixo de elementos a seu critério);
  10. 10. Perguntas que devem ser feitas ao se ler um trabalho envolvendo amostragem: 1) Será que o pesquisador tinha tempo e dinheiro para fazer um bom levantamento dos dados? 2) Como foi feito o questionário? As perguntas eram claras? Podem induzir o informante a mentir por alguma razão? 3) Qual é a população? 4) Como a amostra foi selecionada e qual é o tamanho da amostra?
  11. 11. Fique sempre atento para o seguinte: • A pessoa pode mentir ao responder perguntas sobre sua idade ou renda; • A pessoa pode não lembrar e dar uma resposta errada quando perguntada sobre questões do tipo: “quantos cigarros o senhor fumou esta semana?” ou “ Quanto o senhor gasta por mês com alimentação?”; • Quando o informante não entende a pergunta pode dar uma resposta qualquer apenas para não passar por ignorante; • Perguntas mal colocadas podem induzir a resposta: Por exemplo: “ Você acha que justo pessoas de idade ficarem passeando de ônibus de graça enquanto estudantes e trabalhadores têm que pagar?”.
  12. 12. Fontes externas de erro • Erros de anotação por parte da pessoa que coleta os dados; • Erros de digitação por parte de quem digita os dados; • Fraudes (a pessoa que coleta os dados preenche os formulários sozinha) • Perda de informações. Todas estas fontes de erro são difíceis de detectar! O treinamento rigoroso para as pessoas que vão coletar os dados é essencial, mas encarece o processo da coleta e, por isto, às vezes é deixado de lado... Fique de olho!!!!
  13. 13. Quando o tamanho da amostra aumenta, independente da distribuição da população original, a distribuição da Média aproxima-se cada vez mais da distribuição Normal. Este resultado é conseqüência de um dos teoremas mais importantes da teoria Estatística, chamado Teorema Central do Limite. Teorema: se é uma amostra aleatória simples de uma população X com média e variância e , então:
  14. 14. Tamanho da amostra Qual o tamanho da amostra que devemos considerar se queremos estimar  A proporção de eleitores que votam em um candidato?  A contaminação da água da praia de Ipanema?  A taxa de açúcar no sangue de uma pessoa?  A temperatura do corpo de uma pessoa?  A renda média dos alunos da sua escola? (como estimar renda?)  A renda média dos brasileiros?
  15. 15. Valor de z (Distribuição Probabilidade (confiança) 1,645 1,960 2,329 90% 95% 99%
  16. 16. No caso, por exemplo, de pesquisa de intenção de votos, temos que a média amostral é a própria proporção de votos para um determinado candidato. Assim o TCL afirma que: Com média p ( proporção verdadeira) e variância pq/n. Ou seja:
  17. 17. Desta forma temos que: E um intervalo de Confiança para a proporção verdadeira “p” pode ser construído assim:
  18. 18. De tal forma que pq Pr[ p ∈ ( p − z (k ) ; n ^ pq p + z (k ) )] = 1 − α n ^ Escolhemos z(k) de modo que a probabilidade de p pertencer ao IC seja 1 - α 1 - α é a “confiança” do intervalo
  19. 19. Usamos o fato de que pq<1/4 para chegar a IC = Este IC é chamado conservativo, pois estamos usando a maior variância possível, o que gera um intervalo maior do que o necessário em geral.
  20. 20.  Desta forma, se estamos interessados em determinar o tamanho da amostra necessária para estimar a proporção de eleitores que votam em um certo candidato, com nível de confiança de 95% e uma margem de erro de 2%, fazemos (1,96) 2 n= = 2401 2 4 × 0,02
  21. 21. Cálculo do tamanho da amostra para populações finitas Se a população é finita, o desvio padrão não é mais pq n Mas sim, N −n N −1 pq n
  22. 22. Desta forma, o cálculo do tamanho da amostra é dado por n= n 1 + (n − 1) / N 0 0 Onde n 0 é dado por 2 z (k ) pq n0 = d 2
  23. 23. Se não conhecemos p, usamos o valor máximo aqui também: z (k ) n0 = 4d 2 2
  24. 24. Exemplo: Um colégio de Ensino médio tem 240 alunos entre as 3 séries. Os alunos devem escolher entre 2 candidatos quem será o presidente do grêmio estudantil. Qual o tamanho da amostra necessária para estimar as intenções devoto, com 95% de confiança e uma margem de erro máxima de 2%? Este é um problema proposto em um livro de segunda série do Ensino Médio. Lá, a resposta é 24. Vejam qual é a resposta correta:
  25. 25. Se 1-α é 95%, então z(k) é 1,96, como a margem de erro é 0,02, temos que: 2 1,96 3,8416 n0 = 4(0,02) 2 = 0,0016 = 2401 Portanto, o tamanho da amostra é: 2401 n= = 218 1 + (2401 − 1) / 240
  26. 26. Exercício Elabore uma atividade para trabalhar com seus alunos que envolva uma pesquisa por amostragem ou censo.  Justifique a sua escolha pela metodologia.  Defina a variável de interesse e a população alvo (é finita ou infinita?).  Como calcular o tamanho da amostra?

×