Este documento discute conceitos fundamentais de amostragem estatística, como população, amostra, censo, amostragem probabilística e não probabilística. Explica que uma amostra envolve estudar uma parcela da população, diferente de um censo que requer examinar todos os itens, e como calcular o tamanho adequado da amostra para estimar parâmetros populacionais com certo nível de confiança.
Medidas de Tendência Central
Desvio Padrão
Variância
Distribuições de Frequência e Probabilidade
Intervalos de Confiança
Apresentação disponível em: https://youtu.be/njXvCxskhdM
Aula de métodos e técnicas de análise da informação para planejamento, UFABC, junho de 2017
Gravação da aula disponível em: https://youtu.be/bwmkSik9mYg
Medidas de Tendência Central
Desvio Padrão
Variância
Distribuições de Frequência e Probabilidade
Intervalos de Confiança
Apresentação disponível em: https://youtu.be/njXvCxskhdM
Aula de métodos e técnicas de análise da informação para planejamento, UFABC, junho de 2017
Gravação da aula disponível em: https://youtu.be/bwmkSik9mYg
3. População e Amostras
Ao conjunto de entes portadores de pelo menos
uma característica comum denominamos
População Estatística ou Universo Estatístico. Ou
seja, não se refere apenas a uma coleção de
indivíduos, mas também pode ser ao alvo sobre o
qual reside nosso interesse.
4. Em Estatística, a palavra população tem um
significado muito mais amplo do que no
vocabulário comum.
Exemplos: A população de interesse pode ser
todas as lâmpadas produzidas por uma fábrica,
todo o sangue que corre no corpo de uma
pessoa ou todos os habitantes de uma cidade,
estado ou país.
5.
6. AMOSTRAGEM X CENSO
Uma amostra envolve o estudo de uma parcela
dos itens de uma população, enquanto que um
censo requer o exame de todos os itens.
A amostragem pode ser melhor em várias
situações
a) A população pode ser considerada infinita.
b) Uma amostra pode estar mais atualizada que
um censo, pois é mais rápido de se obter
informações.
c)Os testes podem ter caráter destrutivo, ou seja,
os itens examinados são destruídos no ato do
experimento.
d) O custo de um censo pode ser proibitivo,
tanto em termos de recurso como de tempo.
e)A amostragem envolve menor número de
coletores de dados, o que pode diminuir os
erros.
7. Censo
No censo coletamos informação sobre todos os
indivíduos da população.
Em algumas situações é mais vantajoso fazer
censo:
a)
A população pode ser tão pequena que o
custo, de tempo e dinheiro, sejam pouco
maiores que o de uma amostra.
b)
Se o tamanho da amostra é grande em
relação à população, o esforço adicional
requerido por um censo pode ser pequeno;
c)
O censo elimina a variabilidade amostral.
Então, se a informação tem que ser precisa, a
única alternativa é o censo.
8. Amostras Tendenciosas
1) As inferências, quando possíveis, só devem ser
feitas para a população onde a amostra foi
recolhida.
2) É preciso verificar se a amostra foi retirada da
população utilizando um processo delineado
segundo critérios estatísticos.
3) Na prática, o tamanho da amostra costuma ser
determinado por considerações de ordem
prática, como o orçamento disponível.
4) Amostras pequenas podem até ser excelentes
estudos de casos, mas não permitem fazer
Inferência Estatística.
Mas desconfie de amostras muito grandes, os
dados podem ser falsos!
9. AMOSTRAGEM PROBABILÍSTICA
Uma amostragem será probabilística se todos os
elementos da população tiverem uma
probabilidade conhecida, diferente de zero, de
pertencer à amostra. Desta forma, a amostragem
probabilística implica um sorteio com regras bem
determinadas.
Como toda a Estatística Inferencial é baseada
em Amostragem Probabilística, as amostras
coletadas de outra forma não têm tratamento
Estatístico adequado desenvolvido para elas.
10. AMOSTRAGEM NÃO PROBABILÍSTICA
Quando não é possível designar uma
probabilidade a cada elemento, dizemos que a
amostragem é não probabilística.
Este processo de amostragem é subjetivo e
depende do conhecimento que o pesquisador
tem a respeito da população que está
estudando.
11. Principais tipos de Amostragem Não
Probabilísticas:
1) A Esmo ( Tenta imitar o aleatório, mas sem
sorteio)
2) Por cotas ( Cada coletor deve amostrar um
número fixo de elementos a seu critério);
12. Perguntas que devem ser feitas ao se ler um
trabalho envolvendo amostragem:
1) Será que o pesquisador tinha tempo e dinheiro
para fazer um bom levantamento dos dados?
2) Como foi feito o questionário? As perguntas
eram claras? Podem induzir o informante a
mentir por alguma razão?
3) Qual é a população?
4) Como a amostra foi selecionada e qual é o
tamanho da amostra?
13. Fique sempre atento para o seguinte:
• A pessoa pode mentir ao responder perguntas sobre sua
idade ou renda;
• A pessoa pode não lembrar e dar uma resposta errada
quando perguntada sobre questões do tipo: “quantos cigarros
o senhor fumou esta semana?” ou “ Quanto o senhor gasta
por mês com alimentação?”;
• Quando o informante não entende a pergunta pode dar uma
resposta qualquer apenas para não passar por ignorante;
• Perguntas mal colocadas podem induzir a resposta: Por
exemplo: “ Você acha que justo pessoas de idade ficarem
passeando de ônibus de graça enquanto estudantes e
trabalhadores têm que pagar?”.
14. Fontes externas de erro
• Erros de anotação por parte da pessoa que
coleta os dados;
• Erros de digitação por parte de quem digita os
dados;
• Fraudes (a pessoa que coleta os dados preenche
os formulários sozinha)
• Perda de informações.
Todas estas fontes de erro são difíceis de detectar!
O treinamento rigoroso para as pessoas que vão
coletar os dados é essencial, mas encarece o
processo da coleta e, por isto, às vezes é deixado
de lado...
Fique de olho!!!!
15. Quando o tamanho da amostra aumenta,
independente da distribuição da população
original, a distribuição da Média
aproxima-se
cada vez mais da distribuição Normal. Este
resultado é conseqüência de um dos teoremas
mais importantes da teoria Estatística, chamado
Teorema Central do Limite.
Teorema: se
é uma amostra aleatória
simples de uma população X com média
e
variância
e
, então:
16. Tamanho da amostra
Qual o tamanho da amostra que devemos considerar se
queremos estimar
A proporção de eleitores que votam em um candidato?
A contaminação da água da praia de Ipanema?
A taxa de açúcar no sangue de uma pessoa?
A temperatura do corpo de uma pessoa?
A renda média dos alunos da sua escola? (como estimar
renda?)
A renda média dos brasileiros?
19. No caso, por exemplo, de pesquisa de
intenção de votos, temos que a média
amostral é a própria proporção de votos
para um determinado candidato. Assim o
TCL afirma que:
Com média p ( proporção verdadeira) e
variância pq/n.
Ou seja:
20. Desta forma temos que:
E um intervalo de Confiança para a
proporção verdadeira “p” pode ser
construído assim:
21. De tal forma que
pq
Pr[ p ∈ ( p − z (k )
;
n
^
pq
p + z (k )
)] = 1 − α
n
^
Escolhemos z(k) de modo que a
probabilidade de p pertencer ao IC seja 1
- α
1 - α é a “confiança” do intervalo
22. Usamos o fato de que pq<1/4 para
chegar a
IC =
Este IC é chamado conservativo, pois
estamos usando a maior variância
possível, o que gera um intervalo maior
do que o necessário em geral.
23.
24.
Desta forma, se estamos interessados em
determinar o tamanho da amostra
necessária para estimar a proporção de
eleitores que votam em um certo
candidato, com nível de confiança de 95%
e uma margem de erro de 2%, fazemos
(1,96) 2
n=
= 2401
2
4 × 0,02
25.
26. Cálculo do tamanho da amostra para
populações finitas
Se a população é finita, o desvio
padrão não é mais
pq
n
Mas sim,
N −n
N −1
pq
n
27. Desta forma, o cálculo do tamanho
da amostra é dado por
n=
n
1 + (n − 1) / N
0
0
Onde n 0 é dado por
2
z (k ) pq
n0 = d 2
28. Se não conhecemos p, usamos o
valor máximo aqui também:
z (k )
n0 = 4d 2
2
29. Exemplo: Um colégio de Ensino
médio tem 240 alunos entre as 3
séries. Os alunos devem escolher
entre 2 candidatos quem será o
presidente do grêmio estudantil.
Qual o tamanho da amostra
necessária para estimar as
intenções devoto, com 95% de
confiança e uma margem de erro
máxima de 2%?
Este é um problema proposto em
um livro de segunda série do Ensino
Médio. Lá, a resposta é 24. Vejam
qual é a resposta correta:
30. Se 1-α é 95%, então z(k) é 1,96,
como a margem de erro é 0,02,
temos que:
2
1,96
3,8416
n0 = 4(0,02) 2 = 0,0016 = 2401
Portanto, o tamanho da amostra é:
2401
n=
= 218
1 + (2401 − 1) / 240
31. Exercício
Elabore uma atividade para trabalhar com
seus alunos que envolva uma pesquisa
por amostragem ou censo.
Justifique a sua escolha pela metodologia.
Defina a variável de interesse e a
população alvo (é finita ou infinita?).
Como calcular o tamanho da amostra?