1) O documento discute os conceitos de população, amostra, amostragem probabilística e não probabilística, censo e como calcular o tamanho adequado de uma amostra para estimar parâmetros populacionais.
2) É explicado que amostragem envolve estudar uma parcela da população, diferente do censo que examina todos os itens, e listados alguns casos em que amostragem pode ser melhor que censo.
3) São apresentados métodos de amostragem probabilística e não probabilística,
3. População e Amostras
Ao conjunto de entes portadores de pelo menos
uma carac terística comum denominamos
População Estatística ou Universo Estatístico. Ou
seja, não se refere apenas a uma coleção de
indivíduos, mas também pode ser ao alvo sobre o
qual reside nosso interesse.
4. Em Estatística, a palavra população tem um
significado muito mais amplo do que no
vocabulário comum.
Exemplos: A população de interesse pode ser
todas as lâmpadas produzidas por uma fábrica,
todo o sangue que corre no corpo de uma
pessoa ou todos os habitantes de uma cidade,
estado ou país.
5.
6. AMOSTRAGEM X CENSO
Uma amostra envolve o estudo de uma parcela
dos itens de uma população, enquanto que um
censo requer o exame de todos os itens.
A amostragem pode ser melhor em várias
situações
a) A população pode ser considerada infinita.
b) Uma amostra pode estar mais atualizada que
um censo, pois é mais rápido de se obter
informações.
c )Os testes podem ter caráter destrutivo, ou seja,
os itens examinados são destruídos no ato do
experimento.
d) O custo de um censo pode ser proibitivo,
tanto em termos de recurso como de tempo.
e)A amostragem envolve menor número de
coletores de dados, o que pode diminuir os
erros.
7. Censo
No censo coletamos informação sobre todos os
indivíduos da população.
Em algumas situaç ões é mais vantajoso fazer
c enso:
a) A populaç ão pode ser tão pequena que o
c usto, de tempo e dinheiro, sejam pouc o
maiores que o de uma amostra.
b) Se o tamanho da amostra é grande em
relaç ão à populaç ão, o esforç o adic ional
requerido por um c enso pode ser pequeno;
c ) O c enso elimina a variabilidade amostral.
Então, se a informaç ão tem que ser prec isa, a
únic a alternativa é o c enso.
8. Amostras T
endenciosas
1) As inferênc ias, quando possíveis, só devem ser
feitas para a populaç ão onde a amostra foi
rec olhida.
2) É prec iso verific ar se a amostra foi retirada da
populaç ão utilizando um proc esso delineado
segundo c ritérios estatístic os.
3) Na prátic a, o tamanho da amostra c ostuma ser
determinado por c onsideraç ões de ordem
prátic a, c omo o orç amento disponível.
4) Amostras pequenas podem até ser exc elentes
estudos de c asos, mas não permitem fazer
Inferênc ia Estatístic a.
Mas desc onfie de amostras muito grandes, os
dados podem ser falsos!
9. AMOSTRAGEM PROBABILÍSTICA
Uma amostragem será probabilística se todos os
elementos da população tiverem uma
probabilidade conhecida, diferente de zero, de
pertencer à amostra. Desta forma, a amostragem
probabilística implica um sorteio com regras bem
determinadas.
Como toda a Estatística Inferencial é baseada
em Amostragem Probabilística, as amostras
c oletadas de outra forma não têm tratamento
Estatístic o adequado desenvolvido para elas.
10. AMOSTRAGEM NÃO PROBABILÍSTICA
Quando não é possível designar uma
probabilidade a cada elemento, dizemosque a
amostragem é não probabilística.
Este proc esso de amostragem é subjetivo e
depende do c onhecimento que o pesquisador
tem a respeito da populaç ão que está
estudando.
12. Perguntas que devem ser feitas ao se ler um
trabalho envolvendo amostragem:
1)Será que o pesquisador tinha tempo e dinheiro
para fazer um bom levantamento dos dados?
2)Como foi feito o questionário? As perguntas
eram c laras? Podem induzir o informante a
mentir por alguma razão?
3)Qual é a populaç ão?
4)Como a amostra foi selecionada e qual é o
tamanho da amostra?
13. Fique sempre atento para o seguinte:
A pessoa pode mentir ao responder perguntas sobre sua
idade ou renda;
A pessoa pode não lembrar e dar uma resposta errada
quando perguntada sobre questões do tipo: “quantos cigarros
o senhor fumou esta semana?” ou “ Quanto o senhor gasta
por mês com alimentação?”;
Quando o informante não entende a pergunta pode dar uma
resposta qualquer apenas para não passar por ignorante;
Perguntas mal colocadas podem induzir a resposta: Por
exemplo: “ Você acha que justo pessoas de idade ficarem
passeando de ônibus de graça enquanto estudantes e
trabalhadores têm que pagar?”.
14. Fontes externas de erro
Erros de anotaç ão por parte da pessoa que
c oleta os dados;
Erros de digitaç ão por parte de quem digita os
dados;
Fraudes (a pessoa que c oleta os dados preenc he
os formulários sozinha)
Perda de informaç ões.
T
odas estas fontes de erro são difíc eis de detec tar!
O treinamento rigoroso para as pessoas que vão
c oletar os dados é essenc ial, mas enc arec e o
proc esso da c oleta e, por isto, às vezes é deixado
de lado...
Fique de olho!!!!
15. Quando o tamanho da amostra aumenta,
independente da distribuição da população
original, a distribuição da Média X aproxima-se
cada vez mais da distribuição Normal. Este
resultado é c onseqüência de um dos teoremas
mais importantes da teoria Estatística, c hamado
Teorema Central do Limite.
Teorema: se )
,...,
,
( 2
1 X
X
X n
é uma amostra aleatória
simples de uma população X com média e
variância
2
e n
X
X
X n
...
1
, então:
)
1
,
0
(
~
/
N
n
X
Z
16. Tamanho da amostra
Qual o tamanho da amostra que devemos considerar se
queremos estimar
A proporção de eleitores que votam em um candidato?
A contaminação da água da praia de Ipanema?
A taxa de açúcar no sangue de uma pessoa?
A temperatura do corpo de uma pessoa?
A renda média dos alunos da sua escola? (como estimar
renda?)
A renda média dos brasileiros?
19. No caso, por exemplo, de pesquisa de intenção de
votos, temos que a média amostral é a própria
proporção de votos para um determinado candidato.
Assim o TCL afirma que:
Ou seja:
Com média p ( proporção verdadeira) e
variância pq/n.
20. E um intervalo de Confiança para a proporção
verdadeira “p” pode ser construído assim:
Desta forma temos que:
21. De tal forma que
1
)]
)
(
;
)
(
(
Pr[
^
^
n
pq
k
z
p
n
pq
k
z
p
p
1 - é a “confiança” do intervalo
Escolhemos z(k) de modo que a probabilidade de p
pertencer ao IC seja 1 -
22. Usamos o fato de que pq<1/4 para chegar a
IC =
Este IC é chamado conservativo, pois estamos
usando a maior variância possível, o que gera um
intervalo maior do que o necessário em geral.
23.
24. Desta forma, se estamos interessados em
determinar o tamanho da amostra
necessária para estimar a proporção de
eleitores que votam em um certo
candidato, com nível de confiança de 95%
e uma margem de erro de 2%, fazemos
2401
02
,
0
4
)
96
,
1
(
2
2
n
25.
26. Cálculo do tamanho da amostra para populações
finitas
Se a população é finita, o desvio padrão não
é mais
n
pq
Mas sim,
n
pq
N
n
N
1
27. Onde n0 é dado por
N
n
n
n
/
)
1
(
1 0
0
Desta forma, o cálculo do tamanho da
amostra é dado por
2
2
0
)
(
d
pq
k
z
n
28. Se não conhecemos p, usamos o valor
máximo aqui também:
2
2
0
4
)
(
d
k
z
n
29. Exemplo: Um colégio de Ensino médio tem
240 alunos entre as 3 séries. Os alunos
devem escolher entre 2 candidatos quem
será o presidente do grêmio estudantil. Qual o
tamanho da amostra necessária para estimar
as intenções devoto, com 95% de confiança e
uma margem de erro máxima de 2%?
Este é um problema proposto em um livro de
segunda série do Ensino Médio. Lá, a
resposta é 24. Vejam qual é a resposta
correta:
31. Exercício
Elabore uma atividade para trabalhar com
seus alunos que envolva uma pesquisa
por amostragem ou censo.
Justifique a sua escolha pela metodologia.
Defina a variável de interesse e a
população alvo (é finita ou infinita?).
Como calcular o tamanho da amostra?