O documento discute os conceitos e métodos de amostragem em pesquisas estatísticas. Aborda os tipos de amostragem probabilística e não probabilística, explicando técnicas como amostra aleatória simples, estratificada e sistemática, além de amostra por conveniência e bola de neve.
4. Probabilidade e Estatística
• O que é Amostragem?
A amostragem é o processo de selecionar um
grupo de indivíduos de uma população, a fim de
estudar e caracterizar a população total.
• Imagine que você quer saber uma informação
sobre um universo ou população, por exemplo,
qual a porcentagem de fumantes no México.
Uma maneira de obter essa informação é entrar
em contato com todos os habitantes do México
(122 milhões de pessoas) e perguntar se são
fumantes. A outra maneira é selecionar um
subconjunto de indivíduos (por exemplo, 1.000
pessoas) e perguntar se eles fumam.
• O grupo de 1.000 pessoas formam
uma amostra e a maneira como eu seleciono
este grupo é chamado de amostragem.
5. Principais conceitos
• Margem de erro – É a diferença entre a média
encontrada na amostra para a média da população.
• Aleatoriedade – Para termos os resultados mais
próximos da verdadeira população, a seleção da
nossa amostra deve ser totalmente aleatória.
• População- É a totalidade dos fatores que
queremos analisar. Seja o total de pessoas que
moram na região do nosso interesse, seja o total de
organismos que vivem em determinado
ecossistema.
• Grau de confiança – O termo confiança,
dentro das técnicas de amostragem, significa o
quanto estamos dispostos a abrir mão de “certeza”
para termos uma amostra mais eficiente. Podemos
pensar em confiança como um intervalo de
probabilidades, onde, quanto maior for o grau de
confiança estabelecido, maior será o intervalo de
resultados possíveis dentro de uma amostra.
6. Por quê a amostragem funciona?
o A amostragem é útil, pois permite
acompanhar um processo inverso
que chamamos
de generalização. Para conhecer
um universo, o que fazemos é:
(1) Extrair uma amostra do mesmo,
(2) Medir um dado ou opinião,
(3) Projetar no universo o resultado
observado na amostra. Esta
projeção ou extrapolação recebe o
nome de generalização dos
resultados.
7. • Felizmente, o erro cometido pela
generalização de resultados pode ser
limitado através de estatísticas. Para
isso, usamos dois parâmetros: a
margem de erro (diferença máxima
entre os dados observados na minha
amostra e os dados reais do
universo) e o nível de
confiança (nível de certeza sobre os
dados reais que está dentro da
margem de erro).
8. • Por exemplo, no caso dos
fumantes mexicanos, se
selecionamos uma amostra de
471 indivíduos e perguntamos
se eles fumam, o resultado
obtido será uma margem de
erro máxima de + 5% com um
nível de confiança de 97%.
Esta forma de expressar os
resultados é correta quando se
utiliza a amostragem.
9. Qual o tamanho da amostra que eu
preciso para estudar um universo?
• Depende do tamanho do universo e do nível
de erro que você está disposto a
aceitar. Quanto mais alta for a precisão,
maior será a amostra necessária.
• Mas o tamanho da amostra tem uma
propriedade fundamental que explica o
porquê a amostragem utiliza diversas áreas
do conhecimento. Esta propriedade pode ser
resumida da seguinte forma: a medida que
estudamos universos maiores, o tamanho da
amostra cada vez mais representa uma
porcentagem menor desse universo.
10. Qual é o modelo mais adequado para o
seu projeto?
• Amostragem probabilística
• Amostragem não probabilística
11. Amostragem probabilística
• Probabilística como o próprio
nome já indica, utiliza-se da
probabilidade, que no caso,
precisa ser maior que zero para
ser considerada. Também é
necessário considerar a
probabilidade de cada
indivíduo, para que a amostra
não seja tendenciosa e possa
comprometer o resultado da
pesquisa.
12. • A amostragem aleatória simples
(M.A.S.) é a técnica de amostragem
onde todos os elementos que
compõem o universo e estão descritos
no marco amostral têm idêntica
probabilidade de serem selecionados
para a amostra. Seria como fazer um
sorteio justo entre os indivíduos do
universo: atribuir a cada pessoa um
bilhete com um número de série,
introduzir os números em uma caixa e
sortear um número aleatório. Todos os
indivíduos têm este bilhete dentro da
urna formam uma amostra.
onde n0 é o tamanho da
amostra necessária para
um universo infinito
N é o tamanho do universo
finito. É possível demonstrar
que o tamanho da amostra
quando usamos
repetição (nr) é sempre igual
ao tamanho necessário para
universo infinito (nr=n0).
13. • A amosta aleatória estratificada é
uma técnica pertence a família de
amostras probabilísticas e consiste
em dividir toda a população ou o
"objeto de estudo" em diferentes
subgrupos ou estratos diferentes, de
maneira que um indivíduo pode
fazer parte apenas de um único
estrato ou camada. Após as
camadas serem definidas, para criar
uma amostra, selecionam-se
indivíduos utilizando qualquer
técnica de amostragem em cada um
dos estratos de forma separada.
14. • A amostra sistemática é uma
técnica dentro da categoria de
amostra probabilística que
requer certo controle do marco
amostral entre os indivíduos
selecionados junto com a
probabilidade que sejam
selecionados – consiste em
escolher um indivíduo
inicialmente de forma aleatória
entre a população e,
posteriormente, selecionar para
amostra cada enésimo
indivíduo disponível no marco
amostral.
K=N/n
A, A + K, A + 2K, A + 3K, ...., A + (n-1)K
15. • A amostra por conglomerados é
uma técnica que explora
existência de grupos
(clusters) na população. Esses
grupos representam
adequadamente a população
total em relação a característica
que queremos medir. Em outras
palavras, estes grupos contêm
variabilidade da população
inteira.
nc = na (1 + (M-1) δ)
16. Amostragem não probabilística
• Não probabilística é aplicada
sem o usa da probabilidade ou
seja é a amostra aleatória, que
utiliza indivíduos sem um
perfil pré-definido.
• Geralmente essa técnica é
aplicada em pesquisa de rua
ou em local de grande
circulação, onde não se pode
escolher os abordados. Neste
caso a margem de erro deve
ser desconsiderada.
17. • Amostra por conveniência é muito
comum e consiste em selecionar uma
amostra da população que seja
acessível. Ou seja, os indivíduos
empregados nessa pesquisa são
selecionados porque eles estão
prontamente disponíveis, não porque
eles foram selecionados por meio de
um critério estatístico. Geralmente essa
conveniência representa uma maior
facilidade operacional e baixo custo de
amostragem, porém tem como
consequência a incapacidade de fazer
afirmações gerais com rigor estatístico
sobre a população.
18. • A amostra por bola de neve é
uma técnica de amostragem não
probabilística onde os indivíduos
selecionados para serem estudados
convidam novos participantes da
sua rede de amigos e conhecidos.
O nome de "bola de neve" provem
justamente desta ideia: do mesmo
modo que uma bola de neve rola
ladeira a baixo, cada vez mais ela
aumenta seu tamanho. O mesmo
ocorre com a essa técnica
amostral, ela vai crescendo a
medida que os indivíduos
selecionados convidam novos
participantes.