1. Prof. Ricardo Tavares - UFOP 1
Técnicas de Amostragem I
Prof. Ricardo Tavares
Definições e conceitos básicos
2. Introdução
• Porquê amostra?
• Por que não
estudar todos?
• Debate sobre
censo vs.
amostragem
Prof. Ricardo Tavares - UFOP 2
3. Introdução
Amostragem probabilística vs. não probabilística:
• Amostragem probabilística é aquela em que cada
elemento da população tem uma probabilidade
conhecida e não nula de seleção;
• Não é uma amostragem probabilística se alguns
elementos da população não podem ser
selecionados (têm probabilidade nula de seleção);
• Não é uma amostragem probabilística se as
probabilidades de seleção não são conhecidas.
Prof. Ricardo Tavares - UFOP 3
4. Introdução
Amostragem probabilística:
• Não é possível garantir “representatividade”
de todas as características de interesse;
• Garante um plano de amostragem com
propriedades estatísticas conhecidas;
• Permite declarações como: “A probabilidade
é 99% que a verdadeira correlação
populacional esteja entre 0,46 e 0,56.
Prof. Ricardo Tavares - UFOP 4
5. Introdução
Sistema de referência é crucial em amostragem
probabilística:
• Se o sistema de referência é pobre e não faz a
cobertura da população de interesse, uma
amostragem aleatória deste sistema de referência não
pode resolver essa deficiência (este problema);
• O sistema de referência não é escolhido
aleatoriamente. Elementos que não estão nele têm
probabilidade nula de seleção;
• Generalizações podem ser feitas APENAS para a
população atual definida pelo sistema de referência.
Prof. Ricardo Tavares - UFOP 5
6. Prof. Ricardo Tavares - UFOP 6
Introdução
• A experiência com amostragem é fato
corrente no cotidiano;
• Exemplos:
– Um cozinheiro verifica o tempero de um prato
que está preparando;
– Um médico detecta as condições de um
paciente através de exames de sangue;
– Uma amostra da água de um rio é avaliada
como saudável ou não;
7. Prof. Ricardo Tavares - UFOP 7
Introdução
• Outros exemplos que usam procedimentos
amostrais mais complicados poderiam ser
listados, mas todos com o mesmo objetivo:
– Obter informações sobre o todo, baseando-se no
resultado de uma amostra;
• Porém, o uso inadequado de um procedimento
amostral pode levar a um viés de interpretação
do resultado;
8. Prof. Ricardo Tavares - UFOP 8
Introdução
• Por exemplo, não mexer bem a sopa antes de
retirar uma colher para experimentar pode levar
à subavaliação da mesma;
• Em estudos em que as informações são obtidas
através de levantamentos amostrais, é comum o
usuário ficar tão envolvido na apuração e
interpretação dos dados que “esquece” de
verificar possíveis viéses originários do
protocolo de escolha da amostra;
9. Prof. Ricardo Tavares - UFOP 9
Introdução
• O uso de amostras que produzam resultados
confiáveis e livres de viéses é o desejo de
todos;
• Estes conceitos não são triviais e portanto
precisam ser estabelecidos para o uso científico
dos processos amostrais;
• Necessitamos da teoria que descreva as
propriedades e impropriedades de alguns
protocolos de obter amostras;
10. Prof. Ricardo Tavares - UFOP 10
Introdução
• Em cursos mais introdutórios de inferência
estatística, estuda-se a generalização para o
todo com base em amostras;
• A abordagem é dada para populações infinitas
ou para amostras retiradas de uma distribuição
de probabilidade;
• Não se discute muito como a amostra foi obtida;
11. Prof. Ricardo Tavares - UFOP 11
Introdução
• Neste contexto, a população será finita e
possivelmente enumerável ou passível de
descrição;
• Daremos uma visão geral das questões
envolvidas em um plano amostral e que
servirá para um primeiro contato com
aspectos metodológicos emergentes de
uma pesquisa;
12. Prof. Ricardo Tavares - UFOP 12
Levantamento amostral
• Uma pesquisa, levantamento ou
experimentação necessita que o pesquisador
planeje, execute, corrija e analise
adequadamente o procedimento proposto e
usado;
• Para alcançarmos resultados convincentes e
confiáveis é necessário tomar uma série de
medidas e cuidados antes, durante e depois da
pesquisa;
• O estatístico elabora uma lista de tópicos para
guiar um levantamento amostral;
13. Prof. Ricardo Tavares - UFOP 13
Lista de tópicos
• Identificação dos objetivos e populações;
• Coleta das informações;
• Planejamento e seleção da amostra;
• Processo de coleta dos dados (campo);
• Processamento dos dados;
• Análise dos resultados (modelos
estatísticos);
• Apresentação dos resultados;
• Disponibilidade dos dados;
14. Prof. Ricardo Tavares - UFOP 14
A obtenção dos dados
• Nem sempre os dados analisados
estatisticamente são coletados a partir da
utilização de técnicas de amostragem;
• Eles podem, por exemplo, ser
provenientes de estudos conduzidos a
partir de experimentação ou a partir de
dados históricos;
15. Prof. Ricardo Tavares - UFOP 15
Pesquisa por amostragem
• Pesquisas por amostragem podem ser
definidas como estudos envolvendo um
subconjunto, chamado de amostra, de
elementos selecionados de uma
população (ou universo) de interesse;
• Da qual se deseja fazer alguma inferência
sobre o comportamento de algumas
variáveis (ou características
populacionais);
16. Prof. Ricardo Tavares - UFOP 16
Pesquisa por amostragem
• O objetivo é retirar informações destas
populações finitas através da observação de
uma parte dela (amostra);
• Os princípios e métodos de coleta e análise dos
dados de uma população finita é um dos ramos
da estatística conhecido como “Sample Survey
Methods” ou “Técnicas de Amostragem”;
• A amostragem, e posterior análise estatística
dos resultados, é o principal instrumento de
pesquisa em inúmeras áreas, incluindo a
Agricultura, Educação, Indústria, Medicina,
Psicologia, Sociologia, Marketing, etc;
17. Prof. Ricardo Tavares - UFOP 17
Exemplo: Economia
• Os níveis dos preços dos produtos
alimentares é sempre objeto de
preocupação;
• De posse de uma lista seletiva bem
definida de produtos podemos, por
exemplo, obter a informação dos preços
praticados no mercado através da
visita à alguns supermercados
previamente selecionados.
18. Prof. Ricardo Tavares - UFOP 18
• "Como será feita a escolha dos produtos?"
• "Como será feita a seleção dos supermercados
a serem visitados?"
• "Que dificuldades práticas iremos encontrar
para coletar os preços?"
• "Quantas vezes cada supermercado
selecionado deverá ser pesquisado?"
• "Qual será a duração da coleta de dados, ou
período da pesquisa?"
• "Como a análise estatística dos dados
observados deverá ser conduzida?"
Algumas perguntas de interesse
19. Prof. Ricardo Tavares - UFOP 19
Exemplo: Educação
• Suponha que uma investigação seja feita
com o objetivo de se conhecer o “grau de
satisfação” dos estudantes da 5a. a 8a.
séries do ensino fundamental com o atual
ensino público de sua respectiva cidade;
20. Prof. Ricardo Tavares - UFOP 20
• Os estudantes estão satisfeitos com as
disciplinas que lhe são oferecidas?
• Os métodos de ensino e de avaliação são
adequados?
• Os estudantes estão satisfeitos com os
professores?
• A infra-estrutura da escola está adequada? O
que está faltando?
• Como os estudantes classificam o grau de
segurança da escola?
Algumas perguntas de interesse
21. Prof. Ricardo Tavares - UFOP 21
Exemplo: Pesquisa de Mercado
• Pesquisas de mercado são muito importantes
tanto no planejamento de novos produtos para
atender o mercado consumidor, quanto para a
avaliação da satisfação do consumidor em
relação aos produtos já existentes;
• Os resultados destas pesquisas norteam as
políticas no que se refere às melhores formas
de apresentação do produto, as campanhas de
publicidade, etc;
• É esperado que as atitudes dos consumidores
mudem devido a diversos fatores tais como,
nível educacional e econômico, faixa etária,
gênero (sexo), profissão, etc;
22. Prof. Ricardo Tavares - UFOP 22
OUTROS CONCEITOS
Parâmetros populacionais:
São medidas que sintetizam a informação dos elementos
populacionais em relação às características populacionais
de interesse.
Ex.: grau de satisfação das pessoas que usaram o 190.
Estimador:
É qualquer função das observações amostrais e que é utilizada
para inferir sobre o parâmetro populacional de interesse.
Ex.: proporção das pessoas que estão satisfeitas com o 190.
Estimativa:
É o valor numérico observado do estimador.
Ex.: 68% das pessoas que acionaram o 190 estão satisfeitas.
Variação amostral:
É a variação que acontece quando amostras com unidades
amostrais diferentes produz estimativas diferentes.
23. Prof. Ricardo Tavares - UFOP 23
Esse erro acontece devido ao fato de que a amostra não
pode fornecer uma informação completa sobre a
característica populacional medida. Tal erro pode ser
controlado através da escolha adequada do procedimento
de amostragem a ser utilizada na coleta de dados e do
tamanho da amostra.
ALGUNS CONCEITOS
Erro de estimação, erro padrão ou erro de amostragem:
É a quantidade:
é o parâmetro populacional de interesse e
um estimador de .
ˆ ˆ
( )
n n
Erro
ˆ
n
24. Prof. Ricardo Tavares - UFOP 24
Vício de um estimador
• Dada uma população, teoricamente seria possível
construir uma lista com todas as amostras de tamanho n
possíveis de serem selecionadas;
• Assim, se cada amostra tem uma probabilidade de seleção,
é possível obter-se os valores possíveis do estimador
com as respectivas probabilidades de ocorrência;
• Assim, pode-se construir a distribuição amostral do
estimador . Seja E[ ] a média da distribuição de valores
de ;
• O vício do estimador é a quantidade
V( )= - E[ ]
ˆ
n
ˆ
n
ˆ
n
ˆ
n
ˆ
n
ˆ
n
ˆ
n
25. Prof. Ricardo Tavares - UFOP 25
Vício de um estimador
Um estimador cujo vício é igual a zero é chamado de não-
viciado.
Pode-se calcular também a variância da distribuição de .
Quanto mais próximos os valores possíveis de estiverem
da E[ ] menor será a variância da distribuição e mais
preciso é o estimador.
ˆ
n
ˆ
n
ˆ
n
26. Prof. Ricardo Tavares - UFOP 26
a) Erros de campo: Não respostas, informações
imprecisas, efeitos dos entrevistadores, etc.
b) Erros de planejamento: Sistemas de referências não
adequados, escolha incorreta do método de seleção de
unidades amostrais, vício na seleção das unidades
amostrais, deficiência dos questionários, etc.
ALGUNS CONCEITOS
Erros não devidos à amostragem:
São erros que podem aparecer nas pesquisas e são mais
difíceis de serem controlados.
27. Prof. Ricardo Tavares - UFOP 27
ALGUNS CONCEITOS
Amostragem:
É o processo de seleção de uma amostra.
Plano amostral:
É o protocolo que descreve todos os métodos e medidas
envolvidos na execução da amostragem.
O plano amostral contém todas as informações: o método
usado para seleção da amostra, o erro de estimação, o
tamanho de amostra, os estimadores usados na pesquisa,
etc.
Um exemplo de plano amostra para a pesquisa na serra
do cipó.
28. Prof. Ricardo Tavares - UFOP 28
ALGUNS CONCEITOS
Seleção probabilística:
São procedimentos de seleção de amostras nas quais cada
unidade amostral tem associada uma probabilidade de
seleção diferente de zero;
As unidades amostrais (ou os elementos) não precisam ter
a mesma probabilidade de seleção, mas essas
probabilidades devem ser especificadas a priori;
Na amostragem probabilística é possível determinar
propriedades estatísticas dos estimadores usados para se
fazer inferências sobre a população referenciada bem
como a precisão das estimativas obtidas;
29. Prof. Ricardo Tavares - UFOP 29
ALGUNS CONCEITOS
Seleção probabilística:
Além disso, é possível se determinar o tamanho das
amostras a serem selecionadas da população por métodos
estatísticos;
A implementação da amostragem probabilística exige um
conhecimento maior da composição da população
referenciada;
Através da amostragem probabilística pode-se fazer
extensões de resultados para a população referenciada;
30. Prof. Ricardo Tavares - UFOP 30
ALGUNS CONCEITOS
Seleção não-probabilística:
São procedimentos de seleção nos quais as unidades
amostrais são escolhidas intencionalmente, ou até atingir-
se uma cota, ou de algum outro modo, com isso algumas
unidades amostrais tem probabilidade zero de seleção.
Esses procedimentos não permitem determinar as
propriedades estatísticas dos estimadores usados para se
fazer inferências sobre a população referenciada bem
como a precisão das estimativas obtidas.
31. Prof. Ricardo Tavares - UFOP 31
PRINCIPAIS CASOS DE AMOSTRAGEM
NÃO-PROBABILÍSTICA
• Inacessibilidade a toda população: quando o pesquisador não
tem acesso a toda população de estudo, somente uma parte
dela está disponível. Exemplo: população de usuários de
drogas de Belo Horizonte (não existe cadastro).
• Material contínuo: devido a característica da continuidade é
impossível realizar sorteio. Exemplo: Retirar amostras de
água em diferentes pontos de um rio para avaliar a poluição.
• Amostragem por quotas: Inclui unidades amostrais na
amostra segundo diversas características da população e nas
mesmas proporções que figuram na população.
Exemplo: idade, sexo, nível sócio-econômico, etc.
32. Prof. Ricardo Tavares - UFOP 32
PRINCIPAIS CASOS DE AMOSTRAGEM
NÃO-PROBABILÍSTICA
• Amostragem por julgamento (ou conveniência): Inclui na
amostra as unidades estatísticas que poderão proporcionar
uma representatividade da população, de acordo com a lógica,
senso comum ou um julgamento equilibrado.
• Amostragem por voluntário: Quando o indivíduo se apresenta
para fazer parte da amostra. É um método muito aplicado em
pesquisas médicas.
• A esmo (ou sem norma): O pesquisador procura ser aleatório
sem, no entanto, realizar propriamente o sorteio.
Exemplo: Misturar 10000 parafusos e retirar 100.
33. Prof. Ricardo Tavares - UFOP 33
ALGUNS CONCEITOS
Amostras com e sem reposição:
As amostras de uma população podem ser selecionadas
com e sem reposição.
Na amostragem sem reposição cada elemento amostral (ou
a unidade amostral) só poderá ser selecionado uma única
vez para composição da amostra.
Assim, é assegurado que todos os elementos (ou unidades)
de uma amostra de tamanho n são distintos (as).
34. Prof. Ricardo Tavares - UFOP 34
Amostras com e sem reposição:
Já na amostragem com reposição cada elemento (ou
unidade amostral) pode ser sorteado mais de uma vez e
logo, a amostra poderá conter vários elementos repetidos.
Do ponto de vista prático a amostragem sem reposição é
melhor pois é mais informativa. Por outro lado, a
amostragem com reposição tem vantagens matemáticas no
sentido que facilita a demonstração de algumas
propriedades de estimadores utilizados no procedimento
de inferência estatística.
Em populações grandes nas quais a probabilidade de se
observar o mesmo elemento populacional mais de uma vez
é muito pequena, o uso de amostragem com reposição é
satisfatório.
Em populações pequenas não é recomendável.
35. Prof. Ricardo Tavares - UFOP 35
Outros pontos importantes
Para que se possa fazer uma pesquisa por amostragem
com qualidade é necessário:
• Ter uma equipe de trabalho muito bem escolhida, treinada
e organizada;
• Ter manuais de instrução para o pessoal encarregado da
coleta de dados e supervisores preparados para resolver
situações inesperadas;
• Processamento de dados: escolher bem a forma de entrar
com os dados no sistema para não dificultar a análise
estatística posterior dos dados;
• Ter bons digitadores bem treinados, manual de digitação
com dicionários de variáveis e códigos de digitação;
• Os erros de digitação e a consistência dos dados precisam
ser verificados;
36. Prof. Ricardo Tavares - UFOP 36
Problema prático
Para estimar quantos livros na biblioteca precisam voltar
para o local certo, uma bibliotecária utiliza uma tabela de
números aleatórios para selecionar aleatoriamente 100
locais nas estantes da biblioteca. Em seguida, ela caminha
para cada local, olha para os livros que se encontram
naquele local, e registra se tais livros precisam ser
recolocados em sua estante correta ou não.
Nesse caso, quem são os itens abaixo:
População alvo:
Sistema de referência:
Unidade amostral:
Unidade de observação:
Possíveis fontes de vício: