Amostragem

1.824 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
1.824
No SlideShare
0
A partir de incorporações
0
Número de incorporações
162
Ações
Compartilhamentos
0
Downloads
43
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Amostragem

  1. 1. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 1 INTRODUÇÃO À AMOSTRAGEM NAS PESQUISAS SOCIAIS1 Hilma Tereza Tôrres Khoury21. A Lógica e a importância da amostragem. Por razões de ordem didática, este texto utiliza-se de uma forma bastante simplificadapara explicar a lógica da amostragem e a teoria da probabilidade. Assim, faz-se necessáriocomplementar esta leitura com outros textos (Babbie, 1999; Salkind, 2000). Amostra é uma porção ou parte de uma população. Quando os cientistas sociais queremsaber algo a respeito de uma população, em geral investigam uma amostra dela e supõem que osresultados encontrados na amostra representam o que acontece ou o que existe na população, ouseja, fazem inferências para a população a partir da amostra. Porém, pergunta-se: Porque estudaramostras e não a população? Estudar uma população pode demandar muito tempo e dinheiro. Geralmente os cientistassociais lidam com prazos e poucos recursos. Então, o mais viável mesmo é estudar uma amostrada população que se quer investigar. Mas, surge outra questão: Até que ponto seria seguro tirarconclusões para a população a partir da amostra? Babbie (1999) faz uma analogia das amostrasde sangue com amostras de população para mostrar que lidar com amostras de população é bemmais complexo. A composição do sangue é a mesma para todos os humanos. Assim, basta umpouco de sangue, de uma única pessoa, e já sabemos a composição do sangue humano. Contudo,pessoas que compõem uma população possuem características diferentes. Uns são homens,outros, mulheres; uns são mais velhos, outros, mais novos; uns possuem baixo nível sócio-econômico, outros, nível sócio-econômico elevado e assim por diante. Então, como ter certeza deque a amostra que selecionamos contém um pouco de tudo o que existe na população? Comogarantir que na amostra estejam representados todos os estratos existentes na população? Comogarantir que a amostra seja uma mini-população? Não há como ter certeza absoluta, mas, existe a1 Texto elaborado para subsidiar a disciplina Teoria e Prática de Pesquisa em Psicologia Social, ministrada pela autora para oCurso de Psicologia – Graduação - da Universidade Federal do Pará (UFPA).2 Psicóloga, Doutora em Psicologia, Professora Associada na Universidade Federal do Pará.
  2. 2. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 2probabilidade de estarmos mais ou menos certos. Tudo vai depender de como selecionamosnossa amostra. E é neste ponto que entra a teoria da probabilidade. A teoria da probabilidade se baseia na seguinte lógica: Suponhamos que retiramos,aleatoriamente, uma amostra de 400 pessoas de uma população de 20000, perguntamos arespeito da pena de morte, se concordam ou discordam; a proporção de concordância foi de 48%.Depois, retiramos mais três amostras de 400 pessoas da mesma população e a proporção deconcordância foi, respectivamente, de 51%, 52% e 48%. Se colocarmos estas estatísticas3 em umeixo de abscissas representando todos os possíveis valores do parâmetro4 populacional, ou seja,de 0% a 100%, e onde o ponto médio do eixo – 50% - representa a situação na qual metade dapopulação concorda com a pena de morte, teríamos o seguinte: Amostra 4 (48%) Amostra 2 (51%) Amostra 1 (48%) Amostra 3 (52%) . . . 0 50 100Figura 1. Porcentagem de pessoas que concordam com a pena de morte em quatro amostras “A regra básica da amostragem aleatória é que as amostras extraídas de uma populaçãofornecem estimativas do parâmetro relativo à população total” (Babbie, 1999, p.127). Assim,cada uma de nossas amostras aleatórias fornece uma estimativa da porcentagem de pessoas napopulação que concordam com a pena de morte. Contudo, temos três estimativas diferentes para3 O termo estatística se refere à descrição sumária de uma variável a partir dos dados de uma amostra. Por exemplo,a média da renda familiar mensal em uma amostra de estudantes universitários de uma determinada cidade.Estatísticas são utilizadas para fazer estimativas sobre parâmetros populacionais.4 O termo parâmetro se refere à descrição sumária de uma variável na população. Por exemplo, a média da rendafamiliar mensal na população de estudantes universitários de uma determinada cidade.
  3. 3. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 3a mesma população: 48%, 51% e 52%. Como saber qual destas estatísticas representacorretamente o parâmetro populacional? Se repetíssemos esse processo e retirássemos mais e mais amostras aleatórias de 400pessoas daquela população, iríamos descobrir que algumas novas amostras repetem estimativasdadas por amostras anteriores, ou seja, há várias amostras de 400 pessoas com 48% deconcordância e várias com 52% de concordância, além de várias com outros percentuais. Vamoscomplexificar a Figura 1 e acrescentar nela um eixo de ordenadas para representar o número deamostras que fornecem certas estimativas. Teríamos algo parecido com o seguinte: 95 49 51 75 47 49 52 55 55 46 49 51 52 35 40 45 47 48 51 52 55 60 15 0 50 100Figura 2. Porcentagem de pessoas que concordam com a pena de morte em muitas amostras A distribuição de todas as estatísticas obtidas em cada uma das n amostras de 400 pessoas(Figura 2) é chamada de distribuição amostral. Observe que temos proporções diferentes deconcordância com a pena de morte nessas amostras (embora muitas proporções se repitam).Portanto, continuamos com o mesmo problema para tentar adivinhar qual o parâmetro napopulação estudada. Qual dessas proporções representa o parâmetro existente na população? Sehá tanta variabilidade, como saber o parâmetro real? Na prática, o parâmetro é sempre desconhecido, mas a teoria da probabilidade traz umaluz para esta questão. Quando muitas amostras aleatórias são extraídas de uma mesma
  4. 4. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 4população, e em tamanho considerado suficientemente grande para ser representativa, asestatísticas fornecidas por estas amostras estarão distribuídas em torno do parâmetropopulacional de uma forma conhecida. Embora haja uma ampla faixa de estimativas, a maioriaestá mais próxima do ponto médio no eixo de abscissas (ver Figura 2). Portanto, o valor real doparâmetro populacional está próximo aos 50%, por isso se fala em distribuição normal padrão. Além disso, a teoria da probabilidade nos diz quão próximo ou quão distante asestatísticas das amostras se encontram do valor real, ou seja, o quanto elas se desviam do valorreal - margem de erro ou erro padrão (Babbie, 1999). O erro padrão é o desvio padrão, ou seja, éa proporção em que as estatísticas amostrais se desviam do padrão real existente na população. Ateoria da probabilidade indica que certas proporções das estimativas amostrais se encontramdentro de certas faixas de erros padrão especificados do parâmetro populacional (Figura 3). -3 -2 -1 0 1 2 3 68% 95% 99,9%Figura 3. Representação de faixas de desvio (desvio padrão) do parâmetro populacional em quea amostra se encontra
  5. 5. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 5 “Aproximadamente 34% das estimativas amostrais estão até um desvio padrão acima doparâmetro da população, e outros 34% até um desvio padrão abaixo do parâmetro” (Babbie,1999, p.128-129). Assim, 68% das amostras (34+34) terão estimativas dentro de mais ou menos5% do parâmetro. No nosso exemplo, portanto, 68% das amostras terão estimativas entre 50% e55% (um erro padrão acima) e entre 50% e 45% (um erro padrão abaixo). A teoria daprobabilidade indica também que “95% das amostras estarão dentro de (mais ou menos) doiserros padrão do valor verdadeiro, e 99,9% das amostras, dentro de (mais ou menos) três desviospadrão” (Babbie, 1999, p.129). Assim, no nosso exemplo, 95% das amostras terão estimativasentre 50% e 60% (dois erros padrão acima) e entre 50% e 40% (dois erros padrão abaixo). Para garantir que nossa amostra produza uma estatística o mais próxima possível dopadrão real existente na população é necessário duas coisas: 1) A amostra deve ser grande o suficiente para que se possa diminuir a distância em que asua estatística se encontra do valor real do parâmetro populacional, ou seja, reduzir o erroamostral; 2) A amostra deve ser selecionada de forma aleatória para que seja representativa davariabilidade que de fato existe na população. Quanto menor a população, maior a variabilidade entre os indivíduos que a compõem e,portanto, maior a necessidade de grandes amostras relativamente ao tamanho desta população.Existem tabelas (Tabela 1) com recomendações de tamanhos de amostras para certos tamanhosde população com dois níveis de precisão ou de margem de erro (Taylor-Powell, 1998). Além da relação entre tamanho da população e tamanho da amostra, ao decidir sobre otamanho da amostra que precisaremos em uma pesquisa temos sempre de avaliar o número desubgrupos que pretendemos analisar. Por exemplo, dois grupos de sexo (masculino e feminino),três grupos de nível sócio-econômico (baixo, médio e alto), dois grupos de status conjugal (comcompanheiro e sem companheiro). Isto porque “o número mágico de quantos participantesdeveriam estar em cada grupo é 30” (Salkind, 2000, p.96). Em geral você precisa de uma grande
  6. 6. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 6amostra para representar acuradamente uma população quando: o montante de variabilidadedentro dos grupos é maior, e a diferença entre os dois grupos é menor (Salkind, 2000).Tabela 1Tamanhos de amostra representativa conforme tamanhos de população. Tamanhos de população Tamanhos de Amostra Margem de Erro 5% 10%50 44100 81 51200 134 67500 222 831000 286 915000 370 9810000 385 9920000 392 10050000 397 100100000 398 100Fonte: Reprodução parcial de tabela contida em Taylor-Powell (1998, p. 10). O risco de estarmos errados dentro da margem de erro especificada é conhecido comonível de confiança. A teoria da probabilidade diz que 68% das amostras estarão dentro de umerro padrão do parâmetro. Então, podemos inferir que uma amostra aleatória tem umaprobabilidade de 68% de estar dentro desta faixa. Isto é o nível de confiança, ou seja, temos 68%de confiança de que a estatística de nossa amostra está dentro de um erro padrão do parâmetro.Ou, ainda, podemos ter 95% de confiança de que a estatística de nossa amostra estará dentro dedois erros padrão do parâmetro (Babbie, 1999). Se tivermos 95% de confiança,conseqüentemente, teremos 5% de chance de que nossa interpretação esteja errada e 95% dechance de que nossas conclusões reflitam de forma precisa o que acontece na população (Taylor-Powell, 1998). “Compreensivelmente, a confiança aumenta quanto mais se estende a margempara erro. Você está virtualmente certo (99,9% de confiança) que a estimativa da amostra estádentro de três erros padrão do valor verdadeiro” (Babbie, 1999, p.130).
  7. 7. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 72. Tipos de Amostragem Probabilística Não-Probabilística Providencia uma seleção randômica ou Em amostras não-probabilísticas, a aleatória. probabilidade de selecionar qualquer membro da população não é conhecida. Isto quer dizer que cada elemento tem a mesma chance de ser escolhido, ou uma Não há listas e, portanto, não há chance conhecida de ser selecionado de qualquer expectativa de que cada forma que seja possível fazer elemento tenha uma chance igual de ser estimativas confiáveis acerca da incluído na amostra. população total baseado nos resultados da amostra. Por exemplo, se há 4500 Em algumas circunstâncias a amostra estudantes em todas as escolas de probabilística pode ser impossível, ensino médio e se há 1000 concluintes, desnecessária ou mesmo não desejável: a probabilidade de selecionar um concluinte como parte da amostra é Você pode estar limitado apenas 1000/4500 ou 0,22 (Salkind, 2000). àqueles participantes que concordam em ser incluídos. Amostras aleatórias aumentam a probabilidade de que a informação Ou querer selecionar casos ricos em coletada seja representativa dos grupos informação, a partir dos quais possa de onde foi retirada (Taylor-Powell, aprender muito acerca dos assuntos 1998, p.3). importantes para o estudo. A seleção de uma amostra Ou ainda, querer aprofundar um probabilística requer uma moldura de assunto específico. amostragem - lista de elementos a partir dos quais é selecionada a amostra. Uma vez que a amostra não pretende representar a população, os achados não deveriam ser generalizados para o todo. 2.1. Tipos de Amostragem Probabilística 2.1.1. Aleatória Simples: Se você tem uma lista com 1000 pessoas e pretende selecionar 250,cada elemento da lista recebe um número e procede-se à seleção por meio de sorteio(http://www.random.org/integers/) ou da tabela de números aleatórios. 2.1.2. Sistemática: A partir da lista de 1000 pessoas, já numerada, escolhe-se 1 elemento acada 5 para inclusão na amostra, até completar 250. 2.1.3. Estratificada: Se na lista de 1000 pessoas existem 600 mulheres (60%) e 400 homens(40%), uma amostra estratificada, por exemplo, por sexo, deve ter a mesma proporção de
  8. 8. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 8homens e de mulheres existente na população. Deve-se providenciar a lista dos homens e a listadas mulheres. Então, para uma amostra de 250 pessoas, 150 devem ser mulheres (60%) e 100devem ser homens (40%). A estratificação visa aumentar o grau de representatividade, reduzindo o provável erroamostral, o qual diminui em função de dois fatores no desenho da amostra: o tamanho daamostra e a homogeneidade da população. A amostragem estratificada se baseia nesse segundofator. Em vez de selecionar a amostra da população total (heterogênea), retiram-se quantidadesapropriadas de elementos a partir de subconjuntos homogêneos da população (p.ex. turmas,gênero, faixas etárias, etc.). 2.1.4. Por Conglomerados em Múltiplas Etapas: É indicada quando a população de onde sepretende retirar a amostra não pode ser facilmente listada (p.ex. população de uma cidade,universitários do país). Nesse caso, amostram-se grupos de elementos (bairros, universidades) e,em seguida, escolhem-se unidades em cada conglomerado selecionado (ruas, cursos). Adesvantagem é que o erro amostral aumenta em cada etapa. 2.2. Tipos de Amostragem Não-Probabilística 2.2.1. Por Quotas: Parece com a estratificação, contudo, é utilizada quando não há listas disponíveis. Parte-se de uma matriz que descreve as características da população alvo, indicando a proporção de cada célula da matriz (moldura das cotas). Por exemplo, se do total de aposentados economicamente ativos no Brasil 65% são homens e 35% são mulheres, minha amostra de aposentados que trabalham, embora selecionada de forma não aleatória, deverá conter essa mesma proporção de homens e de mulheres. Colhem-se dados de pessoas com todas as características de uma dada célula na matriz. Este tipo de amostragem não- probabilística assegura algum grau de representatividade de todos os estratos existentes na população (Salkind, 2000), portanto, tem algum potencial de generalização.
  9. 9. Amostragem – Profª Drª Hilma Khoury-UFPA/IFCH/FAPSI Produzido em Maio/2006. 2ª. Revisão: Outubro/2010 9 2.2.2. Intencional ou por Julgamento: É utilizada em situações em que a natureza dos objetivos da pesquisa necessita ou se satisfaz com espécies de juízes selecionados. A seleção da amostra é baseada no conhecimento da população. Algumas vezes, você quer estudar um pequeno subconjunto de uma população maior, onde muitos membros do subconjunto são facilmente identificados, mas cuja enumeração total seria quase impossível. Por exemplo, estudar a liderança de um movimento de protesto estudantil; muitos dos líderes são facilmente visíveis, mas não é viável definir e amostrar todos eles. Ao estudar todos ou uma amostra dos líderes mais visíveis, você pode coletar dados suficientes para seus propósitos (Babbie, 1999, p. 153). 2.2.3. Conveniência: A amostra é selecionada conforme a disponibilidade ou acessibilidade às pessoas que compõem a população. “Pesquisadores universitários freqüentemente fazem surveys com estudantes matriculados em grandes salas de aula. A facilidade e baixo custo deste método explicam sua popularidade, mas estes surveys raramente produzem dados com algum valor genérico”(Babbie, 1999, p. 155). Este tipo de amostragem só se justifica mediante a dificuldade de uma seleção randômica ou de outras formas de amostragem não-probabilística, “jamais deve ser desculpa para a preguiça” (Babbie, 1999, p.155). ReferênciasBabbie, E. (1999). Métodos de Pesquisas de Survey. Belo Horizonte: UFMGSalkind, N. J. (2000). Exploring Research, 4ª ed. New Jersey: Prentice-Hall, 336pp.Taylor-Powell, E. (1998). Sampling: Program development and evaluation. Cooperative Extension Publications. University of Wisconsin, 10pp.

×