Curso de estatística básica

785 visualizações

Publicada em

Material para estudo de Estatística

Publicada em: Educação
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
785
No SlideShare
0
A partir de incorporações
0
Número de incorporações
15
Ações
Compartilhamentos
0
Downloads
26
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Curso de estatística básica

  1. 1. GIOVANI GLAUCIO DE OLIVEIRA COSTA Curso de Estatística Básica: Teoria e Prática 2ª Edição EDITORA ATLAS SÂO PAULO, 2013 1
  2. 2. Agradecimentos: À minha mãezinha querida, Oneida Barreto de Campos Costa; Aos meus irmãos amigos e companheiros André Luiz de Oliveira Costa e Andréa Viviane de Oliveira Costa; à minha afilhadinha e sobrinha amada Juliana Paula Costa Lima e a Editora Atlas pela confiança que depositou em meu trabalho. 2
  3. 3. Prefácio Este livro é o resultado de experiências vividas a partir de 1991, quando iniciei a minha vida acadêmica como docente de graduação das Faculdades Cândido Mendes em Campus do Goitacazes no Estado do Rio de Janeiro. A partir daí o material didático que utilizava para lecionar Estatística foi se aperfeiçoando com a prática adquirida em outras instituições de ensino superior, tais como a Universidade Salgado de Oliveira, a Universidade Federal do Rio de Janeiro, a Universidade da Cidade, a Universidade Federal Fluminense, dentre muitas outras, até terminar nos últimos quatro anos com a Universidade Federal Rural do Rio de Janeiro. Foi também testado em cursos de especialização e mestrado em economia e administração, sendo apresentado como texto para contemplar diversos programas. Essa soma de cursos e experiências mostrou que a melhor maneira de apresentar a matéria é a de expor os assuntos de maneira objetiva, prática e instrumental, onde os conceitos são contextualizados dentro da área de formação de cada curso ou estudante. Este recurso didático é importante porque motiva e impulsiona o gosto pela disciplina pelos estudantes. Procuro, na maioria dos casos, apresentarem os conceitos sucintamente de maneira a ser usado imediatamente na empresa ou em situações de pesquisas, sem grandes demonstrações matemáticas ou formalismos. Logo em seguida, os exemplifico através de “cases” práticos, reais em diversas áreas negócios, saúde e engenharias. São disponibilizados exercícios propostos no final de cada unidade. O presente livro se destina a cursos de estatística em nível básico ou introdutório em áreas predominantemente de ciências humanas e sociais. O seu conteúdo objetiva dar uma visão geral e instrumental de estatística descritiva e suas aplicações nestas áreas. Para tanto, versa sobre conceitos básicos de estatística, variáveis, noções de amostragem, fases do método estatístico, séries estatísticas, números relativos, gráficos estatísticos, estudo 3
  4. 4. das distribuições de frequências, números-índices e análise exploratória de dados(EAD). No final do livro, em anexos, são apresentados textos auxiliares que completam o entendimento e aplicação dos conceitos e exercícios: arredondamento de dados, normas de representação tabular e como construir uma distribuição de frequência por classes. As áreas e os cursos de aplicação deste livro são amplos e muito diversificados em cursos de estatística de nível básico, mas podemos destacar a adoção deste compêndio em disciplinas de estatística básica ou introdutória de cursos de Administração, Economia, Turismo, Educação, Saúde, e também em programas de pós-graduação especialização e mestrado, como nivelamento. Gostaria muito de contar com a ajuda de todos os leitores, alunos e colegas para avaliação crítica positiva deste texto, de modo que possamos evoluir em qualidade, superando os erros e aperfeiçoando os acertos. Será muito gratificante para mim se meu livro tiver sido de alguma forma útil para o leitor, nem que tenha sido em somente um parágrafo e/ou em somente uma página, mas espero de verdade que ele seja relevante em todo o seu conteúdo. Obrigado a todos e boa leitura. O autor. 4
  5. 5. Sumário Capítulo 1 : Conceitos Básicos de Estatística............................................... Fenômeno.......................................................................................................... Ciência............................................................................................................... Ciência Estatística............................................................................................. Fenômeno Coletivo ou de Massa...................................................................... População.......................................................................................................... Amostra.............................................................................................................. Levantamentos Estatísticos............................................................................... Censo................................................................................................................. Amostragem....................................................................................................... Razões para o Uso da Amostragem................................................................... Importância da Amostra...................................................................................... Divisão da Estatística......................................................................................... Estatística Descritiva.......................................................................................... Estatística Inferencial......................................................................................... Esquema Lógico de um Estudo Estatístico....................................................... Exercícios Propostos......................................................................................... Capítulo 2: Variáveis....................................................................................... Conceito de Variáveis........................................................................................ Tipos de Variáveis............................................................................................. Variáveis Qualitativas........................................................................................ Variável Qualitativa Nominal.............................................................................. Variável Qualitativa Ordinal............................................................................... Variáveis Quantitativas...................................................................................... Variável Quantitativa Discreta............................................................................ Variável Quantitativa Contínua.......................................................................... Resumo do Conceito de Variáveis..................................................................... 5
  6. 6. Exercícios Propostos......................................................................................... Capítulo 3: Noções de Amostragem............................................................. Conceitos de Amostragem................................................................................. Amostragens Probabilísticas............................................................................. Tipos de Amostragem Probabilística................................................................. Amostragem Aleatória Simples......................................................................... Amostragem Sistemática.................................................................................. Amostragem Estratificada.................................................................................. Amostragem por Conglomerados...................................................................... Amostragens Não-Probabilísticas...................................................................... Tipos de Amostragens Não-Probabilísticas....................................................... Inacessibilidade a Toda População................................................................... Amostragem a Esmo ou Sem Norma................................................................ População Formada de Material Contínuo........................................................ Amostragem Intencional.................................................................................... Amostragem por Voluntários............................................................................. Amostragem por Quotas.................................................................................... Tamanho de Amostras para Estimação de Proporções Populacionais em Pesquisas.......................................................................................................... População Finita e Infinita.................................................................................. Tamanho de Amostras em Amostragem Aleatória Simples.............................. Cálculo de Tamanho da Amostra Alternativo.................................................... Tamanho de Amostras em Amostragem Estratificada ou por Quotas............... Amostragem por Quotas Versus Amostragem Aleatória Estratificada.............. Exercícios Propostos......................................................................................... Capítulo 4: Fases do Método Estatístico...................................................... Método............................................................................................................... Método Estatístico............................................................................................. Fases do Método Estatístico.............................................................................. 6
  7. 7. Planejamento......................................................................................................... Necessidade(Relevância) da Pesquisa................................................................. Definição das Variáveis da Pesquisa..................................................................... Definição da Necessidade da Pesquisa com Trabalho de Campo........................ Pesquisa com Trabalho de Campo........................................................................ Projetos de Pesquisa............................................................................................. Coletas de Dados(Trabalho de Campo)................................................................ Fonte de Dados em Pesquisas.......................................................................... Tipos de Dados em Pesquisas.......................................................................... Sequência no Processo de Dados em Pesquisas............................................. Crítica de Dados................................................................................................ Apuração de Dados........................................................................................... Análise de Dados............................................................................................... Emissão do Relatório Final................................................................................ Comunicação dos Resultados........................................................................... Exercícios Propostos......................................................................................... Capítulo 5: Séries Estatísticas....................................................................... Conceitos de Séries Estatísticas....................................................................... Séries Temporais............................................................................................... Séries Geográficas............................................................................................ Séries Especificativas........................................................................................ Séries Mistas..................................................................................................... Distribuições de Freqüência.............................................................................. Exercícios Propostos......................................................................................... Capítulo 6– Números Relativos Dados Absolutos................................................................................................. Dados Relativos................................................................................................... Coeficientes.......................................................................................................... Taxas................................................................................................................... 7
  8. 8. Percentagens...................................................................................................... Índices.................................................................................................................. Exercícios Propostos............................................................................................. Capítulo 7: Gráficos Estatísticos.................................................................. Conceito de Gráficos Estatísticos...................................................................... Requisitos Fundamentais de um Gráfico........................................................... Finalidades dos Gráficos................................................................................... Tipos de Gráficos............................................................................................... Gráficos de Reclame......................................................................................... Tipos de Gráficos de Reclame........................................................................... Construção dos Gráficos................................................................................... Gráfico Linear ou de Linha................................................................................. Gráfico de Colunas............................................................................................ Gráfico de Barras............................................................................................... Gráfico de Setores ou “Pizza”............................................................................ Interpretação de Gráficos de Reclame.............................................................. Gráficos de Análise............................................................................................ Tipos de Gráficos de Análise............................................................................. Interpretação de Gráficos de Análise................................................................. Histograma......................................................................................................... Polígono de Frequência.................................................................................... Exercícios Propostos......................................................................................... Capítulo 8: Estudo das Distribuições de Freqüências............................... Conceitos de Medidas de Distribuições de Frequências................................... Medidas de Tendência Central.......................................................................... Medidas de Posição(Separatrizes).................................................................... Medidas de Dispersão..................................................................................... Medidas da Forma de uma Distribuição.......................................................... Exercícios Propostos....................................................................................... 8
  9. 9. Unidade 9: Números-Índices......................................................................... Conceitos de Números-Índices......................................................................... Números-Índices Simples ou Relativos............................................................ Relativos de Base Móvel(Elos Relativos)......................................................... Relativos de Base Fixa(Relativos em Cadeia).................................................. Número-Índice Agregado ou Número-Índice Composto................................... Número-Índice Agregativo Simples.................................................................. Número-Índice Agregativo Ponderado.............................................................. Construção de Índices de Preços.................................................................... Taxas de Inflação............................................................................................ Indicadores de Inflação................................................................................... Deflacionamento de Dados.............................................................................. Taxa Média de Crescimento Anual................................................................. Exercícios Propostos....................................................................................... Unidade 10: Análise Exploratória de Dados.................................................... Introdução........................................................................................................ Conceito............................................................................................................ Importância da AED......................................................................................... Gráfico de Caule-e-Folhas................................................................................. Gráfico de Extremos-e-Quartis ou Caixa-com-Bigodes.................................... Gráfico de Probabilidade(P-P)............................................................................ Gráfico de Ajustamento dos Resíduos.................................................................. Anexo : Textos Auxiliares................................................................................. Texto 1: Arredondamento de Dados..................................................................... Texto 2: Normas de Representação Tabular........................................................ Texto 3: Construção de Distribuições de Frequência com Intervalos de Classes Bibliografia........................................................................................................... 9
  10. 10. Unidade I Conceitos Básicos de Estatística Fenômeno: É tudo que pode ser percebido pelos sentidos ou pela consciência. Exemplos: Uma fruta que cai de uma árvore, uma pessoa que nasce, uma mistura de leite com café, a incidência de uma doença, o comportamento das pessoas numa loja, o consumo de certo produto, a oferta de certo produto, a demanda por certo produto, o lucro de uma empresa, o peso de uma criança ao nascer, etc. Ciência: É o conjunto orgânico de conhecimentos sobre os fenômenos e suas relações recíprocas. Ciência Estatística: A Estatística é a ciência que estuda um determinado tipo de fenômeno: os fenômenos coletivos ou de massa. È, então, o conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos ou de massa. 10
  11. 11. Fenômenos Coletivos ou de massa: São os que não possuem regularidade na observação de casos isolados, mas na massa de observações. Exemplo: Em geral, quando estudamos uma ou mais características de um conjunto de elementos, chamado população, estamos diante de um fenômeno coletivo ou de massa: as notas em matemática dos alunos de uma turma, o nível sócio econômico dos consumidores de um produto, renda dos brasileiros, lucro de empresas cariocas, gênero dos torcedores de um clube de futebol, oferta de certo produto por parte de empresas fornecedoras e nível de demanda de empréstimos consignados por servidores públicos. População: É o conjunto de elementos portadores de pelo menos uma característica comum de interesse para ser estudado estatisticamente. Exemplos:  Num estudo sobre satisfação por certo serviço, a população estatística é constituída por todos os consumidores deste serviço;  Num estudo sobre hábitos de fumar de certa cidade, a população será formada por todos os habitantes desta cidade;  Num estudo sobre conteúdo dos e-mails´s de sua caixa-postal, o conjunto de e-mails de sua caixa postal é uma população estatística.  Num estudo sobre a oferta de certo produto, a população alvo 11
  12. 12. pode ser constituída por estabelecimentos comerciais. Amostra: É um subconjunto finito da população, selecionada adequadamente para representá-la. Para que as conclusões sobre a população sejam fornecidas adequadamente pelas amostras é necessário que elas sejam representativas da população. Amostras representativas são aquelas que são verdadeiras miniaturas da população, isto é, têm todas as características da população, mas em menor escala. Para obtermos amostras representativas existem vários métodos de extração, mas os mais eficazes são aqueles em que os elementos que vão compor a amostra são selecionados por sorteio, aleatoriamente. Exemplos:  Num estudo sobre satisfação por certo serviço oferecido por uma empresa, a amostra é constituída por parte dos clientes (aqueles que utilizaram) deste serviço;  Num estudo sobre hábitos de fumar de clientes de um hotel, a amostra será formada por parte dos clientes desta empresa.  Num estudo sobre conteúdo dos e-mails´s de sua caixa-postal, a amostra será uma parte representativa do conjunto de e-mails de sua caixa postal. 12
  13. 13. Levantamentos Estatísticos: A Estatística possui dois tipos de levantamentos: Censo Amostragem Censo: Estudo de uma população com base em todos os seus elementos. Exemplo: No Brasil, o Instituto Brasileiro de Geografia e Estatística (IBGE) realizam, de dez em dez anos, o traço do perfil demográfico e sócio-econômico da população brasileira. O objetivo principal do levantamento é atualizar os dados estatísticos populacionais no intuito de orientar políticas e ações públicas com informações atualizadas sobre a população. 13
  14. 14. Outros Exemplos:  Quando estudamos características de banco de dados relacionais através do exame exaustivo de seus registros, estamos diante de um censo;  Quando estudamos o desempenho dos programas criados por diferentes analistas de sistemas de uma grande empresa, periciando todos os computadores alvo da pesquisa;  Quando estudamos os motivos de exclusões de perfis do facebook através da observação de todos os facebooks excluídos. Amostragem: É o estudo de uma população com base em uma parte representativa da mesma, isto é, com base numa amostra. Exemplos:  Quando estudamos características de banco de dados relacionais através do exame de uma parte representativa de seus registros, estamos diante de uma amostragem;  Quando estudamos o desempenho dos programas criados por diferentes analistas de sistemas de uma grande empresa, periciando uma amostra dos computadores alvo da pesquisa;  Quando estudamos os motivos de exclusões de perfis do facebook através da observação de amostra dos facebooks excluídos. 14
  15. 15. Razões para o Uso da Amostragem: o A população é infinita, ou considerada como tal, não podendo, portanto ser analisada na íntegra; o Custo excessivo do processo de recolha e tratamento dos dados, como resultado da grande dimensão da população ou da complexidade do processo de caracterização de todos os elementos da população; o Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo à obtenção de informação desatualizada; o As populações são dinâmicas, de onde resulta que os elementos ou objetos da população estão em constante renovação, de onde resulta a impossibilidade de analisar todos os elementos desta população; o Recolha de informação através de processos destrutivos (que, se aplicada exaustivamente, conduziria à completa destruição da população); o Inacessibilidade a alguns elementos da população, por diversas causas. Exemplos1 Como exemplo, temos o caso de uma fábrica de automóveis que, pelas questões apontadas acima, não efetua inspeção e ensaios em 100% dos itens que serão agregados ao automóvel, faz as verificações de qualidade e conformidade em momentos específicos durante a produção, seja no início, meio ou fim. Logo no início do processo produtivo, é efetuada uma inspeção(usando técnicas de amostragem) dos lotes de produtos recebidos. 15
  16. 16. Exemplo 2: Outro exemplo interessante do uso de técnicas de amostragem é o manejo sustentável de áreas florestais com fins extrativistas. Neste caso, numa floresta definem-se áreas de controle( a amostra), mede-se a densidade florestal destas áreas e extrapola-se o resultado para toda a mata. Pode-se assim conhecer com boa precisão o número de espécies vegetais encontradas e sua idade média, dentro outros aspectos. Importância da Amostra: Portanto, se a constituição da amostra obedecer a determinadas condições, a análise das características da amostra pode servir para se conhecer como se comporta a característica na população. Divisão da Estatística: A Estatística se divide em dois ramos: 16
  17. 17. Estatística Descritiva: É a parte da Estatística que tem o objetivo de descrever os dados observados, isto é: •Obtenção dos dados; •Redução dos dado;. •Representação dos dados. É atributo da Estatística Descritiva a obtenção de algumas informações como médias, proporções, dispersões, tendências, índices, taxas que resumem e representam os fenômenos observados. Isto encerra as atribuições da Estatística Descritiva. No caso de ter se optado pelo estudo estatístico com amostras, a Estatística estabelece técnicas para se afirmar se a estimativa obtida junto à amostra é de qualidade. Este é o objetivo da Estatística Inferencial. Estatística Inferencial: É a parte da Estatística que tem o objetivo de estabelecer técnicas de avaliar se a estimativa obtida junto à amostra é de qualidade, isto é, se está próxima do valor do parâmetro populacional. Portanto, é a técnica de tomar o parâmetro populacional pela estimativa, desde que ela seja de boa qualidade, isto é, significante. A estatística Inferencial tem o objetivo de estabelecer níveis de confiança para a tomada de decisão de associar uma estimativa amostral a um parâmetro populacional de interesse. 17
  18. 18. Exemplo 1: Suponha que tivéssemos interesse na renda média dos habitantes de uma cidade. Para investigar o seu valor, optou-se por um estudo por amostragem. Na amostra colhida, verificou-se uma estimativa de R$ 800,00 para a renda dos habitantes da cidade. Com base nesta estimativa, o que se pode dizer do parâmetro populacional correspondente? Exemplo 2: Suponha que tivéssemos interesse no salário médio dos funcionários de uma empresa. Para investigar o seu valor optou-se por um estudo por amostragem. Na amostra colhida, verificou-se uma estimativa para o salário dos funcionários da empresa R$ 2000,00. Este valor é significante? Está próximo do valor do salário de toda a população? É válido como parâmetro populacional? Ou é fruto de erro amostral? Exemplo 3: Suponha que tivéssemos colhido uma amostra de 50 contracheques de um total de 2000 funcionários de uma empresa, e obtivéssemos a porcentagem de pessoas que tiveram descontos por falta ou atrasos num mês considerado. É função da Estatística Inferencial verificar se este resultado encontrado em 50 trabalhadores para os 2000 é de boa qualidade, isto é, é significante. 18
  19. 19. Esquema Síntese de um Estudo Estatístico: População Amostra Estatística Descritiva Inferência Estatística Nesta figura, temos uma população da qual é retirada uma amostra. Vê- se a Estatística Descritiva sendo aplicada para descrever e resumir o que ocorre na população ou na amostra. Quando a Estatística resume populações, ela faz Amostragem. Quando resume características, faz Estatística Descritiva e quando a(s) descritiva(s) está(ão) num contexto de amostragem, é(são) gerada(s) estimativa(s). Esta(s) estimativa(s) deve(em) ser avaliada(s) quanto à sua qualidade de estimação, aonde são feitos os Testes de Significância. Portanto, a amostragem resume populações e a Estatística Descritiva resume características, gerando quase sempre estimativas. Para você ter uma visão global das etapas envolvidas em um estudo estatístico observe atentamente o esquema a seguir: 19
  20. 20. Esquema Lógico de um Estudo Estatístico: ALVO POPULAÇÃO ESTATÍSTICAS DESCRITIVAS: PARÂMETROS AMOSTRA ALEATÓRIA CÁLCULO DE ESTIMATIVAS DE PARÂMETROS CÁLCULO DAS PROBABILIDADES ESTATÍSTICA INFERENCIAL: TESTES DE SIGNIFICÂNCIA TOMADA DE DECISÃO 20
  21. 21. Conclusão: Este esquema mostra que o estudo estatístico se inicia na população, passa pelas etapas amostragem, geração de estimativas, testes de significância, e, é finalizado na tomada de decisão em uma contexto de incerteza, mas que foi devidamente embasada pela metodologia estatística, envolvida na análise, fato que irá lhe assegurar maior credibilidade. Testes de significância são aqueles nos informam, com certa segurança, se a estimativa gerada por uma amostra particular é ou não é fruto de um erro de amostragem muito grande, orientando o pesquisador na decisão de tomar o valor do parâmetro populacional por esta estatística disponível. 21
  22. 22. Exercícios Propostos Responda às questões abaixo: 1. O que é Ciência? 2. O que é Estatística? 3. Explique o que você entende pôr população e amostra? 4. Qual o objetivo da Estatística Descritiva? 5. Qual o objetivo da Estatística Inferencial? Dê exemplos práticos. 6. O que você entende por censo? 7. O que você entende por amostragem? 8. Para que as conclusões sejam válidas, como devem ser as amostras? 9. Para que as amostras sejam representativas da população em estudo, como devem se extraídos os seus elementos? 10. Explique o esquema lógico de um estudo estatístico. 22
  23. 23. Unidade II Variáveis Conceito de Variável: É uma característica de interesse que associamos à população para ser estudada estatisticamente. Exemplos: Altura, idade, estado-civil e salário de entrevistados em uma pesquisa. Tipos de Variáveis: As variáveis podem ser de dois tipos: Qualitativas e Quantitativas Variáveis Qualitativas Apresentam como possíveis resultados uma qualidade (ou atributo) do elemento pesquisado. Exemplos: Sexo, cor, aparência, status social, etc. As variáveis qualitativas se classificam em nominais e ordinais. 23
  24. 24. Variável Qualitativa Nominal: Não existe nenhuma ordenação possível nas realizações das categorias. Exemplos: Sexo, cor, estado-civil, nacionalidade, etc. Variável Qualitativa Ordinal: Existe certa ordem ou hierarquia entre as realizações de cada variável. Exemplos: o Nível de instrução: superior > médio > fundamental o Nível Sócio-Econômico: classe alta > classe média > classe baixa Outras: Cargo ocupado por funcionários em uma empresa, posto no serviço militar, classificação de candidatos no serviço público. Variáveis Quantitativas São aquelas em que as possíveis realizações são valores numéricos. Exemplos: Idade, estatura e peso corporal. As variáveis quantitativas se classificam em discreta e contínua. 24
  25. 25. Variável Quantitativa Discreta: São aquelas que resultam de contagens. Só podem assumir valores inteiros. Exemplos: Número de filhos de um paciente, salário, número de acidentes numa via expressa, número de atendimentos em um posto de saúde, etc. Variável Quantitativa Contínua: São aquelas que resultam de medição. Não são necessariamente inteiras, dependem da precisão adotada e do instrumento de medida. 25
  26. 26. Exemplos: Idade (tempo de vida), quilômetros rodados de um automóvel, estatura e peso corporal dos entrevistados em uma pesquisa de satisfação com produtos da linha light. Resumo do Conceito de Variáveis: Nominal Qualitativas Ordinal Variáveis Discreta Quantitativas Contínua 26
  27. 27. Exercícios Propostos Classifique as variáveis abaixo: 1. Cor dos olhos dos candidatos a modelos de uma agência. 2. Número de filhos de casais residentes em uma cidade. 3. Causas de acidentes de trabalho de funcionários de uma fábrica. 4. Salários de funcionários de uma empresa. 5. Renda de clientes de um banco. 6. Classificação num concurso público. 7. Nota atribuída por parte de donas de casa à satisfação com certo eletrodoméstico de 0 a 5. 8. Peso de candidatos num concurso na área militar. 9. Estabelecimentos de saúde, públicos e particulares. 10. Estado-civil de entrevistados em uma pesquisa de opinião. 27
  28. 28. Unidade III Noções de Amostragem Conceitos de Amostragem: oAmostragem é o processo de retirada de amostras; oÉ o estudo de uma população com base em uma amostra representativa; o Amostra é uma parte da população, retirada segundo uma regra conveniente; o Existem vários tipos de amostragem, ou melhor, várias regras para seleção de amostras; o O pressuposto básico para que se utilize uma determinada regra de amostragem é que ela gere amostras representativas, isto é, com todas as características básicas e importantes do universo: que seja uma verdadeira miniatura da população; o Apresentaremos as principais regras para a retirada de uma amostra; o As regras de amostragem podem ser classificadas em duas categorias gerais: probabilísticas e não- probabilísticas. Amostragens Probabilísticas: São amostragens em que a seleção é aleatória de tal forma que cada elemento da população tenha uma chance real de fazer parte da amostra. Assim: se N define o tamanho da população e se todos os elementos da população possuem igual probabilidade, teremos que 1/N é a probabilidade de cada elemento participar da amostra. 28
  29. 29. Tipos de Amostragens Probabilísticas: oAmostragem aleatória simples oAmostragem sistemática oAmostragem estratificada oAmostragem por conglomerados Amostragem Aleatória Simples: Também conhecida por amostragem ocasional, causal, randômica etc. A amostragem aleatória simples destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, não soantes de ser iniciado, como até completar-se o processo de coleta. Eis o procedimento para seu uso: 1o . Devemos numerar todos os elementos da população. Se, por exemplo, nossa população tem 5000 elementos, devemos numerá-los de 1 a 5000 ou, como acontece geralmente, usamos um número que identifica o elemento. 2o . Devemos efetuar sucessivos sorteios com ou sem reposição até completar o tamanho da amostra (n). Para realizar o sorteio de forma aleatória sugere-se o uso da planilha eletrônica Excel, utilizando a função “ aleatório” ou em análise de dados a opção “amostragem”. O processo termina quando for sorteado o último elemento “n”. 29
  30. 30. Amostragem Sistemática Trata-se de uma variação da amostragem simples, muito conveniente quando a população está naturalmente ordenada, como fichas em um fichário, listas telefônicas, clientes de uma empresa registrados em um banco de dados etc. Procedimento: Se N o tamanho da população e n o tamanho da amostra. Então, calcula-se o intervalo de amostragem N/n ou o inteiro mais próximo de “I”. Sorteia-se, utilizando-se algum dispositivo aleatório qualquer (geração de números aleatórios no Excel ou a tabela de números aleatórios) um número x entre 1 e “I” formando-se amostra dos elementos correspondentes aos números: x; x+I; x+2I; ... ; x+ (n-1)I. Exemplo: Seja N = 500 e n = 50. Então, 500/50 = 10 ou I = 10 Sorteia-se um número de 1 a 10. Seja 3, (x = 3) o número sorteado. Logo, os elementos numerados por 3; 13; 23; 33; ... Amostragem Estratificada No caso de população heterogênea, na qual podemos distinguir subpopulações mais ou menos homogêneas, denominadas estratos, podemos usar a amostragem estratificada. Estratificar uma população é dividi-la em L subpopulações denominadas estratos, tais que N1 + N2 + ... +NL = N, onde os estratos são mutuamente exclusivos. Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada subpopulação. 30
  31. 31. Se as diversas subamostras tiverem tamanhos proporcionais ao respectivos número de elementos no estrato, teremos a estratificação proporcional. Amostragem por Conglomerados: Quando a população apresenta uma subdivisão em pequenos grupos não necessariamente homogêneos, mas fisicamente próximos, podemos chamar cada grupo de elementos fisicamente próximos de conglomerados e realizar a amostragem por conglomerados. Pode-se fazer a amostragem por conglomerados, a qual consiste em sortear um número suficiente de conglomerados, cujos elementos constituirão a amostra. As unidades de amostragem sobre as quais é feito o sorteio passam a ser o s conglomerados e não mais os elementos individuais da população. Esse tipo de amostragem é às vezes adotado por motivos de ordem prática e econômica, ou mesmo por razões de viabilidade: não é possível se obter uma listagem da população numerada para realizar um sorteio, mas é relativamente fácil se conseguir a listagem de conglomerados. Exemplo: Numa pesquisa consumo de certo produto, é mais fácil se ter a listagem de bairros onde o produto é consumido do que de todos os consumidores propriamente ditos. Então, sorteiam-se os bairros(conglomerados) e os consumidores localizados nestes bairros formariam a amostra em um primeiro estágio. 31
  32. 32. Exemplos de Conglomerados: Quando se pretende pesquisar a avaliação de alunos de uma faculdade quanto ao desempenho dos professores, pode-se considerar cada turma da faculdade como um conglomerado e realizar o sorteio de certo número de turmas, cujos alunos componentes constituirão amostra. Em algumas situações, podemos identificar um grupo de elementos que tenha aproximadamente a mesma composição da população. Neste caso pode ser interessante realizar a amostragem somente com os elementos desse grupo. Outro Exemplo: Algumas empresas, quando pretendem avaliar a aceitação de um produto no eixo Rio- São Paulo, lançam o produto em Curitiba, cuja população se comporta como uma miniatura do mercado eixo Rio- São Paulo. 32
  33. 33. Amostragens Não-probabilísticas: São amostragens em que há uma escolha deliberada dos elementos da amostra. As amostras não-probabilísticas não asseguram naturalmente e necessariamente que amostra gerada seja representativa da população, uma vez que podem ter elementos da população que não tenham chance real de fazerem parte da amostra . Isto coloca em discussão a sua confiabilidade. As amostras não-probabilísticas são, muitas vezes, empregadas em trabalhos estatísticos, por simplicidade ou por impossibilidade de se obterem amostras probabilísticas como seria desejável. Como em muitos casos, os efeitos da utilização de uma amostragem não-probabilísticas podem ser considerados equivalentes aos de uma amostragem probabilística : os processos não-probabilísticos de amostragem têm também sua importância. Sua utilização, entretanto, deve ser feita com reservas e com a convicção de que não introduzam tendências. Tipos de Amostragens Não-Probabilísticas: o Inacessibilidade a toda a população o Amostragem a esmo ou sem norma o População formada por material contínuo o Amostragens intencionais o Amostragens por voluntários o Amostragem por quotas Inacessibilidade a Toda a População Esta situação ocorre com muita freqüência na prática. Ocorre quando somos obrigados a colher a amostra na parte da 33
  34. 34. população que nos é acessível. Surge, portanto, uma distinção entre população-objeto e população amostrada. População-objeto é aquela que temos em mente ao realizar o trabalho estatístico. População amostrada é aquela que está acessível para que a amostra seja selecionada. Se as características da variável de interesse forem às mesmas na população-objeto e na população amostrada, então esse tipo de amostragem equivalerá a uma probabilística. Uma situação muito comum em que ficamos diante da inacessibilidade a toda a população é o caso em que parte da população não tem existência real, isto é, é hipotética. Exemplo: Seja uma pesquisa em que a população alvo é constituída por todas as peças produzidas por certa máquina. Mesmo estando à máquina em perfeito funcionamento, existe uma parte da população que é formada por peças que ainda vão ser produzidas. Se nos interessa a população de todos os portadores de febre tifóide, estaremos diante de um caso semelhante. Em geral, estudos realizados com base nos elementos da população amostrada terão, na verdade, seu interesse de aplicação voltado para os elementos restantes da população-objeto. Esse fato realça a importância de se estar convencido de que as duas populações podem ser consideradas como tendo as mesmas características. O presente caso de amostragem não-probabilística pode ocorrer também quando, embora se tenha a possibilidade de atingir toda a população, retiramos a amostra de uma parte que seja prontamente acessível. 34
  35. 35. Exemplo: Se fôssemos recolher uma amostra de um monte de minério, poderíamos por simplificação retirar a amostra de uma camada próxima da superfície, pois o acesso as porções interiores seria problemático. Amostragem a Esmo ou Sem Norma: É a amostragem em que o amostrador, para simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o sorteio , usando algum dispositivo aleatório confiável. Exemplo: Se desejarmos retirar uma amostra de 100 parafusos de uma caixa contendo 10.000, evidentemente não faremos uma amostragem aleatória simples, pois seria extremamente trabalhosa, mas procederemos à retirada simplesmente a esmo. Os resultados da amostragem a esmo são, em geral, equivalentes aos de uma amostragem probabilística, se a população é homogênea e se não existe a possibilidade de o amostrador ser inconscientemente influenciado por alguma característica dos elementos da população. População Formada por Material Contínuo: Nesse caso, é impossível realizar amostragem probabilística devido à impraticabilidade de um sorteio rigoroso: se a população for líquida ou gasosa. O que se costuma a fazer é homogeneizar e retirar a amostra a esmo. Tal procedimento pode, às vezes, ser usada no caso de material sólido. Outro procedimento que pode ser empregada nesses casos, especialmente quando a homogeneização não seja praticável, é a 35
  36. 36. enquartação, que consiste em subdividir a população em diversas partes (a origem do nome pressupõe a divisão em quatro partes), sorteando-se uma ou mais delas para constituir a amostra ou para delas retirar a amostra a esmo. Amostragem Intencional: Enquadram-se aqui os diversos casos em que o amostrador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos da população. Na amostragem intencional, o pesquisador simplesmente inclui os sujeitos convenientes na amostra, dela excluindo os inconvenientes. O perigo desse tipo de amostragem é obviamente grande, pois o amostrador pode facilmente se equivocar em seu pré-julgamento. Apesar disso, o uso de amostragens intencionais, ou parcialmente intencionais, é bastante freqüente, ocorrendo em vários tipos de situações reais. Exemplo: O editor de uma “revista gay” pede aos seus leitores que respondam perguntas sobre seu comportamento geral e opiniões para avaliar seu perfil e estilo de vida. Amostragem por Voluntários: Ocorre quando o componente da população se oferece voluntariamente para participar da amostra independente do julgamento do pesquisador. Exemplo: Ocorre, por exemplo, no caso da pesquisa experimental de uma nova droga em que pacientes são solicitados, havendo concordância, a servirem de 36
  37. 37. “sujeitos” para a verificação da eficácia do novo medicamento. Os que se interessarem se apresentarão voluntariamente ao pesquisador. Amostragem por Quotas: É a mais usada e conhecida amostragem não-probabilística. Muito praticada no Brasil, sobretudo em pesquisas de mercado e de intenção de voto. Na amostragem, por quota, diversas características de uma população, tais como sexo, classe social ou etnia são amostradas nas mesmas proporções em que figuram na população. Suponham, por exemplo, que tivéssemos de extrair uma amostra, por quota, da população de alunos de uma dada universidade, onde 42% fossem mulheres e 58% homens. Usando este método, os entrevistadores recebem a incumbência de localizar uma quota de estudantes de tal forma que somente 42% da amostra consista de mulheres e 58% de homens. As mesmas porcentagens que figuram na população são reproduzidas na amostra. Se o tamanho global da amostra fosse 200, então 84 moças e 116 rapazes deveriam ser selecionados. As amostras por quotas são usadas em certos tipos de pesquisa de mercado e opinião pública, porém as inferências feitas nessas condições não permitem a probabilidade do erro de amostragem. Tamanho de Amostras para Estimação de Proporções Populacionais em Pesquisas: É o número mínimo de casos a ser amostrados, escolhidos preferencialmente aleatoriamente, para garantir certa segurança estatística em relação à representatividade dos dados na estimação de proporções em pesquisas. O tamanho de uma amostra deve alcançar determinadas dimensões mínimas, estabelecidas estatisticamente. As necessidades práticas de tempo, custos, etc. Recomenda-se não ultrapassar o tamanho mínimo determinado pela estatística. 37
  38. 38. Portanto, é necessário conhecer a forma de calcular o tamanho da amostra, não só para garantir a possibilidade de generalizar os resultados, mas também pelos aspectos práticos mencionados. O tamanho da amostra depende dos seguintes fatores: o Tamanho da população do universo o Nível de confiança estabelecido o Erro de amostragem permitido o Proporção de uma quota característica importante do universo População Finita e População Infinita Segundo o tamanho da população, o universo divide-se em finito e infinito. Consideram-se universos finitos(limitados) aqueles que não ultrapassam às 100.000 unidades(pessoas, alunos, estabelecimentos educacionais, empresas, países etc.). Universos infinitos são aqueles que ultrapassam essa quantidade. Tal distinção é importante para determinar o tamanho da amostra, pois as fórmulas são diferentes. No caso do universo infinito, supõe-se que o seu tamanho da população não influi na fórmula a aplicar. O universo finito depende do número de unidades da população. Neste curso, apresentam-se as fórmulas mais simples, para amostras aleatórias simples e amostras estratificadas. 38
  39. 39. Tamanho de Amostras em Amostragem Aleatória Simples: Exemplo 1: Numa pesquisa sobre as atitudes dos estudantes das universidades paulistas em relação às suas expectativas sexuais pré-matrimoniais, qual é o tamanho de uma amostra representativa, com um nível de confiança de 99% e um erro permitido de 4%? Convém utilizar a fórmula para universos infinitos, pois as universidades de São Paulo têm mais de 100.000 alunos. Portanto, o tamanho da população não influi no cálculo desta amostra. n = (Z2 . P . Q)/E2 Onde: n = tamanho da amostra Z = escore da curva normal que é função do nível de confiança escolhido. Na tabela abaixo, apresentamos valores de Z, retirados da curva normal, em função do nível de confiança arbitrado: Confiança (%) Z 68 1,00 90 1,65 95 2,00 99 3,00 O objetivo do pesquisador é estimar a proporção populacional π. Como se não conhece π, deve-se obter uma amostra piloto( n´ ) e nela estimar π pela freqüência relativa amostral P. 39
  40. 40. Se n < n´ → a amostra piloto já foi suficiente. Portanto: P é a estimativa de uma proporção populacional de interesse( que se quer estimar) obtida numa amostra piloto de n´ elementos. Se concluir-se que n < n´, a amostra piloto já terá sido suficiente para a estimação da proporção de interesse P. Quando não se dispuser da estimativa de P, pode-se supor que ela seja 50% na população, o caso mais desfavorável na estimação, pois é aquela em que se trabalha com o tamanho máximo de amostra. É lógico, se a estimativa da proporção da característica pesquisada fosse outro, seria necessário um menor número de casos. Q = 100 – P. Exemplo: A proporção P de alfabetizados na amostra piloto é igual a 40%, tem-se Q = 100- 40 = 60% . E = erro de amostragem, em termos percentuais, definido da seguinte forma: E = | π - P | , Onde: π = proporção de uma característica populacional que se deseja estimar P = estimativa da proporção π obtida junto a uma amostra piloto No exemplo: 40
  41. 41. Para uma confiança de 99%, Z = 3 n = (32 . 50 . 50) / 42 = 1406,25 = 1406 estudantes. Assim, o resultado obtido significa que o tamanho da amostra deve ser pelo menos 1406 estudantes, para oferecer segurança de probabilidade de 99% de resultados válidos para o universo e de 4% de erro admitido. Exemplo 2: Suponha-se que a pesquisa sobre as atitudes dos estudantes universitários seja realizada na Paraíba, onde os resultados não passam de 50.000. Além disso, o pesquisador quer trabalhar apenas com um nível de confiança de 95% e um erro de amostragem de 4%. Qual é o tamanho da amostra, com essas exigências? Considerando que o universo é menor que 100.000 estudantes, utiliza-se a fórmula para universos finitos: n = [Z2 . P . Q . N] / [E2 . (N – 1) + Z2 . P .Q] Onde N é o tamanho da população. Cálculo: Para uma confiança de 95%, Z = 2 n = [22 . 50 . 50 . 50.000] / [16 . (50.000 – 1) + 22 . 50 .50] = 617,3 = 617 estudantes. 41
  42. 42. Exemplo 3: Numa pesquisa de mercado bem conduzida, 57 das 150 pessoas entrevistadas afirmaram que seriam compradoras de certo produto a ser lançado. Essa amostra é suficiente para estimar a proporção real de futuros compradores, com uma precisão de 0,08 e confiança de 95%? Tem-se P= 57/150 = 0,38 22 . 0,38.0,62 n = ──────────── = 0,9424 / 0,0064 = 147 pessoas ( 0,08)2 Como n´= 150 > n=147, conclui-se que a amostra piloto é suficiente. Exemplo 4: Qual o tamanho da amostra suficiente para se estimar a proporção de defeituosas fornecida por uma máquina, com precisão de 0,02 e 95% de confiança, sabendo que essa proporção seguramente não é superior a 20%? 22 . 0,20.0,80 n = ──────────── = 0,64 / 0,0004 = 1600 elementos ( 0,02)2 42
  43. 43. Cálculo do Tamanho da Amostra Alternativo: 1 n0 = ────── E2 N. n0 n = ────── N+n0 Onde: N = tamanho da população E = erro amostral tolerável n0 = primeira aproximação do tamanho da amostra n = tamanho da amostra Exemplo 1: Num estudo sobre pesquisa de orçamento familiar, temos N = 200 famílias e E = erro amostral tolerável = 4% (E = 0,04) n0 = 1/(0,04)2 = 625 famílias n (tamanho da amostra corrigido) = n = 200x625/200+625 = 125000/825 = 152 famílias E se a população fosse de 200.000 famílias? n = (200.000)x625/(200.000 +625) = 623 famílias 43
  44. 44. Observação: Observe=se que se N é muito grande, não é necessário considerar o tamanho exato N da população. Nesse caso, o cálculo da primeira aproximação já é suficiente para o cálculo: 1 n = n0 = ────── E2 O tamanho da amostra deve ser tomado como um percentual do tamanho da população? Observe que: N = 200 famílias, E0 = 4% n = 152 famílias →76% da população Observe que: N = 200.000 famílias, E0 = 4% n = 623 famílias → 0,3% da população Logo, é errôneo pensar que o tamanho da amostra deve ser tomado como um percentual do tamanho da população para ser representativa. O cálculo do tamanho de amostra que acabamos de estudar independe do nível de confiança e do valor da proporção P. Quando usamos este recurso estamos adotando sempre um nível de confiança de 95% e a proporção P= 50%. 44
  45. 45. Tamanho de Amostras em Amostragem Estratificada ou por Quotas: As amostras estratificadas apresentam um problema especial na determinação de seu tamanho. O número de casos de amostra global pode ser calculado utilizando-se fórmulas já analisadas, mas deve-se, também, calcular o tamanho de cada estrato dos grupos. É a condição básica desse tipo de amostra que deve representar, o mais exatamente possível, os estratos, segundo sua proporção na população. A forma mais simples de calcular o tamanho da amostra, as respectivas percentagens que cada estrato representa na população. Isso permite determinar o número de casos a ser distribuído em cada um deles. Exemplo 1: Um pesquisador realiza um estudo sobre a imagem que empresários americanos têm das condições políticas e econômicas de uma cidade que pretendem expandir seus negócios. De acordo com as informações em poder do pesquisador, esse tipo de comportamento varia muito de acordo com a área dos empresários. Portanto, o pesquisador está interessado em levantar tal imagem estratificando os empresários por área de atuação. Na época da pesquisa a cidade alvo da expansão tinha 10.000 empresários, o nível de confiança corresponde a 95% e o erro de amostragem permitido é de 4%. De acordo com a informação disponível, os empresários distribuem-se nas seguintes áreas: 45
  46. 46. Base da Amostra: Áreas Estratos Populacionais Construção Civil 1000 Financeira 2000 Alimentação 3000 Comércio 4000 Total 10.000 1o ) Determinação do tamanho proporcional dos estratos: Áreas Cálculos Estratos Amostrais Construção Civil 1000/10000 10% Financeira 2000/10000 20% Alimentação 3000/10000 30% Comércio 4000/10000 40% Total ─── 100% 2o ) Tamanho Global da amostra: n = [22 . 50 . 50 . 10.000] / [16 . (9.999) + 22 . 50 .50] = 588 46
  47. 47. 3o ) Número de casos em cada estrato amostral: Áreas Cálculos Estratos Amostrais Construção Civil 10% de 588 59 Financeira 20% de 588 118 Alimentação 30% de 588 176 Comércio 40% de 588 235 Total ─── 588 Exemplo 2: Analistas de um site de relacionamento estão planejando realizar uma pesquisa junto aos seus clientes para descobrir suas expectativas futuras para o amor. A pesquisa envolverá uma amostra por quota de clientes que estejam on line durante um período de 3 meses. Os analistas acreditam que aspectos como gênero, estado-civil, aparência e faixa-etária sejam essências para manter a representatividade da amostra e assegurar a precisão das estimativas. A pesquisa terá 5% de erro de amostragem para mais ou para menos. Informações prévias do perfil da população quanto às variáveis importantes para a representatividade se encontra abaixo: Sexo: masculino e feminino Estado-civil: solteiro, casado, viúvo e divorciado Aparência: boa aparência e má aparência Faixa-etária: jovem, adulto e idoso 47
  48. 48. Dados Populacionais com os Números Absolutos Referentes às Variáveis Escolhidas Categorias População Masculino solteiro boa aparência jovem 340 Masculino solteiro boa aparência adulto 445 Masculino solteiro boa aparência idoso 175 Masculino solteiro má aparência jovem 310 Masculino solteiro má aparência adulto 470 Masculino solteiro má aparência idoso 150 Masculino casado boa aparência jovem 100 Masculino casado boa aparência adulto 115 Masculino casado boa aparência idoso 65 Masculino casado má aparência jovem 160 Masculino casado má aparência adulto 200 Masculino casado má aparência idoso 250 Masculino viúvo boa aparência jovem 260 Masculino viúvo boa aparência adulto 295 Masculino viúvo boa aparência idoso 90 Masculino viúvo má aparência jovem 150 Masculino viúvo má aparência adulto 175 Masculino viúvo má aparência idoso 135 Masculino divorciado boa aparência jovem 335 Masculino divorciado boa aparência adulto 340 Masculino divorciado boa aparência idoso 115 Masculino divorciado má aparência jovem 500 Masculino divorciado má aparência adulto 525 Masculino divorciado má aparência idoso 300 48
  49. 49. Continuação.... Categorias População Feminino solteiro boa aparência jovem 350 Feminino solteiro boa aparência adulto 395 Feminino solteiro boa aparência idoso 75 Feminino solteiro má aparência jovem 410 Feminino solteiro má aparência adulto 52 Feminino solteiro má aparência idoso 200 Feminino casado boa aparência jovem 100 Feminino casado boa aparência adulto 52 Feminino casado boa aparência idoso 65 Feminino casado má aparência jovem 160 Feminino casado má aparência adulto 46 Feminino casado má aparência idoso 250 Feminino viúvo boa aparência jovem 300 Feminino viúvo boa aparência adulto 400 Feminino viúvo boa aparência idoso 295 Feminino viúvo má aparência jovem 140 Feminino viúvo má aparência adulto 175 Feminino viúvo má aparência idoso 140 Feminino divorciado boa aparência jovem 335 Feminino divorciado boa aparência adulto 350 Feminino divorciado boa aparência idoso 310 Feminino divorciado má aparência jovem 650 Feminino divorciado má aparência adulto 450 Feminino divorciado má aparência idoso 300 Total 12000 Realize o “desenho de uma amostra por quotas” Cálculo das Proporções das Variáveis para a População 49
  50. 50. Categorias % Masculino solteiro boa aparência jovem 2,8 Masculino solteiro boa aparência adulto 3,7 Masculino solteiro boa aparência idoso 1,5 Masculino solteiro má aparência jovem 2,6 Masculino solteiro má aparência adulto 3,9 Masculino solteiro má aparência idoso 1,3 Masculino casado boa aparência jovem 0,8 Masculino casado boa aparência adulto 1,0 Masculino casado boa aparência idoso 0,5 Masculino casado má aparência jovem 1,3 Masculino casado má aparência adulto 1,7 Masculino casado má aparência idoso 2,1 Masculino viúvo boa aparência jovem 2,2 Masculino viúvo boa aparência adulto 2,5 Masculino viúvo boa aparência idoso 0,8 Masculino viúvo má aparência jovem 1,3 Masculino viúvo má aparência adulto 1,5 Masculino viúvo má aparência idoso 1,1 Masculino divorciado boa aparência jovem 2,8 Masculino divorciado boa aparência adulto 2,8 Masculino divorciado boa aparência idoso 1,0 Masculino divorciado má aparência jovem 4,2 Masculino divorciado má aparência adulto 4,4 Masculino divorciado má aparência idoso 2,5 50
  51. 51. Continuação.... Categorias % Feminino solteiro boa aparência jovem 2,9 Feminino solteiro boa aparência adulto 3,3 Feminino solteiro boa aparência idoso 0,6 Feminino solteiro má aparência jovem 3,4 Feminino solteiro má aparência adulto 0,4 Feminino solteiro má aparência idoso 1,7 Feminino casado boa aparência jovem 0,8 Feminino casado boa aparência adulto 0,4 Feminino casado boa aparência idoso 0,5 Feminino casado má aparência jovem 1,3 Feminino casado má aparência adulto 0,4 Feminino casado má aparência idoso 2,1 Feminino viúvo boa aparência jovem 2,5 Feminino viúvo boa aparência adulto 3,3 Feminino viúvo boa aparência idoso 2,5 Feminino viúvo má aparência jovem 1,2 Feminino viúvo má aparência adulto 1,5 Feminino viúvo má aparência idoso 1,2 Feminino divorciado boa aparência jovem 2,8 Feminino divorciado boa aparência adulto 2,9 Feminino divorciado boa aparência idoso 2,6 Feminino divorciado má aparência jovem 5,4 Feminino divorciado má aparência adulto 3,8 Feminino divorciado má aparência idoso 2,5 Total 100 51
  52. 52. Cálculo do Tamanho da Amostra Exemplo: N = 12000 clientes e = erro amostral tolerável = 5% (e = 0,05) n0 = 1/(0,05)2 = 400 n = 12000x400/12000+400 = 4.800.000/12.400 = 387 clientes A primeira aproximação do tamanho da amostra já é suficiente. 52
  53. 53. Número de Entrevistas por Quotas Categorias Amostra Masculino solteiro boa aparência jovem 11 Masculino solteiro boa aparência adulto 15 Masculino solteiro boa aparência idoso 6 Masculino solteiro má aparência jovem 10 Masculino solteiro má aparência adulto 16 Masculino solteiro má aparência idoso 5 Masculino casado boa aparência jovem 3 Masculino casado boa aparência adulto 4 Masculino casado boa aparência idoso 2 Masculino casado má aparência jovem 5 Masculino casado má aparência adulto 7 Masculino casado má aparência idoso 8 Masculino viúvo boa aparência jovem 9 Masculino viúvo boa aparência adulto 10 Masculino viúvo boa aparência idoso 3 Masculino viúvo má aparência jovem 5 Masculino viúvo má aparência adulto 6 Masculino viúvo má aparência idoso 5 Masculino divorciado boa aparência jovem 11 Masculino divorciado boa aparência adulto 11 Masculino divorciado boa aparência idoso 4 Masculino divorciado má aparência jovem 17 Masculino divorciado má aparência adulto 18 Masculino divorciado má aparência idoso 10 53
  54. 54. Continuação.... Categorias Amostra Feminino solteiro boa aparência jovem 12 Feminino solteiro boa aparência adulto 13 Feminino solteiro boa aparência idoso 3 Feminino solteiro má aparência jovem 14 Feminino solteiro má aparência adulto 2 Feminino solteiro má aparência idoso 7 Feminino casado boa aparência jovem 3 Feminino casado boa aparência adulto 2 Feminino casado boa aparência idoso 2 Feminino casado má aparência jovem 5 Feminino casado má aparência adulto 2 Feminino casado má aparência idoso 8 Feminino viúvo boa aparência jovem 10 Feminino viúvo boa aparência adulto 13 Feminino viúvo boa aparência idoso 10 Feminino viúvo má aparência jovem 5 Feminino viúvo má aparência adulto 6 Feminino viúvo má aparência idoso 5 Feminino divorciado boa aparência jovem 11 Feminino divorciado boa aparência adulto 12 Feminino divorciado boa aparência idoso 10 Feminino divorciado má aparência jovem 22 Feminino divorciado má aparência adulto 15 Feminino divorciado má aparência idoso 10 Total 400 54
  55. 55. Amostragem por Quotas versus Amostragem Aleatória Estratificada 1a ) Amostragem por Quotas: Passos: • Definir as variáveis relevantes para o estudo planejado; • Obter os dados censitários com os números absolutos referentes às variáveis escolhidas; • Calcular as proporções das variáveis para a população; • Definir o tamanho da amostra; • Multiplicar as proporções de cada variável obtida ou o cruzamento destas pelo tamanho da amostra; • Localizar os respondentes de cada quota em ruas, em locais ou pontos de grande movimento. 2a ) Amostragem Aleatória Estratificada: Passos: • Definir as variáveis relevantes para o estudo planejado; • Obter os dados censitários com os números absolutos referentes às variáveis escolhidas; • Calcular as proporções das variáveis para a população; • Definir o tamanho da amostra; • Multiplicar as proporções de cada variável obtida ou o cruzamento destas pelo tamanho da amostra; 55
  56. 56. • Localizar os respondentes de cada estrato amostral através da realização de uma amostragem aleatória simples em cada estrato populacional. Comparações: • As amostras por quotas são mais simples que as estratificadas, de tecnologia mais fácil e são bem mais baratas; • As amostras estratificadas têm sustentação teórica e empírica; • A amostra por quota somente tem sustentação empírica. 56
  57. 57. Exercícios Propostos 1) Responda às questões abaixo: a) Explique o que você entende por população e amostra b) O que você entende por amostragem? c) Qual a função da tecnologia da amostragem? d) Qual o melhor tipo de amostragem para uma pesquisa em particular? e) Qual a justificativa para se utilizar amostragem? f) Quais os tipos de amostragem existentes? g) Qual a diferença entre conglomerados e estratos? h) O que é amostragem probabilística? i) O que é erro de amostragem? j)O que é intervalo de confiança? k) O que é precisão? l)O que é tamanho da amostra? m)Quais os tipos de amostragem probabilística? n) Defina e explique amostragem aleatória simples. o)Qual o dispositivo prático para se selecionar aleatoriamente uma amostra? p) Qual a diferença básica entre amostragem probabilística e não probabilística? q) Explique a amostragem por quotas? r) Em que tipo de amostragem o tamanho da amostra é dimensionado matematicamente? s) Que tipo de amostragem é considerado a única científica? Por quê? t) Qual tipo de amostragem probabilística em que não é preciso um cadastro ou listagem de toda a população para se realizar a seleção da amostra? Por quê? u) Quais os dois elementos que devem ser estabelecidos a priori ao se determinar o tamanho da amostra? 57
  58. 58. v) O que é nível de significância na determinação do tamanho da amostra? w) O que é precisão na determinação do tamanho da amostra? 2) Um instituto de pesquisa vai realizar uma pesquisa de opinião de intenção de voto por amostragem por cotas. A base da amostra foi obtida junto ao IBGE e está apresentada na tabela abaixo: Sexo Faixas de Idades (em anos) 0 a 20 21 a 40 41 anos ou mais Total Masculino 120 205 125 450 Feminino 180 255 185 620 Total 300 460 310 1070 Realize o ‘desenho’ da amostra para o instituto, desenvolvendo os passos abaixo:  Elabore a tabela com as cotas populacionais que devem ser guardadas na amostra;  Determine o tamanho da amostra ou o número de entrevistas a serem realizadas para uma margem de erro de 10%, para mais ou para menos, com uma confiança de 95%. Considere P=50%.  Determine a tabela com o número de entrevistas por cotas. Fórmula: n = Z2 . P .Q e2 58
  59. 59. 3)Para levantar dados sobre o número de filhos por casal, em uma comunidade, um pesquisador organizou um questionário que enviou, pelo correio, a certo número de residências amostradas aleatoriamente. A resposta ao questionário era facultativa, pois o pesquisador não tinha condições de exigir resposta. Neste questionário pergunta-se o número de filhos por casal morador na residência. Você acha que os dados assim obtidos têm algum tipo de tendenciosidade? 4)Um pesquisador pretende levantar dados sobre o número de moradores por domicílio, usando a técnica da amostragem sistemática. Para isso, o pesquisador sorteará uma primeira residência dentro do intervalo de amostragem, a partir daí visitará as casas em cinco em cinco numa progressão aritmética. Se nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra e visitará a quinta residência próxima até formar o tamanho da amostra. Esta última determinação introduz tendenciosidade? Por quê? 5)Muitas pessoas acreditam que as famílias se tornaram menores. Suponha que, para estudar essa questão, foi selecionada uma amostra aleatória de 2000 casais com filhos e perguntou-se quantos filhos eles tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avós. O procedimento introduz tendenciosidade nos dados? Por quê? 6)Qual o tamanho da amostra para estimar a proporção de pessoas do sexo masculino no Rio de Janeiro com erro de amostragem de 1% e confiança de 95%? 59
  60. 60. 7) Os dados abaixo referem à população hipotética de certa cidade com presença ou não de telefone: N S N S S N N S N N N N N N S N S S S N N S N S S N N S N N N N N N S N S S S N N S N S N N N S N N N N N N S N S S S N N S N S S N N S N N N N N N S N S S S N S S S S S N N S N N N N N N S N S S S N S S N S S N N S N N N N N N S N S S S N N S N S S S N S N N N N S N S N S S S N S S N S S N N S N N N N N N S N S N S N N S N S N N N S N N S N N N S N S S N N N S N S S N N S N S N N S N S S S N S S S S S S N N S N N N N N N S N S S S S N S S N S S N N S N N S N N N N N S N S N N S S S S N N S N N N N N N S N S N N N S N N S S N N S N N N N N N S N S S S S N S N N N S N N S S N 60
  61. 61. Onde S, significa presença de telefone e N, a pessoa não tem telefone. Faça o que se pede: a) Selecione através da planilha eletrônica Excel uma amostra aleatória simples de tamanho 100. b) Calcule a porcentagem de pessoas com telefone. O que significam estas medidas? 8)Um administrador financeiro está interessado em descobrir o percentual de famílias com problemas de dívida. Para isso irá realizar uma investigação nas residências das pessoas do bairro sob investigação. O bairro em estudo tem 10 ruas descritas abaixo, segundo residência e existência de dívidas ( S = sim e N = não): Rua A : S S S S S S S N Rua B : S S N S N S N S S S S N Rua C : N S N S N S S N S N S Rua D : S S S N N S S N N S Rua E : S S N N S S Rua F: S N N S S Rua G : S N S S N S N N N S S N N S S N N Rua H : S N N S S N S N S N S Rua I : S N N S Rua J : S S S NN S S S N S N S S N N S S Selecione uma amostra por conglomerados por bairro de tamanho 5, utilizando a planilha eletrônica Excel. 61
  62. 62. 9) Os dados abaixo se referem ao consumo, em mil reais, de um produto comercializado por uma loja: 130,0 105,0 120,0 111,5 99,0 116,0 82,5 107,5 125,0 100,0 107,5 120,0 143,0 115,0 135,0 130,0 135,0 127,5 90,5 104,5 136,5 100,0 145,0 125,0 104,5 101,5 90,5 101,5 134,5 158,5 110,0 102,5 90,5 115,5 124,5 121,5 135,0 102,0 119,5 115,5 125,5 117,5 107,5 140,0 121,5 107,5 113,3 93,0 103,5 Selecione uma amostra aleatória de tamanho 10, com base em funções do Excel e: a) Calcule a média populacional; b) Calcule a média amostral; c) Calcule o erro de amostragem em módulo. 10)Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%? 11)Com o objetivo de avaliar a confiabilidade de um novo sistema de transmissão de dados, torna-se necessário verificar a proporção de bits transmitidos com erro em cada lote de 100Mb. Considere que seja necessário um erro amostral máximo de 2%. Qual deve ser o tamanho da amostra? 62
  63. 63. 12)Sabe-se que no Brasil 2.883 municípios têm cobertura banda larga 3G, dados de fevereiro de 2012. Qual o tamanho da amostra necessário para estimar o percentual de municípios com cobertura banda larga 3G da operadora Claro, com um erro de amostragem de ±4%? 13))Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se deseja garantir um erro amostral não superior a 2%? 14)Em 2011, 2176 instituições de ensino superior no Brasil participaram do ENADE. Qual o tamanho da amostra necessário para se estimar a proporção de centros universitários e universidades com IGC 1 e 2, com 95% de confiança de que o erro efetivo de amostragem não ultrapasse o tolerado que é de ±5%? 15)Qual o tamanho da amostra para se estimar a nota média de alunos no vestibular de uma faculdade, onde a variação das notas não passa de 400 e admitindo uma confiança de 95% e um erro de amostragem de ±2 pontos? 63
  64. 64. Unidade IV Fases do Método Estatístico Método: É um conjunto de etapas, ordenadamente dispostas, a serem seguidas na investigação da verdade, no estudo de uma ciência ou para alcançar determinado fim. Método Estatístico: É um conjunto de fases, que devem ser seguidas na ordem determinada, para se obter resultados estatísticos. Fases do Método Estatístico: Com essa ou outra nomenclatura, com menos ou mais detalhes, a literatura sobre o assunto admite tais fases do trabalho estatístico: o Planejamento: o Coleta de Dados; o Crítica de Dados; o Apuração de Dados; o Análise de Dados; o Emissão do Relatório Final; o Comunicação dos Resultados. 64
  65. 65. Planejamento Na fase de planejamento, podemos resumir em uma lista, como a que segue, as principais etapas a serem desenvolvidas no planejamento: 1. Definir o objetivo ou problema da pesquisa; 2. Definir a necessidade(relevância) da pesquisa; 3. Definir as variáveis da pesquisa; 4. Definir a necessidade da pesquisa com trabalho de campo e as fontes dos dados da pesquisa; 5. Identificar o esquema de amostragem (como escolher a amostra e que tamanho essa amostra deve ter); 6. Decidir que método de coleta de dados será utilizado (questionário via e-mail, impresso auto- aplicável, entrevista, telefone, etc.) 7. Definir materiais e métodos da pesquisa; 8. Selecionar e treinar qualquer pessoa envolvida no processo de coleta de dados 9. Definir o orçamento da pesquisa; 10.Definir o cronograma da pesquisa. Deste modo, o trabalho estatístico nasce quando um estudioso (pesquisador) sente a curiosidade de conhecer com mais precisão o comportamento de um fenômeno coletivo ou de massa. Esta curiosidade estatística é o objetivo ou problema de pesquisa. 65
  66. 66. Exemplo: Um economista deseja conhecer quais as características demográficas, socioeconômicas e de estilo de vida dos consumidores de certo bem ou serviço. Necessidade(relevância) da Pesquisa Considerando os volumes relativos de investimentos que o mercado exige para realização adequada de produtos e serviços, supérfluo seria discutir a sua importância. A pesquisa já há tempo vem sendo uma rotina nas empresas e institutos mais avançados e já se desenvolve em pequenas e médias corporações e instituições. Ninguém quer se arriscar a investir amadoristicamente, com base apenas em suposições. Ninguém quer “queimar” o seu serviço colocando-o inadequadamente no mercado. Ao saber que os bancos públicos reduzirão fortemente as taxas de juros para empréstimos e financiamentos, empresários devem buscar informações balizadas do impacto dessa decisão no consumo de seus bens e serviços colocados no varejo. O que importa, de fato, não é discutir a necessidade da pesquisa, porque isso é uma fato hoje incontestável. O relevante é discutir o momento certo para viabilizá-la e que tipo de dados é mais viável economicamente. 66
  67. 67. Exemplo: Num estudo do “Perfil dos turistas envolvidos em um pacote viagem em uma cidade”, a motivação para a pesquisa poderá ser o de obter informações para que no futuro se aperfeiçoe o oferecimento do referido pacote turístico cada vez mais moldado ao perfil e à necessidade de quem o demanda. Definição das Variáveis da Pesquisa O pesquisador precisa definir quais as características ou variáveis precisam ser observadas para responderem ao seu objetivo de pesquisa. Exemplo: Para conhecer as características demográficas, socioeconômicas e de estilo de vida de consumidores de um serviço bancário, é necessário observarmos dentre outras, o sexo, idade, estado-civil, renda, análise de crédito, etc. 67
  68. 68. Definição da Necessidade da Pesquisa com Trabalho de Campo Para verificar a necessidade e momento certo de um trabalho de pesquisa efetivo, com coleta de dados, devemos responder as seguintes perguntas: a) Que informações são necessárias para responder ao meu problema de pesquisa? b) Estas informações estão disponíveis e são suficientes para resolver o meu problema de pesquisa no momento? c) Podem ser consultadas em tempo hábil na empresa ou em outras partes? d) Se as soluções às ultimas perguntas forem negativas está estabelecida à necessidade de pesquisa com trabalho de campo. Então, podemos concluir que a pesquisa com trabalho de campo aparece nitidamente como necessidade, quando trabalhadas e analisadas as informações já disponíveis ao pesquisador, este observa que ainda resta um vazio, que algumas questões ainda não ficam respondidas, algumas dúvidas não se resolvem. A insuficiência de dados disponíveis é o fundamento que se precisa para a pesquisa com trabalho de campo. 68
  69. 69. Projeto de Pesquisa: Quando tudo for estabelecido, resume-se o que se planejou em um pequeno relatório escrito que se chama “Projeto de Pesquisa”, com o problema de pesquisa, metodologias, prazos, orçamentos, etc. e submeta às autoridades da empresa ou outra fonte de aprovação da realização da mesma. Coleta de Dados ( Trabalho de Campo ) É a observação, o registro ou a medição sistemática da manifestação das variáveis de pesquisa. Para a coleta de dados são mais utilizados os métodos de questionários, realização de entrevista ou a consecução de observação. É a parte visível da pesquisa, é o entrevistador abordando os entrevistados em uma rua de grande movimento, ou em suas residências, locais de trabalho, locais de estudo, para colher dados sobre as variáveis da pesquisa. Em pesquisas de mercado, pesquisas eleitorais, pesquisas de opinião, pesquisas de intenção de votos, são comuns se localizarem os respondentes (ou entrevistados) em locais ou pontos de grande movimento ou ruas. 69
  70. 70. Fontes de Dados Há quatro diferentes fontes de dados em pesquisa: a) Pesquisado; b) Pessoas que tenham informações sobre o pesquisado; c) Situações similares; d) Dados disponíveis. Pesquisado Os próprios pesquisados são a maior fonte de dados em pesquisa. O dado pode ser obtido do pesquisado através de sua própria declaração, oralmente ou por escrito, ou através de sua observação. Exemplo: Numa pesquisa de “Clima Organizacional”, as entrevistas realizadas junto aos funcionários da empresa é um exemplo de pesquisa cuja fonte dos dados é o próprio pesquisado. 70
  71. 71. Pessoas que tenham informações sobre o pesquisado Quando ocorre de o pesquisado ser inacessível, possuir pouco conhecimento da informação desejada ou tiver dificuldade de expressar-se, às vezes, é mais fácil conseguir a informação com outras pessoas que tenha informações confiáveis sobre ele. Exemplos: ⇒ Obter informações sobre as crianças de uma casa com a mãe; ⇒ Obter informação sobre o marido com a esposa; ⇒ Obter informação sobre o chefe com a secretaria; ⇒ Obter informação sobre o subordinado com o chefe; ⇒ Obter informação sobre o cliente com o vendedor. Situações Similares É a busca de conhecimento em situações análogas ou similares. Exemplos: ⇒ Aprende-se bastante em saber como lançar no mercado, para posterior venda, um bem ou serviço, através do mesmo procedimento já vivido por outras empresas; ⇒ Como outras empresas do mesmo ramo trabalham com a variável promoção de vendas; ⇒ Como foram as reações dos consumidores quando determinada marca de carros foi lançada em outro país de 71
  72. 72. mesma cultura e desenvolvimento econômico. Dados Disponíveis Existe uma infinidade de dados úteis para o analista que já foram coletados, tabulados e, às vezes, até analisados que estão catalogados à disposição dos interessados. Para obter estes dados exige-se apenas o esforço de dedicar algum tempo à consulta de órgãos de geração de informações para o turismo e no mundo atual, a pesquisa na internet. Existe uma infinidade de informações sobre turismo já disponíveis. Tipos de Dados Dados Primários Dados primários são aqueles que ainda não passaram pelas fases da apuração e análise de dados. São aqueles que ainda não foram trabalhados estatisticamente. Exemplo: Numa pesquisa de “Satisfação de clientes” ou de “Clima Organizacional”, após a aplicação dos questionários ou da realização das entrevistas, temos ainda dados primários. As fontes básicas de dados primários seriam: ⇒ Pesquisado; ⇒ Pessoas que tenham informações sobre o pesquisado; ⇒ Situações Similares. 72
  73. 73. 73
  74. 74. Dados Secundários São aqueles que já passaram pelas fases da apuração e da análise de dados, e já estão à disposição para interpretação e tomadas de decisão, ou até mesmo para serem “retrabalhados“ estatisticamente. Exemplos: o As estatísticas fornecidas nos relatórios técnicos do Instituto de Economia Aplicada(IPEA) são dados secundários; o As pesquisas de intenção de votos divulgadas à mídia e a candidatos são dados secundários; o Os índices de audiências fornecidos às emissoras de TV são dados secundários. o O Anuário Estatístico do IBGE contém para consulta dados secundários. As fontes básicas de dados secundários são: ⇒ A própria empresa. ⇒ Publicações. ⇒ Governos. ⇒ Instituições não governamentais. ⇒ Serviço padronizado de informações em marketing. ⇒ Internet. 74
  75. 75. Seqüência na Procura de Dados em Pesquisas no Turismo: É comum as pessoas imaginarem que a única forma de obter dados em pesquisa de negócios seja através de um levantamento de campo. Na verdade, os levantamentos de campo e outras formas de coleta de dados primários somente deverão ser usados se outras formas mais rápidas, baratas e eficientes não conseguirem atender às necessidades de dados da pesquisa. Um grande esforço nos estágios iniciais da pesquisa deverá ser canalizado para procurar tentar descobrir se, ao menos em parte, os dados necessários estejam de alguma forma disponíveis. Este esforço inicial poderá significar grande economia de tempo, dinheiro e energia na realização da pesquisa. É apresentada na tabela abaixo, a seqüência dos passos no processo, que normalmente deve ser seguida na definição dos dados e das fontes de dados no processo de pesquisa estatística. 75
  76. 76. Tabela Etapas para Definição dos Dados e das Fontes de Dados no Processo de Pesquisa Estatística 1. Definir os objetivos da pesquisa. 2. Especificar as necessidades de dados. 3. Planejar as etapas da pesquisa. 4. Determinar as fontes de dados. 5. Procurar dados secundários internos. 6. Procurar dados secundários externos: Publicações: - gerais - governamentais - institucionais Governos: - federal - estadual - municipal Instituições não governamentais: - universidades, faculdades e centros de pesquisas - associações patronais e de empregados - sindicatos patronais e de empregados Serviços padronizados de informações de marketing: 7. Determinação das necessidades de dados primários. 76
  77. 77. Determinação das fontes de dados primários: - pesquisado - pessoas que tenham informações sobre o pesquisado - situações similares: • estudo de casos • experimentos Crítica de Dados: É a preparação dos dados coletados para a apuração. Constitui a verificação de respostas erradas, verificação de lacunas deixadas pelos informantes e quantificação de perdas naturais de informações. Apuração de Dados: É a contagem ou soma dos resultados observados de cada variável especificada e medida no questionário. Exemplo de Apuração: Suponha que na pesquisa do “Perfil dos Clientes da Clínica”, uma variável observada seja ‘sexo dos clientes’ e que do resultado da coleta a 10 clientes tivéssemos encontrado: Indivíduo 1: Masculino, Indivíduo 2: Feminino, Indivíduo 3: Masculino, Indivíduo 4: Masculino, Indivíduo 5: Masculino, Indivíduo 6: Feminino, 77
  78. 78. Indivíduo 7: Masculino, Indivíduo 8: Feminino, Indivíduo 9: Feminino Indivíduo 10: Masculino. Este tipo de apuração é a Manual. A apuração de dados é a contagem dos dados registrados, no caso do exemplo, de quantas pessoas do sexo masculino e do sexo feminino foram observadas. Geralmente o número de observados é bem maior do que 10, então a apuração se torna mais trabalhosa ou mesmo operacionalmente inviável. Neste caso deve ser realizada eletronicamente, através de um pacote específico para apuração. Existem vários, entre eles, o ‘SPSS’, ‘Statistica’, ‘R’ e o “SAS”. Análise de Dados: A análise de dados consiste no tratamento estatístico dos dados registrados, no caso do exemplo, seria estabelecer que os resultados da apuração fossem informados numa tabela estatística como a descrita abaixo: É a fase em que se estabelece a forma de representação dos dados e de acordo com as normas de representação oficial de informações estatísticas e todas as técnicas para se tirar informações importantes dos registros apurados (são estabelecidas as tabelas para representar os dados, os gráficos necessários, porcentagens, totais, médias, técnicas multivariadas, inferências, etc..). Na fase da análise de dados, os resultados da pesquisa são trabalhos para gerar informações úteis, isto é, são os “achados da pesquisa”. Geralmente, com esta fase concluída pode-se redigir o “Relatório Final da Pesquisa”. 78
  79. 79. Sexo Contagem Masculino 6 Feminino 4 Total 10 Emissão de Relatório Final: Depois da análise de dados, onde os achados da investigação foram obtidos, redige-se um relatório final de pesquisa, acrescentando aos resultados da análise de dados: o problema estabelecido no planejamento, a metodologia da pesquisa, realização de conclusões e tomadas de decisão, referências bibliográficas e bibliografias. Comunicação dos Resultados: Esta etapa do método torna o trabalho do cientista um processo social. As teorias e conclusões do seu trabalho de pesquisa devem ser relatadas publicamente e sobreviver a um período de debate, avaliação crítica e a repetição dos ensaios e testes por outros profissionais competentes. Só assim os novos conhecimentos são incorporados à ciência universal. Em conseqüência, tem-se que o conhecimento é um bem público e acervo da humanidade. Além do objetivo de socialização dos resultados, os dados precisam ser comunicados por razões práticas: o homem de negócios precisa dos resultados da pesquisa para tomar decisões administrativas estratégicas com menos riscos. Exercícios Propostos 79
  80. 80. Responda às perguntas abaixo: 1. Defina Método. 2. Explique o que é o Método Estatístico? 3. Quais são as fases do Método Estatístico? 4. Quando nasce a necessidade de se realizar um trabalho estatístico? 5. Qual a primeira fase de um trabalho estatístico? 6. Antes mesmo de ser aplicar o Método Estatístico, o que devem ser definidos primeiro pelo pesquisador? 7. O que é objetivo de pesquisa? 8. O que é Motivação ou relevância de uma pesquisa? 9. Quais as fases de um planejamento de pesquisa estatística? 10.O que é ‘Projeto de pesquisa’? 11.O que é coletar dados? 12.Quais os tipos de dados? 13.O que são dados primários? 14.O que são dados secundários? 15.O que é crítica de dados? 16.O que é apuração de dados? 17.O que é apuração de manual de dados? 18.Cite dois programas estatísticos que realizam apuração de dados estatísticos via computador. 19.O que é análise de dados? 20.O que são estabelecidos na análise de dados? 21.Quando são realizadas inferências estatísticas aos resultados inicialmente encontrados? 22.Qual a importância de se realizar a Comunicação dos Resultados da Pesquisa? 23.Explique o que seja a tomada de decisão num trabalho estatístico? 80
  81. 81. 24.Escolha um objetivo de pesquisa na sua área de formação, estabeleça uma finalidade para sua realização e apresente um “Projeto de Pesquisa”. 81
  82. 82. Unidade V Séries Estatísticas Conceito de Séries Estatísticas: É a representação das informações em forma de tabelas. Seu objetivo é obter um resumo organizado das informações sobre a variável: fornecer o máximo de informações em um mínimo de espaço. Tabela: É um quadro que resume um conjunto de observações. A construção de tabelas deve seguir as “Normas de Representação Tabular do IBGE” (ver anexo II). As Séries Estatísticas podem ser: • Séries Temporais; • Séries Geográficas; • Séries Especificativas; • Séries Mistas; • Distribuições de Frequência. Séries Temporais: Uma determinada informação é estudada em função do tempo. 82
  83. 83. Exemplo: Quantidade de Itens Vendidos de um Produto por uma Loja nos Últimos 10 meses em Mil unidades. Meses Quantidade de Itens Vendidos Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembr o Outubro 1 2 2 3 4 4 6 8 8 12 Total 50 Séries Geográficas: Uma determinada informação é estudada em função de uma região ou localidade. É feita para apresentar dados de diferentes regiões geográficas. Exemplo: Percentual de Pessoas com 10 anos ou Mais que Declaram Rendimento de Até um Salário Mínimo, Segundo as Grandes Regiões do País. 83
  84. 84. Regiões Percentual Norte Nordeste Sudeste Sul Centro-Oeste 32,8 48,0 16,0 18,8 22,3 Brasil 25,3 Fonte: Folha de São Paulo (2002) Séries Especificativas: Neste caso a informação em estudo é dividida em categorias que a especifica. Exemplo: Número de Consultas Médicas Segundo Especialidades de Saúde Realizadas por Funcionários Associados a um Plano de Saúde Conveniado pela Empresa Empregadora. Junho de 2001. Especialidades Consultas Geral Urologia Cardiologia Dermatologia Ginecologia Neurologia Oftalmologia Ortopedia Otorrinolaringologia 200 35 151 59 90 83 101 45 29 Total 793 84
  85. 85. Séries Mistas: São aquelas séries estatísticas resultantes da combinação das séries estatísticas temporais, geográficas, especificativas ou entre distribuições de freqüências. Exemplo: Taxas de Analfabetismo de Pessoas com 15 anos e Mais, Segundo a cor, nos Censos Demográficos de 1991 e 2000. Cor Censos 1991 2000 Branca Preta Amarela Parda Indígena Sem declaração 11,9 31,5 5,4 27,8 5,8 18,7 8,3 21,5 4,9 18,2 26,1 16,1 Brasil 19,4 12,9 Fonte: Retrato do Brasil 85
  86. 86. Distribuições de Frequência: À cada resultado ou subconjunto de resultados de uma variável quantitativa são registradas nas células da tabela a freqüência com que foram observados na coleta de dados. Tipos de Distribuição de Frequência: • Distribuição de Frequência Simples; • Distribuição de Frequência por Classe. Distribuição de Frequência Simples: À cada resultado de uma variável quantitativa são registradas nas células da tabela a freqüência com que foram observadas na coleta de dados. Exemplo: Funcionários de uma Empresa Segundo Idades. Rio de Janeiro, Julho/2001 Idades Número de Funcionários 27 15 32 23 35 32 38 35 42 43 47 28 86
  87. 87. 53 10 Total 186 87
  88. 88. Distribuição de Frequência por Classe: À cada subconjunto de resultados de uma variável quantitativa são registradas nas cédulas da tabela a freqüência com que foram observados na coleta de dados. É a distribuição de freqüência em que a variável observada está dividida em classes, que são subintervalos do intervalo total. Formas de se representar uma Classe: |—— → inclui à esquerda e exclui à direita ——| → exclui à esquerda e inclui à direita |——| → inclui ambos —— → exclui ambos Exemplo: Tempo em Segundos dos Gastos por Funcionários para Preencher Determinado Formulário Tempo (em segundos) Número de funcionários 40 |― 45 3 45 |— 50 8 50 |— 55 16 55 |— 60 12 60 |— 65 7 65 |— 70 3 70 |— 75 1 Total 50 Elementos de Uma Distribuição de Frequência: 88
  89. 89. a) Classe: são os subintervalos do intervalo total. Exemplos: 40 |— 45, primeira classe. 50 |— 55, terceira classe. 70 |— 75, última classe. b) Limites de Classe: são os valores de classe, sendo: da esquerda (menor valor) chamado limite inferior. da direita (maior valor) chamado limite superior. Exemplo: 55 |— 60 55, limite inferior 60, limite superior c) Intervalo de Classe (h): É o comprimento de cada classe. É obtido pela diferença entre o limite inferior de uma classe e o limite inferior da classe anterior da classe anterior ou a diferença existente entre o limite superior de uma classe e limite superior da classe anterior. O intervalo de classe (h) deve ser uma constante na distribuição de frequência por classe. 89
  90. 90. Exemplos: 45 → limite inferior da segunda classe. 40 → limite inferior da primeira classe. Logo, h = 45 – 40 = 5 OU 50 → limite superior da segunda classe. 45 → limite superior da primeira classe. h = 50 – 45 = 5 d) Ponto Médio (xi): É a média aritmética simples entre o limite superior e inferior de uma mesma classe. Todas as classes têm um ponto médio distinto. O ponto médio é o representante dos valores contidos em uma classe. O ponto médio varia de classe para classe. Exemplo: Tempo (em segundos) Número de funcionários Pontos Médios (xi) 40 |― 45 45 |— 50 50 |— 55 55 |— 60 60 |— 65 65 |— 70 70 |— 75 3 8 16 12 7 3 1 42,5 47,5 52,5 57,5 62,5 67,5 72,5 Total 50 ──── e) Frequência Simples (fi): 90
  91. 91. Também chamada de frequência absoluta. É o número de vezes que os valores de uma classe ocorreram na observação, isto é, a freqüência com que foram observados. Exemplo: Tempo (em segundos) Frequência Simples (fi) 40 |― 45 3 45 |— 50 8 50 |— 55 16 55 |— 60 12 60 |— 65 7 65 |— 70 3 70 |— 75 1 Total 50 f) Frequência Relativa (fri): É o quociente entre a frequênica simples da respectiva classe pela freqüência total. A soma das freqüência relativas é sempre igual a 1. 91
  92. 92. Exemplo: Tempo (em segundos) Número de funcionários Frequência Relativas (fri) 40 |― 45 45 |— 50 50 |— 55 55 |— 60 60 |— 65 65 |— 70 70 |— 75 3 8 16 12 7 3 1 0,06 0,16 0,32 0,24 0,14 0,06 0,02 Total 50 1 Observação: Se quisermos obter a freqüência percentual (fri%), basta multiplicarmos as frequências relativas por 100. Exemplo: Tempo (em segundos) Número de funcionários Frequência Percentual (fri%) 40 |― 45 45 |— 50 50 |— 55 55 |— 60 60 |— 65 65 |— 70 70 |— 75 3 8 16 12 7 3 1 6 16 32 24 14 6 2 Total 50 100 92
  93. 93. g) Frequências Acumuladas (FACi) É obtida através da adição sucessiva à frequência simples da primeira classe das frequências simples das classes seguintes. A primeira frequência simples é a primeira frequência acumulada e a última freqüência acumulada é o somatório total das freqüências absolutas, isto é, a freqüência total n. Exemplo: Tempo (em segundos) Número de Funcionários Frequências Acumuladas (FAC'S) 40 |― 45 45 |— 50 50 |— 55 55 |— 60 60 |— 65 65 |— 70 70 |— 75 3 8 16 12 7 3 1 3 11 27 39 46 49 50 Total 50 ______ 93
  94. 94. Exercícios Propostos 1) Classifique as séries estatísticas abaixo: a)Crianças Não Vacinadas Contra Pólio.1989 Regiões Quantidades Nordeste Sudeste Norte Centro-Oeste Sul 512900 299585 148818 124791 105371 Fonte: IBGE c) Avicultura Brasileira, 1988 Espécie Número (cabeças) Galinhas Pato, Marrecos Perus 511834 58888 3823 Fonte: IBGE 94
  95. 95. d) Tempo de Licença Sem Vencimento de Funcionários de uma Empresa Tempo (em dias) Quantidade 1 3 4 5 6 7 8 9 10 10 15 25 31 17 28 5 29 34 e) Comprimentos, em centímetros, de Cobaias de 90 dias Comprimentos (cm) Quantidade 19 20,5 23,50 25 25,5 26,0 4 7 1 2 3 5 95
  96. 96. e) Número de Suicídios Ocorridos no Brasil em 1986, Segundo a Causa Atribuída Causa Atribuída Nº Suicídios Alcoolismo Dificuldade Financeira Doença Mental Outro Tipo de Doença Desilusão Amorosa Outras 263 198 700 189 416 217 Fonte: IBGE 3) Elabore tabelas estatísticas com os relatórios descritos abaixo: a) Na Bete Marketing, empresa situada no Rio de Janeiro em 1999, um estatístico realizou um levantamento do número de consultas de funcionário do plano de saúde conveniada com a empresa por especialidade médica. Na ortopedia, foram 200funcionários, na clínica geral foram 432, na urologia foram 154, na psiquiatria foram 133, na ginecologia foram 220 e na dermatologia foram 90 pacientes. b) Em 2000, o mesmo profissional do item anterior, resolveu acrescentar a variável sexo ao seu levantamento e constatou: Na ortopedia foram 130 do sexo masculino e 100 do feminino; na clínica geral foram 153 do sexo masculino e 165 do feminino; na urologia foram 145 funcionários; na psiquiatria foram 112 do sexo masculino e 80 do feminino; na ginecologia foram 129 do sexo feminino e na dermatologia foram 29 do sexo masculino e 100 do feminino. 96
  97. 97. c) O levantamento feito pelos nutricionistas de uma fábrica de sabão revelou a quantidade de refeições fornecidas aos operários nos vários turnos de trabalho: Desjejuns: 74052; Almoço: 72249; Merenda: 72178; Jantar: 72523; Ceias: 72999. Nas informações, não foram incluídas no total refeições extras, mamadeiras e dietas especiais. Nas refeições ceias e jantar não são oferecidas sobremesas. d) Movimento ambulatorial do hospital das clínicas da UERJ no período de 1973 a 1975. Em 1973, houve 36.0001 pacientes dos quais 17.885 do sexo masculino; 5.470 internações e 4.698 altas. Em 1974, 20.001 pacientes foram do sexo masculino e 18.920 do sexo feminino; as internações foram em número de 6.667 e as altas 4.667. Em 1975, num total de 39.370 pacientes, 20.263 eram do sexo masculino; as altas foram 5.483 e as internações 7.063. Quanto aos óbitos foram: 2.264, 1.733 e 1958 nos três anos consecutivos. e) Os dados abaixo resultaram da coleta de sangue de 100 servidores a serem admitidos em uma grande empresa em 2000 em Petrópolis. Tipo O, 15 Tipo A, 45 Tipo B, 35 Tipo AB, 5 f) Os mesmos funcionários foram consultados quanto ao seu fator sanguíneo e resultou-se: Rh+ , 55 Rh- , 40 Observação: cinco, não souberam responder. 4) Os dados abaixo se referem ao peso dos pacientes ao entrar num 97
  98. 98. Spa para dieta de emagrecimento. Estes dados foram levantados por um auxiliar de administração: Pesos em Classes (Kg) Pacientes 90 |— 100 100 |— 110 110 |— 120 120 |— 130 130 |— 140 140 |— 150 150 |— 160 160 |— 170 170 |— 180 180 |— 190 190 |— 200 Total 1 5 7 10 13 15 25 32 15 11 4 138 a) Limite inferior da 2a classe; b) Limite superior da 4a classe; c) Os pontos médios das classes; d) As frequências relativas; e) As frequências percentuais; f) As frequências acumuladas; g) O número de pacientes cujo peso não atinge a 140 Kg; h) O número de pacientes cujo peso atinge e ultrapassa a 150 Kg; i) A percentagem de pacientes com pesos entre 150 e 180 Kg; j) A percentagem de pacientes com peso maior ou igual a 180 Kg. 98
  99. 99. 5) Agrupe os dados abaixo em classes: Idades de Respondentes a uma Pesquisa de Mercado 6 4 61 6 5 43 4 5 5 4 51 7 4 3 0 100 9 1 75 7 8 6 8 80 6 9 7 2 27 4 0 93 9 9 9 4 78 7 2 5 9 78 9 5 62 4 2 9 6 100 9 5 8 1 84 7 8 103 9 8 6 0 84 9 1 99
  100. 100. Unidade VI Números Relativos Dados Absolutos Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida são chamados dados absolutos. A leitura dos dados absolutos pode ser enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas comparações numéricas. Daí o uso imprescindível que faz a estatística dos dados relativos. Dados Relativos Dados relativos é o resultado de comparação por quociente (razões) que se estabelecem entre os dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de, coeficientes, taxas, percentagens e índices. 100

×